Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????^	00111111001111110011111100111111001111110011111101011110	3f3f3f3f3f3f5e
SJIS-WIN	霍｣闊碁ｮｮ^	11101000101101111010001111101000100010001000110011101001101011101010111001011110	e8b7a3e8888ce9aeae5e
EUC-JP	霍｣闊碁ｮｮ^	11110000101110011000111010100011111011111110100010111000111010111000111010101110100011101010111001011110	f0b98ea3efe8b8eb8eae8eae5e
UTF-8	霍｣闊碁ｮｮ^	11101001100111001000110111101111101111011010001111101001100101111000101011100111101000101000000111101111101111011010111011101111101111011010111001011110	e99c8defbda3e9978ae7a281efbdaeefbdae5e
UHC	??闊碁??^	001111110011111111111100110001001101000110110011001111110011111101011110	3f3ffcc4d1b33f3f5e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)