Character and Charcode - Check how computer recognize characters

To what bitstring a character(s) is encoded in each character set?

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???????????????B	00111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111100111111001111110011111101000010	3f3f3f3f3f3f3f3f3f3f3f3f3f3f3f42
SJIS-WIN	筌??淫??應??釉??獄??B	111000101010001100111111001111111000100011111010001111110011111110011100111001000011111100111111111001111101011000111111001111111000110110010110001111110011111101000010	e2a33f3f88fa3f3f9ce43f3fe7d63f3f8d963f3f42
EUC-JP	筌??淫??應??釉??獄??B	111001001010010100111111001111111011000011111100001111110011111111011000111001100011111100111111111011101101100000111111001111111011100111110110001111110011111101000010	e4a53f3fb0fc3f3fd8e63f3feed83f3fb9f63f3f42
UTF-8	筌뗫툕淫멱쳸應됵쭓釉뚯꽭獄쏆뜆B	11100111101011011000110011101011100101111010101111101101100010001001010111100110101101111010101111101011101010011011000111101100101100111011100011100110100001111000100111101011100100001011010111101100101011011001001111101001100001111000100111101011100110101010111111101010101111011010110111100111100011011000010011101100100011111000011011101011100111001000011001000010	e7ad8ceb97abed8895e6b7abeba9b1ecb3b8e68789eb90b5ecad93e98789eb9aafeabdade78d84ec8f86eb9c8642
UHC	筌뗫툕淫멱쳸應됵쭓釉뚯꽭獄쏆뜆B	11101111101001111000101111101011101110001000110011101011111000101011100011101000101010111001101111101011111010111000100111101111101001111000101111101011101110001000110011101100100001001011100011101000101010111001101111101100100011011000100101000010	efa78bebb88cebe2b8e8ab9bebeb89efa78bebb88cec84b8e8ab9bec8d8942

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)