Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	襍ｶ陋嗣	11101000101101011011011011101000100110111000111001101011	e8b5b6e89b8e6b
EUC-JP	襍ｶ陋嗣	1111000010110111100011101011011011101111111110111011101111001100	f0b78eb6effbbbcc
UTF-8	襍ｶ陋嗣	111010001010010110001101111011111011110110110110111010011001100110001011111001011001011110100011	e8a58defbdb6e9998be597a3
UHC	??陋嗣	001111110011111111010111101100001101111011001011	3f3fd7b0decb

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)