Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	厄?????	10010110111011110011111100111111001111110011111100111111	96ef3f3f3f3f3f
EUC-JP	厄??堉??	110011001111000100111111001111111000111110110111111111010011111100111111	ccf13f3f8fb7fd3f3f
UTF-8	厄닿낯堉띹뜎	111001011000111010000100111010111000101110111111111010111000001010101111111001011010000010001001111010111001110110111001111010111001110010001110	e58e84eb8bbfeb82afe5a089eb9db9eb9c8e
UHC	厄닿낯堉띹뜎	111001001111100010110100111010101011001110111000111010111011110010001101111010001000110110010001	e4f8b4eab3b8ebbc8de88d91

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)