Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	罌??逸??	1110001110100000001111110011111110001000111011010011111100111111	e3a03f3f88ed3f3f
EUC-JP	罌??逸??	1110011010100010001111110011111110110000111011110011111100111111	e6a23f3fb0ef3f3f
UTF-8	罌삳벝逸뷸콢	111001111011110110001100111011001000001010110011111010111011001010011101111010011000000010111000111010111011011110111000111011001011110110100010	e7bd8cec82b3ebb29de980b8ebb7b8ecbda2
UHC	罌삳벝逸뷸콢	111001011010001010111011111010111001001110111000111011001110111110111010111001101011000110011010	e5a2bbeb93b8ecefbae6b19a

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)