Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	暗??掌	100010001100001100111111001111111000111110110110	88c33f3f8fb6
EUC-JP	暗??掌	101100001100010100111111001111111011111010111000	b0c53f3fbeb8
UTF-8	暗뤹날掌	111001101001101010010111111010111010010010111001111010111000001010100000111001101000111010001100	e69a97eba4b9eb82a0e68e8c
UHC	暗뤹날掌	1110010011011110100011111110011110110011101011111110110111100110	e4de8fe7b3afede6

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)