Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??h??hB	00111111001111110110100000111111001111110110100001000010	3f3f683f3f6842
SJIS-WIN	硝涇h硝涇hB	1000111111001001111110101111101101101000100011111100100111111010111110110110100001000010	8fc9fafb688fc9fafb6842
EUC-JP	硝涇h硝涇hB	10111110110010111000111111000111110001110110100010111110110010111000111111000111110001110110100001000010	becb8fc7c768becb8fc7c76842
UTF-8	硝涇h硝涇hB	111001111010000110011101111001101011011010000111011010001110011110100001100111011110011010110110100001110110100001000010	e7a19de6b68768e7a19de6b6876842
UHC	硝涇h硝涇hB	1111010110100110110011001101110001101000111101011010011011001100110111000110100001000010	f5a6ccdc68f5a6ccdc6842

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)