Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	?順叱疾	00111111100011111000011110001110101101101000111010111110	3f8f878eb68ebe
EUC-JP	瑄順叱疾	100011111100110010111001101111011110011110111100101110001011110011000000	8fccb9bde7bcb8bcc0
UTF-8	瑄順叱疾	111001111001000110000100111010011010000010000110111001011000111110110001111001111001011010111110	e79184e9a086e58fb1e796be
UHC	瑄順叱疾	1110000011000101111000101111011111110010111010101111001011110000	e0c5e2f7f2eaf2f0

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)