Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????B	0011111100111111001111110011111101000010	3f3f3f3f42
SJIS-WIN	裁?裁?B	10001101110110010011111110001101110110010011111101000010	8dd93f8dd93f42
EUC-JP	裁?裁?B	10111010110110110011111110111010110110110011111101000010	badb3fbadb3f42
UTF-8	裁됨裁됨B	11101000101000111000000111101011100100001010100011101000101000111000000111101011100100001010100001000010	e8a381eb90a8e8a381eb90a842
UHC	裁됨裁됨B	111011101010111010110101110010101110111010101110101101011100101001000010	eeaeb5caeeaeb5ca42

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)