Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???TB	0011111100111111001111110101010001000010	3f3f3f5442
SJIS-WIN	驤皮漉TB	1110100110001000100101001110011110001101100101110101010001000010	e98894e78d975442
EUC-JP	驤皮漉TB	1111000111101000110010001110100110111001111101110101010001000010	f1e8c8e9b9f75442
UTF-8	驤皮漉TB	1110100110101001101001001110011110011010101011101110011010111100100010010101010001000010	e9a9a4e79aaee6bc895442
UHC	?皮?TB	001111111111100110101011001111110101010001000010	3ff9ab3f5442

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)