Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??K	001111110011111101001011	3f3f4b
SJIS-WIN	嘆達K	1001001001010001100100100100001001001011	925192424b
EUC-JP	嘆達K	1100001110110010110000111010001101001011	c3b2c3a34b
UTF-8	嘆達K	11100101100110001000011011101001100000011001010001001011	e59886e981944b
UHC	嘆達K	1111011110100011110100111011100101001011	f7a3d3b94b

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)