Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????i	0011111100111111001111110011111101101001	3f3f3f3f69
SJIS-WIN	哀???i	100010001010001100111111001111110011111101101001	88a33f3f3f69
EUC-JP	哀???i	101100001010010100111111001111110011111101101001	b0a53f3f3f69
UTF-8	哀넘됱졒i	11100101100100111000000011101011100001001001100011101011100100001011000111101100101000011001001001101001	e59380eb8498eb90b1eca19269
UHC	哀넘됱졒i	111001001110111010110011110100011000100111101100101000001011111101101001	e4eeb3d189eca0bf69

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)