Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????m	00111111001111110011111100111111001111110011111101101101	3f3f3f3f3f3f6d
SJIS-WIN	娃??歪??m	100010001010000100111111001111111001100001100011001111110011111101101101	88a13f3f98633f3f6d
EUC-JP	娃??歪??m	101100001010001100111111001111111100111111000100001111110011111101101101	b0a33f3fcfc43f3f6d
UTF-8	娃믭쉘歪륅쉼m	11100101101010001000001111101011101011111010110111101100100010011001100011100110101011011010101011101011101001011000010111101100100010011011110001101101	e5a883ebafadec8998e6adaaeba585ec89bc6d
UHC	娃믭쉘歪륅쉼m	11101000110111111001001011101111101111011010100111101000111000001000111111101111101111011011000001101101	e8df92efbda9e8e08fefbdb06d

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)