Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	?る?爰?Ⅷ	001111111000001011101001001111111110000010100111001111111000011101011011	3f82e93fe0a73f875b
EUC-JP	?る?爰??	0011111110100100111010110011111111100000101010010011111100111111	3fa4eb3fe0a93f3f
UTF-8	閭る틳爰덃Ⅷ	111011111010011010000110111000111000001010001011111011011000101110110011111001111000100010110000111010111000110110000011111000101000010110100111	efa686e3828bed8bb3e788b0eb8d83e285a7
UHC	閭る틳爰덃Ⅷ	111001101010110110101010111010111011101010011011111010101011101010001000111001101010010110110111	e6adaaebba9beaba88e6a5b7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)