Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	腫驀??弔?	100011101110111011101001011111010011111100111111100100101010001000111111	8eeee97d3f3f92a23f
EUC-JP	腫驀??弔?	101111001111000011110001110111100011111100111111110001001010010000111111	bcf0f1de3f3fc4a43f
UTF-8	腫驀렗렗弔렒	111010001000010110101011111010011010100110000000111010111010000010010111111010111010000010010111111001011011110010010100111010111010000010010010	e885abe9a980eba097eba097e5bc94eba092
UHC	腫驀렗렗弔렒	111100001111111011011000111010011000111010101100100011101010110011110000110000001000111010100111	f0fed8e98eac8eacf0c08ea7

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)