Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	諍驀?琮?帝	11100110011110011110100101111101001111111111101101101010001111111001001011101001	e679e97d3ffb6a3f92e9
EUC-JP	諍驀?琮?帝	1110101111011010111100011101111000111111100011111100110010110010001111111100010011101011	ebdaf1de3f8fccb23fc4eb
UTF-8	諍驀색琮렟帝	111010001010101110001101111010011010100110000000111011001000001110001001111001111001000010101110111010111010000010011111111001011011100010011101	e8ab8de9a980ec8389e790aeeba09fe5b89d
UHC	諍驀색琮렟帝	111011101011010111011000111010011011101111110110111100001111100110001110101100001111000010101000	eeb5d8e9bbf6f0f98eb0f0a8

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)