Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	?????k	001111110011111100111111001111110011111101101011	3f3f3f3f3f6b
SJIS-WIN	霽紐墨彦?k	11101000110001111001010101010010100101100110111010010101010001100011111101101011	e8c79552966e95463f6b
EUC-JP	霽紐墨彦?k	11110000110010011100100110110011110010111100111111001001101001110011111101101011	f0c9c9b3cbcfc9a73f6b
UTF-8	霽紐墨彦렋k	11101001100111001011110111100111101101001001000011100101101000101010100011100101101111011010011011101011101000001000101101101011	e99cbde7b490e5a2a8e5bda6eba08b6b
UHC	霽紐墨彦렋k	1111000010111000110100101110111111011001111110001110010111101001100011101010001001101011	f0b8d2efd9f8e5e98ea26b

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)