Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	猥??音?４	111000001100111000111111001111111000100110111001001111111000001001010011	e0ce3f3f89b93f8253
EUC-JP	猥??音?４	111000001101000000111111001111111011001010111011001111111010001110110100	e0d03f3fb2bb3fa3b4
UTF-8	猥롢뀧音깆４	111001111000110010100101111010111010000110100010111010111000000010100111111010011001111110110011111010101011100110000110111011111011110010010100	e78ca5eba1a2eb80a7e99fb3eab986efbc94
UHC	猥롢뀧音깆４	111010001110010110001110111000111000010110011110111010111110010110110001111011001010001110110100	e8e58ee3859eebe5b1eca3b4

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)