Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	????	00111111001111110011111100111111	3f3f3f3f
SJIS-WIN	竣?あ?	100011110111011000111111100000101010000000111111	8f763f82a03f
EUC-JP	竣?あ?	101111011101011100111111101001001010001000111111	bdd73fa4a23f
UTF-8	竣찰あ엉	111001111010101110100011111011001011000010110000111000111000000110000010111011001001011110001001	e7aba3ecb0b0e38182ec9789
UHC	竣찰あ엉	1111000111100010110000101111101110101010101000101011111011111011	f1e2c2fbaaa2befb

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)