Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	???T???	00111111001111110011111101010100001111110011111100111111	3f3f3f543f3f3f
SJIS-WIN	??びT?訥オ	00111111001111111000001011010001010101000011111111100110011000111000001101001001	3f3f82d1543fe6638349
EUC-JP	??びT?訥オ	00111111001111111010010011010011010101000011111111101011110001001010010110101010	3f3fa4d3543febc4a5aa
UTF-8	룵퓦びT룶訥オ	11101011101000111011010111101101100100111010011011100011100000011011001101010100111010111010001110110110111010001010100010100101111000111000001010101010	eba3b5ed93a6e381b354eba3b6e8a8a5e382aa
UHC	룵퓦びT룶訥オ	10001111101010101011111110001111101010101101001101010100100011111010101111010010111011011010101110101010	8faabf8faad3548fabd2edabaa

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)