Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	?芦?撰ぞ?	001111111000100010110000001111111001000011101111100000101011110000111111	3f88b03f90ef82bc3f
EUC-JP	?芦?撰ぞ?	001111111011000010110010001111111100000011110001101001001011111000111111	3fb0b23fc0f1a4be3f
UTF-8	뤗芦쥘撰ぞ퐥	111010111010010010010111111010001000101010100110111011001010010110011000111001101001001010110000111000111000000110011110111011011001000010100101	eba497e88aa6eca598e692b0e3819eed90a5
UHC	뤗芦쥘撰ぞ퐥	100011111100011111111011110110001100000111100110111100111011110010101010101111101011110110001110	8fc7fbd8c1e6f3bcaabebd8e

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)