Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	蔵俗即湛即旦	100100011010000010010001101011011001000110100110100100100101100010010001101001101001001001010101	91a091ad91a6925891a69255
EUC-JP	蔵俗即湛即旦	110000101010001011000010101011111100001010101000110000111011100111000010101010001100001110110110	c2a2c2afc2a8c3b9c2a8c3b6
UTF-8	蔵俗即湛即旦	111010001001010010110101111001001011111110010111111001011000110110110011111001101011100110011011111001011000110110110011111001101001011110100110	e894b5e4bf97e58db3e6b99be58db3e697a6
UHC	?俗?湛?旦	001111111110000111010100001111111101001111000000001111111101001110101001	3fe1d43fd3c03fd3a9

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)