Character and Charcode - Check how computer recognize characters

Input one character or short letters and click "Convert."

Charset	Character	Bit string (binary)	Bit String (hexadecimal)
ISO-8859-1	??????	001111110011111100111111001111110011111100111111	3f3f3f3f3f3f
SJIS-WIN	鸙室裙辞鵰ﾞ	1111110001001010100011101011101011100101111000111000111010101011111111000100011111011110	fc4a8ebae5e38eabfc47de
EUC-JP	鸙室裙辞鵰ﾞ	1000111111101100110101101011110010111100111010101110010110111100101011011000111111101011111110111000111011011110	8fecd6bcbceae5bcad8febfb8ede
UTF-8	鸙室裙辞鵰ﾞ	111010011011100010011001111001011010111010100100111010001010001110011001111010001011111010011110111010011011010110110000111011111011111010011110	e9b899e5aea4e8a399e8be9ee9b5b0efbe9e
UHC	?室裙???	0011111111100011111110001100111111011001001111110011111100111111	3fe3f8cfd93f3f3f

SJIS-Win,EUC-JP: Classic charsets mainly used as Japanese encoding set on Windows(SJIS-Win=CP932) and UNIX(EUC-JP)