HOME -> SEO用語解説 > 「2バイト文字」、「1バイト文字」

SEO用語解説 - は

このエントリーをはてなブックマークに追加

「2バイト文字」、「1バイト文字」

2バイトのデータで表現可能な文字を「2バイト文字」と呼びます。文字コードによって異なるが、伝統的にはひらがなや全角カタカナ、漢字、全角記号などのことを指します。これに対して半角のアルファベットや数字、カタカナなどを「1バイト文字」という。

1バイト(8ビット)で表現できるのは256通りですが、2バイトだと6万5536通りにもなります。アルファベットのように文字の種類が少ない場合は、1バイトの文字コードで十分なのですが、漢字は使用頻度の最も多いJIS第1水準で約3000字、続くJIS第2水準で約3400字あるなど極めて文字数が多い。このため、2バイトで表現する文字コードが用意されました。

現在、主に私用されている2バイト文字コードは国ごとに別々に定めてあり、例えばシフトJISコードのテキストは標準的な中国語環境では正しく表示できない。そのため、世界各国の文字体系に対応できる統一的な文字コードとしてUnicode(ユニコード)が開発された。

このUnicode(ユニコード)では従来の1バイト文字も2バイトで表現可能で、また3バイト以上で1文字を構成するコード体系も存在します。そのため、ASCIIの範囲に収まらない文字の総称として「多バイト文字」(multibyte characters)という用語も使用されます。

このエントリーをはてなブックマークに追加
PAGE TOP