tlavitz.com


Shift_JIS


Shift_JIS(IANAへの登録名。読み方は『シフトジス』)は、現在多くのパソコン上で日本語を表すために使われている文字コードである。独自のコードを使っていた会社があったが、現在は標準化しているJIS X 0208の附属書1で規定している。 Microsoft等の各ベンダが実装するShift_JISの亜種については『Microsoftコードページ932』を参照。Mac OSが実装する亜種については『MacJapanese』を参照。 1980年代、パソコン用16ビットCPUの普及もあいまって、漢字を表示可能なハードウェアを備えたパソコンが続々と発売された。そのため、これらパソコン用の文字符号化方式を模索していた。 Shift_JISを「シフトJISコード」と呼んで符号化文字集合(文字コード)の面のみを考える議論があるが、ここでは文字符号化方式の面に焦点を当てる。 この文字符号化方式には、先行してよく利用していたJIS C 6220(現在のJIS X 0201)の8ビット符号(以下「英数字・半角カナ」)と、JIS C 6226(現在のJIS X 0208、以下「漢字」)の両文字集合を、表現しようとした。ファイルの大きさ、処理時間の短縮を図るためエスケープシーケンスなしで混在可能にすることを考案した。 JIS C 6220とJIS C 6226の2つはともに、ISO 2022で文字集合を切り替えて利用する設計があった。ISO 2022にもとづく文字符号化方式では、英数字、半角カナ、漢字はそれぞれ、8ビット符号空間の中のGL/GRという領域の1つを(ただし漢字は2回)使うことで表現できる。もし英数字と漢字の2つをエスケープシーケンスなしで混在したいなら、英数字をGL、漢字をGRに割り当てる方法がある。EUC-JPは、おおよそそのように実装している。 しかし、パソコンではすでに、JIS X 0201の8ビット符号、つまり、GLに英数字、GRに1バイトカタカナ(半角カタカナ)を割り当てることが普及していた。英数字と1バイトカタカナの2つを動かすことは、文字化けの原因になるため避ける必要があった。そのため、ISO 2022の枠内の領域に漢字を混在させることは困難だったのである。


SJISとは、日本語文字コードの一つ。 Microsoft社によって策定された。文字の1バイト目を見るだけで漢字か1バイト文字(いわゆる半角英数字)か分かる、等幅フォントで表示した場合に画面上の桁数とバイト数が一致するなどの特長から、同社のMS-DOSやWindows、Apple社のMac OSなど、パソコンの標準文字コードとして広く普及した。


IANAに登録されている日本語の文字集合を符号化する文字符号化方式のうちの一つ。JIS X 0201?の英数字記号、カタカナ、JIS X 0208の漢字、記号などが使える。 名称内にJISとあるが、JISの文字集合を扱っているだけで、Shift_JIS自体はJISの規格ではない。 Shift-JISとかかれることがあるが、それは間違い。また、以前はx-sjisという表記も行われていたが、IANAに登録された現在では使うことは避けるべきである。 類似のものにWindows-31J?やCP932?があるが、これらはShift_JISよりも扱える文字集合が多い文字符号化方式である。「(株)」などのいわゆる機種依存文字を使うためにはWindows-31J(またはMacで使われる文字コード 正式名称不明)などを指定する。これらについてはシフトJISの項目も参照のこと。