性病の全知識.com 【05/29update】

▼最新情報をCheck!!▼


「TRONコード」||性病の全知識.com 【05/29update】

TRONコード wikipedia|無料辞書

前のページ 1/4 次のページ
TRONコード(トロンコード)とは、TRONプロジェクトで開発されたコンピュータ文字コードのこと。32Bit長のコードで、今のところ150万字ほどを混在して扱うことができる。TRON多国語言語環境の初期論文は1987年に発表され、以来主にBTRONで利用されてきた。

◆ 特徴
多言語文字コードとしてUnicodeと比較される事が多いが、実質はメタ・文字コードと呼ぶべき体系であり、本質的に別物と捉えるべきである。
Unicodeが「見た目の異なる全ての文字に単一のコードが割り当てられる」ことを保証するのに対して、TRONコードは「たとえ見た目が同じでも視点が異なれば別の文字である」という考え方をとる。従ってTRONコードでは字形が同一の文字が複数のコードを持っていることが多い。それらが使われてきた文化的意味を前提とした場合、実際に同一の文字と見なせるのか、それともたまたま同じ形をしているのか、絶対的な判断を下す事はできないからである。現在のTRONコードもJIS、Unicode、GBコード(中国語)などが混在する。このため、たとえば、旧字体・当用漢字・簡体字で違いがない漢字は、完全にないしほとんど同じ字形に対し、5つのコードを持つ。これらの重複に対しては、必要に応じてアプリケーションレベルでの同一性判定を行なっている。
なお、GT書体は「とめ」「はね」などの差異もそれぞれが異字であると解釈して収録されるため、TRONコードという枠の中で考えたとき、上記の「何を以って同じ字形と捉えるか」という問題はあまり大きな意味を持つものではないとも言える。むしろJISなどの一般の文字コード枠は法令改訂などによって字形が刷新されるもの、大漢和辞典枠やGT書体枠は字形を恒久的に維持するものとして両者を包括的に収録構成する多面的文字セットとして見る方が、TRONコードの構築概念としては正解である。
包摂の判定を放棄するこの方針を合理的とする評価もあるが、一方で、コードの割り当て基準が必ずしも明確でない事、TRONに包摂判定を提供するレイヤが定義されていない事等から、文字コードとしては稚拙であると評する向きも少なくない。
逆にアルファベットでは従来の文字コードが全角/半角を別の文字と見なすのに対し、TRONコードでは同じ文字コードの別表現(スタイル)として扱われる。
他の文字コード体系に比べて規定が非常に緩く、また「外字は存在しない」という方針のため、未知の文字は「とりあえず入れてしまう」方針をとる。変わったところではトンパ文字SF作品中の架空文字であるアーヴ文字なども正式なコードを割り当てられている。

◆ 仕様

◇ コード体系
TRONコードはASCIIコードとの互換性を考慮しておらず、制御文字以外の全領域を割り当て領域として使用する。このため48,400文字を表現できるが、言語切り替えコードを使用することで、更に多くの文字を収納できる。2バイトの言語切り替えコードを用いて31面(各面をスクリプトと呼ぶ)150万文字を割り当てることができるが、仕様上は3バイト以上の切り替えコードが認められており、必要であれば更なる文字の登録が可能である。以下にTRONコードの構成を示す。

◇ ゾーン
コード体系によってそれぞれのスクリプトにおける文字コード領域は4つに分断される。この分断された個々をゾーンと呼び、文字を収録する際には文字種や文字セットをゾーンによって振り分けている。従って大雑把な表現をするのであれば、各スクリプトに4種類の文字種を収録できるということもでき、それぞれAゾーンは2121〜7E7E、Bゾーンは8021〜FD7E、Cゾーンは2180〜7EFD、Dゾーンは8080〜FDFDと定義される。
TRONコード第2面2100〜21FF番の表を参照されたい。この領域はGT書体が収録されている。2100から2120までは制御などに掛かる未使用領域であり、実際の文字領域は2121から開始される。217Fは未使用であるが、続く2180からの収録文字はそれまでの系列の文字とは異なる。2121から217Eまでは「
16px
」の部に関連した「
16px
(
16px
)」を含む文字群が収録されている。一方、2180からは「
16px
」を部首とする文字群の領域である。
ほかの文字コードではこうした配列になることは少ないが、ゾーンという概念を持つTRONコードでは第1バイトが同じであっても連続するコードの中で分断されるという現象が生じる。なお、上記の例ではAゾーンとCゾーンの隣接によるものであり、第2面217E番の「
16px
」に続く文字は第2面2221番「
16px
」から再び続行される。TRONコード第2面2200〜22FF番の表を参照。

◇ スクリプト構成
上記の通り、標準では31面150万文字の登録が可能であるが、2006年10月27日時点で割り当てられているのは、9面18万文字である。各スクリプトの構成は以下の通りである。