Written by Yutaka Kataoka. Copyright (C) 1997 by Yutaka Kataoka at Waseda University.
Comments or suggestions: kataoka@mling.waseda.ac.jp
国際化・多言語化テキスト処理プロジェクトは、全世界の全ての文字を混在処理することによって、全世界の言語を含む文書をコンピュータで処理するための研究プロジェクトである。本プロジェクトの成果は、POSIX Operating Ssystem と X Window System を、全世界のあらゆる言語のテキストの混在処理を可能とする環境に変更する(図1参照)。
図1は、実際に動作している早稲田国際化・多言語環境(System 1)の画面のハードコピーである。この図に表示されていないが、既に使用できる文字が多数ある。
この環境への変更は、OS と X Window System の部分的置換でなされる。後方互換性が極めて高く、ほとんどソースコードの修正をせずにあらゆる文字コードの混在するテキストの処理が可能となる。文字コードの混在と拡張のための ISO 2022、ISO 6429、及び各国の規約を満足している。内部表現は文字で正規化した固定長コードであるため、検索・置換といったテキスト処理を正しく文字単位で行える。
現在、公用語の文字だけでなく、コード化されていない文字のコード化とフォント・データを作成している。
国際化とは、全世界の文字の混在したテキストの、言語に依存しない同時混在処理である。一方、地域化は、特定の言語で使用される文字のみの処理である。従って、地域化は、国際化の機能の限定的使用である。国際化の実現には、地域化では起こらない問題(縦書きと横書き文字列の混在など)を解決する必要がある(図2)。そのため、複数の地域化を集めても国際化とはなりえない。
図2 縦書きと横書きの混在処理
代表者:小原 啓義 教授 (Hiroyoshi Ohara)、 理工学部 情報学科
研究主任:片岡 裕 (Yutaka Kataoka)
研究員:片岡 朋子 (Tomoko Inagwa Kataoka)
研究員:
研究協力者:ダワ イトムソウ (Dawa Idomuso)、 新彊工学院 助教授、早稲田大学留学中
博士課程:上園 一知 (Kazutomo Uezono)、 理工学部 情報学科
修士課程:佐藤 出 (Izuru Sato)、 理工学部 情報学科
研究業績の参照には、ここをクリックして下さい。
国際化の実現には、実際に使用される文字の知識が不可欠である。そのため、日本では資料を得ることができない文字に関し、調査を続けている。特に、実際の使用法、表記規約、字種の確定が、極めて重要となる。
1996年7月、中国新彊ウイグル自治区において、文字改正の行われた New Uighur Script、New Sibo Script などの文字を調査した。パミール高原は、キルギス族の文字を得るために訪れた。文字を得るため、砂漠とオアシスと高原を踏破した。
96年度中国文字調査旅行
山岡先生の「調査そのものも重要である。」という御示唆により、調査での写真を掲載することとなった。
左から、片岡 裕、砂漠とパミール高原を走破したドライバーさん、片岡
朋子さん、
天才的語学力の通訳のエリキンさん、小原教授、ダワ先生
左のバスで砂漠と高原と川を踏破した、故障は死につながる
撮影は上園君
左端が上園君
パミール高原のカラクリ湖に至るシルクロード上にて
10年以上文字の研究を続けてきた片岡。この時、肺炎に罹っていた(薬学と医学の心得があるのに:)
このような調査には、言語学、民俗学、歴史学の知識はもとより、公衆衛生学と医学的知識が必須である。教えを請いに来たのであって、理論の証明に来たのではないということを熟知し実践しなければ、得られるものは主観だけである。調査では、人間性が問われる。
If you have comments or suggestions, email me at kataoka@mling.waseda.ac.jp