Internationalized & Multilingual Text Processing Project


International Conference on Multilingual Text Processing (ICMTP '98) was held at Waseda University.
国際シンポ ジウム「マルチリンガルテキスト処理」(ICMTP '98)が早稲田大学で開催 されました。


このホーム・ページの参照には、Netscape 3.X または Internet Explorer 3.X 以降をご使用下さい。
文、図及び写真の転用、ハードコピーの制作、このページへのリンクには、 kataoka@mling.waseda.ac.jp の許可が必要です

Thie Home Page can be referred by Netscape 3.X, Internet Explorer 3.X or upper versions.
Permission by kataoka@mling.waseda.ac.jp is required for:
making 'link' to this page(s), using any statement, picture and photograph in this page(s).

Written by Yutaka Kataoka. Copyright (C) 1997 by Yutaka Kataoka at Waseda University.

Comments or suggestions: kataoka@mling.waseda.ac.jp


プロジェクトの目的

国際化・多言語化テキスト処理プロジェクトは、全世界の全ての文字を混在処理することによって、全世界の言語を含む文書をコンピュータで処理するための研究プロジェクトである。本プロジェクトの成果は、POSIX Operating SsystemX Window System を、全世界のあらゆる言語のテキストの混在処理を可能とする環境に変更する(図1参照)。

public/ml-system2S.gif

図1 早稲田国際化・多言 語環境(実物大:44KB)

図1は、実際に動作している早稲田国際化・多言語環境(System 1)の画面のハードコピーである。この図に表示されていないが、既に使用できる文字が多数ある。

この環境への変更は、OS と X Window System の部分的置換でなされる。後方互換性が極めて高く、ほとんどソースコードの修正をせずにあらゆる文字コードの混在するテキストの処理が可能となる。文字コードの混在と拡張のための ISO 2022、ISO 6429、及び各国の規約を満足している。内部表現は文字で正規化した固定長コードであるため、検索・置換といったテキスト処理を正しく文字単位で行える。

現在、公用語の文字だけでなく、コード化されていない文字のコード化とフォント・データを作成している。


国際化の定義

国際化とは、全世界の文字の混在したテキストの、言語に依存しない同時混在処理である。一方、地域化は、特定の言語で使用される文字のみの処理である。従って、地域化は、国際化の機能の限定的使用である。国際化の実現には、地域化では起こらない問題(縦書きと横書き文字列の混在など)を解決する必要がある(図2)。そのため、複数の地域化を集めても国際化とはなりえない。

public/mix3.gif

図2 縦書きと横書きの混在処理


スタッフ

代表者:小原 啓義 教授 (Hiroyoshi Ohara)、 理工学部 情報学科

研究主任:片岡 裕 (Yutaka Kataoka)

研究員:片岡 朋子 (Tomoko Inagwa Kataoka)

研究員:

研究協力者:ダワ イトムソウ (Dawa Idomuso)、 新彊工学院 助教授、早稲田大学留学中

博士課程:上園 一知 (Kazutomo Uezono)、 理工学部 情報学科

修士課程:佐藤 出 (Izuru Sato)、 理工学部 情報学科


研究業績

研究業績の参照には、ここをクリックして下さい。


調査旅行

国際化の実現には、実際に使用される文字の知識が不可欠である。そのため、日本では資料を得ることができない文字に関し、調査を続けている。特に、実際の使用法、表記規約、字種の確定が、極めて重要となる。

1996年7月、中国新彊ウイグル自治区において、文字改正の行われた New Uighur Script、New Sibo Script などの文字を調査した。パミール高原は、キルギス族の文字を得るために訪れた。文字を得るため、砂漠とオアシスと高原を踏破した。

96年度中国文字調査旅行

山岡先生の「調査そのものも重要である。」という御示唆により、調査での写真を掲載することとなった。

public/kashi3.jpg

カシュガルのバザール前の広場にて(59KB)

左から、片岡 裕、砂漠とパミール高原を走破したドライバーさん、片岡 朋子さん、
天才的語学力の通訳のエリキンさん、小原教授、ダワ先生
左のバスで砂漠と高原と川を踏破した、故障は死につながる
撮影は上園君

public/silk.jpg

パミール高原の古シルクロードの野営地を、川を挟んた新道から撮影(69KB)

左端が上園君

public/silk3

パミール高原の大峡谷、背景のコングル(7719m)の向こう側へ向かう(72KB)

パミール高原内の巨大な盆地の、極めて浅く風で移動する湖(52KB)

コングルを越えると、ムスタグ・アタ(7546m)がそびえる(55KB)

横を越えてきたコングルとカラクリ湖と青い空(標高約3600m)(47KB)

カラクリ湖畔のキルギス族のテント、右遠景に見えるホテルで宿泊できる(41KB)

カラクリ湖は氷河の水、ムスタグ・アタを越えればパキスタン国境は近い(37KB)

public/ykfs2.jpg

パミール高原のカラクリ湖に至るシルクロード上にて

10年以上文字の研究を続けてきた片岡。この時、肺炎に罹っていた(薬学と医学の心得があるのに:)

このような調査には、言語学、民俗学、歴史学の知識はもとより、公衆衛生学と医学的知識が必須である。教えを請いに来たのであって、理論の証明に来たのではないということを熟知し実践しなければ、得られるものは主観だけである。調査では、人間性が問われる。

If you have comments or suggestions, email me at kataoka@mling.waseda.ac.jp