アイヌ語・日本語対訳データの構成と検索ツールの開発

 [概要]
 アイヌ語・日本語機械翻訳システムの構築やアイヌ語と日本語の比較対照的な考察にとって,アイヌ語・日本語対訳データは,有用で基礎的なデータとなる.本考察では,アイヌ語・日本語対訳データの基本的な構成と対訳データの構成を考慮に入れた検索ツールの開発を進めている.

[例:アイヌ語・日本語対訳データの基本構成要素]
   exp0100601:usey e=ku rusuy ya ?
   exp0100602:名詞 人接=他動詞 助動詞 終助詞 ?
   exp0100603:お湯 あなた=飲む たい か ?
   exp0100604:名詞 代名詞=他動詞 助動詞 終助詞 ?
   exp0100605:お湯を飲みたいか?
   exp0100605:お湯が飲みたいかい?


 [例は,「中川裕,中本ムツ子:エクスプレス アイヌ語,白水社,1997.」から]

[アイヌ語・日本語対訳データの構成]
  上の例は,次のような6層の情報から構成される単位を基本構成要素としている.
   付加コード1:アイヌ語文(原著の)
   付加コード2:アイヌ語品詞列
   付加コード3:日本語単語直接翻訳
   付加コード4:日本語品詞列
   付加コード5:日本語訳1(自然な)
   付加コード6:日本語訳2(原著の)

このように,情報源となる文献資料に依存して,対訳データは階層的な構成となり,また,その層は必 ずしも6層とは限らない.例えば,「切替英雄編著:アイヌ神謡集辞典,大学書林,2003」における 「知里幸恵編著『アイヌ神謡集』」の対訳データの構成では7層の基本構成要素が考えられる.
   付加コード1:アイヌ語文(原著:知里幸恵編著)
   付加コード2:アイヌ語文(切替版)
   付加コード3:アイヌ語品詞列
   付加コード4:日本語単語直接翻訳
   付加コード5:日本語品詞列
   付加コード6:日本語訳1(自然な)
   付加コード7:日本語訳2(原著の(切替版))


[層指定検索ツールの試作]

・データの階層:6を指定している.
・検索する階層:1を指定している.
・階層1には,アイヌ語文が納められているので,検索する語"ku"をアイヌ語文の中に検索し,それを含む構成要素を出力している.
・2つの層を指定して,それぞれに含まれるキーワードを指定して検索する機能の実現を検討中である.

・システムはJavaで作成されている.


視覚・画像情報処理研究グループへ
ロボット・制御情報処理研究グループへ