6. 自動翻訳によるコミュニケーションの実用性



6.1 自動翻訳によるメッセージ伝達モデルと誤訳の発生原因

 掲示板に投稿されたメッセージのログを分析結果から,メッセージの伝達のモデルは図6.1のように表した。メッセージ発信者の発信した事柄が,メッセージ受信者に理解されるまでにはつぎのような過程が存在する。

・原文の表現の過程
メッセージ発信者は,自分の言いたいことをテキスト入力して発信文書を作成し掲示板に登録する。
・原文の解釈の課程
自動翻訳システムは,文法知識,語彙知識をもとに,発信文章の意味を一文ずつ解釈する。
・翻訳文の表現の過程
自動翻訳システムは,文法知識,語彙知識をもとに,解釈した内容を相手国語に変換し,翻訳文章を提示する。
・翻訳文の理解の過程
メッセージ受信者は,さまざまな背景知識を駆使して翻訳文章の意味するところを理解する。
図6-1 自動翻訳による情報伝達モデル

 原文の表現,原文の解釈,翻訳文の表現,翻訳文の理解というそれぞれの過程においては,誤りの混入や情報の修復が行われる。メッセージ発信者とメッセージ受信者の間でコミュニケーションが成立するかどうかは,単に自動翻訳システムの翻訳の性能だけによるのではなく,メッセージ発信者,メッセージ受信者という人間系にも依存している。

「原文の表現」の過程
 メッセージ発信者が発信文書を入力する際には,以下のような誤りが発生する可能性がある。

・表記の誤り
誤字,仮名遣いの誤り,タイプミス,ミススペル,句読点の過不足,分かち書きなど。
・使用語彙の誤り
個々の言葉の使い方にあやまりがある。「見れる」のような用言の活用の誤りもこの範疇に入る。
・文構成の誤り
一つの文を作成する際に,文法に沿った表現になっていない。
・論理の誤り
文章を構成する文がいくつかある場合に,それぞれの文の間の関係が明確でない。
・背景説明不足
相手が知らないことを背景説明なしで書いてしまう。

「原文の解釈」の過程
 自動翻訳システムが発信文章を解釈する際には,以下のような誤りが発生する可能性がある。

・構文解釈の誤り
主語・述語の関係,修飾関係,呼応関係など各文の構造の解釈の誤り
・語彙解釈の誤り
個々の言葉の意味の解釈のあやまり。意味の解釈については、上記の構文解釈と密接な関係があることが多いが、言葉自体が辞書に登録されていないこともある。
・文脈理解の誤り
文または文章の全体の意味をとらえずに,個々の語,文の意味をとらえようとしているため、誤った解釈をしている。


「翻訳文の表現」の過程
 自動翻訳システムが,解釈した内容を相手国語に変換し,翻訳文章を提示する際には,以下のような誤りが発生する可能性がある。

・構文構築の誤り
翻訳文の構文を組み立てるときの誤り。言いたい内容としては、正しく解釈されていても、文法的に正しく表現されていない場合は,ここに分類される。
・単語・表現の誤り
翻訳文の中で使う単語や表現が適切なものになっていない。

「翻訳文の理解」の過程
 メッセージ受信者が,翻訳文章の意味するところを理解する際には,翻訳文章そのものを言語的に理解するだけでなく,利用可能なさまざまな手段を用いて情報を修復することが可能である。文章全体の文脈,事前に相手から得た情報,一般常識等の知識の利用が考えられる。


6.2 自動翻訳によるコミュニケーション実現性評価

6.2.1 コミュニケーション実現性の評価方法


(1) 掲示板上の翻訳ログデータからの評価

 掲示板上で交わされたメッセージのログデータからコミュニケーションの実現度を評価するとともに,コミュニケーションを阻害する要因について分析した。掲示板は,各学校の教師および児童・生徒が使用したが,ここでは児童・生徒のログデータを分析の対象とした。


(2) 評価基準

 上記のメッセージ伝達モデルに従って,以下の評価項目を設定した。
 原文の入力
  ・表記ミス
  ・語彙・語法の誤り
  ・説明不足
 原文の解釈
  ・構文解釈
  ・語彙解釈
 翻訳文の表現
  ・表現・語法
 翻訳文の理解
  ・理解困難


 ここで,「原文の表現」の「使用語彙の誤り」と「文構成の誤り」は,明確な区別が難しいため「語彙・語法の誤り」として統合した。同様に,「翻訳文の表現」における「構文構築の誤り」と「単語・表現の誤り」については,区別しにくいので,「表現・語法の誤り」として統合した。
 また,現時点の自動翻訳システムは,一文ずつの翻訳をするため,文と文の間の論理や文脈まで考慮できないことがわかっているため,「原文の解釈」の「文脈理解の誤り」は,項目としては採用しなかった。さらに,入力文が比較的短く,「原文の表現」の「論理の構成」の問題は,結果的に発生しなかったため,実験結果の表上では省略している。


(3) ログデータの評価方法

 掲示板上のメッセージをどのように理解したのかを個々の児童・生徒にメッセージごとに分析的に評価してもらうのは現実的でないため,児童・生徒には全体的な理解度をアンケートで尋ねるに留めた。個々のログデータの評価については,筆者の一人である森本が評価を行った。また,理解が困難なメッセージについては,何が原因で理解が困難なのかも分析した。
 投稿メッセージは,一般には複数の文で構成されているが,1メッセージ内の文数はさまざまであるため,メッセージ単位で理解度を比較することは困難である。ここでは,メッセージを構成する一文ずつについて評価を行った。以後,メッセージ文と呼ぶ。評価は,該当するかしないかの2値で行った。



前のページへ 次のページへ