Home > コンピュータ > 機械翻訳

パソコンで使える機械翻訳

新規作成日 2015-12-07
最終更新日

パソコンで翻訳を行うという野望は、コンピューターが登場したかなり初期のころから存在し、数々の試みが行われきています。

現在では、インターネット上で無料で提供できるサービスが存在するため、手軽に利用できる身近なものになってきています。

日本語に翻訳する必要性

英文を多用する人は、英文を日本語に翻訳してから理解するのではなく、英文のまま理解した方が良いと言われています。

しかし、何度も確認する文書であれば、日本語に翻訳してしまった方が、検索性が高くなり、英語が苦手な人でも利用できるようになります。

また、Webサイトで、英文で書かれた内容を翻訳して、日本語のコンテンツとして公開したい場合も日本語に翻訳する必要があります。英文を和訳して公開するだけで、新たな価値が生まれます。

文章を翻訳することで、価値が発生します。この価値をお金に変換できる場合、得られる価値が、作業コストを上回れば、翻訳する価値があります。

翻訳ソフトを外部アプリケーションから操作したり、プログラムから操作する方法は、ぜひ提供してもらいたいものです。

無料で使えるWeb翻訳サービス

インターネット上には、無料で利用できる翻訳サービスが、提供されており利用すると便利です。

業務に関連する書類で、外部への公開に問題がない文章であれば、問題なく利用できます。

これらのWeb翻訳サービスは、AI翻訳の学習のために、文章を集める目的で運用されている場合が多いので、業務に関連する文章の翻訳で利用する場合には、情報の流出に注意してください。

機械翻訳の手法

これらの翻訳サービスで生成された翻訳結果は、ときどき、問題がある訳が提示されます。

英語を日本語に翻訳する場合、日本語として不自然なものは、その時点で排除できますが、日本語として問題がないものの訳として問題がある場合があります。

  • 文の一部の訳が省略される
  • 逆の意味に翻訳される

文章の概略を理解するだけであれば、許容できる場合がありますが、きちんと理解する必要がある文章では、提供された訳から、問題がある訳を排除するために、単語や熟語と、訳で使われた単語との対応を確認する作業は、省略できる段階には無いように思えます。

スマートフォンで利用できる翻訳アプリでは、英会話の音声から翻訳できたり、町中の看板や、料理のメニューを画像から文字認識して翻訳できるものもあるようです。また、専用端末で、会話の翻訳に特化している製品も存在します。

パソコンにインストールする翻訳アプリケーション

会話重視の昨今ですが、文章の翻訳は、変わることなく重要です。

業務に関連する書類で、外部への公開できない場合、外部に翻訳文を公開したくない場合、インターネット上で提供されている無料の翻訳サービスは利用できません。有料の情報保護を謳ったサービスか、パソコンにインストールする翻訳アプリケーションを利用する必要があります。

翻訳業務向けの高価格帯のサービスやアプリケーションと、一般向けの手軽な価格の製品があります。

翻訳業務においても、コンピュータに翻訳させ、その翻訳結果で不十分な文書を人間が翻訳する方法で行われているようです。

翻訳アプリケーションには、いろいろなものがあり、その名称も複数存在します。

  • TMS 翻訳管理システム
  • MT 機械翻訳
  • CAT コンピューター支援翻訳

一般向けの翻訳アプリケーションは、MT機械翻訳のカテゴリーに分類されるものと思われます。

一般向けの手軽な価格の製品には、翻訳メモリ機能が搭載されていないことが多いことに注意が必要です。

翻訳メモリ機能

以前に翻訳した文と全く同じ(完全一致)、あるいは、一部が同じ(部分一致)文があれば、以前に翻訳した訳文を当てはめる機能。人間が翻訳した訳文が提示されるので自然な訳文が得られる。

翻訳メモリの完全一致のみに対応した(登録した対訳が提示される)無料で利用できる翻訳支援アプリケーションが存在します。

  • OmegaT(無料で利用できます)

しかし、このOmegaTは、利用する恩恵が得られる(かどうかは不明)までの対訳の登録作業の手間がかなりの作業負荷になります。

翻訳メモリの完全一致辞書は、著作権の問題が微妙なので、提供が難しいという問題があります。

たとえば、ある書籍のすべての文に対訳を作成して、公開すると、書籍の著作権を侵害する可能性が生じます。もちろん、著作権の問題が発生しない文章だけで作成する方法もありますが、同様の著作権問題は、多くの文で発生するため、名詞を一般化して、部分一致の辞書にする必要があります。これが、AI翻訳サービスが無料で利用できる理由の1つ(対訳を作成する文章の収集)と思われます。

翻訳アプリケーションは、どれを選択しても使い込んで、ユーザー辞書を育てて行く必要があること、自分の翻訳作業にどのように組み合わせていくかを考えて試行錯誤する必要があるので、導入してすぐ、導入効果が現れる種類の製品では無いことに注意が必要です。

コーパス

大量の文章をデータベースに登録し、単語と単語の関連性を調べるツールがコーパスです。

例えば、似たような動作を示す動詞でも、名詞によって使い分けられます。それを確認し、違和感の少ない、読み易い文書を作成するために、どの言い回しを使用するか判断するために使用されます。

単語と単語の関連性は、次の言葉で表現されます。

  • 語彙コロケーション
  • 容認度(acceptability)

英文に対するコーパスは、多くのものが存在し、無料で利用できるものもあります。

コーパスを使用して検索することで、単語の組み合わせの頻出度を確認できます。

対訳データに対するコーパスは存在しないと思われます。

対訳の保存

理想的には、自分で翻訳した文章のすべては、なんらかの方法で、対訳として保存しておくべきです。

似たような文書を、自分が以前にどのように翻訳したか確認できれば、便利です。翻訳メモリの辞書としても利用できる対訳のデータの蓄積と活用は、重要になるはずです。

英文あるいは和文と訳文は、対訳と呼ばれ、翻訳アプリケーションの独自形式になりますが、ファイルに保存できます。

翻訳ソフトを外部アプリケーションから操作したり、プログラムから操作する方法は提示されていないので、手作業になりますが、対訳は、保存して管理することも考慮すべきです。

過去に翻訳した文章と同じ文章が登場したとき、対訳が存在すれば、過去の訳文を呼び出すことが出来れば、翻訳作業を軽減できます。この機能は、翻訳メモリと呼ばれ、翻訳ソフトによっては機能として搭載されています。

便利な方法は、提示されていないと思われるので、自分でプログラムを作成したり、テキストエディタを利用して、作業負荷が高くなりすぎない範囲で、自分なりの方法を見つける必要があります。

自分でプログラミングする

いずれ、作業支援ツールを自分で作成する必要がある場面に遭遇するはずです。

具体的で、明確な利用方法は、思い浮かびませんが、テキストエディタ、ワープロソフト、表計算ソフトのマクロ機能や、開発言語を使ったプログラミング、SQLiteなどのデータベースを扱えるようになっておいた方が良いものと思われます。

汎用テキストエディタの秀丸エディタとそのマクロ機能を使い、翻訳作業を軽減するという記述は、ちょくちょく見かけますが、実際にどういったものなのかという記述は見かけたことがありません。ちょっとした気づき、簡単な操作で、翻訳作業を軽減することができる可能性を示しているものと推測しています。

翻訳アプリケーションを使ってみる

翻訳を支援するアプリケーションには、いろいろなものがあります。

おそらく、そのすべてか、実際に使い込んで自分なりの活用方法を検討しないとうまく活用できない可能性が高いものと思われます。資金と時間の両面からチャレンジを必要とするものと推測しています。

  • いろいろな翻訳アプリケーション

金額的に手軽にお手軽な製品を使ってみました。

翻訳ブレイン

翻訳ブレイン3

最新バージョンは、翻訳ブレイン3です(2011.02.10)。すでに販売終了。発売元は、ジャストシステム クロスランゲージのOEM、サポート、ユーザー対応、アップデート対応は、クロスランゲージ社で行われています。 Windows8以降での使用際は、アップデートパッチ(メンテナンスパック)が配布されているので、入手し、適用する必要があります。 カタログ上の辞書語数は多いですが、辞書パッケージから複数を選択する形式なので、同時に利用できる語数には制限があります。

  • 翻訳メモリを採用した翻訳アプリケーションの中では、低価格です。
  • 内部の文字コードは、Shift-Jisです。
  • 同時使用可能な専門辞書は9種類のみです。ユーザー辞書と基本辞書を含めて、12種類同時使用が可能です。
  • 英文和訳時に、単語の数詞は識別されません。
  • 翻訳メモリは、部分一致に対応しています。しかし、"<"や">"を含む文では、正常に動作しないので、部分一致が利用できません。
  • 1つの翻訳メモリ辞書は、10万文ごとに分割する必要があります。10万文を超える数を登録した翻訳メモリ辞書が存在すると、異常終了の頻度が増えます。

翻訳ブレイン 3を実際に使ってみた。

本格翻訳10

基本辞書340万語に加え、理系分野から芸術、工学、スポーツ分野まで、106分野の360万語の専門辞書を収録

本格翻訳10 Platinumを実際に使ってみた。

機械翻訳についての情報

このエントリーをはてなブックマークに追加

Home PC C# Illustration

Copyright (C) 2011 Horio Kazuhiko(kukekko) All Rights Reserved.
kukekko@gmail.com
ご連絡の際は、お問い合わせページのURLの明記をお願いします。
「掲載内容は私自身の見解であり、所属する組織を代表するものではありません。」