Home > コンピュータ > 機械翻訳

パソコンで使える機械翻訳

新規作成日 2015-12-07
最終更新日

パソコンで翻訳を行うという野望は、コンピューターが登場したかなり初期のころから存在し、数々の試みが行われきています。

現在では、インターネット上で無料で提供できるサービスが存在するため、手軽に利用できる身近なものになってきています。

機械翻訳の手法

提供形態

単体で動くスタンドアロンのものと、翻訳システム本体は、インターネット上のサーバーに存在し、翻訳文章を送信し、翻訳結果を受け取るインターネットサービススタイルのものに分けられます。

スタンドアロンのシステムでは、翻訳すステムの教育を自分で行う必要があるため、おおくの場合、購入時点からあまり成長させることができません。しかし、インターネット上の翻訳システムに、翻訳したい文章を送信する必要がないため、運用する組織の情報流出防止ルールに抵触する可能性は低くなります。製品の中には、部署内の複数のユーザーが部署内のネット回線を通じて同じ辞書を利用できる製品も存在します。その場合、辞書は、複数の利用者で成長させることができます。

インターネット上の翻訳サービスでは、サーバー上の翻訳エンジンや翻訳辞書は、随時更新され、たとえ利用しなくても、翻訳精度は向上していく可能性があります(サービスの中には、公開時点から変化しないものもあると思います)。運用する組織の情報流出防止ルールによっては、利用できない場合があります。インターネットに接続できない場所では利用できません。

利用端末

パソコンやスマートフォンに加えて、専用端末が提供されています。使用端末によって、翻訳システムの利用目的が異なることに注意が必要です。

  • パソコン
  • スマートフォン
  • 携帯型の専用端末

パソコンでは、文章を翻訳する用途が主となります。書籍やマニュアル、カタログ、文献、特許、手紙の翻訳に使用されます。スマートフォンや携帯型の専用端末では、会話や写真で撮影した文章が主な翻訳の対象になります。外国人との会話、飲食店でのメニューや看板などの翻訳に活用されています。

パソコンで行う機械翻訳とスマートフォンや携帯型の専用端末で行う機械翻訳は、大きく用途が異なります。

スマートフォンや携帯型の専用端末で利用する機械翻訳システムが有効な場面

スマートフォンや携帯型の専用端末は、海外旅行や海外からの旅行者の対応、使用する言語の問題で意思疎通が難しい顧客や一緒に働く仲間とのコミュニケーションの補助に役に立つと思います。

学びたい言語のネイティブと一緒の職場や身近に接することができる環境にいる場合、スマートフォンや携帯型の専用端末を利用して、積極的に会話することで、言語を学ぶモチベーションを維持し、機械翻訳で、わからない文章を解読する作業を軽減することが期待できます。話が通じなくて距離を置くよりも、機械翻訳のチカラを借りて、積極的に会話することで、言語の習得が楽になる可能性があります。

インターネットに接続して、利用するシステムの場合、山の上など、インターネットに接続できない状態では、サービスが利用できないことに注意してください。

パソコンで利用する機械翻訳システムが有効な場合

パソコンで機械翻訳システムを利用する場合、インターネットに接続できれば、特に何もしなくても、機械翻訳が利用できます。しかし、きちんと翻訳できているか判断するためには、ある程度、翻訳対象の言語が理解できている必要があります。

インターネット上で利用する翻訳サービス

パソコンから、インターネット上で利用する翻訳サービスには、無料で利用できる翻訳サービスだけでなく、利用料金を支払って利用する翻訳サービスが存在します。

スタンドアロンで動作する翻訳アプリケーション

インターネット上で利用する翻訳サービスでは、翻訳する単語の対訳の辞書登録や翻訳した文章の対訳が登録できないため、間違った翻訳は、ずっと間違ったまま提供されます。

一部には、Google翻訳のように訳された文章の間違い指摘し、翻訳候補として登録できるものもありますが、翻訳により対価をもらっていると、そのようなサービスの翻訳結果の間違いを修正して登録する行為自体が躊躇されます。

そういった場合は、翻訳アプリケーションをが有利です。翻訳アプリケーションの他に、CAT(Computer Assisted Translation 、コンピューター支援翻訳 、翻訳支援ツール)とも呼ばれます。

翻訳アプリケーションを使用する利点

自分で翻訳するよりも翻訳作業の軽減が期待できますが、翻訳技能が高い場合は、使用せずに翻訳したほうが早いといった状況も発生するようです。

確実に正しい翻訳結果が得られるとは限らないため、基本的には、対象の言語を翻訳できる人が利用するツールです。あまり翻訳技能が高くない場合、翻訳作業の負荷が減ることで、多くの文を翻訳することができ、そのことで、技能向上が図れる可能性もあります。

特に、カタコトの場合は、翻訳アプリケーションの補助がなければ、読まない翻訳しない文章を読む機会が生まれることで、技能向上につながる可能性があります。

語学習得に重要な暗記部分をコンピュータに負担させることで、翻訳技能が低い期間でもより安定してそれなりの速度で翻訳できることを目的にしているのが翻訳アプリケーションの存在意義だと思います。

具体的には、利用する事で以下の利点が得られます。

単語の意味を探す作業が軽減できる

単語辞書に登録された単語は、自動で変換されるため、自分で調べて意味を確認する必要はありません。誤った候補が提示されても単語辞書に登録された中から選択する事で修正できます。単語辞書に登録されていない場合は、自分で意味を登録でき、次回から反映されます。

タイプ数が減る

翻訳対象の文章がテキストデータとして得られる場合、自分で翻訳してテキスト入力するより、翻訳アプリケーションが出力する訳語を利用することで、タイプ数を減らすことができます。

訳語の統一ができる

翻訳辞書に登録することで約語の統一ができます。

一度翻訳した文と同じ文は翻訳する必要がない

翻訳メモリ(TM :Translation Memory )機能を持っている製品であれば、一度翻訳すれば、その文の対訳を登録することで、同じ文は翻訳する必要はありません。

マニュアルや技術文書などで、同じ文章がよく使われている場合は、翻訳を重ねるごとに作業量が軽減できます。特に、一部のみ修正された文章の場合は、明らかな作業軽減の効果があります。

訳の抜けを防ぎやすい

一文ごとに訳を対比できることから、訳の抜けを防ぎやすいといった利点があります。

翻訳アプリケーションを使用する問題点

単語登録や翻訳メモリの登録には、その分だけの手間がかかります。そのため、それをしない場合よりも翻訳作業が遅くなります。使用する人の翻訳技能の状況により、登録することが無駄な時間になったり、時間の短縮になることもあります。

具体的には、一定以上の翻訳能力をすでに持っていれば、使わないほうが早く翻訳できる可能性があります。

ゆっくりだけど、ある程度、翻訳できる段階にいる人が、一番、翻訳アルリケーションの利益を享受できるものと推測できます。

CAT(Computer Assisted translation)ツール

CATツールは、一般に高価であるため、翻訳業務で利益を生み出している状態ではないと利用しにくいと思います。1つの目安として、翻訳作業に専従している状態かどうかです。

サービス内容と翻訳作業の効率化の効果と利用料金と収益を判断して活用していく必要があります。

スタンドアロンアプリケーション型

オンラインサービス型

  • Memosource
  • Across
  • Translation Workbench
  • Smartling
  • XTM

翻訳メモリ機能を持つ翻訳アプリケーション

直接翻訳で利益を得ていない状態では、CATツールやサービスを利用する決断はつけにくいと思います。その場合の選択肢になるのが、翻訳アプリケーションです。

Google翻訳などのインターネット上で無料で利用できるサービスが存在するため、翻訳アプリケーションのメリットを想像できません。

そこで、翻訳メモリ機能を持っているアプリケーションが選択肢に入ります。一度翻訳した文と同じ文を次回翻訳した際、登録した訳が現れる翻訳メモリ機能を持っていれば、部分的に変更された文や同じ言い回しが多い、同じ人が書いた文章では、効率的に翻訳できます。

翻訳アプリケーションで、翻訳すればするほど、同じ文章が登場する確率が増えるので、翻訳の効率が向上していきます。

ネットワークで提供されている翻訳サービスや、他の言語の翻訳ソフトに開発リソースを取られているのか、 整理縮小の対象になって開発部門がなくなってしまったのか、開発が停止しているアプリケーションが多いです。 購入時は、その辺りも考えて選択しないと学習させた辞書や翻訳メモリがムダになります。

アプリケーションの特徴は、翻訳メモリです。ただ、低価格のアプリケーションには搭載されていないので注意が必要です。

ここで紹介するアプリケーションの中で、今でも開発が行われているのは、「LogoVista PRO」と「PC-Transer翻訳スタジオ」の2つです。

翻訳メモリとは

以前に訳した文と同じ文があれば、その時の訳を呼び出してくれる機能です。可変部分を指定して、登録することもできるアプリケーションが多いです。 その結果、翻訳エンジンで対応できない文の訳の訳文を呼び出すことが可能です。

また、改訂された原文を訳す際など、同じ文の訳は、以前のものが自動で呼び出されるので、かなり作業が効率化できます。

使用すればするほど、対訳が登録されていくので、翻訳効率が向上していくはずです。

注意点

複数人での作業を考えている場合は、ネットワーク対応しているものが無いか探してみましょう。翻訳辞書、翻訳メモリが共有できる可能性があります。

辞書の登録語数が表記されていますが、同時利用ができない場合があるので、注意が必要です。 存在する辞書セットの中から最大何個かを選択するスタイルが多いのではと考えています。

辞書の登録を増やしていくと動作が遅くなるものも存在します。

添付された辞書の登録語数で製品グレードが分かれていますが、単語登録や翻訳メモリの登録は手間なので、 より、多く辞書や用例が登録されている、高グレードの製品を選択したほうがいいような気がします。

別メーカーの製品に移行する場合は、使用している製品の辞書や翻訳メモリが移行できないか問い合わせてみましょう。

機械翻訳ソフトの位置付け

現状の、機械翻訳ソフトは、翻訳支援ソフトと考える必要があります。つまり、支援してくれるだけです。 そのため、使用者の英語力が低ければ、翻訳した文章は読みにくく意味がわからないものになります。 一度訳した文章は、翻訳メモリにより、その時訳したとおりに再現されます。自動で、完全な訳文を生成してくれるものではないことを理解しておく必要があります。

購入検討時の確認項目

体験版は提供されていないので、ユーザーサポートに購入前相談で問い合わせる必要があります。

  • 内部の文字コードは?Shift-jis、UTF-8、UTF-16のどれかと思われる。Shift-jisの場合は、既に現在では使いにくいので避けたほうが無難。
  • 現在使っている翻訳ソフトの翻訳メモリや翻訳辞書の内容を移行するツールが用意されているか、修正、管理ツールは存在するか、また、使い勝手は?
  • 翻訳メモリの登録可能件数は?
  • 専門辞書の同時使用数に制限があるか?提供されている専門辞書を全て有効にした状態で利用できるか?
  • "."(ピリオド)を含む単語の扱いは?プログラム内では、"."(ピリオド)は、ほとんどの場合、文の区切りとして使用されています。省略単語など、ピリオドを含む単語扱いを確認しておきましょう。
  • 単語の数詞表現に対応しているか?日本語では、数えるものによって、数詞が使い分けが必要です。名詞辞書に、数詞や単・複・単複同型などの情報を登録することができるか、生成される翻訳文に反映されているか?
  • 主に、文頭に使用する独立句の処理は、また、ユーザーで登録は可能か。

LogoVista PRO

LogoVistaは、Webサービスと異なり、翻訳にWebサービスを使わないので、翻訳する文章が外部に漏れる事がありません。

翻訳辞書の大きさの違いから、翻訳辞書の総語数1,119万語のフルパック版658万語のベージック版が存在します。

一度翻訳した英文と和文の関係を記録し、翻訳時に、以前翻訳した文章を利用できる翻訳メモリ機能が搭載されています。また、複数のコンピューターで使用しているLogoVistaの翻訳辞書をネットワーク上で共有することが可能です。

LogoVista PRO 2020は、2019-12-13発売予定です。

  • 翻訳メモリを複数ユーザーで共有使用できる機能が用意されています。

SDL Trados Studio

現在、SDL Trados Studio 2019(2018.10.05)。商業翻訳者を対象とした翻訳ツール。無料トライアル版あり

PC-Transer翻訳スタジオ

購入の際は、優待版の適用条件が広く設定されているので、低価格の対象商品と優待版を購入したほうが、通常版を購入するより安い場合があります。

アカデミック版も存在します。

V26(2019-11-29),V25(2018-12-07)

「翻訳メモリ」機能が、完全一致だけでなく、部分一致にも対応しています。

PC-Transer 翻訳スタジオ V26

amazon 楽天 Yahoo!ショッピング NTT-X Store ヤマダウェブコム ノジマオンライン eBEST ひかりTVショッピング 公式サイト

アカデミック版が存在します。下位製品の「翻訳ピカイチ」には、翻訳メモリ機能がありません。

翻訳ブレイン

最新バージョンは、翻訳ブレイン3です(2011.02.10)。すでに販売終了。発売元は、ジャストシステム クロスランゲージのOEM、サポート、ユーザー対応、アップデート対応は、クロスランゲージ社で行われています。 Windows8以降での使用際は、アップデートパッチ(メンテナンスパック)が配布されているので、入手し、適用する必要があります。 カタログ上の辞書語数は多いですが、辞書パッケージから複数を選択する形式なので、同時に利用できる語数には制限があります。

  • 翻訳メモリを採用した翻訳アプリケーションの中では、低価格です。
  • 内部の文字コードは、Shift-Jisです。
  • 同時使用可能な専門辞書は9種類のみです。ユーザー辞書と基本辞書を含めて、12種類同時使用が可能です。
  • 英文和訳時に、単語の数詞は識別されません。
  • 翻訳メモリは、部分一致に対応しています。しかし、"<"や">"を含む文では、正常に動作しないので、部分一致が利用できません。
  • 1つの翻訳メモリ辞書は、10万文ごとに分割する必要があります。10万文を超える数を登録した翻訳メモリ辞書が存在すると、異常終了の頻度が増えます。

翻訳ブレイン 3を実際に使ってみた。

The翻訳プロフェッショナル

最新版は、The翻訳プロフェッショナルV15(2011.09.09)。 開発は、終了し、サポート対応だけになっている可能性が高いです。

The翻訳プロフェッショナルV15

amazon 楽天 Yahoo!ショッピング 公式サイト

ATLAS 翻訳(公式ページ)

翻訳辞書の登録語数により、フルパック版(辞書843万語、翻訳例文(翻訳メモリ辞書)84万文)とスタンダード版(基本辞書には286万語、翻訳例文(翻訳メモリ辞書)10万5千例文)が存在します。

開発は、終了し、サポート対応だけになっている可能性が高いです。

  • 最新版は、V14.0 (2007.12.14)。開発は、終了し、サポート対応だけになっている可能性が高いです。
  • 体験版があります。
  • 名詞の単語登録に、数詞、単・複・単複同型の登録項目があります。
  • 翻訳メモリは、文全体が登録されます。部分差し替えには対応していないようです。

ATLAS 翻訳スタンダード V14.0

amazon 楽天 Yahoo!ショッピング 公式サイト

Benten(公式ページ)

オープンソースの翻訳支援ツール、翻訳ワークフロー支援ツールです。 2010.10が安定版の最新更新日で、開発が停止しているようです。

関連サイト

形態素解析

  • MeCab (和布蕪)

    関連していないかもしれませんが、オープンソース 形態素解析エンジンです。文節分けと品詞割り当てをしてくれます。

このエントリーをはてなブックマークに追加

Home PC C# Illustration

Copyright (C) 2011 Horio Kazuhiko(kukekko) All Rights Reserved.
kukekko@gmail.com
ご連絡の際は、お問い合わせページのURLの明記をお願いします。
「掲載内容は私自身の見解であり、所属する組織を代表するものではありません。」