メディア

4大自動翻訳サービスの実力比較と活用ポイント DeepLの弱点が明らかに

自動翻訳サービスで近年急速にユーザーを増やしているのがDeepLだ。他の自動翻訳サービスと比較してみると長所もあれば短所もあり、無償版と有償版の違いもある。DeepLの特徴や品質、無料版と有料版の比較、複数サービスの効率的な活用についてを解説する。

» 2022年08月09日 07時00分 公開
[土肥正弘キーマンズネット]

 自動翻訳サービスの中でも急速にユーザーを増やしているのが「DeepL」だ。その訳文を他の自動翻訳サービスと比較してみると、長所と短所が見えてくる。複数の自動翻訳サービスで短所を補完し合えば翻訳品質が高くなるが、その際にはどんなツールが利用できるだろうか。

 ヒューマンサイエンスで翻訳事業に長く従事する中山雄貴氏がDeepLの特徴や品質、無料版と有料版の比較について、高野敬一氏が複数サービスの効率的な活用を語った。

DeepL、Google、MS、Amazon、4大自動翻訳の特徴と比較

 DeepLは2017年にドイツでリリースされ、2020年3月に日本語対応した比較的新しい自動翻訳サービスだ。無料サービスがWebで提供され、「こなれた日本語」に翻訳できると近年大いに人気が高まっている。

 同様の自動翻訳サービスとしては、「Google 翻訳」と「Microsoft Translator」が2016年に日本語対応し、「Amazon Translate」は2018年に日本語に対応した。DeepLは登場後間もなくこれら3大自動翻訳サービスに肩を並べる存在になった。先行する3サービスに比較してDeepLが改善している特徴的な点は次の2つだ。

特徴1.段落単位での翻訳

 DeepL以外のサービスは文単位に分割して翻訳するため逐次的な訳になるが、DeepLは複数の文をまとめて段落単位で翻訳する。前後の文脈を理解して翻訳するため、原文にはない単語を訳文に挿入することがある。

 図1はその一例だ。DeepLは原文にはない「2位」「3位」を挿入している。他の翻訳サービスでは「followed by」を「続いた」のように逐語的に訳すが、DeepLはその後の「fourth and fifth」という言葉を理解して訳したのが分かる。

図1 段落単位の翻訳により原文にない訳文も挿入して自然な訳文にする(出典:ヒューマンサイエンスの資料)

特徴2.より自然な言い回し

 例えば図2のように、「highly successful」を「大きな成功を収め」と訳し、「know a thing or two」を「熟知している」と訳すなど、他のサービスと比べて不自然なところのない日本語になる。

図2 原文の直訳ではなく日本語として自然な訳文に(出典:ヒューマンサイエンスの資料)

 ただし、他のサービスと同様に次のような問題点もある。

問題点1.訳抜け

 文節や単語が訳文から抜けることがあり、訳文が丸ごと抜けることもある。DeepLは他のサービスと比較して訳抜けが多く発生する。例えば図3のように、「or not in service」に対応する訳として、他のサービスは「またはサービス中でないときに」のように訳したが、DeepLは対応する部分の訳がない。訳文だけを見れば自然な日本語に見えるため、原文と対比しなければ訳抜けに気付けない。

図3 訳抜けの例(出典:ヒューマンサイエンスの資料)

問題点2.名称誤り

 固有名詞の誤りや用語のブレがある。例えば「ミー文字」と訳すべき「Memoji」を「メモ帳」や「メモジ」と誤訳する。ただしGoogleではアルファベットのまま「Memoji」、Microsoftでは「メモジ」と訳す。Amazonだけが正しく訳せた。

問題点3.敬体や常体の混在

 「である」調と「ですます」調が混在する。DeepLでは1つの段落の翻訳で「する」「できます」などが混在することがある。

 しかし、上記のような問題点は全てのサービスで発生するため、人間による確認と修正は必須である。ただし名称誤りについては、2022年に日本語に対応した用語集機能を利用すれば、あらかじめ用語を登録することで修正可能だ。

DeepLの翻訳品質を他と比較するとどうなる

 4つの自動翻訳サービスの品質を比較してみる。自動翻訳と人による参照訳の類似度を機械的に比較・数値化する「BLEUスコア」を指標に調査した結果を以下に示す。また、DeepLの無料版と有料版の違いについても、中山氏の講演を基に解説する。

 BLEUスコアは高いほど高品質な翻訳であることを示す。0.5以上は「非常に高品質で人手翻訳と遜色ないレベル」、0.4では「高品質な翻訳」、0.3では「理解できる適度な品質の翻訳」、0.2では「文の趣旨は分かるものの誤訳や訳抜けの可能性が高いレベル」となる。実用できる目安は0.3以上だ。

 IT、医療、機械、契約書、特許の5分野の翻訳を試した結果は図4のようになった。DeepLはIT領域の日英翻訳、医療と契約書(英日・日英)、特許(英日)で他サービスよりも優れていて、MicrosoftはITと機械(英日)、Googleは機械と特許(日英)分野で優れた品質を示した。その一方、機械(日英)、医療(英日)、IT(日英)領域ではスコア0.3を超えるサービスがなかった。

図4 自動翻訳4サービスの品質評価の結果(出典:ヒューマンサイエンスの資料)

 2020年の調査の同スコア評価を見ると、その後スコアを伸ばした領域もあれば下げた領域もある。Microsoftは全体的にスコアを上げ、他のサービスもほとんどの領域で上げた。時間の経過によってサービスの品質は変動するということだ。現時点での各領域の1位をまとめると図5のようになる。

図5 2020年と2022年を比較し各領域で最高スコアを得たサービス(出典:ヒューマンサイエンスの資料)
ヒューマンサイエンス 中山雄貴氏

 こうしたランキングが自社文書に対する翻訳品質に当てはまるとは限らない。各サービスで文書を翻訳して評価する必要があり、文書の種類に合ったサービス選択を中山氏は勧めた。

DeepLの無料版と有料版の違い

 DeepLには無料版のほか、「Starter」「Advanced」「Ultimate」という3つの有料版がある。無料版と有料版の大きな違いは、「入力したテキストや訳文、修正した訳文がDeepL側で二次利用されるか否か」である。無料版の場合は原文や訳文、修正文は一定期間DeepL側のサーバに保管され、翻訳エンジンのトレーニング目的で二次利用される。他社が翻訳する際に、自社が過去に翻訳した文書に含まれる情報が入り込む可能性があるということだ。

 有料版では二次利用されないため機密が保持される。社内文書など機密情報が存在する文書を対象にする場合は、必ず有料版(DeepL Pro)を使用すべきだ。

 テキスト翻訳できる文字数の制限にも違いがある。無料版は1回5000文字までだが、有料版では無制限になる。また1カ月でファイル翻訳できるファイル数も異なる。無料版は3ファイル、Starterは5ファイル、Advancedは20ファイル、Ultimateは100ファイルが上限だ。無料版ではファイル翻訳したファイルの訳文の編集ができないが、有料版では編集可能になる。

 新機能の用語集機能にも違いがある。無料版は用語集は1個、登録できる用語ペアは10ペア(同じ用語の英日ペア、日英ペアを登録する場合は2つのペアと数える)、Starterでは用語集1個、5000ペアまで、Advanced以上は用語集2000個、それぞれ5000ペアまで登録できるうえ、用語集はアップロード・ダウンロードが可能なので一括登録なども可能だ。しかし用語集機能は万全ではなく、高い頻度で用語集登録用語が訳文に使用されないことが確認されている。また、Advanced以上はCAT(コンピュータ支援翻訳)ツールへの組み込みが可能になっている。

複数の自動翻訳サービスを効率的に活用するために

 以上からDeepLの特徴と弱点が分かる。他の自動翻訳サービスの長所も生かし、対象文書の種類や対象分野によって使い分けることで品質が上がる。しかし複数サービスの翻訳結果を突き合わせて最良の訳文にするには人手がかかる。そこで別途ツールの導入が有効だ。

 一つの方法は、プラグインを介してCATツールに接続することだ。翻訳会社などのプロユースでシェアの高い「Trados」「memoQ」などは、上記4サービスを含む自動翻訳エンジン用のプラグインを利用できる。

ヒューマンサイエンス 高野敬一氏

 もう一つの方法は、複数の自動翻訳エンジンに対応する自動翻訳サービスを利用することだ。ヒューマンサイエンスの事業推進部の高野敬一氏が推奨するのは、同社が提供する「MTrans Team」だ。

 このサービスではDeepLやGoogle、Microsoftの自動翻訳エンジンにAPIを介して接続(別途契約の必要はない)し、それぞれの翻訳結果を選択して利用できる。例えばDeepLで作成した訳文の一部を、同一画面でMicrosoftやGoogleのサービスによる訳文に差し替え、必要なら人手でポストエディットして最良の訳文に作り変えられる。

図6 MTrans Teamの翻訳画面(出典:ヒューマンサイエンスの資料)

 翻訳対象のファイルサイズ上限が45MBまで拡張され、対象ファイル種類としては、「Microsoft Excel」、CSV、HTML、テキストファイルも対象になる(DeepLでは、『Microsoft Word』や『Microsoft PowerPoint』、PDFが対象)。翻訳上限ファイル数は無制限、各種の校正支援機能を備えており、ポストエディット機能、独自の用語管理機能(用語集、フレーズ集)も利用可能だ。翻訳後は、原文のファイルのレイアウトを反映した訳文をダウンロードできる。

 高野氏は「MTrans Team導入で翻訳業務の人件費が年間900万円から630万円へと、30%軽減した例がある」と言い、費用対効果の高さにも触れた。同ツールは初期費用10万円、月額9000円(ユーザー3人まで)から15万円(ユーザー100人まで)の6段階のプランを用意しており、機能や翻訳エンジン、ユーザー数のカスタマイズに応じるとのことだ。

 CATツールのMEMSOURCE、Trados用のプラグインも提供しており、それらツールでも3つの自動翻訳エンジンが使用でき、自動用語適用、スタイル適用も可能になっている。MTrans製品は無料試用が可能だ。

本稿はヒューマンサイエンスのオンライン講演「DeepL翻訳をビジネスで使うには?〜無料版、有料版(DeepL Pro)の違いを徹底解説〜」を基に、編集部が再構成したものだ。

Copyright © ITmedia, Inc. All Rights Reserved.

会員登録(無料)

製品カタログや技術資料、導入事例など、IT導入の課題解決に役立つ資料を簡単に入手できます。