DeepLの翻訳が自然で精度が高いとの記事を読んだのでGoogle翻訳と比較した | そう備忘録

DeepLの翻訳が自然で精度が高いとの記事を読んだのでGoogle翻訳と比較した

DeepL

以前からディープ・ラーニングをベースにしたDeepLの翻訳が自然で精度が高いとの話を聞いていた所にImpress Watchに以下の記事が載っていたので読んでみた。

「DeepL」の驚くほど自然な翻訳に迫る。失敗しない使い方

Impress Watchより

上記の記事中で「単語単位での翻訳精度ではGoogle翻訳や他のサービスと比べて大きな差は感じられないが文脈推測のアルゴリズムがあるので文章(長文)だと話題の流れを理解して自然な翻訳文を引き当てれる強さがある」とあった。

自分の場合、コンピューター関連、LEGOやDeep Learningなどは海外の記事が多いので英語のページを読むことは良くあるのだが正直、英語は”からっきし”なのでGoogle翻訳に頼りっきりになっている。

Chromeで開いて右クリックで”日本語に翻訳”を多用している。

しかしGoogle翻訳もかなり精度が上がってきているとはいえ、日本語にした時に「ん!???」という翻訳も少なくない。

その際は一旦原文に戻して英単語の意味を調べながら英語で読んだ方が自分程度の英語力でも理解しやすかったりする。

  1. Google翻訳で全文翻訳してざっくり文章全体の意味を把握
  2. 意味がイマイチ分からなくて重要な部分は英文に戻して英単語を調べながら自力で翻訳

この2の部分が意外に時間がかかったりするのだがDeepLではどの様な翻訳になっていてるのか興味深い。

試してみる

DeepLのWEB版はこちらのサイトで試すことができる。

翻訳元の記事はForbesのAssembling A Top-Notch AI Team(一流のAIチームの構築)で試してみた。

まずは最初の文章。

Forbes Assembling A Top-Notch AI Team

Even though there are many great AI software tools on the market, you still need to assemble a strong team when it comes to putting together projects. The technology is complex and evolving. There are also the challenges of change management within an organization.

Forbesより

Google翻訳だと、

市場には多くの優れたAIソフトウェアツールがありますが、プロジェクトをまとめるには、強力なチームを編成する必要があります。テクノロジーは複雑で進化しています。組織内の変更管理の課題もあります。

DeepLの翻訳だと、

市場には優れたAIソフトウェアツールが数多く出回っていますが、プロジェクトをまとめる際には強力なチームを編成する必要があります。テクノロジーは複雑で進化しています。また、組織内での変更管理の課題もあります。

ほとんど違いが無い。

自分でも何とか自力で翻訳できるレベルの文章だと大した違いは出ないのだろうと思う。

続いて、自力だと何回も読み直してやっとうっすら意味が分かるか分からないかのレベルの文章。

Forbes Assembling A Top-Notch AI Team

Now the executive sponsor will likely not have enough time to manage the day-to-day activities. This is why there should be a project owner, who will keep the focus on the KPIs (key performance indicators) and the timetables. He or she will also be helpful in dealing with the organizational bottlenecks and politics.

Then there needs to be one or more SMEs (subject matter experts). These are people within the organization who have experience with the area of the business that the AI will be applied. Such a person will be critical for refining the model and coming up with the parameters.

Forbesより

Google翻訳

現在、エグゼクティブスポンサーは、日常の活動を管理する十分な時間がない可能性があります。これが、KPI(主要業績評価指標)とタイムテーブルに焦点を当て続けるプロジェクトオーナーが必要な理由です。彼または彼女はまた、組織のボトルネックと政治に対処するのに役立ちます。 

次に、1つ以上のSME(主題専門家)が必要です。これらは、AIが適用されるビジネスの領域での経験を持つ組織内の人々です。そのような人は、モデルを洗練し、パラメータを思い付くために重要です。

DeepLの翻訳

現在、エグゼクティブ・スポンサーは、日々の活動を管理する時間を十分に確保できていない可能性が高い。そのため、KPI(主要業績評価指標)とタイムテーブルに焦点を当てるプロジェクトオーナーがいるべきである。彼または彼女はまた、組織的なボトルネックや政治に対処するのに役立つでしょう。

次に、1人以上のSME(subject matter experts)が必要です。これらはAIが適用されるビジネスの区域の経験を持っている構成内の人々である。そのような人はモデルを磨き、パラメータを思い付くために重大である。

Google翻訳の方が表現が若干だが回りくどく感じる。

例えば、「これが・・・・プロジェクトオーナーが必要な理由です」よりも「そのため・・・プロジェクトオーナーがいるべきである」の方が自分的には直感的に理解しやすかった。

そう、翻訳した文章って回りくどいせいで意味がイマイチ分からない事が多い気がする。

一方、「refining the model」を「モデルを洗練」と訳したGoogle翻訳と「モデルを磨き」と翻訳したDeepLではGoogle翻訳の方が意味が通る。

この辺はまぁ些末な差なのでどうでも良いのだが。

続いて、

Forbes Assembling A Top-Notch AI Team

Data Engineer or Data Annotation Specialist: This person often gets overlooked—but this is a big mistake. Data for AI projects is usually messy. So there is a need for data wrangling and labeling, which can be tedious and time consuming.

Forbesより

Google翻訳だと

データエンジニアまたはデータアノテーションスペシャリスト:この人物は見過ごされがちですが、これは大きな間違いです。AIプロジェクトのデータは通常厄介です。そのため、面倒で時間のかかるデータのラングリングとラベル付けが必要になります。

DeepLだと

データエンジニアまたはデータアノテーションスペシャリスト。この人は見落とされがちですが、これは大きな間違いです。AIプロジェクトのデータは通常、厄介なものです。そのため、データの整理やラベル付けが必要になりますが、これは面倒で時間のかかる作業です。

前半部分の翻訳はほとんど同じ、しかし最後の1文、”So there is a need for data wrangling and labeling, which can be tedious and time consuming.”の翻訳はGoogle翻訳がwhich以降を文章の先頭にもってきたのに対してDeepLでは後ろに持ってきて”作業”という単語を追加(?)している。

多分、英文の訳し方としては(英語力には全く自信がありませんが)Google翻訳が正解なんだと思う。

which以降はdata wrangling and labelingにかかっているのだし、作業なんて単語は英文中には無いのだから。

だけど文章としては自分はDeepLの方が分かりやすかった。

日本人が書く文章に近いという感じがする。

最後に

全文を翻訳してみたのだけれども、大きな差は無いのだけれどもちょいちょいDeepLの方が分かりやすい箇所があった。

これが自然で精度が高いと言われる理由なのかも知れない。

正確な翻訳というよりも日本語として理解しやすい翻訳をするというイメージが近いのかも知れない。

ただ、英文のページでDeepLを常に使うか?と言われるとちょっと疑問。

なぜなら右クリックで”日本語の翻訳”の方が簡単なので。

Google翻訳でイマイチ意味が分からなかった時やスマートフォンのアプリ(アプリ化はまだらしい)だったらこちらを使いたいと思う。

最後に

この記事が何処かで誰かの役に立つことを願っている。

尚、当記事中の商品へのリンクはAmazonアソシエイトへのリンクが含まれています。Amazonのアソシエイトとして、当メディアは適格販売により収入を得ていますのでご了承ください。

souichirou

やった事を忘れない為の備忘録 同じような事をやりたい人の参考になればと思ってブログにしてます。 主にレゴ、AWS(Amazon Web Services)、WordPress、Deep Learning、RaspberryPiに関するブログを書いています。 仕事では工場に協働ロボットの導入や中小企業へのAI/IoT導入のアドバイザーをやっています。 2019年7月にJDLA(一般社団法人 日本デイープラーニング協会)Deep Learning for GENERALに合格しました。 質問は記事一番下にあるコメントかメニュー上部の問い合わせからお願いします。

おすすめ

質問やコメントや励ましの言葉などを残す

名前、メール、サイト欄は任意です。
またメールアドレスは公開されません。