建築大好きオジサンの覚書

55才からの迷わないマンションリフォーム

AI翻訳ってすごい:Google 翻訳よりVoiceTraを勧める3つの理由と使い方

f:id:shirokumablog:20180818114719j:plain

最近AI翻訳ってすごい精度があがっています。とりわけおススメなのがVoiceTraです

 VoiceTraをご存じでしょうか?情報通信研究機構(NICT)が2017年6月に一般に開放した翻訳システムです

日本勢が一丸となって開発に取り組んでいるVoiceTra、まだ開発途上ですがなかなかいい感じに仕上がっています。ボクは別に関係者じゃないですが、このアプリは注目しています

Google翻訳に満足いかない時、是非VoiceTraを試してみてくださいね

voicetra.nict.go.jp

 VoiceTraアプリのダウンロード方法

別のアプリを間違ってダウンロードしてしまう方が増えているようです。くれぐれもご注意ください。「ボイストラ」で検索して表示されるアプリは別物です!

  • iPhoneからAppStoreで「NICT」と検索します
  • アプリ名はVoiceTraです(緑色が基調で、男女が話しているアイコンです)
  • ダウンロードも使用もすべて無料です 

VoiceTraを勧める3つの理由

情報の秘匿性に配慮

Google翻訳は背後に莫大なデータがあるので、翻訳精度が非常に上がっています。しかし、内容を公開したくない文章を翻訳したいときはGoogleさんにデータが吸い上げられるので、使用がはばかられます。情報の秘匿性を考慮すると、一企業のGoogle翻訳をビジネスで使うのは考えものです

その点、VoiceTraは国立研究所の情報通信研究機構(NICT)が開発していて一企業に依存していないので、安心感があります。日本の技術の漏洩を防ぐために総務省もVoiceTraの開発に予算を集中的に割いています。またNICTの中の先端的音声翻訳研究開発推進センター(ASTREC)には多数の日本企業からの研究者が出向して開発に携わっています。エンジニアの方々はがんばっています!

VoiceTraは音声入力が基本だが文章でも確認可能

実際の使用状況を想定して、VoiceTraの翻訳は基本的に音声入力です。会議や観光などを想定しているので、音声入力は実装に便利です。また、入力した日本語を表示した上で、「こう翻訳しました」の英文の下に「翻訳の意味はこれです」と日本語が出ます。これがすごく使い勝手がいいなと思います。

Google翻訳では「実際どういう風に日本語を解釈して英訳したのかな」と不安に思うこともが多々あります。もちろん途中で「もしかして」と予測変換は出るのですが、最終的にGoogle翻訳が何を判断基準にしているかが分かりません。

その点、VoiceTraは「あなたの日本語をこの機械はこう解釈して訳しています」と提示されるので確認できます。この安心感がいいですよね

翻訳結果の読み上げがスムーズ

これはもう趣味の問題ですが、シニアのボクにとってはGoogle翻訳の音声読み上げより、スムーズに感じました。女性の発話の仕方もトーンもとても聞きやすいです

AI翻訳をうまく使いこなす3つの方法

アタマに浮かんだ日本語をダラダラ入力しない

AI翻訳をうまく使うには、ダラダラした日本語を入力しないことが一番です。AI翻訳の精度は上がっていますが、それでもなかなかボクらの意図を忖度できません。

つまりAI翻訳を使う時は以下の点を少し意識するだけでも制度が上がります

  • 日本語の文章を短くくぎる
  • 「主語」「動詞」「目的語」を意識する

日本語の文章を短くくぎる:ラザニアを作るように主張を重ねよう

ダラダラとアタマに浮かんだ日本語を入力しても機械は分かりません。ま、人間もダラダラ言われたら分かりませんけれどね。

まず日本語を短文に切ってみましょう。イメージとしては、ラザニアです。

f:id:shirokumablog:20180818185758j:plain

自分の「言いたいこと」をラザニアのパスタとしましょう。それをまず短く切ります。ラザニアを小さな容器で作るイメージです。小さく切ったラザニアを茹でて重ねていくのです。間に「言いたいこと」の「根拠」をラザニアの具のようにはさんていく感じですよ。

短文で十分です。一つひとつ「主張」と「根拠」を重ねて大きなラザニアを作り上げるイメージです。

パスタの間の具は「言いたいこと」をしっかりサポートします。間の具だからとおざなりにせず、気を配ってちゃんと味付けしましょう。

サポートの事例がたくさんあれば、それも短文にしましょう。具たっぷりのラザニアになるイメージで短文を積み重ねましょう

  • 理由
  • バックグラウンド
  • 状況
  • エピソード

などが「言いたいこと」すなわち「主張」をサポートする「根拠」ですね。短文で重ねていきましょう。美味しそうなラザニアが出来上がるでしょうか?

「主語」「動詞」「目的語」などを意識して入力しよう

AI翻訳は英語から日本語への変換は比較的うまくいっています。問題は逆方向、日本語から英語への変換が今一歩なことです

まず、日英の語順がスムーズな翻訳のさまたげになっていることはボクらでも想像できます。次に考えるべきは、日本語特有な使い方を英語に寄せてあげることです。「主語」「動詞」「目的語」を少し意識するだけでも違います。

さらに、誰が「動作をする側(動作主)」で何が「動作をされる側(被動作主)」であるかを明確にするとかなり精度があがります。

実際に見ていきましょう

最初の例:そのままダラダラ日本語を入力してみたら

例えば

「Facebookは情報の漏洩が心配で最近は遠ざかっている」

を翻訳サイトに入れてみましょう

「誰」が「何」に「遠ざかっている」かが明確に指示されていません。また、「遠ざかる」という動詞があいまいですよね

Facebook has been away recently due to concern about information leakage.

Facebook is concerned about the leakage of information and has been far away lately.

上がGoogle 翻訳で、下がVoiceTraの訳です

案の定、残念な出来になってしまいました。「遠ざかる」という日本語に引っ張られてしまっています。また主語(動作主)が明確でないのが影響しています。Facebookの会社が懸念しているようになってしまっています

 「主語」と「動詞」を意識してみる

「Facebookは情報の漏洩が心配で僕は使わない

Facebook is concerned about leakage of information I do not use it recently.

Facebook is concerned about the leakage of information, so I don't use it these days.

上がGoogle 翻訳で、下がVoiceTraの訳です

「主語(動作主)」を入れてあげたので、後半の"I”はしっかり提示されました。 また「遠ざかる」の代わりに「使わない」としたのでより明確になりました。動詞を分かりやすくしたので動詞の後の目的語もきちんと入りました。

しかし相変わらず「僕が心配している」ことが反映されていません。Facebookの会社が心配しているような翻訳になってしまいました。

それでも、VoiceTraは前の文と後の文のつながりにも配慮することで論理的に展開しようと何とかがんばっています

「連語(助動詞+接続助詞)」や「接続詞」を意識する
  • 自分の主張の意図を明確にする
  • 日本語の段階で論理的に考える

がAI翻訳をうまく使うコツです。今回は「連語」を入れてみました。使った連語は「なので」です。解釈はいろいろありますが、「断定の助動詞『だ』の連体形『な』」と「接続助詞の『ので』」の組み合わせと今回は考えました

「Facebookは情報の漏洩が心配なので僕は最近使わない」

Since Facebook is concerned about leakage of information, I do not use it recently.

Facebook is concerned about the leakage of information, so I don't use it these days.

上がGoogle 翻訳で、下がVoiceTraの訳です

Facebookの会社が心配していることは相変わらずですが、前後の文章のつながりは明確になりました。

連語でなく、より明確に接続詞でもトライしてみましょう

「Facebookは情報の漏洩が心配だから僕は最近使わない」

Since Facebook is concerned about the leakage of information I have not used it recently.

Facebook is worried about the leakage of information, so I don't use it these days.

上がGoogle 翻訳で、下がVoiceTraの訳です。

Google翻訳の方はinformationとIの間になぜかコンマがなくて分かりづらいです。いずれにせよ、Faceookの会社が心配しているという英訳になってしまっています

「主語」を英語の構造に近い場所に置く

僕はFacebookの情報漏洩が心配だから最近使わない」

I do not use it recently because I am concerned about leakage of Facebook information.

I'm worried about Facebook information leakage, so I don't use it these days.

上がGoogle 翻訳で、下がVoiceTraの訳です。

目的語のitが最初に出てきてしまうGoogle翻訳よりVoiceTraの方がより自然な構成の英語に近いですね。またrecentlyの副詞の位置や冠詞がGoogle翻訳は最適ではないです。

VoiceTraの方はだいぶ良くなりました。VoiceTraがんばりました!

まとめに代えて:どんどんVoiceTraを使ってみよう! 

VoiceTraは情報通信研究機構(NICT)の研究成果を使用しているアプリです。オリンピックに向けて今は特に「誤り」を精査しようとしているので、どんどん使ってみましょう。そうして「誤りの報告」をガンガンしてくださいね。アプリの右上の表示に「誤り報告」があるので、そこからアクセスできます

「誤り報告」のボタンを押すと

  • 音声認識結果(自分が吹き込んだ音声との乖離)
  • 翻訳結果(翻訳の結果に満足がいかない場合)
  • 逆翻訳結果(英語翻訳の元になっている日本語の表記)
  • 合成音声結果(読み上げてくれる英語音声)

の4つが表示されるので、該当箇所にチェックを入れて報告するだけです。とても簡単です

ボクは家で気軽に出来るオリンピックのボランティア活動と考えて、積極的にVoiceTraを使うようにしています。そうして「誤りの報告」をすることでこの翻訳システムの性能の向上に少しでも貢献したいと思っています

たくさんの方が使用してたくさんの間違いを指摘することで翻訳システムの精度があがることは、Google翻訳でもよく知られていることです。

たとえば、Google翻訳の「日本語→フランス語」変換は比較的スムーズと言われている背景に、「日本のアニメや漫画を読みたい」フランス人の熱意があるということはフランス語学習者界隈では有名です

さぁ、VoiceTraを皆でお利口さんにしようではありませんか!

www.shirokumablog-renovation.com