BRIDGE

タグ Google翻訳

Google、AIで「男女別翻訳」に対応

SHARE:

Googleは4月22日、文法上の男女別に翻訳する機能を英語からスペイン語、そしてフィンランド語・ハンガリー語・ペルシャ語から英語へのGoogle翻訳においてリリースすることを発表した。新しいパラダイムを活用して翻訳結果を性別に対応した文章に修正することにより、ジェンダーバイアスの問題に対処する。 同社は、すでにトルコ語から英語への男女別翻訳を提供していたが、その根幹となる技術は主にジェンダー中立…

Google via Flickr by YsfYlmz

Googleは4月22日、文法上の男女別に翻訳する機能を英語からスペイン語、そしてフィンランド語・ハンガリー語・ペルシャ語から英語へのGoogle翻訳においてリリースすることを発表した。新しいパラダイムを活用して翻訳結果を性別に対応した文章に修正することにより、ジェンダーバイアスの問題に対処する。

同社は、すでにトルコ語から英語への男女別翻訳を提供していたが、その根幹となる技術は主にジェンダー中立かどうかをデータ集約的に検出する仕組みであった。今回のアプローチはそうではないため、よりスケーラブルだとしている。Google ResearchのシニアソフトウェアエンジニアであるMelvin Johnson氏はこう述べている。

男女別翻訳の質を高め、さらに4つの言語ペアに拡張することで、初めにローンチしたものよりも格段に進化しました。ジェンダーバイアスにさらに取り組んでいくことを約束し、ドキュメントレベルの翻訳にも拡大する予定です。

Johnson氏の説明によると、トルコ語から英語への男女別翻訳に使用されていた従来の分類子は、新しい言語に適応するのに手こずり、ニューラル機械翻訳(NMT)システムを使用して男女別翻訳を個別に出力することができなかったという。さらに、適格なクエリに対して男女別翻訳を表示することができなかった割合は最大40%だった。これは、男女別翻訳結果が、ジェンダーに関する部分以外でも一致しないことが多いからだ。

対照的に、新しいリライトベースの手法では、まず翻訳を生成し、次にそれらをレビューして、ジェンダー中立のソースフレーズからジェンダー固有の翻訳を生み出すインスタンスを特定。それが正しければ、センテンスレベルのリライターがもう片方の性の翻訳文を出力する。最後に、初めの翻訳文とリライトされた翻訳文をレビューし、違いがジェンダーだけであることを確認する。

Googleによると、このリライターは男性形・女性形のフレーズのペアからなるトレーニング用の例文を数百万件使用して構築された。Google翻訳チームは、一言語の膨大なデータセットに対し、性の区別のある代名詞を男性形から女性形(またはその逆)に交換することでリライト候補文を用意した。エンジニアが開発した言語モデルを数百万件の英文でトレーニング。コーパスから、男性形のインプットから女性形のアウトプット、またはその逆のトレーニングデータを抽出した。

双方向のトレーニングデータをマージしたものを使って、1層のTransformerベースのシーケンス間モデルをトレーニングした。次に句読点や大文字・小文字のバリエーションをつけたトレーニングデータでモデルの堅牢性を高め、最終的に男性形または女性形へのリライトを99%の割合で確実に生成できるようになった。

Johnson氏によると、Googleが開発したバイアスリダクションという測定基準で新旧の翻訳システムのバイアス減少率を測定したところ(ここでいう「バイアス」とは、ソースには男女の区別がないのに翻訳結果にはどちらか一方の性が選択されてしまうことを指す)、ハンガリー語、フィンランド語、ペルシャ語から英語への翻訳においてバイアスが90%以上減少。トルコ語から英語への翻訳については60%から95%に改善された。性別の正確性(性別を指定した場合に正しい男女別で翻訳できる割合)は平均97%だった。

改良版のGoogle翻訳システムは、同社がCloud Vision APIから人々の画像を「男性」「女性」とラベル付けする機能を削除してから数カ月後にロールアウトされる。これとは別に、2018年1月、GoogleはGmailの文章を自動的に補完する機能、Smart Composeにおいても推定される性別に基づいた男女別代名詞を使うことを中止している。

翻訳やコンピュータビジョンへのジェンダー中立なアプローチは、AIシステムから偏見をなくすためにGoogleが行っている大規模な取り組みのほんの一部だ。マウンテンビューに本社を置く同社では、AI倫理チームが開発したテストでバイアスを割り出し、予測技術から暴言、人種差別、ライバル会社への中傷や悲劇的な出来事への言及を取り除いている。

【via VentureBeat】 @VentureBeat

【原文】

----------[AD]----------

Google翻訳がさらに高品質にーーヒンディー語、ロシア語、ベトナム語の翻訳にニューラル機械翻訳技術の採用を開始

SHARE:

Googleは今日(原文掲載日:3月6日)ヒンディー語、ロシア語、ベトナム語のテキストをGoogle翻訳にかける際、ニューラル機械翻訳に切り替えることを発表している。Googleのフレーズベースの機械翻訳システムからの移行は、より自然で高品質な翻訳につながる。 Googleはまず昨年9月に英語から中国語、11月に英語、スペイン語、ポルトガル語、フランス語、ドイツ語、トルコ語、中国語、日本語、韓国語…

Above: Google Translate for iOS.:Image Credit: Jordan Novet / VentureBeat

Googleは今日(原文掲載日:3月6日)ヒンディー語、ロシア語、ベトナム語のテキストをGoogle翻訳にかける際、ニューラル機械翻訳に切り替えることを発表している。Googleのフレーズベースの機械翻訳システムからの移行は、より自然で高品質な翻訳につながる。

Googleはまず昨年9月に英語から中国語、11月に英語、スペイン語、ポルトガル語、フランス語、ドイツ語、トルコ語、中国語、日本語、韓国語の翻訳に採用した。今度はさらに3言語をAndroid、iOS、ウェブ用のGoogle翻訳、Google検索、GoogleAppで利用できる。これはGoogleのChromeブラウザのウェブページの翻訳の横に表示される。

今後数週間で、さらに多くの言語でのニューラル機械翻訳のサポートが予定されていると、Google翻訳のプロダクトリードであるBarak Turovsky氏がブログに書いている。この情報は驚くべきものではないが、これらは近い将来に実施されるということだそうだ。Googleは翻訳できる103の言語のすべてについて、ニューラル機械翻訳に移行する予定だという。

ニューラル機械翻訳では、人工ニューラルネットワーク(Googleの場合はlong short-term memory recurrent neural networks/LSTM-RNN)を利用可能なデータでトレーニングし、新しい受信クエリについて推論する。Googleはこのアプローチで、様々な製品においてメッセージへのスマートな受け答えを生成するため、画像内のオブジェクトや人物を認識し、さらにはデータセンターをより効率的に運用するための人工知能(AI)への活用も考えている。

Googleは翻訳してもらうためにAIを開発する会社ではない。マイクロソフトも自社の翻訳アプリで同じことをしている。

Googleは、よりスマートになった翻訳システムを大いに誇りに思っているが、同社は翻訳コミュニティを通じた生の人々の貢献を非常に高く評価している・・・と同時に貢献するのを止めてはいけない、とTurovsky氏は書いている。

【原文】

【via VentureBeat】 @VentureBeat

----------[AD]----------