日本のAI産業の発展、言語データの確保にかかった

SHARE:

人工知能時代にどう備えるべきか、言語ビックデータ会社Flittoジャパンが語る未来

日本政府が「ソサエティー5.0(Society 5.0)」という4次産業革命のブランドの下、AI産業の発展に拍車をかけている。政府の2018年度予算案に計上された人工知能(AI)関連予算は総額770億4000万円で、前年度比3割り増し、過去最大とのこと。(2018年2月発表)
これにより、ソフトバンク社のペッパーをはじめとするAIロボット、AI自動会話システム(チャットボット)、スマートスピーカー、自動運転(自律走行)音声認識など、AI関連産業が急浮上している。
このように日本がAI業界での競争力を確保していく中で、AI通・翻訳サービスは比較的遅い足取りを見せている。日本はまだ日本企業が開発した独自の翻訳機よりもほとんどがGoogle翻訳を使用している。世界中の訪問者が訪れる2020東京オリンピックを控えて、日本国内でも独自のAI翻訳機を一日でも早く開発しなければならないという声が高まっており、現在、NTTドコモなどが独自AI翻訳機の開発に着手して速度を出している。一方、日本を訪れる外国人観光客の中で最も多くの割合を占めている中国人の場合、中国「百度₍Baidu₎」で開発したAI翻訳機を主に使用している。百度翻訳機は中国内でGoogle翻訳機よりも高い占有率を記録し、中国の国民翻訳機として使われている。

AI翻訳技術の高度化を迅速に進めるためには、ビッグデータ、その中でも言語データの確保が不可欠である。 「良質」の言語データを「大量」に投入するほど、AI認識率及び翻訳値が精巧になるからだ。中国百度翻訳機が、中国語の翻訳でGoogle翻訳より良い評価を受けているのも、中国ユーザーの言語データの確保により有利な環境で開発されたからである。百度は言語データ企業とのコラボレーションなど、多方面で言語データを確保してきたし、Flitto(フリット)もパートナーとして中国語とその他の外国語の言語ペアデータを大量に供給した。日本は AI翻訳技術の高度化に速度を増すにつれ、言語データに対するニーズが急増したが、いざ良質の言語データを供給するほどの企業がほとんどないということが日本国内のAI産業関係者たちの共通の悩みだった。

PR TIMESで本文を見る