ビデオ会議のZoomは本日(原文掲載日は現地時間で6月29日)、AIを活用したリアルタイム言語翻訳技術を開発するスタートアップKites GmbH(カールスルーエ・インフォメーション・テクノロジー・ソリューションズ、以下、Kites)を買収したことを発表した。買収の条件は公表されていない。Zoomによると、Kitesの12名の研究員チームはドイツに残り、エンジニアリングチームがZoomユーザーのための翻訳機能の構築を支援することになる。
Kitesは、Zoomが今年初めに実施した17億5,000万ドル以上の株式売却後、最初に獲得した企業のひとつとなった。Zoomは1月に米国証券取引委員会に提出した書類の中で、調達した資金の一部をM&A活動に使用できるとしている。3月時点で同社は42億ドルの現金を保有しており、CFOのKelly Stackelberg氏はYahoo Finance Liveのインタビューで、「人材や技術を増強する買収機会」などに充てるとしている。これに先立って昨年2020年5月にZoomは、暗号化通信に特化したセキュリティスタートアップであるKeybaseを非公開の金額で買収している。
Kitesはカールスルーエ工科大学の教員であるAlex Waibel氏とSebastian Stüker氏によって2015年に設立された。Waibel氏は以前、Facebookで言語技術グループを立ち上げ、それがソーシャルネットワークの応用機械学習部門の一部となった経験を持っている人物だ。Waibel氏は、音声翻訳研究の国際コンソーシアムであるC-STARの創設者でもあり、1998年から2000年まで会長を務めている。
Kitesのプラットフォームは、当初、国際的な学術チーム間の対話を促進するためのツールとして設計された。その後、AIを活用した汎用的な翻訳フレームワークへと焦点が拡大されている。
Zoomユーザーが多言語での会話を可能にするサードパーティ・ツールはすでに多数存在する。約80の言語と100の言語ペアをリアルタイムでサポートするLigmoもそのひとつだ。また、人気のプラグインであるWorldlyは、16種類の言語を理解して翻訳することができる。
しかしKitesは、クラウドまたはオンプレミスで動作する自社開発の「最先端」のテクノロジーと予測型AIを活用することで、低遅延かつ最高レベルの翻訳精度を実現すると主張している。トランスクリプトと翻訳されたテキストは、話者が文章を完成させる前にリアルタイムで表示され、文脈を追加してより良い解釈が見つかった場合は自律的に修正されるのだ。
Kitesによると、認識に関してはシステムのエラーレートが約5%、人の会話の遅れはわずか1秒程度だという。Waibel氏とStüker氏はこのように述べている。
「Kitesは言語の壁を取り除き、言語を超えたシームレスな交流を日常生活で実現することを使命としており、世界中の人々を簡単に結びつけるZoomの能力を以前から高く評価していました。ZoomはKitesのミッションを推進するための最良のパートナーであると確信しており、Zoomの素晴らしいイノベーション・エンジンの下で次に何が起こるのか期待しています」。
買収後、Waibel氏はZoomのリサーチフェローとなり、Zoomの機械翻訳の研究開発に助言を与える役割を担うことになる。また、これに合わせてZoomのプロダクト&エンジニアリング担当社長のVelchamy Sankarlingam氏はドイツにR&Dセンターを開設検討中であることも明かしている。
「私たちはユーザーに喜びを与え、会議の生産性を向上させるための新しい方法を常に模索しています。そして機械翻訳ソリューションは、世界中のZoomのお客様のためのプラットフォームを強化するための鍵となるはずです」(Sankarlingam氏)。
BRIDGE Members
BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。- 会員限定記事・毎月3本
- コミュニティDiscord招待