研究者らが無償のオープンソース版Siriを開発

SHARE:
Image Credit: Bhupinder Nayyar/Flickr
Image Credit: Bhupinder Nayyar/Flickr

AppleやMicrosoftのような大手テクノロジー企業は、モバイル機器に搭載されたパーソナルデジタルアシスタント機能を多くの人に提供してきた。そのおかげでユーザはデバイスに話しかけるだけでアラームをかけたり、質問の回答を得たりすることができるようになった。現在、他の企業も新しいオープンソースのソフトウェアを用いて、それぞれ独自のバージョンのアシスタント機能を作成することが可能になった。そのソフトウェアは、Sirius。もちろん、AppleのSiriをもじったものだ。

今日、トルコで開かれている「プログラム言語およびOS向けアーキテクチャサポートに関する国際会議」にて、ミシガン大学の研究者らがSiriusについてのプレゼンテーションを行った(編集部注:原文掲載3月14日)。時を同じくした今朝、SiriusはProduct Huntにも登場した。

「Siriusとは、音声認識、画像マッチング、自然言語処理および質疑応答システムなどのIPA(インテリジェントパーソナルアシスタント)の中心的機能を果たすものである」と研究成果を記載した新たな学術論文で研究者らは述べた。このシステムは、モバイル端末から質問や命令を受け、サーバー上で情報を処理し、モバイル端末上に音声で返答してくれる。

スタートアップの中には独自のスマートアシスタントの開発に躍起になっているところもあるが、まだAppleやGoogle、Microsoftに対抗できる企業はない。Siriusが登場したことでこうした状況は変化する可能性がある。

研究者らは「商用レベルのシステム」の実現を図った。実際、Siriusの音声認識コンポーネントには、人工知能の手法としてトレンドになってきているディープラーニング(深層学習)が組み込まれている。ディープラーニングとは大量のデータを深いレベルのニューラルネットワークに学習させ、その知識に基づいて新しいデータについて推定させるものだ。

研究者らはパーソナルデジタルアシスタントについて記載しているが、それに加えて、Siriusのような複雑な負荷を扱うのに最適なサーバーチップはどれかを決めるテストも行った。

「GPUやFPGAアクセラレータを使用したサーバーでは、クエリ実行のレイテンシを平均して10倍および16倍低くできることを証明している」と彼らは記し、「レイテンシを低くすることで、GPUやFPGAアクセラレータを使用したサーバーのTCO(総所有コスト)をそれぞれ2.6倍と1.4倍減らすことができる」と続けた。

Siriusをさらに知りたい方はこちらから論文全文(PDF)をご覧いただきたい。GitHubに掲載されたSiriusの情報はこちらから。

さらに、こちらはミシガン大学博士課程のJohann Hauswald氏がコマンドラインインターフェイスを用いてSiriusのデモンストレーションを行っている映像だ。

【via VentureBeat】 @VentureBeat
【原文】

BRIDGE Members

BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。
  • 会員限定記事・毎月3本
  • コミュニティDiscord招待
無料メンバー登録