研究者らが無償のオープンソース版Siriを開発

AppleやMicrosoftのような大手テクノロジー企業は、モバイル機器に搭載されたパーソナルデジタルアシスタント機能を多くの人に提供してきた。そのおかげでユーザはデバイスに話しかけるだけでアラームをかけたり、質問の回答を得たりすることができるようになった。現在、他の企業も新しいオープンソースのソフトウェアを用いて、それぞれ独自のバージョンのアシスタント機能を作成することが可能になった。そのソフトウェアは、Sirius。もちろん、AppleのSiriをもじったものだ。

今日、トルコで開かれている「プログラム言語およびOS向けアーキテクチャサポートに関する国際会議」にて、ミシガン大学の研究者らがSiriusについてのプレゼンテーションを行った（編集部注：原文掲載3月14日）。時を同じくした今朝、SiriusはProduct Huntにも登場した。

「Siriusとは、音声認識、画像マッチング、自然言語処理および質疑応答システムなどのIPA（インテリジェントパーソナルアシスタント）の中心的機能を果たすものである」と研究成果を記載した新たな学術論文で研究者らは述べた。このシステムは、モバイル端末から質問や命令を受け、サーバー上で情報を処理し、モバイル端末上に音声で返答してくれる。

スタートアップの中には独自のスマートアシスタントの開発に躍起になっているところもあるが、まだAppleやGoogle、Microsoftに対抗できる企業はない。Siriusが登場したことでこうした状況は変化する可能性がある。

研究者らは「商用レベルのシステム」の実現を図った。実際、Siriusの音声認識コンポーネントには、人工知能の手法としてトレンドになってきているディープラーニング（深層学習）が組み込まれている。ディープラーニングとは大量のデータを深いレベルのニューラルネットワークに学習させ、その知識に基づいて新しいデータについて推定させるものだ。

研究者らはパーソナルデジタルアシスタントについて記載しているが、それに加えて、Siriusのような複雑な負荷を扱うのに最適なサーバーチップはどれかを決めるテストも行った。

「GPUやFPGAアクセラレータを使用したサーバーでは、クエリ実行のレイテンシを平均して10倍および16倍低くできることを証明している」と彼らは記し、「レイテンシを低くすることで、GPUやFPGAアクセラレータを使用したサーバーのTCO（総所有コスト）をそれぞれ2.6倍と1.4倍減らすことができる」と続けた。

Siriusをさらに知りたい方はこちらから論文全文（PDF）をご覧いただきたい。GitHubに掲載されたSiriusの情報はこちらから。

さらに、こちらはミシガン大学博士課程のJohann Hauswald氏がコマンドラインインターフェイスを用いてSiriusのデモンストレーションを行っている映像だ。