人気本格英文チェッカー「Ginger」が予想する、認識技術に基づいたプラットフォームの成熟

by ゲストライター ゲストライター on 2013.12.27

Dudu Noy※本稿は、The Bridgeでも紹介した英文チェッカー「Ginger」のCMOであるDudu Noy氏による寄稿記事だ。Gingerについては、「恥ずかしい英語におさらばできる無料の本格英文チェッカー「Ginger」が日本で正式ローンチ」を読んでみてほしい。2013年12月には、Androidに対応した英文入力アプリ “Ginger Keyboard” の日本語版をリリースしている。


2014年はCaaSの年と記憶される、あるいは  「Cognition-as-a-Service(サービスとしての認識(技術))」がプラットフォームとして成熟する年になる − Ginger Softwareは、こう予想する。「認識力」は歴史的にも生物における非常に複雑な特質とされている。判断、問題解決、学習、論理的思考、作業記憶を司り、言語だけでなくその能力は、コンピュータサイエンスの多角的な視点から少しずつ解き明かされてきている。

メインフレームからPC、インターネット、クラウド、SaaS、さらにはユビキタスなスマートモバイルまで、過去30年間のコンピューティングの主要な進化過程を見ると、新領域においては大きな転換はないが、拡張はされていることがわかる。同様にCaaSが描く未来は、アプリやサービスをより知的に直感的に動作させ、さらに会話や質問、指令を可能にし、高い効率性と利便性をもってタスクを完了できるようになるだろう。

cloud_ginger

AppleのSiriは、日常的に使われる認識技術として最も有名であるが、Googleが最近行っている会話の文脈を考慮したモバイル向け検索サービスは、拡張的な認識技術領域においてSiriに迫りつつある。双方ともに利用するデバイス自体はユーザーの手の中にあるものの、クラウドサービスではあるので、インターネット接続環境下で動作する。Googleの検索は必ず接続が必要であるが、Siriはスマートフォンのアプリで利用される場合はその限りではない。

音声入力を有効にするための2つの要因である音声認識と自然言語処理(NLP)を行うためには、膨大な量の情報を処理するアルゴリズムを動作させる環境が必要であり、それは手で持って操作できるテクノロジーの域を超えているのだ。

NLPとは、無限に広がる言語の多様性を意味し、ひいては人類を意味し、ゆえに壮大なチャレンジと解釈できる。従来のNLPは、インプットされる情報を既知のインプット情報のリストから探すという柔軟性のないソリューションであった。リストは言語処理を行うために十分な長さになることはなく、凝り固まったルールは新しい言語に適用できなくなるため、恐らくユーザーにおける スマートアシスタントとの会話は、多くストレスを感じるものだったのではないだろうか。

ユーザーが真に必要としているのは、日常使われるような文章を簡単に理解してくれるアプリなのである。例えば、 「ゆうこはりんごが食べたい」という文章を 「ゆうこは欲望を持ち、食べる能力がある何か」 であり、「りんごとは食べられる何か」であると認識できるアプリなのである。想像するのはたやすいが、そのアプリには高度な技術が必要となる。しかしながらGingerをはじめ、数社がそれを可能にしつつあるのだ。

AppleとGoogleだけがその領域に注目しているわけではない。IBMという技術界の巨人が、アメリカの人気クイズ番組 「This is JEOPARDY!(ジョパディ!)」を制したあの 「ワトソン」と同等のレベルというソフトウェアで参入を果たした。たった数ヶ月で医学大に通う2年生と同じ能力を習得できると診断されたそのソフトが、APIとツールキットによってアプリ開発者に提供されるのである。この出来事は、認識技術を搭載するアプリが ワトソン をクラウド上でホスティングされるようになるということだ。IBMのホスティングビジネスにとっても明らかに良いニュースである。

技術ビジネスにとって、プラットフォームモデル は無論新しいものではない。IBMでは近年、数千にものぼる開発者が所属するソフトウェアコミュニティの内部プロジェクトから発足させた 「Websphere application server」というサービスを自身で手がけている。Salesforce.com は、Force cloudというアプリ開発のプラットフォームをもっており、同様にAmazonも、Amazon Web Servicesという独自のストレージおよびサーバー構築のレンタルサービスを行っている。

それらのサービスとCaaSのプラットフォームとでは、一体何が異なっているのか。それは、認識技術はオペレーティングシステムの裏側で稼働しているということだ。アプリはプラットフォーム上で開発され、次々と入力される未知の文脈へ習得した知性を適用していくのである。

GingerはまだAPI機能を公開していないが、近い将来我々のもつ高度な認識技術を世界中の人へ提供していく予定だ。Gingerの技術は、自然言語習得を応用した認識における統計的なアルゴリズムを用いており、ウェブにある何兆という英語の文章データベースを参照している。これにより、ユーザーがアプリを通じてどんなコミュニケーションを試みているのかを理解し、MS OfficeのアプリケーションやGmail、Facebook上などどこでも英文のミスとよりよい表現を提示できるのである。

ひとつだけ確かなことは、認識技術領域を手がけるのはとても面白く、認識技術に基づいたコンピューターが2014年にどう進化するのか今後目が離せない、ということである。

ニュースレターの購読について

毎日掲載される記事の更新情報やイベントに関する情報をお届けします!


----------[AD]----------