ロシアの文字認識サービス大手ABBYY、AIを活用した63言語対応可能なリアルタイム認識SDKをローンチ

SHARE:

2-passport-capture-use-case.jpg

ここ数年、コンピュータビジョンが急速に進化している。Word Lens から Google Goggles に至るまで、あらゆるデバイス上で迅速に文字や物体を認識できる機能が開発されており、文書スキャンや時間のかかる OCR の時代と比べると隔世の感がある。

ドキュメントやコンテンツをキャプチャする企業 ABBYY は本日(11月27日)、最新型リアルタイム認識ソフトウェア開発キット(RTR SDK)をリリースしたと発表した。これにより、文字のキャプチャは新たな次元へ進化することが約束される。

私はこのソリューションの動きをロンドンで開かれた AI Europe で目にした。一言で言うと、それは素晴らしいものだった。

このソリューションはスマートフォンのライブストリーミング動画を使い、たとえどのような複雑な文書や物体であろうと文字やデータを即座に抽出することができる。例えば、ユーザがパスポートのデータを提供しなくてはならないアプリをあなたが開発しているとすると、ABBYY の RTR SDK を使うことでパスポートから直接、全ての文書情報を即座にキャプチャして取り込むことができる。

ABBYY はリアルタイムで動作するとしているが、それはあながち間違いではない。私はこのソリューションが身分証明書、銀行の取引明細、運転免許証などから情報を即座に捉えているのをこの目で見た。さらに素晴らしいのは、これが63言語に対応していることだ。Google が現在対応している画像翻訳の言語数をも上回る。

ABBYY の CMO である Jupp Stoepetie 氏はこう語ってくれた。

アプリのユーザはリアルタイムの認識技術を活用することで、印刷物や銀行のカードなどから簡単にデータを入力できます。別の言葉で言えば、リアルタイムで認識することで、モバイルユーザの体験と、顧客とブランドのやり取りを変化させるのです。

デベロッパーはこの SDK を使うと、現実世界の文書データを即座にアプリに取り込むことができるようになる。

迅速で正確、簡単な文字認識とテキスト分類により、印刷物からのデータ入力を必要とするアプリケーションは何であれメリットを受けます。金融、保険、物流、e コマース、コンシューマー、さらには公的機関のアプリケーションと統合することで、リアルタイム認識 SDK は複雑な身分証明、登録、加入手続きをかなり早められます。具体的には口座開設やローン申請、銀行カード情報、IBAN、プロモコードの入力などが考えられます。(Stoepetie 氏)

重要なことに、以上の動作がセキュリティ上の問題に関係することなく行われる。

このテクノロジーは、セキュリティやプライバシー規則の順守が求められる手続きにうまく適しています。いかなる画像もサーバに送信されませんし、デバイスに保存されることもないからです。(Stoepetie 氏)

では RTR SDK 関係で次に期待できることは何だろうか?今後の機能について、アプリのデベロッパーが期待できることは?

Stoepetie 氏は述べた。

現在私たちは認識の正確性向上に向けニューラルネットワークに取り組んでいます。さらに、モバイルデバイス内蔵の最新 AI チップがもたらす機会にも注目しています。Apple iPhone のニューラルエンジン、Huawei Mate 10のニューラル処理ユニットその他の新世代モバイルプロセッサにより、オンデバイスの AI やマシンラーニングが強化されています。そして、ユーザのフィードバックをもとに継続的な改善が可能な私たちのオンデバイスなインテリジェントキャプチャと連動するのです。

ABBYY のリアルタイム認識 SDK は本日(11月27日)より、iOS および Android アプリ用として新規もしくは既存のアプリケーションに統合が可能となる。デベロッパー用ツールキットも本日より利用できる。統合を容易にするためのコードサンプルとクイックスタートガイドのサポート付きだ。

【via VentureBeat】 @VentureBeat

【原文】

BRIDGE Members

BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。
  • 会員限定記事・毎月3本
  • コミュニティDiscord招待
無料メンバー登録