Baidu(百度)のディープラーニングフレームワーク「PaddlePaddle」は、人工知能開発競争で中国にどのように貢献するか

SHARE:
Baidu-Building
PaddlePaddle を生み出した Baidu(百度)のシリコンバレー AI ラボ
Photo credit: Baidu(百度)

中国の検索大手 Baidu(百度)は今年、人工知能への投資に力を入れている。Raven Tech(渡鴉科技) などの企業を買収し、また、同社の Institute for Deep Learning からのスピンオフプロジェクトとして新たな AR 研究チームを設立した。

同社は現在、電子機器製造業など中国の伝統産業大手と提携する上で、同社の「PaddlePaddle」(PArallel Distributed Deep LEarning)と呼ばれるディープラーニングフレームワークを活用したいと考えている。

PaddlePaddle の技術責任者である Wang Yi(王益)氏は、Tech in Asia に対してこう語った。

特に中国では、このような企業には AI 技術が必要とされています。テレビ売り場を見てください。古参の Changhong(長虹)も新参の Leshi(楽視)も、売っているテレビは全てリモコンがないのです。代わりに音声認識を使っています。

AI の分野では Google や Amazon のような欧米の企業が脚光を浴びているが、中国の影響力も日増しに高まっている。中国では現在、アメリカより多くの AI 研究が行われている。中国の研究者はその存在感を増してきており、Association of the Advancement of Artificial Intelligence が今年ニューオーリンズで開催した集会は、中国の旧正月と重なったことを理由に日程変更されたほどだ。

中国は強力な国産 AI を求めており、PaddlePaddle がこれに貢献する可能性がある。中国では政府によって Google のサービスが遮断されている。また、言語障壁があるため欧米の AI フレームワークは浸透しにくい。これらの点は PaddlePaddle に有利に働く。

こうしたことから、PaddlePaddle は、ニューラルネットワークの構築と機械学習を手がける中国の開発者にはうってつけだ。ニューラルネットワークは AI を実現するアプローチの一種で、例えばネコの画像を認識し、中国語の会話を文字起こしするなど、様々な能力を学習することができる。

また、他のフレームワークがクラウドでの動作を基本とするのに対し、PaddlePaddle はクラスタで稼働するよう設計されている。クラスタとは相互接続されたコンピュータ群のことで、このため店舗などの現場で実行でき、より細かく制御することが可能だ。ただし、対するクラウドコンピューティングはその設計上、基盤となるハードウェアの能力を開発者が意識しなくてよいという利点もある。

伝統的な企業は通常、クラウドを信頼していないので、あえて利用することはありません。(Wang Yi 氏)

彼らはクラスタを好む。AI 機能を必要としているが、クラウドに重要なデータを持たせたくない企業は多い。同氏はそこにビジネスチャンスを見出した。

彼によると、Baidu はすでに複数の中国企業からアプローチを受けており、現在、国内のスマートフォンブランドや航空会社などと交渉を進めているという。同社は先月、PaddlePaddle で Kubernetes が利用できることを発表した。これは開発者がクラスタ内のコンピュータの負荷管理をすることができるオープンソースのツールである。

XuWei
PaddlePaddle 考案者 Xu Wei(王益)氏
Photo credit: Baidu(百度)

Baidu は、クラスタを利用したディープラーニングで実績を作りたいと考えている。同社がクラウドを得意としないことも大きな理由だ。Baidu は中国でクラウドサービスを展開しているものの、e コマース大手の Alibaba(阿里巴巴)が Alibaba Cloud(阿里雲)を提供しているため、存在感の弱さは否めない。

例えば Google であれば、すでに同社のクラウドサービスが成功しているため、万人に Google Cloud を勧めるのは当然です。しかし今日、当社のクラウドサービス(中略)は非常に小規模です。認知度も低いと言えるでしょう。

だからこそ、Baidu はクラスタ上で稼働するディープラーニングに賭けている。この分野で成功すれば、中国だけでなく世界各地にも PaddlePaddle をアピールできるからだ。

中国へ、そして世界へ

Baidu が競争に打ち勝つための道は険しい。昨年9月、同社は PaddlePaddle をオープンソース化した。Google はすでに2015年11月、Tensorflow をサードパーティの開発企業に公開しており、これと比較して1年の遅れである。多くの開発者はすでに Google のプラットフォームで開発を進めており、PaddlePaddle に人々を呼び戻すには多大な努力が必要だ。

PaddlePaddle は分散コンピューティングの機能を有し、しかも競合と肩を並べる処理スピードを実現しています。同プラットフォームはまだオープンソース化されたばかりですので、それを考えれば驚くべきことです。

香港科技大学の博士課程で機械学習を専攻する Weiyan Wang 氏は、Tech in Asia に e メールでコメントを寄せた。同氏は PaddlePaddle を利用しており、データマイニングと AI の専門家である Qiang Yang(楊強)教授と共に働いている。Qiang 教授は WeChat(微信)を運営している中国テック大手企業 Tencent(騰訊)と定期的に協業している

PaddlePaddle は半年前にオープンソース化されましたが、もっと早い時期か、少なくとも競合他社と同時期にできたはずです。その点は残念です。(Weiyan 氏)

Tensorflow や Torch などの他のフレームワークでは、すでに開発者間で一定の開発文化が形成されており、オープンソースコミュニティで多くのコード提供者を引き付けているという。

一方、PaddlePaddle には強力な武器もある。中国のソフトウェアエンジニアによって開発されたという事実だ。Facebook の Torch や Amazon DSSTNE などの欧米のツールとは異なり、開発資料は中国語と英語の両方が用意されている。また、PaddlePaddle の協力者やコード提供者間のやり取りも中国語で行われることが多い。英語よりも断然理解しやすい。

北京にいる開発者たちが英語で自分のアイデアを伝えることは難しいので、利便性の高い中国語をよく使うことになります。Github でも、多くの PaddlePaddle に関する項目が中国語で書かれています。

英語を話す人がこのコミュニティに参加した場合は不便を感じるでしょうが、ここでは誰もが英語を話せるわけではないので、全員に英語を強制することは難しいです。開発者とのコミュニケーションに支障が出るような場合は、我々 PaddlePaddle 側も中国語を使うことがあるかもしれません。(Wang Yi 氏)

【via Tech in Asia】 @techinasia

【原文】