ベトナム大手の検索エンジン「CocCoc」はGoogleを超えるか

SHARE:

【原文】

google-coccoc-search-engine-315x183

1月30日、ベトナムの検索エンジン業界に新しいサービスCocCocが登場した。CocCocは、ここ数月間に登場した大きな国内開発の検索エンジンでは2つ目。ここでいう大きいという意味は、つまり次の通りだ。

「検索評価をする人やその他のスタッフを含め、当社には約400人の社員がいます。マーケティング担当が5人、会計担当が4人、残りのスタッフは技術チームと言ってもいいでしょう。」

と語るのは、CocCocのCEOであるVictor Lavrenko氏。同プロジェクトが開始されたのは2年前だが、ごく最近まで非公開の開発段階にあった。プロジェクト開始当初からの資金投入額は1500万米ドルを超え、スタッフ400人のほとんどが正社員として働いている。この新しい検索エンジンは、Google.com.vnと昨年11月にローンチされた競合サービスと対抗することを目指している。

ロシアからの資金注入

Lavrenko氏はロシアの出身で、同チームのエンジニア40人もロシア出身だ。この40人のエンジニアは故郷のロシアでGoogleと競い合った経験を持っており、ネイティブのサーチエンジンNigmaで市場の20~25%のシェアを確保した。だから、ベトナム市場への完全参入には十分な自信を感じており、参入に同社のエネルギーを向けることにしたのだ。同社は主に、ロシアのベンキャーキャピタリストからの支援を受けている。そのなかには、以前にFacebookにも出資をしているDigital Sky Technologies社も含まれている。

CocCocは実はロシアで展開していたプロジェクトのスピンオフサービスだ、とLavrenko氏はTechinAsiaに説明している。

「CocCocはnigma.ruというロシアでの実験的な検索エンジンが元になっています。このプロジェクトから、良い経験と良いチームを手に入れることができました。そして、私たちは、アイデアもしくは脆弱なプロトタイプを持っているだけという単なるスタートアップではありません。

当社にはすでに、この検索エンジンがありますし、Googleの現社員および元社員を含む多くの専門家がいます。そして、当社が提供する検索機能の質の良さについても、かなりの自信があります。」

「例えば、Googleベトナムの責任者を務めるベトナム人のChristopher Nguyen氏は、ある特定のウェブサイトを検索する場合、検索結果の92%を比較すると、CocCocはGoogleと同程度、もしくはそれ以上の良い結果を出すと考えています。

また、当社には非常に経験豊かなスタッフが大勢います。ロシアの市場シェア率において、3:1という割合でGoogleを打ち負かしたロシアの大手検索エンジンYandexから、約10人ほどのスタッフがCocCocに来ています。当社のウェブ検索チームの責任者はロシアで最初に検索エンジンを開発した者です。その最初の検索エンジンは後に、買収されたインタネットサービスプロバイダーによって潰されてしまったので、その開発者はMail.ruで2度目の開発をし、今では市場シェア率の約10%を獲得しています。

この数字はそれほど大きくはありませんが、Googleの20%と比較できる数字です。また、彼はわずか70万ドルしか持っていなかったので、同プロジェクトへの資金が不足していたにもかかわらず、彼はかなり良い結果を出しました。私自身はMail.ruのCTOで共同設立者でしたが、同社は今では時価総額が70億ドルにも上る、ロンドン証券取引所の上場企業となっています。」

さらに、冒頭にて前述した昨年11月にローンチされたベトナムの新しい検索エンジンサービスWadaにもロシアをルーツにするものがある。同サービスは、Ashmonov & Partnersが開発した検索テクノロジーを元に構築されている。

どうしてロシア人がベトナムの検索エンジンサービスに関わっているのかは私にも分からない。

CocCocの仕組み

CocCocはベトナム語で「ノック、ノック」と言う意味で、同チームがベトナム語に敏感なことを示している。Lavrenko氏は、この新しい検索エンジンはベトナム語を「よりよく理解し、無関係な検索結果を表示することがめったにない。少なくとも、それが私たちの目標ですが」と強調している。

パソコンおたくの人のために、CocCocがGoogleの検索メカニズムと比べて具体的に何が優れているのかをLavrenko氏に聞いてみた。同氏は、Googleのクローラはベトナム以外にあるので、そのリンクが弱いと言う。

CocCocには国内でこれまでにインデックスをつけたページが20億ページあるので、同サービスのその数はGoogleよりも最新であるとLavrenko氏は語る。だが、ベトナム語というのが最も厄介な要素で、それがGoogleにとって厄介な問題であることが既に証明されている。同氏はベトナム語の難しい点について次のように説明している。

「例として、私たちの名前を使って具体的に説明するのが簡単だと思います。『Ed』という言葉の間にはスペースがあることに気付くと思います。といっても、この言葉をタイプ入力するときにはないのですが!これは、ベトナム語が音節によって書かれているからです。

ベトナムでは以前は中国語の文字が使われていました。原則的には、1つの中国語文字に1つの音節が用いられています。ですから、通常、言葉は2つ以上の音節から構成されています。1つの音節しかない言葉でも、ベトナム語には『ペアをつくる傾向』があります。すなわち、単一音節であると告げるのを避けるためだけに、ストップワードや同じ意味を持つ音節を加えるのです。」

「もう1つの具体例は区別的発音符です。これには2つの要素があります。1つめは発音です。例えば、「o」には「o」もしくは「ô」あるいは「ơ」という発音があります。2つめは声調です。「o」には「o」「ó」「ỏ」「ò」「õ」「ọ」の声調があるので、これらすべてを組み合せると「o」には18通りの言い方があります。」

明らかに、CocCocにはこれらの言語的な問題をGoogleよりもはるかに上手く対処する準備ができているようだ。ユーザはこれらの区別的発音符を入力する必要はないが、同検索エンジンがそれを考慮している。これは、Wadaのミッションの中核でもある。Wadaも区別的発音符にはGoogleよりも上手く対応している。CocCocがこの課題をうまく扱うことができても私は驚かないだろう。CocCocは、ベトナム人エンジニアの採用率が高いからだ。

Alexaによると、どちらにしてもCocCocは、その言語的優位があってもGoogleを追い抜くためには相当努力しなければならない。なぜならGoogleはすでにベトナムで一番よく使われているウェブサイトだからだ。同社が開発中の機能の1つにGoogle StreetViewのベトナム版のような「Pho Xa 360機能」というものがある。Googleは現在ベトナムで同サービスを実装していない。

【viaTech in Asia】 @TechinAsia

BRIDGE Members

BRIDGEでは会員制度の「Members」を運営しています。登録いただくと会員限定の記事が毎月3本まで読めるほか、Discordの招待リンクをお送りしています。登録は無料で、有料会員の方は会員限定記事が全て読めるようになります(初回登録時1週間無料)。
  • 会員限定記事・毎月3本
  • コミュニティDiscord招待
無料メンバー登録