スタンフォード大のチーム、AIでAirbnbの価格を69%の精度で予測するシステムを発表

by Kyle Wiggers Kyle Wiggers on 2019.8.7

Image credit: baloon111 / 123RF

Airbnb の価格予測を人間がやる必要はない — ユーザレビューやレンタル機能などの情報がインプットされた人工知能が予測してくれる。それがスタンフォード大学の院生からなるチームが出した結論だ。彼らは Arxiv.org 上で、機械学習と自然言語処理を活用して将来の Airbnb での価格を予測するシステム「機械学習とセンチメント分析を使った Airbnb の価格予測」に関する論文を発表した。

今回の論文と並行して、研究者たちは最適化したモデルを GitHub にも公開している。

共同執筆者らは以下のように述べている。

来客数にも影響するため、物件のオーナーが Airbnb の宿泊価格を設定するのは簡単ではありません。一方で、利用者側は物件の最適値に関して最小限の知識しかないまま価格が適正なのか判断しなければなりません。

今回の論文の目的は、機械学習やディープラーニング、自然言語処理といった技術を使って、信頼性の高い価格予測モデルを開発することです。そうすることで物件のオーナーと利用者の双方が、物件に関して最小限の情報しかなくても適切な価格判断ができるようになるのです。

価格予測システムをトレーニングするために、研究者たちは公開されているニューヨーク市の Airbnb のデータセットを利用した。これは、それぞれ96の特徴をもつ50,221の物件からなるものだ。彼らは特徴をひとつずつ調べ上げて、頻出する回復不可能な破損フィールドを取り除き、ブール値をバイナリに変換した。さらに、重複を取り除いて、ホスト画像の URL などの役に立たない特徴を削除した(これによって特徴は22まで減った)。チームは元データの90%(39,980のサンプル)をトレーニングに使い、5%(9,996のサンプル)を検証とテスト用に残した。

トレーニングの前に、チームはオープンソースの TextBlob コーパスを使ってユーザレビューのセンチメントを解析し、それぞれに-1(非常にネガティブなセンチメント)から1(非常にポジティブなセンチメント)のスコアを付けた。リスティングごとに関連するすべてのレビューのスコアの平均値を求め、それをトレーニングデータセットに特徴の1つとして追加した。

このチームは線形回帰やツリーモデル、サポートベクター回帰、ニューラルネットワークなどの複数の価格予測用機械学習技術をテストした。しかし、彼らのレポートによると、最も成績が良かったのはサポートベクター回帰で、テストデータに対して69%の R2スコア(現実のデータポイントをどれくらい正確に近似できるかを示す指標)を達成した。

彼らは次のように述べている。

データセットが不均一で、考慮するのが不可能な物件所有者の性格などといった隠れた要因や相互作用があることを考えると、これくらいのレベルの精度は今後に期待が持てると言えます。

彼らは、トレーニングサンプルのさらなる収集や、新たなニューラルネットワークアーキテクチャの実験は将来の研究に委ねるとしている。

<関連記事>

【via VentureBeat】 @VentureBeat

【原文】

ニュースレターの購読について

毎日掲載される記事の更新情報やイベントに関する情報をお届けします!

----------[AD]----------