Runway は、Google などが支援する AI 動画ソフトウェアとモデルに特化した数億米ドルの資金を持つスタートアップだが、「404 Media」が25日に報じた、同社が何千もの YouTube 動画からデータをコピーする取り組みを行ったとされるスプレッドシートに関する報道を受けて、クリエイターから熱い視線を浴びている。
404 Media は、Runway の元従業員が、「The New Yorker、VICE News、Pixar、Disney、Netflix、Sony、その他多くのメディアやエンターテイメント企業の YouTube チャンネル」を分類し、タグ付けし、トレーニングする計画を示すとされる会社のスプレッドシートをリークし、このデータが Runway の AI 動画作成モデル「Gen-3」であると 404 Media が言う、「Jupiter」と呼ばれる製品に影響を与えたと報じている。
Casey Neistat 氏、Sam Kolder 氏、Benjamin Hardman 氏、Marques Brownlee 氏など、多くのフォロワーを持つ YouTuber もスプレッドシートに含まれている。
我々は、このスプレッドシートの真偽を確かめるため Runway に問い合わせており、回答があり次第、本稿を更新する。
「Gen-3 Alpha」の背後にある毒の木の実?
Runway は先月、初期バージョンの「Gen-3 Alpha」を公開し、そのリアルさが高く評価された。
404 Media は、Runway のスプレッドシートとされるものを Google Sheets で編集したものを、記事内のリンクとしてオンライン上に公開した。
「high_camera_movement」とラベル付けされたスプレッドシートの別のタブには、177以上の異なる YouTube アカウントが含まれている。
クリエイターと批評家をこき下ろす
404 Media は報道の中で、次のように述べた。
スプレッドシートに含まれるすべての動画が Gen-3 のトレーニングに使用されたかどうかは確認できなかった。一部のコンテンツが後でフィルタリングされた可能性もあるし、スプレッドシート上のすべてのリンクがスクレイピングされたわけでもない。
しかし、スプレッドシートの存在そのものと、これらの YouTube 動画のすべて、あるいはいずれかが、Gen-3 Alpha モデル(またはその他の製品)に情報を提供するために、Runway のエンジニアや機械学習アルゴリズムによってコピー、ダウンロード、その他の方法で分析された可能性があると示唆することは、生成 AI の多くのクリエイターや批評家を誤った方向に導いたことになる。
影響力のある技術評論家 YouTuber の Marques Brownlee a.k.a. MKBHD は、X に「まあまあまあ」と投稿し、とろけるようなスマイルの絵文字を添えた。Brownlee 氏 は過去にも、自分の動画で AI をトレーニングしている他人を批判したことがある。
これはこれは。 Runway の AI 動画ジェネレーターが、1,600本以上の MKBHD の動画を含む YouTube の動画を無断でトレーニングしていた。(Marques Brownlee 氏)
Well well well. Runway AI video generator was trained on YouTube videos without permission, including 1600+ MKBHD videos 🫠https://t.co/U4s5KIq1XZ
— Marques Brownlee (@MKBHD) July 25, 2024
とはいえ、彼は以前の動画で、OpenAI の「Sora」のような AI 動画技術にも興奮と熱意を示している。
Here are some of the entries in Runway’s spreadsheet entitled “Video sourcing”, unearthed by @404mediaco …
1. A playlist of all Taylor Swift’s music videos https://t.co/58ARITDb6O pic.twitter.com/7EG75eHaaP
— Ed Newton-Rex (@ednewtonrex) July 25, 2024
YouTuber の Omni こと「Lay It Omni」は、X の投稿でスプレッドシートを 「insane(いかれている)」と呼び、Runwayの盗用を非難した。
guys this is actually INSANE. a former employee of a multi-billion dollar company, Runway, confirmed that they mass downloaded YouTube videos in order to feed their AI. there's a spreadsheet with NOTES showing HOW they swiped videos. Nintendo was on the list. https://t.co/fZ3XvkxmOg
— Omni ☕️ (@InfernoOmni) July 25, 2024
THEY STOLE FROM MIYAZAKI?? AND USED KISSANIME TO GET ANIME VIDEOS OH MY GOD pic.twitter.com/042UNhzJcN
— Omni ☕️ (@InfernoOmni) July 25, 2024
Dustin Hollywood 氏など、過去に Runway のツールを使って制作したことのある AI フィルムメーカーでさえ、同社を盗用とみなし、批判を表明している。
GEN3についてクソ嵐が来るのを感じる…?
企業はいつになったら学習するのだろうか? データを購入し、有料アーティストプログラムを作成し、データを提供する。データを盗むな くそっ。
欲のせいで誰も学ばない。もしあなたが、人々が方法/制度に取り組んでいないと思うなら…(Dustin Hollywood 氏)
I feel a shit storm coming about GEN3.. 😳😬
When are companies gonna learn, purchase your data, create paid artist programs to create and feed you data. DONT FUCKING STEAL DATA. Damn.
No one one learns because of greed. If you think people are not working on ways/institutions…
— Dustin Hollywood (@dustinhollywood) July 25, 2024
しかし、私が Hollywood 氏に対する X でのリプライで指摘したように、すでに複数の企業が、モデルのトレーニングに著作権で保護された動画を明示的な許可や承認、支払いなしに使用していたとして、告発されたり発覚したりしている。
実際、つい最近、Wired(私の妻が編集長として働いている)は、Proof News と共同で、Apple、Nvidia、AI スタートアップのAnthropic(「Claude 3 Sonnet」と「Claude ファミリー」のモデルメーカー)といった大企業も、YouTube 動画の書き起こしを無許可で AI モデルにトレーニングさせていることを発見したとする記事を発表した。
私の考えでは、スクレイピングとトレーニングは、議論の余地はあるものの、合法的なものであり、Google が web をスクレイピングし、検索用にインデックスを作成した前例に支えられている。というのも、Runway はすでに、許可も補償もなく自分のデータをトレーニングしたとしてクリエイターから訴えられている多くの AI 企業のひとつだからだ。そして世論という法廷では、Runway は今日大きな打撃を受けたようだ。
【via VentureBeat】 @VentureBeat
Members
BRIDGEの会員制度「Members」に登録いただくと無料で会員限定の記事が毎月10本までお読みいただけます。また、有料の「Members Plus」の方は記事が全て読めるほか、BRIDGE HOT 100などのコンテンツや会員限定のオンラインイベントにご参加いただけます。無料で登録する