Press Release

ヒトの読解能力を超えたAIの最新言語モデル、日本語版初公開！

ストックマーク 2019.10.25

～ビジネス文章データを学習したXLNet事前学習済モデル～

日本語の文章を解析するAI（=自然言語処理技術）の研究開発をするストックマーク株式会社（https://stockmark.ai/　本社：東京都港区、代表取締役CEO：林達、以下「ストックマーク」）は、2019年10月25日、ディープラーニングを用いたアルゴリズムであるXLNet（エックスエルネット）の日本語事前学習済モデルを初公開いたしました。
様々なタスクを高精度で解くという意味でこれまで最も良いとされていたのは「BERT」と呼ばれるモデルで、日本語のBERT事前学習済モデルとそれ以前にはELMo学習モデルにおいても公開してまいりました。この度は、20を超える評価タスクでBERTの精度を超えたXLNetについて、大規模日本語ビジネスニュースコーパスを学習したXLNet（MeCab+Sentencepiece利用）モデルを初公開します。XLNetを適用することにより、特にエンティティ抽出の精度がさらに向上し、これまで人が文章を読まないと判断できなかったビジネスおける新しい製品名やサービス名、新興企業などを事前の辞書（コーパス）なしに自動抽出することが可能となり、大量のビジネス文章から精度のよい洞察を導くことが可能となります。

▼モデルのダウンロードリンク及び詳細はこちらから
https://qiita.com/mkt3/items/4d0ae36f3f212aee8002

▼自然言語処理とは
人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術であり、人工知能と言語学の一分野です。

▼ディープラーニングとは
人間が自然に行うタスクをコンピュータに学習させる機械学習の手法の一つです。

▼XLNetとは
ディープラーニングを用いた自然言語処理は翻訳、QAタスク、文書分類など多岐にわたるが、それらのタスクを解く際は、タスクにまたがって有用な表現を教師なしで取得する「事前学習」と、事前学習の結果をもとにタスク用に再学習させる「微調整(fine-tuing)」という２段階にわけるという手法が近年とメジャーとなっています。
事前学習においては、BERTという手法と、Seq2Seqという自己回帰を用いた言語モデルの２つが頻繁に使われています。
BERTは、順方向・逆方向の情報をうまく扱えますが、予測対象の単語同士の依存関係を学習しにくいという特徴があります。一方、Seq2Seqのような自己回帰言語モデルは順々に単語を読み込ませるため、予測対象の単語同士の依存関係を学習できますが、順方向・逆方向の情報を同時に扱えないという問題がありました。
XLNetは、予測対象の単語同士の依存関係を学習できる自己回帰言語モデルでありながら、自己回帰言語モデルの弱点でありBERTの良いところである「順方向・逆方向の情報を同時に扱える」性質を持っています。

▼ストックマーク株式会社　会社概要

PR TIMESで本文を見る

Press Release

AI inside、テレビ朝日に人工知能（AI）技術提供

AI inside 株式会社 2019.10.25

―「ZOZO CHAMPIONSHIP」にて、リアルタイムで選手名を変換― 　AI inside 株式会社(本社：東京都渋谷区、代表取締役社長CEO：渡久地択、以下「当社」)は、株式会社テレビ朝日（本社：〒106-8001　港区六本木6-9-1、以下「テレビ朝日」）の日本初開催となる PGA TOUR トーナメント「ZOZO CHAMPIONSHIP」にて、人工知能（AI）を技術提供したことをお…

PR TIMESで本文を見る

Press Release

フラッグシップオーケストラ、コーポレートサイト＆ロゴをリニューアル

株式会社フラッグシップオーケストラ 2019.10.24

サイト、ロゴのリニューアルに加え、新たなフィロソフィーを策定し、更なる飛躍を図る動画制作のプラットフォーム「ムビラボ」を運営する株式会社フラッグシップオーケストラ（本社：東京都品川区、代表取締役社長：大澤穂高　以下フラッグシップオーケストラ）は、コーポレートサイト、並びにロゴ、フィロソフィーをリニューアル致しました。 2014年創業以来5期連続で大幅な成長を遂げているフラッグシップオーケストラ。…

PR TIMESで本文を見る

Press Release

【11/8開催】“生の声”が聞けるセミナー「#MarketingLIVE Vol.5」クラシル・FiNC・ココナラから学ぶ！～アプリによるユーザーエンゲージメント向上の外せないポイントとは～

株式会社D2C R 2019.10.24

日時：2019年11月08日(金)17:00～日時・場所： 2019年11月08日（金）17時30分～（受付17時00分）東京都中央区銀座6-18-2 野村不動産銀座ビル5F 「株式会社D2C内」アクセス：会場の地図はこちらよりご確認ください（https://www.d2cr.co.jp/company#access）参加費：無料参加人数：250名セミナー対象者：アプリデベロッパー、ア…

PR TIMESで本文を見る

Press Release

【医療×IT】延べ100万人の学会会員医師にコミュニケーションツールを提供するメディカルマスターズ第2回株式投資型クラウドファンディングを開始

株式会社メディカルマスターズ 2019.10.24

～学会からの情報発信をもっとアクティブに、そしてもっと交流を！～医学系学会導入型のコミュニケーションチャネル「MEDICAL MASTERS」のアプリ開発、サービス提供を行う株式会社メディカルマスターズ（東京都千代田区代表取締役：本岡守）は、株式投資型クラウドファンディングサービス「FUNDINNO（ファンディーノ）」において、2019年10月 30日（水）より募集による投資申込みの受付を開…

PR TIMESで本文を見る

Press Release

飛行機×ヘリコプターという旅の体験価値を提案　～ANAホールディングスとAirXがシェアリングサービスにおいて業務提携～

株式会社AirX 2019.10.24

ANAホールディングス株式会社（本社：東京都港区、代表取締役社長：片野坂真哉、以下「ANAHD」）と、エアモビリティの交通プラットフォームを開発する株式会社AirX（本社：東京都新宿区、代表取締役：手塚究、以下「AirX」）は業務提携を行い、ANAグループとして空港からその先も、空の移動にて快適に迅速に移動する体験を提案していきます。具体的には、空いているヘリコプターの座席を利活用して、気軽…

PR TIMESで本文を見る

ヒトの読解能力を超えたAIの最新言語モデル、日本語版初公開！

新着・ニュース

トレンド

AI inside、テレビ朝日に人工知能（AI）技術提供

フラッグシップオーケストラ、コーポレートサイト＆ロゴをリニューアル

【11/8開催】“生の声”が聞けるセミナー「#MarketingLIVE Vol.5」クラシル・FiNC・ココナラから学ぶ！～アプリによるユーザーエンゲージメント向上の外せないポイントとは～

【医療×IT】延べ100万人の学会会員医師にコミュニケーションツールを提供するメディカルマスターズ第2回株式投資型クラウドファンディングを開始

飛行機×ヘリコプターという旅の体験価値を提案　～ANAホールディングスとAirXがシェアリングサービスにおいて業務提携～