Nishikaが新たなデータサイエンスコンペティション「判例の個人情報の自動マスキング」を開始

SHARE:

データサイエンスコンペティションプラットフォーム”Nishika”にて、新たなコンペティションが2020年10月29日より開始。Nishikaではこれが6回目のコンペ開催になる

データサイエンスコンペティションを中心としたプラットフォーム”Nishika”を運営するNishika株式会社(東京都千代田区、代表取締役山下達朗、以下Nishika)が本日より新たなコンペティション「判例の個人情報の自動マスキング」(以下本コンペ)をスタート致しました!Nishikaではこれが6回目のコンペ開催になり、これまで1500人のデータサイエンティストが国内外から参加しています。

・URL:https://www.nishika.com/competitions/7/summary
・締切:2021/01/14
・賞金総額:16万円

本コンペでは裁判記録(以下判例)に記載されている個人情報を自動で抽出して分類するタスクに挑戦して頂きます。BERTなど最新の自然言語処理技術を活用した、個人情報の自動抽出という様々な領域で必要とされるタスクに挑戦して頂きます。
【本コンペ概要】
 最高裁判所や地方裁判所では日々様々な裁判が行われております。これら日々の裁判の記録である判例は、現行の司法制度において重要な役割を果たしています。
 
 判例を広く公開することは、法律解釈における一貫性を保つという点で社会にとって必要なものであると言えます。実際、多くの判例が裁判所のホームページや商用データベース、雑誌・判例集などで公開されており多くの方々に利用されています。

 一方で、判例には個人が特定可能な氏名や組織名が記載されていたり、住所や日付など個人の特定に繋がり得る情報を多く含んでいることが多く、プライバシー保護の観点からそのままの状態で公開されるべきではありません。そのため、個人情報や個人の特定に繋がり得る情報については、“A氏”や“●年●月●日” のような形で適切にマスキングを行う必要があります。
 
 現在日本では、刑事事件、民事事件等を合計すると年間で350万件を超える裁判が行われていますが、公開されている判例はこの内の僅か数%に過ぎません。

 従来はこの個人情報の特定とマスキング作業は主に人手によって行われてきましたが、機械学習により判例の中の個人情報を自動で抽出し、適切にマスキングできれば、大幅な業務効率化が期待でき、判例データベースの充実化に繋がります。

【データサイエンスコンペティションについて】
データサイエンスコンペティションは、AIやビッグデータの解析モデルをオープンイノベーション方式で開発する仕組みのことで、最高精度のAIモデルが開発可能なためアメリカや中国においてAI開発の新たな手法として普及しています。

PR TIMESで本文を見る