はじめに
AIを利用した開発では、学習用プログラムを作成する段階、それを使用して学習済みモデルを作成する段階、及び学習済みモデルの利用段階において、それぞれデータ(ビッグデータ)を収集、利用することになると思われます。
本記事では、これらの場面において問題になる法的ポイントを解説します。
個人情報の問題
例えば、請求書や発注書などの情報をAIで学習する場合は代表者や担当者の個人名が入っていますし、防犯カメラ等の映像をAIで学習する場合は個人の容貌が写り込んでいることがあります。
これらはいずれも個人情報に当たりますから、まずは個人情報保護法上、次の点をクリアする必要があるでしょう。
利用目的の特定・公表
個人情報保護法上、個人情報を取得した場合は、予め利用目的を公表している場合を除き、速やかに、利用目的を本人に通知し又は公表しなければなりません。
本人への通知は事実上不可能ないし困難な場合が多いでしょうから、プライバシーポリシー等で、機械学習に利用する旨を具体的に記載しておく必要があります。
(参照条文)個人情報保護法
(利用目的の特定) (利用目的による制限) (取得に際しての利用目的の通知等) |
第三者提供
ユーザに対し学習済みモデルを提供するに際し、SaaS形態で提供する場合には、ユーザ側で学習済みモデルに対する入力を行うことになります。
この場合、ユーザからベンダへの個人情報の提供は、委託に伴う提供と整理することが考えられます。そして、このように整理する場合、ユーザ側は、委託先の監督義務が生じます。
(参考条文)個人情報保護法
(第三者提供の制限) (委託先の監督) |
著作権の問題
請求書や発注書に関して言えば、著作物性がないとされるケースも十分考えられるところですが、書籍内の文書や画像を機械学習する場合、著作権法上の問題をクリアする必要があります。
このように、大前提として、学習対象の著作物性の有無を適切に判断することが必要です。
その上で、著作物の機械学習への利用については、2018年の改正著作権法第30条の4で一定の手当がなされています。
これのポイントは、以下の点です。
①改正前は「統計的な」解析に限定されていたのが、ディープラーニングで利用される「代数的」「幾何学的」な解析が可能になったこと
②改正前は解析する主体自身に情報解析目的が必要であったのが、学習済みモデルの生成を行うベンダが情報解析の用に供することも対象となったこと
③いずれの方法によるかを問わず利用できるとされたことにより、改正前は不可能だった譲渡や公衆送信も可能となったこと
(参考条文)著作権法
(著作物に表現された思想又は感情の享受を目的としない利用) |
ただし、30条の4の但書の存在には注意が必要で、都度慎重な検討が必要となると考えられます。
契約上の問題
web上でデータを収集し、これを利用する場合、利用規約等において利用方法が制限されていることがあります。この場合、いわゆる「契約による著作権法のオーバーライド問題」があります。これは、著作権法上の権利制限規定によって認められる利用を契約で制限できるかという問題です。
この問題については、確立した解釈は現時点では存在しませんが、前提として、契約に拘束される状況か否かをまずは検討すべきです。なぜなら、サイト管理者が利用規約で機械学習への利用を禁止していたとしても、当該利用規約は、これに同意した者にしか効力を有しないからです。
したがって、データの利用が利用規約への同意を要件とされているか否かを確認することが必要でしょう。
本記事に関する留意事項
本記事は掲載日現在の法令、判例、実務等を前提に、皆様への情報提供として一般的な情報を掲載するのみであり、その性質上、特定の個人や団体に具体的に適用される個別の事情に対応するものではありません。個別の事案に適用するためには、本記事の記載のみに依拠して意思決定されることなく、適用に関する具体的事案をもとに適切な専門家にご相談ください。