昨年11月末のリリースから世界的なブームを巻き起こしているChatGPT。その基盤技術をマイクロソフトが検索エンジン「Bing」に応用するなど、ビジネスや産業界への導入も進み始めている。
しかし、その前に、いや恐らくはそれと並行してクリアしなければならない重大な課題がある。それは、ChatGPTのような生成AI(人工知能)の機械学習に使われる、テキスト(文章)や画像、コンピュータ・プログラムなど各種コンテンツの利用許諾や著作権に関する問題だ。

米国の主要メディアがOpenAIに抗議
今年2月、米国の主要経済紙ウォーストリート・ジャーナルを発行するダウジョーンズ(米ニューズコープ傘下)が、ChatGPTの開発元である米OpenAIが正当な対価を支払うことなくウォールストリートジャーナルの記事を利用している、と抗議した。
同社は「ウォールストリート・ジャーナルの記事をAIのトレーニング(機械学習)に利用したいと考える者は誰でも、そのための正当なライセンス(使用許諾権)をダウジョーンズから取得しなければならない」とする公式コメントを出した。
一般にChatGPTのような生成AIはウェブ上からテキストや画像をはじめ様々なコンテンツを大量に収集して、これらから「機械学習」と呼ばれる手法で学ぶことによって、まるで人間が書いたかのような自然な文章を書いたり、玄人はだしの絵画やイラストなどの画像を描き出したりすることができる。
ところが、こうした生成AIの機械学習に使われるコンテンツ(一般に「教師用データ」あるいは「学習用データ」などと呼ばれる)は無断で、つまり著作権者からの利用許諾を得ることなく勝手に収集されて使われている。ダウジョーンズはまさにこれを理由にOpenAIを非難しているのだ。
米ブルームバーグ・ニュースの報道によれば、ダウジョーンズがOpenAIに抗議することになった直接のきっかけはある告発であったという。