「OpenAI」は自然言語の文章を生成する言語モデルの完全版「GPT-2」を公開したことを発表しました。「OpenAI」は完全版の「GPT-2」の公開にあたって、「GPT-2」のフェイクニュース生成などの危険性についても指摘しています。
イーロン・マスク氏が共同会長を務める非営利の人工知能研究開発団体「OpenAI」は米現地時間11月5日、自然言語の文章を生成する言語モデルの完全版「GPT-2」を公開したことを発表しました。
「OpenAI」は2月に「GPT-2」を発表しましたが、その段階では悪意あるアプリに悪用されフェイクニュースやスパムなどが生成される可能性があるという懸念から、オープンソース化はせず縮小版モデルと論文のみ公開していました。
「OpenAI」はその後も研究開発を続け、フル機能を備えた完全版を公開し悪用されたという証拠は見つかっていないとしてWeb上に公開しました。
人工知能を研究する「OpenAI」が開発したAIによる文章生成ツール「GPT-2」は、最小限の情報を与えるだけで辻褄の合う内容のテキストを生成する能力を持つテキスト生成システムです。
開発陣は「GPT-2」があまりに高度な文章を生成するために悪用されるリスクがあると判断し、開発した4つのモデル全てを一度に公開することを控えていました。
その代わりに、2019年2月、5月、8月と段階的にパラメーターを増やしたモデルを公開していて、今回公開された15億個のパラメーターを持つ「GPT-2」が、「GPT-2」の段階的リリースにおける最後の完全版モデルとなるとしています。
「OpenAI」は今回の完全版公開と共に、「GPT-2」の危険性についても指摘しています。「GPT-2」は悪用のために微調整できると「OpenAI」は認めています。
ミドルベリー大学のテロ・過激主義対策センターによると、例えば白人優越主義・マルクス主義・イスラムのジハード主義・アナーキズムなど特定の差別的な思想などを擁護するように調整し、プロパガンダを生成するシステムに仕立てることも可能とされます。
しかし「OpenAI」は、3月に公開された制限付きバージョンがフェイクニュース生成などに悪用された兆候が見られないため、完全版のフル機能バージョンの公開を行ったと説明しています。
これに対し「OpenAI」は「GPT-2」によって生成された文章を検出するためのシステムも開発していて、すでに「GPT-2」の完全版モデルの文章を95%近い精度で検出可能だそうです。
とは言え、これは自動処理ではなく、フェイク画像や動画の検出のように一部で人間の目も借りて強化していく必要があるようです。
「OpenAI」は今後、「GPT-2」がコミュニティや一般の人々によってどのように使用されるかを監視しつつ、「機械学習のための責任ある出版規範」プロジェクトに参加しコミュニティとともに議論していくとしています。
「GPT-2」が何者かに悪用されるのではないかという懸念は大きかったものの、今回のリリースの時点では、これまで公開した「GPT-2」のモデルが実際に悪用された証拠は見つかっていないと言います。
しかし出力の信頼性が向上するにつれて「GPT-2」のような文章生成ツールが悪用される可能性は高くなり、開発した側の「OpenAI」であっても全ての悪用に気づくことはできないと認めています。
また実際に「GPT-2」を利用して文章を生成させることができる「Text Synth」というWebサイトも登場していて、「GPT-2」がどれほどの精度を持つのかを実際に試してみることができます。
「Text Synth」では、ユーザーが入力した文章に続けて「GPT-2」が自動で文章を生成してくれます。試しに何か文章を入力して、下部の「Complete Text」をクリックすると、ゆっくりとしたスピードで画面下部に入力した文章の続きが自動で生成されていきます。
生成される文章は確かに文章として成り立っているものの、文脈に関しては違和感が多い印象です。「Select an example」をクリックすると、適当な文章の例も用意されているため、さまざまな候補から選択して文章を生成させることも可能です。