AI生成アート

概要

AI生成アートとは、機械学習モデルが自律的または人間のプロンプト（指示文）を受けて生成した画像・映像・音楽・テキストなどの総称である。狭義にはビジュアルアートを指すことが多い。

技術的な萌芽は2014年のGAN（敵対的生成ネットワーク）に遡る。その後、2021年にOpenAIがDALL-Eを、2022年にStability AIがStable Diffusionをリリースしたことで一般利用が急拡大した。Midjourneyを加えた三者が現在の主要プラットフォームを形成している。

2022年、Midjoureyを使用した作品がコロラド州美術賞のデジタルアート部門で受賞したことが論争の起点となった。AIが人間のアーティストを置き換えられるか否かという問いは、それ以降、文化・法律・経済の各分野に波及している。

技術的仕組み

主流の画像生成モデルは拡散モデル（Diffusion Model）に基づく。学習時に画像にノイズを加え、推論時にノイズを除去する過程で画像を再構成するアーキテクチャである。テキストと画像の対応関係はCLIPなどのマルチモーダルモデルで学習する。

学習データはインターネット上に公開された数十億枚の画像で構成される。LAIONデータセット（50億枚以上）がその代表例だ。この点が著作権問題の核心となる——既存アーティストの作品が無断で学習に使用されているという批判が根強い。

GANとの比較では、拡散モデルは学習の安定性と出力品質の一貫性に優れる。ただしGANは単純な構造上の解釈可能性があり、リアルタイム生成に強みを持つ。用途によって両者は使い分けられている。

概要

技術的仕組み

文化的・哲学的論点

創造性の定義

著作権の空白

現代への示唆

1. クリエイティブ産業の構造変化

2. 著作権戦略の再構築

3. 「本物性」の価値再評価

関連する概念