MENU

この記事の要約

現代音楽のフロンティアを行く作曲家、ロバート・レイドロー氏の画期的な探求。人工知能(AI)を単なるツールとしてではなく、創造性の本質、音楽的時間、真贋といった根源的な問いを掘り下げる存在として創作プロセスに統合した彼の道のりを追います。初期の実験から大規模オーケストラ作品に至るまで、AIとの対話から生まれた独自の技法や美学を詳解し、人間とAIが共創する未来の音楽の可能性に迫る記事です。
現代の音楽シーンにおいて、人工知能(AI)の存在感は日増しに高まっています。単なる技術的ツールとしてだけでなく、芸術的な創造プロセスそのものに深く関わる存在として、AIは作曲家たちに新たな問いを投げかけています。気鋭の現代クラシック音楽作曲家、ロバート・レイドロー氏の博士論文は、まさにこの最前線を鮮やかに描き出しています。彼の探求は、AIを単に便利な道具として利用するに留まらず、AIそのものの性質や、AIが普及した社会における音楽、さらには芸術の真贋時間構造といった根源的な問いを、音楽作品を通して深く掘り下げています。 本記事では、彼の博士論文に基づき、AIが現代音楽の創造プロセスにどのように組み込まれ、そこからどのような技術的・美学的な考察が生まれたのかを探ります。AI作曲の黎明期における実験的な試みから、大規模オーケストラ作品への発展に至るまでの道のりを追体験することで、人間とAIが織りなす未来の音楽の可能性に迫ります。
目次

なぜ今、AIと音楽なのか? – 探求の背景

レイドロー氏の音楽的背景には、ジャズ演奏家としての経験と、科学者との共同作業を通じた数学や物理学への深い関心があります。原子核物理学や天文学といった分野とのコラボレーションから生まれた過去の作品は、すでに異分野の概念を音楽に翻訳する試みを含んでいました。AIへのアプローチも同様に、プログラミングや統計学の専門家としてではなく、この分野が自身の作曲に何をもたらすかを好奇心を持って探求する姿勢から始まりました。 彼の探求の中心にあったのは、現代音楽におけるテクノロジーとの関係、そして音楽のフォーム時間に対する問いです。ベートーヴェンのソナタ形式から現代作曲家アンドリュー・ノーマンの作品まで、彼は音楽形式を操作・発展させる対象として捉えてきました。また、時間そのものを空間的な現象として再文脈化するクララ・イアノッタやジョン・ルーサー・アダムズといった作曲家からも影響を受けています。 さらに、AIとの協業は「AIは作曲家と言えるのか?」「AIの書いた部分はどこか?」といった、創造性や作者性に関する根源的な問いを突きつけました。レイドロー氏は、AIを「人間中心(human-centred)」なツールとして捉え、完成された音楽ではなく、創造プロセスを支援する「不完全な鏡」として利用することを模索します。これは、AIが生み出す予期せぬ結果や「バグ」さえも、作曲の素材として積極的に受け入れるという姿勢に繋がります。

ミュージカル・ストラクチャリズム(Musical Structuralism)とは

構造主義哲学のアイデアを音楽に適用する考え方の一つ。AIのデータ拡張という技術から着想を得て、音高やリズムなどの個別の要素そのものよりも、それらの要素間の「関係性」や「構造」を重視する考え方を指します。音を転調したり楽器を変えたりしても、その関係性が保たれていれば本質的に同じと見なせる、というような視点です。

アルゴリズム時間(Algorithmic Time)とは

アルゴリズムがその処理ステップを進めることで経過する時間のこと。私たちが普段感じる時計の針が進む「実際の時間」とは異なり、アルゴリズムの内部的な進行によって定義されます。AIが音楽を生成する際など、その過程自体に時間的な構造を見出す考え方です。

AIを「ツール」として使う初期実験 – 様々なアルゴリズムとの対話から生まれた作品群

レイドロー氏の初期の実験は、様々な種類の生成AIアルゴリズムを試し、その特性を理解することに焦点が置かれました。彼は「Clara」という比較的シンプルなLSTM-RNNモデルから始め、「MuseNet」や「GPT-2」といったより高度なトランスフォーマー・アーキテクチャに基づくモデルへと移行します。これらのシンボリック生成AIは、楽譜やMIDIデータ、あるいはテキストといった「記号」を扱います。一方、「WaveNet」や「SampleRNN」といったオーディオ生成AIは、直接「音」のデータを扱います。

生成AIアルゴリズム(Generative AI Algorithm)とは

テキスト、画像、音楽、音声といった新しいデータを作り出すことができるAIのこと。既存のデータを分析・分類することとは対照的です。

シンボリック生成AI(Symbolic-Generative AI)とは

楽譜データ(MIDIなど)やテキストといった、音楽を記号的に表現したデータを生成するAI。対照的なのはオーディオ生成AIです。

オーディオ生成AI(Audio-Generative AI)とは

音のデータ(WAVやMP3ファイルなど)を直接生成するAI。音楽や話し声など、様々な種類のオーディオを作り出せます。

トランスフォーマー(Transformer)とは

近年、テキストや音楽生成の分野で広く使われているAIのモデル構造の一つ。長期的なパターンや文脈を捉えるのが得意で、LSTM-RNNなどの以前の構造よりも優れた結果を出すことが多いです。
これらのAIとの対話から生まれた主要なテクニックが、「Interlocking(インターロッキング)」「Collaging(コラージュング)」「Hidden Layers(隠しレイヤー)」です。「Interlocking」は、人間が作曲した部分とAIが生成した部分を交互に配置する手法です。AIがまだ長期的な構造をcoherentに保つのが苦手だった当時、自身の素材で音楽を再編成する目的で開発されましたが、AIの生成する「忘れっぽさ」や不完全さからインスピレーションを得て、意図的にぎくしゃくした対話を生み出すためにも用いられました。 「Collaging」は、AIが生成する断片的な素材(個々は大きく異なっても、抽象的な特徴を共有していることが多い)を重ね合わせることで、全体としてAIの「アーキテクチャ内部」のような混沌とした音響空間を作り出す試みです。初期の試みでは必ずしも満足のいく結果ではなかったものの、後のオーディオ生成AIを用いた作品で発展していきます。 そして「Hidden Layers」は、AIが生成した素材を最終的な「聞こえる表面(audible surface)」としてではなく、作品の計画段階、いわば「下書き」や「骨格」として利用する手法です。これは、作曲家が細部のコントロールを保ちつつ、AIによる予期せぬ方向への展開を促すための工夫でした。例えば、AIが繰り返しパターンを生成する際の「癖」から着想を得て、その「癖」自体を音楽作品の隠れた構造として組み込むといった方法が取られました。 これらのテクニックは、彼の初期作品群で具体的に試されました。
  • Turing Test // Prelude (2019): バッハのソロ鍵盤曲の途中にAI(Clara/MuseNet)が生成した部分を挿入し、聴衆がバッハかAIかを聞き分けるチューリング・テスト形式の作品。AIが楽器の特性を理解しないことから生じる「unidiomatic」(非慣用的な)な音楽に着目。
  • Three Entistatios (2019): 機械学習の異なる訓練段階にあるAI(Clara, MuseNet)を用いて作曲。各楽章が異なる手法(Collaging, Interlocking, Hidden Layers)をプロトタイプ的に探求。特に、AIの「忘れっぽさ」や「繰り返し」の癖から着想を得た隠しレイヤーを用いた。
  • Alter (2019): メゾソプラノ、アンサンブル、エレクトロニクスのための作品。19世紀の数学者エイダ・ラブレースの Analytical Engine に関する考察から着想を得て、AI(MuseNet, WaveNet, GPT-2, カスタムText-RNN)が自己認識を高めていく物語を描く。人間と電子声部間の「垂直方向の Interlocking」や、Text-RNNとGPT-2を連携させたテキスト生成、WaveNetによる音声生成などを試みた。特に、AIが生成するテキストの奇妙な「偏極」が作品の雰囲気に影響を与えている。
  • Rose Green (2021): 固定メディアのオーディオ・ビジュアル作品。新たなAIモデルを訓練せず、「拾ってきた」既存のAI(LakhNES, Synth1GAN, FakeYou, 強化学習AI)を用いることで、AI訓練のエネルギーコストとノスタルジアをテーマにする。LakhNESによる8ビット音楽生成、FakeYouによるAI生成テキストの朗読、ゲームを学習する強化学習AIの映像などをコラージュ的に組み合わせ、AIとノスタルジア、気候変動といったテーマを探求。オーディオ生成AIをコラージュする試みを行った。
  • Disc Fragments (2021): テノールとシンセサイザーのための作品。パンデミックに関する歴史的テキストをAI(fine-tuned GPT-2)に生成させ、それを元に作曲。テノール声部はisorhythmicなパターンを繰り返し、シンセサイザー(Omar Peracha開発のAIアルゴリズムを使用)はコラージュ的な聖歌風のフレーズを生成。GPT-2がテキスト生成を突然中断する性質から着想を得た構造を採用。第4楽章では、シューベルトの「冬の旅」で訓練したSampleRNNによる音声生成をテノールが模倣する「Imitation」を探求した。

音楽構造主義と時間 – AIから得た新たな視点、その深化

初期の実験を経て、レイドロー氏の関心はAIが示唆する音楽構造主義時間の概念へと深まっていきました。AI、特にシンボリック生成AIの学習方法、例えばデータセット拡張の手法は、彼に音楽の本質について深く考えさせました。データセット拡張では、音楽の音高やリズムの「関係性」を保ったまま、調性を移調したり、楽器を変えたり、リズムを引き伸ばしたりといった操作を行います。これは、音楽が個別の音そのものというより、それらの間の関係性から「創発(emergent)」するという考え方を暗示しているようにレイドロー氏には映りました。 この音楽構造主義的な視点は、彼の作品「Chromodynamics」「Gravity」「Warp」に色濃く反映されています。「Chromodynamics」では、粒子物理学の概念(時間の経過が粒子の質量によって異なる)から着想を得て、同じ音楽的イベントが時間のスケールを変えて何度も現れるアルゴリズム時間の構造を探求しました。一つのイベントを異なる速度の「参照フレーム」で繰り返すことで、時間の感覚を操作しています。これまでの作品での反省を活かし、各参照フレーム内で十分な音楽的ヴァリエーションを持たせることで、単なる反復ではなく加速・変形していく感覚を強めました。 「Gravity」では、アイザック・ニュートンの万有引力論からアルベルト・アインシュタインの一般相対性理論へと、重力に関する科学的説明の歴史を辿るように音楽が展開します。ここでは、18世紀の音楽理論家トーマス・サーモンが提案した独自の調律システム(ニュートンの理論に触発されたとされる)を借用し、「Salmon-scale」と名付けた固定の音律を導入しました。この音律は特定の調(Ddur)に引き寄せられる性質を持ち、無限に移調可能なはずの音楽素材に内在的な引力を持たせることで、音楽構造主義的なアプローチを具現化しています。さらに、彼は「チューニング(音律)」「ティンバー(音色)」「テクスチャ(密度)」「タイム(時間)」の四つの「配列(arrays)」を設定し、それぞれの配列の極限(「ゼロ」や「最大」)を探ることで、一般相対性理論が極限スケールで破綻するという物理学の課題を音楽に翻訳する試みも行いました。最終楽章の静寂は、これら四つの配列全てが極限に達した状態、つまり「音楽的時間」が停止した状態として描かれています。 「Warp」では、アインシュタインの場の方程式の解(光速を超えるワープドライブの可能性)を音楽で表現することを試みました。ここでは、「Gravity」で探求した「配列」の概念を拡張し、オーケストラの楽器ごとに異なるティンバー配列速度配列を設定しました。ワープする宇宙船をソロピアノ、時空の織物をオーケストラに見立て、音色と速度の配列上を旅するオーケストラの音響的なジャーニーを描きます。特定の楽器に固有の拡張奏法を配列の極限に配置することで、音楽構造主義的な無限の移調可能性に対する、楽器の「エッセンス」に基づいた音楽のあり方を対比させています。ピアノとオーケストラは互いに異なる論理で進行し、最後になって統一されます。

データセット拡張(Dataset Augmentation)とは

機械学習で使う訓練データが少ない場合に、既存のデータに変換(例:音楽の移調、速度変更)を加えて新しいデータを人工的に増やし、学習効果を高める手法です。

配列(Array)とは

レイドロー氏が作品「Gravity」や「Warp」で用いた作曲上の概念。音色、リズム、テクスチャなど、ある音楽的パラメータにおける複数の可能な状態やポジションをリストアップしたものです。作品の中でこれらの配列上のポジションを移動したり組み合わせたりすることで、音楽の構造や変化を設計しました。

真贋とシステムの二面性 – 作品「Silicon」の中心テーマ

レイドロー氏の探求は、AIが持つ真贋(オーセンティシティ)という側面へと移ります。近年、AIは人間が作成したものと見分けがつかない偽物(フェイクニュース、ディープフェイク動画など)を生成する能力を高めています。これは、情報の真贋を問うことがこれまで以上に重要になる社会状況を生み出しています。芸術の世界でも同様に、AIがモーツァルト風の音楽を生成できたとしても、それが真にオーセンティックな音楽であるかどうかは主観的な問題として残ります。 オーケストラという場は、まさにこの真贋について考える格好の場でした。オーケストラの演奏家は、何世紀も前の音楽を演奏する際に、その時代の演奏習慣や解釈について深く議論します。AIが生成した音楽を「本物の」人間である演奏家が演奏するとき、それはどのようなオーセンティシティを持つのでしょうか?そして、AIが普及した時代に、オーケストラという存在の秘密、つまりなぜ人々が実際に会場に足を運び、人間が音を奏でるのを見たいと思うのか、という問いが浮かび上がります。 大規模作品「Silicon」(2020-2022)は、これらの問いを包括的に探求する作品です。全三楽章からなり、「Mind(精神)」「Body(身体)」「Soul(魂)」というテーマが、AIが持つ「未来と過去」「フェイクとリアル」「システムと秘密」という三つのデュアリティ(二面性)に対応しています。 A symphony orchestra plays unusual, slightly distorted music in a concert hall setting. The musicians look focused. The lighting is dramatic. 第一楽章「Mind」では、未来と過去のデュアリティを探ります。ここでは、AI(MuseNet)にモーツァルト風の音楽を生成させ、それをソナタ形式という伝統的な構造に収めることから始めます。AIが生成した素材を、期待されるモーツァルト風から意図的に偏極させ、奇妙で不気味の谷のような音響へと変化させていきます。これは、AI研究がしばしば過去の巨匠の模倣で有効性を示すことへの問いかけでもあり、AIが過去の音楽をどのように「学習」するのか、その「スタイル」の理解は表面的なものなのか、それともより深いところにあるのか、というレイドロー氏自身の探求でもあります。また、音楽の時間軸上での反転(逆行)を多用し、古典的なソナタ形式の構造的繰り返しとAI的な時間操作を対比させています。 第二楽章「Body」では、真贋(フェイクとリアル)のデュアリティを探求します。AIによるスタイル転送技術、特に音源の音色を別の音源の音色で再現する技術(DDSPやRAVE)に焦点を当てます。AIディープフェイクの技術論文「Everybody Dance Now」(ダンサーの動きを別の人物に転写する)から着想を得て、作品全体の「Source(源)」となる音楽的骨格をDDSPで生成された電子音に演奏させます。その上に、ビッグバンドジャズ、電子テクノ、フォークダンスという三つの「Target(標的)」スタイルをオーケストラが演奏します。このオーケストラが演奏するスタイルは、DDSPが演奏する「Source」の音高、リズム、テンポといった要素に合わせて変形(転調、伸縮など)させられます。これは、オーセンティックに聞こえる表面(Target)が、より抽象的で異質な隠れた構造(Source)によって支配されている状態を表現し、音楽が徐々にインオーセンティックに感じられるように意図されています。表面の音楽はスタイル間を急速にカットすることで、ソーシャルメディアのアルゴリズムが注意持続時間を細分化する様子も反映しています。 第三楽章「Soul」では、システムと秘密のデュアリティを探ります。AIは膨大なデータを分析し、驚異的な速度で新しい音楽を生成できます。アーティファクト(望ましくないノイズなど)のない「完璧な」AIを思考実験として想定した場合、それは人間と見分けがつかないほどリアルな音楽をあらゆるスタイルで生成できるでしょう。しかし、それは音楽なのでしょうか?あるいは、ただ「音楽のように聞こえる」だけなのでしょうか?聴衆は、単に音響的にリアルなだけでなく、芸術に何らかの「秘密の成分」や「魂」を求めているのではないでしょうか。この問いに対し、レイドロー氏は、オーケストラの演奏が単なる音響生成ではなく、演奏家間のコミュニティ共有の行為であるという側面に注目します。そして、SampleRNNを用いてBBCフィルハーモニックの過去の放送アーカイブ(2000時間!)という膨大なデータセットで学習させた「個人的な」AIを、オーケストラのドッペルゲンガーとして作品に組み込みます。AIは完全に自律的に音を生成し、人間側はそれを模倣したり、共存したりします。ここでは、AIが持つ分析とシステム化の能力が、オーケストラという共同体の持つ「秘密」や「魂」の理解に繋がる可能性を探求します。オーケストラのパートは、楽器の物理的な特性に基づく「自然な」音(開放弦、自然倍音、固有の拡張奏法など)を多用し、AIの生成物との対比を際立たせています。

スタイル転送(Style Transfer)とは

あるデータ(Source)の内容を、別のデータ(Target)のスタイルで再構築する技術。画像分野でよく使われ、写真の内容を有名な画家のスタイルで描く、といったことが可能です。音楽や音声の分野にも応用され、ある音源の音色(Targetのスタイル)を使って別の音源(Sourceの内容)を鳴らす、といったことができます。

DDSP(Differentiable Digital Signal Processing)とは

Google Magentaが開発したAIベースの音源変換ツール。音のスペクトルやハーモニーといった内容を保ったまま、音色(ティンバー)を別のものに変換したり、新しい音色を生成したりできます。

SampleRNNとは

音の波形データをサンプル単位で生成するオーディオ生成AIの一つ。与えられたオーディオデータセットから音響のパターンを学習し、新しい音声を生成します。

ドッペルゲンガー(Doppelgänger)とは

ドイツ語で「二重の歩く者」を意味し、自分とそっくり同じ姿の分身のこと。ここでは、BBCフィルハーモニックの音を学習して生成されたAIを、オーケストラ自身の音響的な分身として比喩的に用いています。

AIは創造プロセスにおける何なのか? – 結論と今後の展望

博士論文の結論で、レイドロー氏はAIを「ツール」「コラボレーター」「エージェント」「アイデア」と様々な言葉で表現した自身の考えの変遷を振り返ります。ハンマーのような単なるツールとは異なり、AIは自ら学習し、予期せぬ結果を生み出します。完全に人間のようなコラボレーターにはまだ達していませんが、「エージェント」として、学習したルールに基づき独自の「決定」を下し、創造プロセスに影響を与える存在である、という捉え方が現時点では最も的確だと述べています。 A composer sits in a modern studio, surrounded by musical instruments and computer screens displaying complex data. The composer is deep in thought, with a mix of concentration and wonder on their face. The background shows a blend of classical instruments and futuristic electronic equipment. しかし、彼の探求はAIをプロセスに組み込む技術的な側面に留まらず、AIが社会のあらゆる側面に浸透していく世界で、音楽がどのように応答できるか、というアイデアとしてのAIにまで及びます。音楽は、AIが引き起こす根本的な変化(社会、思考、コミュニケーションモードの変化)に対する鏡となり得ると考えています。 今後の展望として、レイドロー氏はAIだけでなく、拡張現実(AR)、ウェアラブル技術といった他の先進技術と音楽制作との結びつきをさらに深めたいと語っています。大規模な編成とテクノロジーの融合は引き続き探求の対象ですが、先進技術の時代における「室内楽」の可能性、つまりより親密なスケールでの人間とテクノロジーの関わり合いも探りたいと考えているようです。 A string quartet plays in a small, intimate room. One musician interacts subtly with a futuristic, translucent device placed near their instrument, which responds visually or sonically. The scene is calm and focused. 彼の作品は、AIが作曲家の創造性を代替するものではなく、むしろそれを拡張し、新たな問いと可能性を引き出す存在であることを示唆しています。AIが生み出す素材の不完全さ、人間には理解しがたい論理、予期せぬ展開こそが、作曲家自身の音楽的直観を刺激し、これまで到達しえなかった領域へと導くのです。ロバート・レイドロー氏の探求は、AI時代の音楽創造が、技術的な洗練だけでなく、人間とAIの間に生まれる複雑な対話、そしてその対話が我々自身の芸術観や世界観に投げかける問いを内包するものであることを教えてくれます。彼の今後の活動から目が離せません。

まとめ

現代作曲家ロバート・レイドロー氏の博士論文は、AI(人工知能)を創作プロセスに深く統合する実践を通して得られた、多角的な探求の記録です。彼はAIを単なるツールではなく、自身の音楽的思考や創造性を刺激する「エージェント」または「アイデア」として捉え、様々な生成AIやスタイル転送技術を実験的に用いました。 初期の実験から生まれた「Interlocking」「Collaging」「Hidden Layers」といった手法は、AIの特性(長期コヒーレンスの欠如、繰り返しへの idiosyncratic なアプローチ、生成物の抽象的な類似性など)を逆手に取り、作品構造や素材生成に応用されました。さらに、AIが学習データに対して行う「データセット拡張」から着想を得た「ミュージカル・ストラクチャリズム」の概念は、「Chromodynamics」「Gravity」「Warp」といった作品において、音律、音色、テクスチャ、時間といった音楽的パラメータ間の「関係性」や「構造」を操作する形で具体化されました。 中心作品「Silicon」では、AIが持つ「未来と過去」「真贋(フェイクとリアル)」「システムと秘密」という三つのデュアリティがテーマとなりました。AIによる過去のスタイルの模倣、AI生成音楽のオーセンティシティ、そしてオーケストラ演奏の持つ人間的な「秘密」への問いが、AI生成サウンドと生楽器の複雑な相互作用を通して探求されています。 レイドロー氏の仕事は、AIが単に音楽を作る技術ではなく、我々の創造性、芸術、さらには社会そのものに対する理解を問い直し、新たな視点をもたらす存在であることを示しています。彼の探求はまだ始まったばかりであり、AIを含む先進技術と現代音楽の交差点で生まれる今後の作品が、どのような新しい音楽の形を提示するのか、大いに期待されます。

よくある質問

ロバート・レイドロー氏のAIと音楽に関するPhD研究は、どのような探求を行いましたか?

レイドロー氏は、人工知能を自身の現代クラシック音楽の創造プロセスに統合し、AIが持つ性質(真贋、時間、構造)が音楽に与える影響を探求しました。AIを単なるツールではなく、自身の音楽的思考を刺激する存在として捉え、作品を通して人間とAIの関わりが生み出す新たな音楽の可能性を模索しました。
目次