Geminiアプリに音楽生成モデル「Lyria 3」が追加。写真や動画から30秒の楽曲を生成


Geminiアプリに音楽生成モデル「Lyria 3」が追加。写真や動画から30秒の楽曲を生成

GoogleのAIアシスタント「Gemini」が、ついに本格的な音楽クリエイターになった。Googleは2026年2月18日、Geminiアプリに最新の音楽生成AIモデル「Lyria 3」を統合したと発表した。これにより、ユーザーはテキストだけでなく、写真や動画をきっかけに、歌詞とボーカルを含む30秒のオリジナル楽曲を生成できるようになる。AI音楽生成が、専門的なツールから誰もが使える日常的な機能へと大きく舵を切った瞬間だ。ただし、現状は30秒という短い尺と、あくまで「カスタムサウンドトラック」という位置付けであるため、本格的な楽曲制作を求めるユーザーには物足りなさが残るかもしれない。

Lyria 3とは:Geminiに統合された「マルチモーダル音楽生成AI」

Lyria 3は、Google DeepMindが開発した最新の音楽生成AIモデルだ。公式ブログによれば、今回の最大の進化点は、テキストだけでなく画像や動画を直接プロンプトとして扱える「マルチモーダル」な入力に対応した点にある。これにより、ユーザーはスマホで撮った写真や動画をGeminiアプリに渡し、「この風景に合う音楽を作って」「この動画の雰囲気に合うBGMを」といった直感的なリクエストが可能になった。

生成される楽曲は最大30秒で、歌詞とボーカル(歌唱)を含む高品質なオーディオトラックとなる。ユーザーはジャンル(例:ローファイ、ポップ、ロック)、テンポ、使用楽器、ボーカルの有無などをカスタマイズできる。対応言語は英語、日本語、韓国語、ドイツ語、スペイン語、フランス語、ヒンディー語、ポルトガル語の8言語で、多言語での歌詞生成が可能だ。利用は18歳以上のユーザーに限られる。

具体的な使い方:写真からBGM、思い出からジングルまで

実際の操作は驚くほどシンプルだ。Geminiアプリを開き、テキストで指示を入力するか、画像/動画をアップロードする。例えば、夕焼けの海辺の写真をアップロードし、「この写真の雰囲気に合う、穏やかでノスタルジックなピアノのインストゥルメンタルを作って」とプロンプトする。あるいは、ペットの面白い動画を送り、「この動画に合う、陽気でコミカルなジングルを、軽快なテンポで作って」と頼むこともできる。

テキストのみのプロンプトでも、「90年代風のシティポップの曲を、夏のドライブをテーマにした日本語の歌詞で」といった具体的な要望に応える。生成された楽曲はアプリ内で即座に再生でき、ダウンロードして他のプラットフォームで使用することも想定されている。

生成物には「SynthID」ウォーターマークが埋め込まれる

DeepMindの公式情報によれば、Lyria 3で生成されたすべての楽曲には、AIが生成したコンテンツであることを識別するためのデジタルウォーターマーク「SynthID」が不可聴域に埋め込まれる。これは、AI生成コンテンツの出所を透明にし、誤った情報の拡散を防ぐためのGoogleの取り組みの一環だ。ユーザーが生成した音楽をSNSや動画プラットフォームで共有する際の、倫理的な基盤を提供している。

主な活用シーン:コンテンツクリエイターと一般ユーザーの橋渡し

この機能の真価は、その手軽さとスピードにある。主な活用シーンとしては以下のようなものが考えられる。

  • SNSやショート動画用のBGM制作:InstagramのストーリーやTikTok、YouTube Shorts用に、映像の雰囲気にぴったり合ったオリジナルBGMを秒単位で作成できる。著作権問題を気にせずに使用可能だ。
  • プレゼンテーションやイベント用のサウンド:スライドショーや結婚式の思い出ムービーなどに、世界に一つのカスタムサウンドトラックを添える。
  • アイデアの具現化とプロトタイピング:音楽制作の初心者がメロディのアイデアを素早く形にしたり、作詞のインスピレーションを得たりするためのツールとして。

また、Googleのエコシステムとの連携も見逃せない。同モデルはYouTubeの「Dream Track」機能でも利用可能であり、将来的にはGoogleの各種クリエイティブツールとさらに深く連携していく可能性が高い。

競合モデルとの比較:歌詞・ボーカル生成と日常への統合が強み

AI音楽生成の分野には、Metaの「AudioCraft」シリーズやStability AIの「Stable Audio」など、強力な競合が存在する。これらのツールは、より長い音声の生成や、高度な音響制御に強みを持つ場合が多い。

Lyria 3の独自性は、歌詞とボーカルを高品質に自動生成する点と、既に多くのユーザーが日常的に使用するGeminiアプリに深く統合されている点にある。競合ツールの多くが専用のWebサイトやアプリを必要とするのに対し、Lyria 3は「AIに質問する」のと同じ感覚で音楽生成にアクセスできる。これは、AI音楽生成の大衆化に向けた大きな一歩と言える。一方で、現時点での30秒という生成長の制限は、競合の一部が提供するより長い生成に比べると、楽曲制作という観点では制約となる。

まとめ:誰が使うべきか?

Geminiアプリに統合されたLyria 3は、AI音楽生成のハードルを劇的に下げた。SNSや動画コンテンツを手軽に作る一般ユーザーや、ちょっとしたオリジナルBGMが欲しいすべての人にとって、強力な味方になる。特に、画像や動画から直接音楽を生み出せる点は、従来にはない直感的な創造性を引き出す。

逆に、DAW(Digital Audio Workstation)を使いこなすプロやセミプロの音楽家が、本格的な楽曲制作の主力ツールとして求めるには、まだ機能が限定的だ。30秒という長さ、細かいミキシングや編集の可否など、課題は残る。しかし、アイデアスケッチやインスピレーション源として、またはクリエイターがファンとの交流で使うツールとしては、非常に興味深い可能性を秘めている。AIが「ツール」から「創造性のパートナー」へと変貌を遂げつつある、現在進行形の変化を体感できる機能だ。

出典・参考情報

cloud9 Written by:

Be First to Comment

    コメントを残す

    メールアドレスが公開されることはありません。 が付いている欄は必須項目です