【雑記】Suno AI (音楽生成AI) が得意・苦手とする音やジャンル

最近、Suno AIという音楽を生成するAIを使用しているのですが、いくつか試してみて得意な音やジャンル、苦手な音やジャンルがわかってきたのでそれをまとめたいと思います。

Suno AIが苦手とする楽器・シンセ表現

まずは苦手な表現の紹介です。 Suno AIの仕組みとして、音声データから学習し、そのジャンルやリズムの特徴を模倣することで特定の楽器やジャンルを再現するという方法を使っていると推測されます (スペクトル模倣)。 それにより周波数帯域が広い音はノイズになりやすかったりする問題があります。

またスペクトル模倣型学習のため「シンセの音がどう作られるか」ではなく「どう聞こえるか」だけを真似しているため、シンセの持つ豊かな音の再現はできていません。例えばTranceなどで使われる Supersaw は Suno AIでは平坦なゆらぎや抜けの悪い音になりがちです。

「苦手な音」の具体的な例としては、以下の楽器・シンセです。

カテゴリ 楽器・シンセ 説明
1. 打楽器系 歪んだキック
(ハードコア/ガバ)
非線形歪み+倍音生成+コンプレッションの複合工程を理解していないため、
「迫力不足/不自然な倍音/埋もれる音」になりやすい
シンバル類 ・クラッシュ、ライド、ハイハットなど
・非周期的な金属振動・倍音の複雑な減衰を捉えきれず、ホワイトノイズっぽくなる
・アタックや粒立ちが弱く、リズムの切れ味が出にくい
・金属打楽器(グロッケン、シロフォン、チャイム類)
・トランジェントの再現が曖昧で、アタックがぼやけたり共鳴感が弱まる
2. 管弦楽器系 トロンボーン/ホルン ・基本的には問題ないがミュート、スライドなど特定の表現が苦手
ポルタメントやミュートによる音色変化を構造的に理解できず、不自然な変化や「ただのこもった音」になりやすい
ピッコロ/
高音域の金管木管
倍音が密集しており、AIがうまく整列できず「耳に痛い/ノイズっぽい」音になりやすい
ハープ、ピチカート弦 弦ごとの共鳴やアタックの繊細さが失われ、モコモコした質感になりやすい
3. シンセ系 ワブルベース LFOでカットオフを動かすプロセスを理解できず、ただの「揺れた低音」や不自然な帯域変化になる
グロウルベース 複雑なフィルタやフォルマント操作を模倣できず、倍音構造が貧弱/不安定
FM リード キャリアとモジュレータの関係を内部的に持っていないため、FM特有の鋭い音色や安定した倍音が出にくい
4. 特殊エフェクト スタッター
(断片リピート)
ms単位のカット&繰り返しを理解せず、
「ただリズムが崩れた」「残響音がカットされないノイズ音」のような結果になりやすい
クラッチ
ターンテーブル操作)
フィジカルな摩擦音・逆再生的な揺らぎを構造的に理解できず、不自然なノイズや逆再生音に近づく
・単調なスクラッチになりやすい

具体的に苦手なジャンルを上げると、EDM 系 (TranceやDubstepなど) はシンセ表現 (Supersawや歪んだドラム) が弱いため、少し聞いただけで 生成AIで作ったことがわかるほどクオリティが低くなりがちです。特にビルドアップでよく使われるスネアロールはノイズになりやすいです。

Suno AIが得意とする音とジャンル

逆にSuno AIで良い曲になると思った音とジャンルは「楽器構成や音がシンプル」なものです。

「Lo-fi hiphop / Chillhop」

具体的には「Lo-fi hiphop / Chillhop」はドラムがシンプルで機械的、メロディやコード進行もミニマルで、エフェクトはローパスやサチュレーション程度で大きなモジュレーションを行いません。 AIによって生まれる多少の粗さやノイズもそれが味になることがあります。

また同系統の「Chill / Ambient」も音の起伏が少なくAIが苦手とする「トランジェント(瞬間的な鋭い音)」や複雑な歪みが出ないジャンルです。

「Indie tiny rock」

それと「Indie rock」特にbedroom / tiny 系 (例えば相対性理論Lamp、ミツメなど) は、クリーンギター、軽いドラム、シンプルなボーカルというミニマルな構成で “こじんまりした音” が AIとの相性が良いです。また世界中で大量にリリースされているジャンルでもあるので、学習データが豊富という点も有利です。

suno.com

minimalist japanese indie rock, post-punk inspired, driving bassline as lead, tight and straightforward drums, sparse guitar riffs with rhythmic accents, fast-paced 8-beat groove, deadpan female vocal with detached delivery, quirky surreal lyrics, sense of urgency mixed with humor, stripped-down production, space-conscious mix, hypnotic and repetitive structure, blended with edm elements such as sidechain pumping synths, subtle arpeggiated pads, electronic percussive hits, atmospheric risers and drops, dancefloor-oriented energy while retaining the minimalist post-punk edge

またアコースティック / フォーク / バラードといったジャンルでの、ギターやピアノは中域主体で、倍音も規則的に並ぶため、AI にとって再現が安定します。

「Boom bap / Old school hip hop」

90年代のHiphopである「Boom bap / Old school hip hop」もシンプルなビート+短いサンプルループは、AIにとって「パターン学習しやすい」素材と言えます。またHiphopは一時期の花形ジャンルであったため学習データも豊富です。 さらに現在主流の Trap よりはシンセのモジュレーションや特殊なエフェクトも少なめです。

suno.com

90s japanese hardcore hiphop, heavy boom bap beat, raw vinyl sampling, dark and gritty atmosphere, straight and hard rap flow, deep male voice delivery, socially conscious and political lyrics, strong message-driven storytelling, tight snare and heavy kick drums, underground cypher vibe, stoic and aggressive mood, minimal melodic elements, focus on lyrical impact and street realism

Jazz / Swing / Big Band Jazz

Suno が比較的得意なカテゴリは ギター・ピアノ・ブラス(中域が中心で音高が安定している楽器)です。 ジャズやビッグバンドはまさにその楽器群が主役なので、AI の強みと一致します。 またSwing や Big Band Jazz は「ウォーキングベース+スウィングリズム」「II–V–I進行」などの 定番パターンが多く、Suno のような生成モデルは、パターン化された構造の再現に強いため、自然にまとまった曲を作りやすいです。Jazzが「即興音楽」であることも AIの揺らぎとの相性が良いと考えられます。

派生ジャンルとして、Electro Swingは EDM的なアプローチをした「4つ打ち+スウィング感のついた裏拍」ですが、パターンは単純でループ性が強いジャンルです。そしてブラス(サックス、トランペット、トロンボーン)、クラリネット、ピアノ、ギターなど「中域〜やや高域」の楽器が主役となっており、これらは Suno が比較的得意なカテゴリ(持続音・明確な音高を持つ楽器)で、AI の表現力が安定して発揮されやすい印象です。 なにより Electro Swingはシャンソンをベースとした「レトロ風の歌唱」であり、表現に粗さにあることが味となります。

suno.com

modern electro swing, energetic swing rhythm, fat electronic bass, sidechain pumping, brass stabs, chopped vocal samples, swing house groove, dancefloor ready, festival vibe

環境音楽・静かなEDM

ホラーBGMのような環境音楽は「メロディ」や「リズム」よりも 雰囲気・テクスチャが重要です。その点、Suno は厳密な音程・リズム処理が苦手ですが、逆に 曖昧さや不安定さが“味”になことがあります。また環境音楽は 長い持続音、ドローン、パッドが多用されますが、スペクトログラム学習で再現しやすく、破綻しにくいです。ただ、音の広がりや豊かさを出すのは苦手なので、そのあたりは考慮する必要があります。

他にも静かな Drum’n’Bass(リキッド / アトモスフェリック系)もAIが得意な「滑らか・広がりのある音像」で十分“らしさ”が出ます。(逆に現代的な精密な構成である Neuro Bass 的な表現は苦手)

suno.com

french chanson, drum and bass rhythm, fast, jazzy pop, whisper female vocal, monotone voice, dreamy and surreal mood, romantic french lyrics, bittersweet, playful, warm orange atmosphere, edm

まとめ

Suno が得意なジャンルは、

  • 音響的に単純で、ループ性が強い
  • 中域主体で扱いやすい周波数構造
  • 学習データが豊富で、スタイルの「平均像」がしっかり学習されている
  • AIの弱点(歪み・ノイズ・トランジェント処理)が目立ちにくい

といった条件を満たすものです。 つまり、AI にとって「音響的に無理をしなくてもジャンルらしさが出る音楽」が得意、と言えます。

この条件を満たせば、今回紹介したジャンル以外にも相性の良いジャンルはたくさんありそうな気がします(80年代J-popやボサノバなど)

おまけ:Suno AIの活用法

ここまで説明した「得意な点」と「苦手な点」を踏まえて、Suno AIをどうやって活用するかです。 作曲の知識がない場合、「得意とするジャンル」を中心に曲を作ってそのまま使うのが良いです。

Suno AIの基本的な使い方や、タグやスタイルを指定する方法については以下のチャンネルがとても詳しく解説していておすすめです。

www.youtube.com

作曲ソフトがあれば、Suno AIは Stem分離が可能 (※ただしクレジットを消費)なので、AIが苦手なハイハットや抜けの良いキックなどを差し替えるのも良いです。 ドラムの差し替えは作曲の知識がなくてもできて、クオリティを上げやすい(Spliceなどのドラムループ素材に差し替えるだけでも良い)ので、オススメです。

作曲の知識があれば、耳コピMIDIにしたり、Melodyneといったオーディオ解析をしたり、"Chord ai" といったコード進行解析ツールで気になるパートを差し替えていくとよりクオリティを上げることができます。

(※ なお、最近Suno Studioがリリースされ、正式にMIDI生成機能が実装されましたが、学習データがオーディオであるため、楽譜やMIDI情報がありません。それにより結局はオーディオ解析となるため、ノートの精度はあまり高くありません)