会員登録

音楽・映像

歌声合成ソフト開発者「人は、歌声を自然さではなく好みで評価する」発言の真意とは

2025.01.25 13:00
0

KAI-YOU編集部_音楽・映像部門

Synthesizer V Studio 2: Exclusive Preview

「人は人工音声を、自然さではなく好みで評価している」

そんな言葉がSNSで話題を集めています（外部リンク）。

話題になっている動画は、歌声合成ソフトウェア「Synthesizer V」を開発するDreamtonics社によるもの。

創設者は、人間の歌唱よりも評価される歌声合成による歌唱を実現したとする一方、聞き手には、技術とは異なる指標が存在することを指摘しています。

技術の到達点に至ってしまった開発者は、どのようにこの課題に立ち向かったのでしょうか。

様々な歌声データベースを利用できる「Synthesizer V」

「Synthesizer V」は様々な歌声データベースを利用できる歌声合成ソフトウェア。

Megpoidや重音テトなどのデータベースが存在しています。

歌声データベース『Synthesizer V AI 重音テト』

人間らしいリアルな歌声を表現できるよう、最新のAI技術が使用されています。

「人間の歌唱より良い評価」まで至った歌声合成ソフトウェア

Dreamtonics社の公開した動画では「Synthesizer V」の歴史を振り返りながら、新製品「Synthesizer V Studio 2」の機能を紹介。

Dreamtonics社の創設者であるKanruさんは「人間レベルの自然さ」を実現したと表現しています。

自然さの評価には、鑑賞者に合成音声のサンプルと人間の歌手のサンプルをランダムに聞かせて判定。

判定を重ねるうちに「合成サンプルが、人間の歌唱サンプルよりも良い評価を得る」ところまで至ったと説明しています。

好みでは「改良できたかどうかを判断する基準」たり得ない

「ボーカル合成という分野全体の悲願」であると振り返る一方、ここで「研究で得られた意外な結果」にぶつかることに。

「そのサンプルが優れている／自然であると感じた理由」を確認してみると、自然さの評価には「個々人の好み」が大きく影響していることが判明したというのです。

夜も眠れなくなったと話すDreamtonics創設者のKanruさん／画像はYouTubeより

「自然さではなく好みで評価しているとわかったら、ここからさらに改良するには一体どうすればいいのかと。本当に改良できたかどうかを（技術的に）判断する基準がありません」

「人間のように」ではなく「自然に聞こえるように」

しかし、人々が好みによって自然さを重視しているとわかったことで、改善できることも見つかったとKanruさんは振り返ります。

特に音楽に重要なジャンルや伴奏、細かい表現などの様々な文脈に着目。

「人間のように」ではなく「自然に聞こえるように」、コントロールできるよう、「Synthesizer V Studio 2」には様々な機能が搭載されました。

「正しい歌ではなく実際に歌うときのような声」を目指す／画像はYouTubeより

作曲のワークフローには、より好みにあった歌い方を選べるような選択肢を提示する「AIリテイク」機能や、歌い方のニュアンスなどボーカルスタイルを調整できる機能が盛り込まれています。

「人間レベルの自然さ」に到達した合成音声技術。その発展は、理想の歌声とは何なのかをクリエイター側に投げかけるところまで来ているのかもしれません。

この記事どう思う？

この記事どう思う？

関連リンク

0件のコメント

KAI-YOU編集部_音楽・映像部門

KAI-YOU編集部_音楽・映像部門

執筆

ポップポータルメディア「KAI-YOU」の編集部（2013年3月15日より運営開始）。重要性の高いニュース記事に加え、クリエイターへのインタビューや発表会、展覧会などのイベントレポート、独自の視点・切り口からのレビューやコラムなども多数配信。ポップカルチャーと現代社会が相互に影響し合う歴史を記録しながら、シーンの最先端にある新たな価値観や才能を発掘・発信している。

音楽・映像部門では、VOCALOIDやDTMなど多様なカルチャーが絡み合い複雑化するインターネット音楽シーンの現状を発信。ジャニーズから歌い手、ネット発アーティストまで、音楽やMV、映画を対象に、最先端技術を使った映像や膨大な時間がかけられたアナログ手法の作品、それらを生み出すクリエイターを紹介している。

最終更新日:2025.04.25 11:41

ページトップへ