【殴り書きコラム】今から10年以上前のこと。NTTも歌声音声合成技術を開発していたそうで。

utabara

声と楽譜と歌詞から“こぶしの効いた演歌”を合成 NTTが新技術 – ITmedia ニュース

 NTT(持株会社)は2月6日、音声データと楽譜と歌詞から歌声を生成する技術「ワンダーホルン」のライセンス提供を、NTTアドバンステクノロジ(NTT-AT)を通じて開始した。同技術が体験できるサイト「うたばら.com」もオープンした。

NTTが2000年に発表した歌声合成技術「ホルン法」を改良したもの。人の声を収録した歌声データベースに、楽譜・歌詞を組み合わせると、楽譜のメロディと歌詞通りの歌声を生成する。

歌声特有の倍音構造を忠実に再現したほか、歌声から抽出した特殊ノイズをミックスすることで、個人の歌声の特徴をより精密に再現できるようになったという。

ビブラートやこぶし回しなどといった「歌唱スタイル」調整機能を組み込んだ。演歌からポップスまでさまざまな歌声の合成が可能だ。少人数の歌声を足し合わせて大合唱にもできる。

…と、松尾Pが自身のTwitterで紹介していたのでNTTも遂に!と思って記事をよく見てみたら2004年の記事なんですね(笑)。

しかし、この「ワンダーホルン」、VOCALOIDよりも後に登場しているにもかかわらず、あまり脚光を浴びなかったのは何ででしょうね?

記事を見る限りだとビブラートやこぶし回しなどの歌唱スタイルも取り込めて、しかも独唱だけでなく合唱にも対応している、といった具合にこの当時のVOCALOIDよりも優れている点が多いというのに(合唱に関しては今でもVOCALOIDでは難しいとされていますし)、何で脚光を浴びなかったのでしょうね?

やっぱり、本体のみで31,500円、データベースが別途で31,500円~とVOCALOIDよりも明らかに高価だったからでしょうか?

 

まぁ、この時点でどんな歌声なのか判らないので、後で公式サイトにあるサンプルを確認してみましょうか…。

Share Button

Add a Comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)