スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

世界の音声合成

最近VOICEROIDを導入したことで歌声合成以外にも手が伸びだした渡辺です。この記事では私が使ったことのある「話し声を合成できるソフト」を紹介していきましょう。触ったことがないものはわからない。

1.VOICEROID

VOCALOIDも販売しているAHSさんが販売している音声合成ソフト。かなりの長文を入力しても重くならずに読み続けることができる。VOICEROID2になると複数の感情表現が混ぜられるようになるものもある。喜び、悲しみ、怒りなどの声質やイントネーション、抑揚の付け方などがブレンドできる。ゲーム実況や解説動画でもよく用いられる。最近ではバーチャルユーチューバーの声としても使われているようだ。場合によっては無理やり高度に制御することで歌わせる「歌うボイスロイド」という作品も存在する。

2.Softalk

ニコニコでは昔からよく使われているゲーム実況、解説でよく見る「ゆっくり」の声を作るソフト。AquesTalkという音声合成を利用したフリーソフトであり、一般層がPC上で自由に使う音声合成の走りともいえる存在。文字を入力するだけで読み上げてくれるが、特殊記号などを用いて制御することで思い通りのイントネーションでしゃべらせることも可能である。PCにインストールされているかなり多くの音声合成をSoftalkから呼び出すことができるためCeVIOなどもSoftalkからある程度コントロールできる。

3.AITalk

株式会社エーアイの提供する音声合成。VOICEROIDをはじめとする多くのソフトに組み込まれていたりする。VOICEROIDとおおむね同じような合成品質である。

4.VoiceText

かなり質の高い音声合成。個人で利用できるソフトウェアではないが、多くの言語、方言に対応しており自然な感情表現も可能。波形合成とディープラーニングを併用しているものもあるようで、細かな息遣いなども駆使した「演技」が可能である。「音声合成の声優事務所」というコンセプトのもとキャラクターもマネジメントされている。自分の手で触りたくてしょうがない。キャラによっては歌を歌うことも可能であり、こちらは楽譜通り歌うのではなく楽譜を読んで勝手に表現して歌うというものであり、やはりクオリティーは人間と聞き間違うほど。

5.CeVIO

ソング機能もあるCeVIOですが、トーク機能もあります。統計的アプローチによる音声合成で、文字を打ち込めば読んでくれる。発売当初から感情モーフィングが搭載されており、喜・怒・哀によって違う声質や抑揚を混ぜて読み上げさせることができる。CeVIOのバージョンが6になったタイミングで仕様が変わり、VOICEROIDのように視覚的にわかりやすく操作しやすいイントネーションコントロールが可能になった。それでいて音素ごとの細かい音程・長さなどの調節が可能で作りこみ要素が多い。

6.LaLaVoice

東芝のPCに入っていた音声合成。アナウンサーのように読み上げてくれる。作りこみ要素はほぼほぼないが、合成スピードがかなり速く本当に読むだけでいいときにパフォーマンスがよい。

7.OpenJTalk

Sinsyと同様ブラウザ上で動く音声合成で、統計的アプローチによる音声合成。やはりCeVIOの前身ともいえる。値を調整しては合成を繰り返すので手間はかかるが、感情モーフィングも可能である。

8.Softalk-唄詠

SoftalkでUTAU音源を喋らせるためのプラグインが唄詠である。しゃべらせたいUTAU音源を登録することでSoftalkで入力した内容を特別な調整なしでしゃべらせることができる。

9.UTAU-HANASHITAI

UTAUでUTAU音源を喋らせるための補助プラグイン。読み上げさせたい内容を入力すると合成してくれたり、UTAUでいじれるようにシーケンスデータを作成してくれる。場合によってはMMDを口パクさせて表示することもできる。イントネーションのコントロールもVOICEROID同様の手順で行うことができるためHANASU初心者にはお勧めできる。

10.HANAUTAU

あらかじめ読み上げさせたい内容を登録しておいたり、リアルタイムにタイピングしながら鼻歌の方法で声を出すと、それをマイクで拾いピッチを取りキャラの声と合成して出力できる。要するに音程は自分の喉で作り、発音はタイピングで行うリアルタイム音声合成。

11.LYREBIRD

自分で英語の音声合成ライブラリを作ることができる学習系音声合成。ブラウザで動く。5分から30分ほど提示される英文を読んで録音すると英語ライブラリを制作してくれる。制作にかかる時間はそこまで長くはなく、出来上がれば読み上げさせたい英文を入力して合成ボタンを押すことで読み上げができる。うまく学習させることができれば自分の英語の癖を持ったライブラリが出来上がるが、上手にできないと、発音が飛んだり聞き取れないものが出来上がる。

12.Alter/Ego-MarieOrk

モントリオールのVST系歌声合成Alter/Egoの新音源MarieOrkにはトーク用のプリセットが用意されている。DAW上でスペイン語訛りのような英語を喋らせることができる。

13.なめうぇーぶ

人力ボカロ用ツールとして作られた音声合成ソフト。録音された音声を切り貼りして話し声を作ることができる。アプレットと呼ばれる機能ごとのモジュールを呼び出して使う。音素切り出しようのアプレットで音素を集め、音素検索アプレットで必要な音素を集めてきて、編集用アプレットでピッチや長さなどを手動で作っていく。UTAU音源を使うことも可能。

音声合成は実に多種多様で、信号機や炊飯器、湯沸かし器に電子辞書に掃除機だってしゃべる時代。ロボットは当然しゃべるしおもちゃだってしゃべる。Nakloidのトーク機能やSHABERU、メグッポイドトークにギャラ子トークにガチャピンに音街ウナTalkもあるし、アプローチの仕方だって千差万別なのです。


著者 渡辺芳綱(ワタナベ ヨシツナ)
ネット上では『くろ州』名義で歌声合成ソフトを使ったカバー曲を作成したり歌声合成技術の話をしたりしている。VOCALOID世界大会で分科会を開いたりUTAU勉強会で講師をしたりCeVIOFeSTAにサークル参加したりSharpkeyのアナウンス翻訳を担当したりと手広い。

実績と依頼(http://twpf.jp/96s_kM4osM)
スポンサーサイト

世界の歌声合成

世界を股にかける歌声合成マッドジャンキー渡辺です。今回は世界にある歌声合成のうち私が触ったことのあるやつを紹介していきます。触ったことないやつは紹介しようがない。

1.VOCALOID

国籍:日本
歌声合成ソフトブームを世界にもたらした日本の歌声合成VOCALOID。影響力がでかすぎる。世界の歌声合成ソフトと比較してみたときにユーザーのアクティブさが異常に高い。こだわらない分には簡単に操作できるが、直観的な操作は少し苦手。ユーザーの作る作品はオリジナル曲が多く、メジャーアルバムが出たりライブイベントがあったりと商業の強み全開の展開がアツい。

2.UTAU

国籍:日本
「VOCALOID持ってないから作った」という経緯で誕生した歌声合成。もともとは人力ボカロ用の補助ツールであったが今では「ユーザー自身がハイクオリティーなオリジナルバーチャルシンガーを作ることができる」という特徴的なソフト。その独自性からほかの歌声合成ユーザーとは毛色が違う。ユーザーの作る作品はカバー曲とバーチャルシンガーが多い。

3.CeVIO

国籍:日本
統計的アプローチによる合成を行う歌声合成。ただ単に打ち込んだだけでも人間らしいピッチやタイミングのずれがありクオリティーが出しやすい。世界でも最も細かく音量をいじることができ直観的な操作感が特徴。「タイミング」という独特な調整パラメーターによって独自の歌声を作り出す。歌だけでなくトークも簡単に作成できるためユーザーの作る作品は多岐にわたる。

4.Aquestone

国籍:日本
音楽制作アプリ(DAW)上でプラグイン(VST)として動く歌声合成。「ゆっくり」で知られるAquesTalkと同じところからリリースされている。音声の人間らしさでは上記のような歌声合成には及ばないが、声自体がブランド化している面もあり「機械的な声」としてはとても優秀。技術的な性質上発音タイミングを正確に設定するのは骨が折れるが、リアルタイムに歌わせることに強い。

5.Alter/Ego

国籍:カナダ、モントリオール
Aquestoneと同じくDAW上でVSTとして動く歌声合成でリアルタイム合成に比較的強い。シンセサイザーらしい声も人間らしい声も出すことができ、操作感は比較的VOCALOIDに似た感じがする。適用できるパラメーターは現在流通している歌声合成の中でもかなり多い方である。カナダで開発され、バーチャルシンガーも英語フランス語スペイン語っぽい英語などが母国語ではあるが、どれもなぜか日本語に対応している。

6.Sharpkey

国籍:中国
中国で生まれた波形接続の髄を集めたような歌声合成。VOCALOIDのような声質パラメーターを持ち、CeVIOのようなタイミング調整機能があり、UTAUのようにサンプルの差し替えやノート配置ができ、さらにオリジナルの「力度」「交叉」など新しいパラメーターによる調声が可能。日本語音源はまだないが、完成したらかなりの脅威になりえる。

7.MUTA

国籍:中国
中国版CeVIOともいうべき歌声合成。CeVIOと同様に統計的なアプローチによる歌声合成であると思われ、打ち込んだままの状態でも自然に歌ってくれる。CeVIOとは違い、多少楽譜通りではなく勝手に表現して歌ってくれる。トークも可能なようである。現在バーチャルシンガーは一人しかいないが追加の予定はあるのだろうか。なさそう。

8.RenoidPlayer

国籍:日本
サウンドフォントベースのブラウザで動く歌声合成。合成クオリティーはAquestoneと大差ないが、UIの構成からしても比較的扱いやすい。ブラウザではなくRenoiseというDAW上で動く歌声サウンドフォントをRenoidのボイスファイルと定義しており自作が可能。RenoidPlayer上で使うこともできる。

9.Sinsy

国籍:日本
Renoidと同じくブラウザで動作する。CeVIOと同じく統計的アプローチによる歌声合成である。むしろ経緯からするとSinsyはCeVIOの前身であるといえる。Sinsy自体ではシーケンスデータ(Sinsy用の楽譜データ)を作ることができないのでCeVIO他のソフトウェアで作ったものをアップロードし、合成結果が返ってくるのを待つ。日中英に対応しており、同様からポップスまで幅広く歌える。やはり素で自然に歌ってくれるが、修正したいときはほかのソフトで行う。

10.Nakloid

国籍:日本
UTAUにフリーライドしている歌声合成。UTAUのシーケンスデータUSTが読み込めたりUTAUのバーチャルシンガーをコンバートして使うことができる。Nakloidというのはエンジンの名前で、GUIを持つソフトの名前はNakloidGUI。GUIの開発は途上であるが、UTAUではできない合成音声の波形表示ができたり、正式にトーク機能がついていたりする。音質は固め。

11.なめうぇーぶ

国籍:日本
UTAU同様人力ボカロ用のツールとして作られたソフト。UTAU音源を使うことも可能。MIDIキーボードを使うことによってリアルタイム合成用のものを除けばおそらく世界で最も早く打ち込みができる歌声合成である。録音された音声ファイルから音素を切り出し切り貼りすることができるツールであり、アプレットと呼ばれる機能別のモジュールを使って作業を進めていく。原音設定が自由で流動的にできる。

12.DelayLama

国籍:オランダ
歌う僧侶。妙にいい声と妙にイラつく顔が特徴。DAW上でVSTとして動く歌声合成であって、子音を発音することはできない。MIDIのピッチベンドで母音を変化させルという独特の方法で母音を滑らかに遷移させることができる。ボイスパッドとして使ったり、歌詞はガン無視でメインを歌わせたりすることができる。声の主張はとても激しい。

13.LaLaSong

国籍:日本
東芝のPCに入っていた歌声合成ソフト。おにいさん、おねえさんなど9キャラプリセットされている。ほかの歌声合成はたいていピアノロールでの打ち込みを行うがLaLaSongは五線譜での打ち込みを行う。子音によっては発音が遅れることもあるためその辺は修正が必要であるが、声の滑らかさはAquestoneやRenoidよりも高い。

14.Unity

Unity自体は歌声合成ソフトではないがVOCALOID SDK for UnityというUnity上で使える簡易なVOCALOIDエンジンが提供されているためランタイム版Unity-chan!が歌うゲームアプリが開発できる。シーケンスデータの再生をするモードやリアルタイムで合成するモードなどがある。VOCALOIDと比べたときに確かに音質は下がり、合成も完全に思い通りとはいかないが自分でアプリに組み込める歌声合成エンジンとしては最も環境が整えられている。

15.VOCALINA

国籍:韓国
サブスクリプション方式で利用料を支払って使う韓国の歌声合成。VOCALOID以外ではかなり珍しいミキサーにVSTエフェクトをさして利用できる歌声合成である。現在利用可能なバーチャルシンガーは一人で、利用するには月額大体600円ほどを支払う必要がある。歌声の滑らかさはAquestoneやRenoidと大差ない。韓国ではオリジナル曲やK-POPカバー作品などが作られているようだ。

16.HANAUTAU

国籍:日本
シーケンスデータを作るのではなく鼻歌からピッチを取り出し歌詞に適用させることでリアルタイムに合成する独特な歌声合成。その性質からトークに活用することもできる。歌詞データをあらかじめ入力しておけばリアルタイムにライブ演奏することもできる。一種のボイスチェンジャーといえなくもない。

17.MyMIDIVocalist

国籍:日本
約20年ほど前から存在する非常に古い歌声合成ソフト。Win10でも動作は確認できた。バーチャルシンガーを制作するところからシーケンスを作り合成するところまで可能な総合的歌声合成ソフトである。滑らかさはAquestoneやRenoidと大体同じで、仕組みとしてはRenoidとほぼ同じであるといえる。

18.v.ConnectStand

国籍:日本
汎用歌声合成シーケンサーCadenciiと連携して使うことができる。UTAU音源をコンバートして利用することも可能であり、複数の歌声をモーフィングして混ぜることができる数少ない歌声合成の一つ。VOCALOIDでいうところのクロスシンセシスのように弱音源と強音源を音程に合わせて混ぜ合わせることが可能。

歌声合成はほかにもドイツのCANTORやNTTのワンダーホルン(現在はどうなってるかわからない)キーボードによくついてくるコーラス音源やMikoVoiceにNIAONIAO、CANTUS、Soloists of Prague、ボーカルサンプル集なんてのもあるわけで、世界中にごろごろ転がっています。

そしてこれからもまだまだ増えますよ。楽しみにしています。


著者 渡辺芳綱(ワタナベ ヨシツナ)
ネット上では『くろ州』名義で歌声合成ソフトを使ったカバー曲を作成したり歌声合成技術の話をしたりしている。VOCALOID世界大会で分科会を開いたりUTAU勉強会で講師をしたりCeVIOFeSTAにサークル参加したりSharpkeyのアナウンス翻訳を担当したりと手広い。

実績と依頼(http://twpf.jp/96s_kM4osM)

そろそろ梅雨ですねぇ

ご無沙汰しております。
Arpeggio会員4回生の
ほたて
と申し上げます。

最近
暖かかったり、
暑かったり、
涼しかったり、
寒かったりと
気温の変化を感じるのが
楽しく思ってます。

昨日6月7日(水)くらいに
梅雨入り宣言されたんじゃなかったかな。

雨は嫌いじゃないです。
眺めるのは好きです。

けど、雨の中歩き回ったり
チャリンコで走り回ったりするときは
濡れるし傘ジャマでめんどくさいから
外にいるときはあんま好きじゃないかな…。

おうちや大学の施設の中とかから
雨が降ってるのは見てて落ち着きます。

雨が降ったら空気中のゴミとかが流されて
空気が綺麗になるから
深呼吸すると気持ちいいです。
みなさんもしてみてください。
雨が少しは好きになれるんじゃないかな。

一番好きなのは雨があがってからの時間。
雨降ってないし空気は綺麗だし涼しいし
いいことだらけです。
運が良ければ虹🌈も見れるし♪

豪雨も割と好きです。
相変わらず外を歩くと酷いことになるけど、
たまにすべてを諦めて豪雨の中傘もささずに
つっ立ってずぶ濡れになるのも悪くない。

台風とか嵐も
屋内から見てる場合は
テンションあがってくるし好き。

もしこれ読んでくれてる方がいらしたら、
みなさんも雨の悪いとこばかり見て
嫌に思ったり鬱っぽくなるんじゃなく、

雨の良いとこを探してみて
少しでも雨の日を楽しんでもらえたら
いいなと思います。



あ、あと
引っ越してから我が家に
セキセイインコ(写真)がやって来ました。

人に慣れまくってて
部屋で放鳥してると
ちょっかいばっかかけてきて
ウザかわいいです。


なんかぼそぼそ呟いてるばっかで
ボカロの話が微塵も入ってないので
少しはしとこうかな。

今週月曜日にNHKの番組で
「初音ミク feat, 鼓童」
ってやつをやってて、
和太鼓演奏集団「鼓動」と
初音ミク(とそのお友達)が
共演してるライブの放送をしてました。

ボカロの曲を
「バンド演奏+和太鼓とかの打楽器」
で演奏してました。

千本桜
初音ミクの消失
初音ミクの激唱
積乱グラフィティ
リモコン
とか10曲くらい演奏してました。

正直、凄かった…。
演奏もだけど、
ミクさんのダンス映像が
めちゃ細かく作り込まれてて
クリエイターの本気を見た気がしました。

もうボカロも
立派な日本の誇れる文化なんだなぁ
としみじみ思いました。

2020年東京オリンピックの開会式とかにも
出てくるんじゃないかなと
期待しとこうと思います♪



うわ~…。
なんかこのブログの記事を書いてたら
気づいたらこんなにも書いてた…。
まぁ、自己満足ってことでいいや( ´△`)

もし誰かがここまでこんなただの呟きを
読んでくれた方がいらしたら
お礼を言わせてください。

ここまで読んでくださって
ありがとうございます。


それでは、また今度いつか~(・∀・)ノ

テーマ : 今日のつぶやき。
ジャンル : 日記

会長ロイド・Marine・新音源の制作中

会長ロイド・Marineをリリースしてからいくらか日にちが立ちました。

現在Marineのバージョンアップ、会長ロイドの拡張音源追加、新女性音源の制作作業中です。

【内容】
・「〇’」で無声化(弱化)する機能の仕様変更、もしくは削除
・会長ロイドの音域拡張
・会長ロイドPower音源・Soft音源追加
・児童会長ロイド(しょた声音源)追加
・新女声音源制作
・不具合と原音設定の修正
・TIPSとMoresampler・fresampに正式に対応するかも

「〇’」で無声化(弱化)する機能はTIPSでしか動作しないようですし、そもそもMac版UTAUではこの機能使えないようなので。

会長ロイドは適応音域を上にも下にも広げました。そのうえで叫ぶように歌うPower音源と息成分の多いSoft音源を追加します。

児童会長ロイドは2016年度会長さんが無理やり出したしょた声で作った音源です。最初の録音の時にできてはいたのですが、その時はボツにした幻の音源が復活します。

新女性音源は低音に強いです。今まで同様、単独音・連続音・CVVC音源として利用できる音源になります。そして新たにちょっとした工夫を加えて、子音の引き延ばしに強い音源になります。

いずれも2017春にリリースです。

スポーツの秋に思い出した事

台風18号(CHABA?)が去って今日は気持ちのいい晴れですね。
毎回毎回、「非常に強い台風」なので、
たまには「台風の形をぎりぎり保ったなめてかかっていい台風」が来て欲しいものです。

そして、お久しぶりです。
ブログが当番制になったので、気をぬいて更新がめっきり減ってしまった、きこです。
サークルにもしばらく顔を出せていなくて申し訳ない。

この間、近隣の小学校で運動会がありました。
たぶん、先週末、今週末あたりに開催されるところも多いのではないでしょうか。

私の近隣の小学校では、準備運動の代わりに「全体ダンス」というのをします。
曲は、ウチの小学校は運動会実行委員の人が独断と偏見で決めていました。
そして、そのとあるの小学校の近くを通り過ぎたとき、
サマータイムレコードが全体ダンスの曲として流れてきました。

時代の流れを感じました。

私たちの頃は、男性アイドルの曲でした。
選曲の理由も、小学生なりに必死に理由をこじつけてました。
ああ、懐かしや。



多分、今年この曲を案で出して来た子は、「”晴天” とか ”快晴” って言葉が出て来るから」
とかなんとか言ったんだろうなー笑
プロフィール

Arpeggio D

Author:Arpeggio D
いらっしゃいませ
VOCALOID研究会Arpeggio
ブログにようこそ!

サークル活動の紹介をしています。

曲紹介などもやってますよー

よかったらみていってくださいな(^o^)

最新記事
最新コメント
twitter
最新トラックバック
月別アーカイブ
カテゴリ
Ring Clock
Flashカレンダー
アクセスカウンター
フリーエリア
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。