超個人的穂歌ソラさん調声法

UTAUの古参男声音源である穂歌ソラさんを使い始めて五年以上経ち
最近ある程度その調声方法が定まってきたのでまとめてみました。

あくまで個人的な好みと感性による方法であり
これが良いとか正しいとかいったものではまったくないです。
UTAUで一番長く使っていて一番使い慣れている音源ですが
まだまだ使い方が下手で勉強中なので
ここから上達方法が見つかれば良いなあという主旨。


●音源のバージョン:穂歌ソラ_ver.20100914_2
●UTAUのバージョン:UTAUver.0.2.0.76
●メインエンジン:UTAUver.0.2.0.76付属のresampler
●サブエンジン:低音にfresamp(11以前のバージョン)、かすれ効果にTIPSかEFB-PB
 ※使用エンジンについての詳細はこちらの記事をご参照下さい

●音源の特徴
・単独音(CV)と連続音(VCV)同梱
・日本語音源
・単音階
・五十音にはないカタカナの単語に使うような一部の音素も単独音にはある
・ 連続音の「n ラ行」はない
・サ行や「しゃしゅしょ」はちょっと苦手
・連続音の音のつながりがなめらかで自然
・カレーが好き

 ●声質の特徴
・知る限り唯一無二の特徴的な声
・クリアで癖のない美しい日本語の発音(外国語は苦手)
・さわやか・優しげ
・空気分が少ない・芯がある
・色で言えば暖色系、暖かみのある声
・一部の単独音と連続音で若干の声質のギャップがある
・高音と低音での声質のギャップが大きめ
・エンジンによる声質のギャップが大きめ


ここから具体的な調声方法のまとめです。

【下準備】
●生成時オプション設定:B0Y0
プロジェクトプロパティで設定するのはこれだけです。
クリアな音が好きなのでbre設定を一括でできるBフラグをここに入れておきます。
(各音に個別に設定するbreの数値が優先されるので初期値をここで設定する感じ)
Y0は連続音使用時の基本という伝説を信じて。

●モジュレーション:0
ソラさんの調声法に関して
確か中の方の動画だったかテキストだったかで
モジュレーション0が推奨されていたように思います。
それを抜きにしても個人的にモジュレーション0の声が好きだし
何故か私が使っているUTAUだとモジュレーション100では
非常に音のつながりが悪くノイズが出るので
モジュレーションは0に設定しています。
100に近付くほどノイズとザラザラ感が増し
音痴に近付きます。
モジュレーション100の声にしか聞こえないのに
綺麗な音を作られる方もいらっしゃるので
上手い人は100でも大丈夫なのでしょうが私にはできません。

●「連続音一括設定」ですべての音を自動で一括設定
音素選びやピッチ調声等はあとでしますが
とりあえず基本的な音素の設定や
各音のクロスフェードのためのエンベロープ設定は
このプラグインで楽にすませてしまいます。
このあとの調声に死ぬほど時間がかかるので下準備はこれで短縮。

【調声】
● 音素選び
・全体的な声質をそろえるため
ソラさんは単音階ですが、単独音・連続音併用音源で
R(休符)のあとなどに来る「歌い出しの音素」は
基本的に母音以外は単独音を使う(連続音の「-」音素が母音以外ない)ので
この単独音が全体の中で浮いて聞こえる場合
他の音素(連続音のどれか)で代用する必要があります。
このギャップも持ち味と思えば別にしなくていいけど
個人的に気になることがあるのでやります。
例:「た」→「u た」
特に単独音の「た」が浮いて聞こえるので
「- た」とほぼ同じく口を閉じた状態から発音する
連続音の「u た」 で代用することが多いです。
当然、連続音なので頭に不要な音が付いているため
発音して欲しくない「u」の部分はエンベロープの設定で削ります。
「n た」でも良いですが「n」の音素は鼻にかかる場合もあるので
無難に「u」を使っていることが多いです。

・表情を変えたり表現のため
声質をそろえる目的の時と同様
基本的に単独音との差し替えに限った話ですが
単純に発音や発声の好みから音素を変える場合があります。
例:「か」→「a か」
ソラさんの「a か」の音素はどの「か」の声よりも
優しい声で発音されています。
そういった、同じ歌詞の音でも微妙に違う発音の音が欲しい
という時に好みの音素と入れ替えます。
多音階だとこの時に選べる音素が多くて理想の音が見つかる場合も多いですが
ソラさんは単音階なので求めたような音がない場合も多々あります。
なくても泣かない。

・滑舌を良くしたり音のつながり、流れを良くするため
曲によって効果的だったり逆効果だったりするので
使いどころをよく考える必要がありますが
破裂音や摩擦音は子音(先行発声?)が長めなせいか
一つ前の音の母音も邪魔に聞こえる場合があるため
サ行やカ行の前の母音を消して自然に聞こえるように
あるいは英語曲で前の余計な母音を消すためなどに
「n」で始まる音素に変える場合があります。
日本語でも「です・ます」などの「す (su)」の「u」はほぼ発音しないので
その「u」を消すために使ったりもします。
あとナ行やマ行の前の母音を「n」に変えて
ナ行やマ行の先行発声のように使ったりもします。
例:「a し」→「n し」、「i ま」→「n ま」

●エンベロープ調整
・自然な歌い方にするため
先述の「n」の音素で母音を消す手法と同じ感じで
直接エンベロープ設定で不要な目的の音を削る
ということもします(DAW上でやる場合も多いです)。
後ろに続く歌詞がない場合の「す」の「u」など
下の画像のように母音の「u」の部分をごっそり削ったりします。
英語曲ではこういうことをよくやります。
画像は「up」の「p」の発音に不要な「ぷ」の「u」を削ったところ。
他には、ソラさんは声に芯があるので
子音のあとの母音の発音がはっきりしていますが
それが逆に不自然に聞こえる場合
画像のように母音を少し削ったりもします(これもDAWでもやります)。
また画像では「ひ」の代用として「u ひ」を使っており
頭の不要な母音「u」をこのように削っています。
あとは単独音と連続音の音量差を均一にするために
大きく聞こえる音を下げる場合など。

・表現として
強弱を付けた歌い方、表現法として
また語尾を弱めて歌う表現法としてなど
エンベロープをいじって調声します。
これが上手くないのでもっと勉強が必要。
他に囁きっぽい線の細い声の作り方として
母音を大げさに削る方法をとっていますが
それはオケとの兼ね合いが大きいのでDAW上でやります。

●ピッチ調声
・歌い方の調節
前の音の高さを引きずったまま次の音を歌い出したり
次の音の高さまで落としながら歌う、といった
一音の中で変わる細かなピッチの変化による歌い方の調整
自分が歌って欲しい歌い方の再現としてのピッチ調声をします。

・表情付けや表現として
音の高さの変化に関する歌い方の調声とは別に
感情的な(やや裏返った感じの?)歌い出しにしたり
語尾を上げてしゃくり?を入れたりこぶしのようなものをきかせる
といった声の表情、表現の仕方としてもピッチをいじることが多いです。
ただソラさんはこのピッチ調整のかかり方が大きいようなので
あまり大げさにやると他の音源では自然に聞こえても
ソラさんだと破綻して変な声になったり不自然な歌い方になったりします。
あくまでソラさんに合った度合い・範囲で
最適なピッチの線を探して書く必要があります。
こんな感じ↓



●gフラグ
・全体の声質をそろえるため
基本的に声質を変えるためではなく
声質をそろえるために
ギャップのある音のgフラグを調節します。
また曲によって声が太く聞こえすぎたり
細く聞こえすぎた場合に「普段のソラさんっぽい声」になるよう
一部のパート・時には一曲全部の音を
gフラグで補正をかけて整えたりします。
女声にする、少年声にするといった声音?を変える目的で
gフラグを使うことはあまりありません。
ソラさんの普段の声が一番好きなので。

・表情付けや表現として
力を入れて歌って欲しいというか
低いところから深く強く歌って欲しいというか
重みのある感じの声にしたい箇所をあえてg+にしたり
逆に高音で抑えたような苦しそうな・あるいは声が暗い感じになっている時に
明るく・または軽ろやかに、のびのびとした感じで歌ってもらうためにg-にする
ということもします(全体ではなくごく一部の必要な音だけピンポイントで)。
その幅は±3~4におさまることが多いですが
曲によっては+6~-7といったあたりまでいくこともあります。
そこまでやっても全体的な声質に変わりは出ず
そこだけ不自然に声が変わるということにもなりません。
というか、そうならない範囲で調節します。
エモーショナルな曲ほどこのgフラグの幅は大きくなる気がします。

●その他
・囁きっぽい声の作り方
他の記事でも何度か少し書いてますが
ソラさんには囁き音源はないので
自分でそれっぽい音を作る必要があります。
私の場合はそれを音量調節で基本的にやります。
囁き声とまではいかなくても
弱い声、線の細い声というのは
「日本語の基本の発音=子音と母音のセット」これの
母音の音が弱いところから来ているように思えるので
がっつりと母音を削る手法で弱めの声を作っています。
下の画像は囁き音源が有名な雪歌ユフさんの「ささやき-ドリップ」の
音素の波形とソラさんの音素の波形を比べたものです。
画像の通りユフさんの母音はソラさんに比べて弱いことがわかります。
このユフさんの波形をソラさんで真似する(母音を削る)ことで
擬似的に弱い声を作るやり方を今はやっています。
UTAU上で削るとどうも金属音が出ることが多かったのと
先にも書いた通りオケとの音量の兼ね合いもあるので
DAW上でオケと一緒に聞きながらやります。

ちなみに高めの音ならTIPSかEFB-PBエンジンを使えば
勝手に声が自然にかすれて囁きっぽい雰囲気に近付くので
エンジンを変えた上で母音を削ると
少なくともresamplerでそのままの母音の音とは
違った雰囲気の声を作ることができます。
ただまあ、結構面倒くさいです。
あと的確な場所を適量削らないと非常に不自然に聞こえます。
しかもそれらを気を付けて頑張ってやっても
大して効果が出ないことも多くて泣けます。
もっと良い方法を見つけたい……。


とりあえずざっと思いつく限りでは
主な調声方法はこんな感じです。
同じフレーズを別のエンジンで書き出して
DAW上で子音と母音をそれぞれ別エンジンの音に変えて
無理やりつなぎ合わせるといったこともしてますが
書くと不毛な気がしたのでやめました。
音域に合わせて最適なエンジンで書き出したwavを
使うこと自体は普通だと思うし
一応UTAU上での調声がメインのつもりなので。
他に思い出したり追記があれば増えるかもしれません。

単音階で感情音源?も他に特にないシンプルなソラさんですが
それでもこれだけ手をかけて遊べる箇所があり
ちゃんと結果を返してくれる(良い結果かどうかは別として)音源なので
使っていて非常に楽しいです。
またシンプルだからこそ使いやすく
初心者でもとっつきやすい上に
いわゆるベタ打ちでもかなり自然に歌ってくれる
恐ろしいほど優秀な音源でもあります。

そしてもはや数え切れないほどの音源があるUTAUの中で
未だに同じ声質を持つ音源がいないと思われる
唯一無二の美声の持ち主です。
個人的には発音の美しさも推しポイントの一つ。
悪く言えば無個性とも言えるのかもしれませんが
変な癖のない上品な発音だと思います。
声質自体は前述の通り特徴的で似た声の音源がないくらいですが。
古い音源でも非常に素晴らしいので
ぜひこれからも使われて欲しいです。

コメント

このブログの人気の投稿

UTAUのエンジンと所持音源の相性メモ