VOICEVOX(ボイスボックス)とは、無料で使える商用利用可能の音声読み上げツール。人間のような自然な声でテキストを読み上げてくれる音声合成ソフトです。
最近有名なChatGPTのようなAIの一つの形態で、文章を音声に変換してくれるツールがこのVOICEVOXなのです。
今回紹介するVOICEVOXは声優さんやVtuberなど様々な方の協力を得ているので、機械的な声ではなく、とても人間的な音声を作ることができます。
自分の声で音声を録音したくない方や動画を機会に完全に任せてしまいたい方には役に立つツールではないでしょうか。
VOICEVOXでできること
VOICEVOXでできることは、
・キャラクターボイス
・商用・非商用問わず無料で利用可能
・インストール後すぐに使えるソフトウェア
・イントネーションの詳細な調整が可能
・喋り声で歌えるハミング機能搭載
とはいえ、機能を一言でいうと、たった一つ、音声ファイルを作ることだけですから、動画を作りたい場合は、別に動画編集ソフトを用意する必要があります。
編集ソフトに関しては、無料から有料まだ様々なものがありますので、ご自身の使い勝手の良いものを選んで動画作成するのがよいでしょう。
動画編集ソフトはWindowsならClipchampやAviUtlがありますし、少し手の込んだことをしたければ有料ソフトのDaVinci Resolve、Adobe Premiere Proなどがよいかもしれません。
ただ、VOICEVOXを使うなら、「ゆっくりMovieMaker4」。Windowsでしか使えませんが商用、非商用ともに無料で使える「ゆっくりMovieMaker4」がVOICEBOXなどの合成音声を使った動画づくりに向いています。
■ゆっくりムービーメーカー4 Lite:https://manjubox.net/ymm4/
VOICEVOXはスマホで使えない
VOICEVOXは理由はWindows/Mac/LinuxといったOSが必要なので、スマホで使うことができません。
ちなみにタブレットの場合、Windows10/11、MacOX Catalina以降、Linux Ubuntu18.04・20.04が搭載されていたら使えますがiPadOSは使えません。
どうしてもスマホで使いたい場合は本家のものとは異なり非公式のツールとなりますが、WEB版VOICEVOXなら利用できます。
■WEB版VOICEVOX:https://www.voicevox.su-shiki.com/
商用・非商用問わず完全無料
VOICEVOXは商用利用、個人利用ともに完全無料で使うことができますが、何も条件がないわけではありません。
気を付けておきたいポイントが二つほどありますので紹介しておきます。
・収録キャラごとの利用規約を守ること
一つ目は収録キャラ、つまり使う音声データのごとに無料で使う条件が少しずつ異なっています。
その条件はVOICEVOXのホームページやソフト内のヘルプに記載されていますので必ずチェックして、約束事を守るようにしましょう。
ちなみに立ち絵を使う場合も別途立ち絵を作った人のルールも存在しますのでそこも守るようにしましょう。
・クレジット表記が必要
クレジット表記とはクレジットタイトルのことで、誰が作ったものなのかを書くことで、VOICEVOXを利用するにはこれを記載しておくことが商用利用、非商用利用ともに必要になります。
具体的に言うと、音声の提供ページや動画の最後とか、説明欄に「VOICEVOX:ずんだもん」のような表示をする必要がある、ということです。
ちなみに動画ではなく音声で配布をするときは、音声で読み上げることも可能となっていますので参考にしてみてください。
あと、もち子さんの場合は「VOICEVOX:もち子(cv明日葉よもぎ)」のように声優名を書く必要がありますから注意しましょう。
VOICEVOXのインストール方法
VOICEVOXを導入するためにインストールしなければなりませんので、そのやり方について説明します。
まず、VOICEVOXの公式サイトにアクセスします。下に公式サイトへのリンクをつけておきますが、ひらがなやカタカナで検索しても出てきますから、そちらから入っても大丈夫です。
voicevox公式サイト:https://voicevox.hiroshiba.jp/
公式サイトの下のほうにはボイスサンプルがありますので、インストールする前にどんな音声が使えるのかを一度ざっくりとでもよいので確認しておくことをおすすめします。
それではインストール方法を順番にお伝えしてきます。
1 ソフトのダウンロード
公式サイトのトップページに、ダウンロードボタンがありますので、そこからVOICEVOXのプログラムをダウンロードします。
まずはこのダウンロードボタンをクリックしてみましょう。
すると下のようなボックスが表示されますので、
・OSは、ご自身のパソコンのOS
・対応モードは、CPU
・パッケージは、インストーラー
を選んでダウンロードボタンをクリックします。
ダウンロードボタンを押して警告が出る場合もありますが、単純にパソコンからの注意書きとしてとらえてもらって大丈夫です。
詳しくは公式サイトのQ&A(https://voicevox.hiroshiba.jp/qa/)に対応方法が書かれていますので、表示された注意書きに応じて対応していけば問題ありません。困ったときには確認してみてください。
ちなみにWindowsの場合だと下のような表示が出ますが、「詳細設定」をクリックすると「実行」ボタンが表示されて続けられるようになります。
2 インストールファイルの実行
「VOICEVOX-CPU.Web.Setup.0.16.1.exe」というファイルがダウンロードされますので、完了したあとは、右クリック→開く、でそのファイルを実行しましょう。少々時間がかかります。
ちなみにファイルの実行中に土のユーザーにインストールしますか?といった表示が出た場合は、「現在のユーザーのみにインストールする」を選択して「次へ」をクリックして大丈夫ですし、インストール先のフォルダーは初期値のデフォルトのままで問題ないです。
条件が整えば、インストーラーに「インストール」のボタンが表示されますので、それをクリックしましょう。セットアップ完了まで少し時間がかかります。
セットアップ完了したら最終確認画面が表示されますので、「使い終わったダウンロード済みファイルを削除する」にチェックを入れて「完了」ボタンをクリックします。
3 起動前の設定
「VOICEVOXを実行する」にチェックが入っているとこの時点でVOICEVOXが立ち上がり、利用規約が表示されますので、確認後に右上の「同意して使用開始」をクリックします。
次に表示される画面は、VOICEVOXのトップページは追加キャラクターの紹介になっています。
サンプルボイスを確認できますし、キャラの並び順も変えることができますので、気に入ったボイスキャラクターを上に設定しておくと便利かもしれません。
後でも設定できるのでここはとりあえず、右上にある完了ボタンをクリックしましょう。
そうすると、「使いやすさ向上のためのお願い」というページが表示されます。
ざっくりいうと、よく使われるボタンなどのデータを収集してより使い勝手のいいプログラムへと改良したいので、操作するデータを送信しても良いか聞いています。
入力したテキストや生成した音声ファイルなどは送信しないそうなので、協力できるようであれば、右上にある「許可」をクリックします。拒否しても動作には影響ないようですが、より使いやすいインターフェースに変えてもらえるのであれば、協力してもやぶさかではないのではないでしょうか。
この許可か拒否のボタンを押すとボイスボックスの操作画面が出てきます。これで導入は完了しました。
お疲れさまでした。
VOICEVOXの初期設定
操作画面が出てきたので、早速使ってみたい、と思われるかもしれませんが、初期設定をしておくことで使い勝手がよりよくなります。
これからも十分に使っていくために、まずは初期設定だけ済ませてしまいましょう。
オプションの設定
設定からオプションを選んでクリックするとオプション設定画面が開きます。
といっても、オプション設定画面で設定するものはほとんど初期設定のままで問題ありません。
より使い勝手を良くするための設定を初めて使う方のために簡単にお伝えしておきます。
書き出し設定をONにする。
はじめに、「保存」のところにある「書き出し先を固定」をONにしておきましょう。
これをONにすることで保存した音声を毎回どこに保存するか指定しなくてよくなるので手間が省けるようになります。
保存先の設定はフォルダマークをクリックして好きな場所を選んでください。
保存先の指定がよくわからなければ、ドキュメントの直下に「voicevox_data」のファイルを作って設定しておくとよいでしょう。
次にするのは、その下にある「書き出しファイル名パターン」の設定。
編集ボタンをクリックすると設定用のポップアップが表示されますので、そのまま「確定」のボタンをクリックしておけば大丈夫です。
次に、その下にある、「上書き防止」と「txtファイルを書き出し」をオンにしておくと後々便利です。
上書き防止をONにすることで、前のデータのほうがよかった、というときなどに巻き戻すことができますし、「txtファイルを書き出し」をONにすることで、音声の文字起こしファイルを作ったり、動画編集するときの字幕作成などに役に立つでしょう。
次に設定しておくのは、実験的機能で、何も考えずにONにしておいて大丈夫です。
特に「疑問文を自動調整」の項目は文章に?マークを付けたときに、語尾が上がって疑問文らしい発音に変換してくれるのでお勧めです。
最後にあるデータ収集の項目は、最初に「許可」か「拒否」をクリックした内容と同じ項目でデータ収集に関する事項です。
文章データも音声データも送信することはないそうなので、もし協力できるようであれば、ONにしておいて大丈夫です。
ヘルプ
ソフトウェアを使うとき、あまり見ることの少ないヘルプですが、クレジット表記についての説明や使い方の説明があるので、一度目を通しておくことをおすすめします。
ざっくり説明しますと、以下の通りです。
・ソフトウェアの利用規約
インストールするときに説明された利用規約です。これから使う際のルールになるので、もめることを防ぐためにも、規約を確認しておくことは大切です。
・音声ライブラリの利用規約
各音声を利用するにあたっての規約です。クレジット表記などの方法も書かれています。音声ごとに若干違いがありますので、使う音声に応じて確認しておくことが必要です。
商用、非商用ともに無料で使えるソフトだからこそ、よく確認しておき、利用条件を守りましょう。
・開発コミュニティ
VOICEVOXはオープンソースのソフトウェアなので、そのプログラムの中身、ソースコードが公開されています。
わからなくても利用する分には全く問題ありません。上級ユーザーになってプログラムが気になったときはこちらを確認してみると新しい発見があるかもしれません。
・ライセンス情報
使われているプログラムのライセンス情報です。
・アップデート情報
これまでの更新情報が記載されています。
・よくあるご質問
インストールの質問から使い方やクレジット表記の問題解決まで網羅されていて、まずは一度目を通しておくことをおすすめします。
・お問い合わせ
感想や要望の連絡方法、不具合やバグの報告方法などが記載されています。
使い方の問い合わせなどは受け付けていないようなので、使い方がわからないときは、「使い方」や「よくあるご質問」の項目をしっかり確認してみるとよいでしょう。
VOICEVOXの使い方
それでは、VOICEVOXの使い方を簡単に説明していきます。
使い始めの方向けへの説明ですので、使えるようになることを目的としてまとめました。
深い内容を確認したいときは公式サイトで確認すればもっと詳しいことが書いていますから、中級者以上のテクニックも知ることができます。
また、YouTubeなどのサイトでも使用方法が紹介されていますので、熟練者向け高騰テクニックはそちらでご確認ください。
まずは読み上げさせたい文書を入力する
VOICEVOXの使い方はとても簡単で、文章を入力して再生すればよいだけです。
文章の入力は横線が引かれているところに入力します。
ボイスキャラクターを変更するには、文章入力欄の横にあるアイコンをクリックすればOKです。キャラクターの一覧が表示されるので望みのキャラクターを選択しましょう。
文字入力エリアの下にある+ボタンで文字入力の行を増やすことが可能です。
行を消したいときは、消したい行にカーソルを合わせるとゴミ箱マークが表示されますので、それをクリックすれば行を削除することができます。
読み方の修正
入力した文字が漢字の場合などに、読み方が違う場合があります。
その場合には変更したい文字に合わせると太文字に変わりますので、そこでクリックすれば変更のためのダイアログが表示されますから、その文字を変更すればOKです。
声を調整するときのポイント
VOICEVOXのAIはとても優れたAIなので、ほとんど調整することなく、そのまま利用できることも多いです。
とはいえ完璧なAIではないので、少し調整したくなることがあるかもしれません。その声を調整するとき、注意しておくポイントがいくつかありますのでいくつか紹介しておきます。
まず、少しくらい違和感があっても、気にしないこと。そして、慣れるまでは微調整だけを心掛けてください。
所詮AIですので、人間の音声に近づけようと完璧を求めすぎると逆におかしな音声になったり、時間だけかかってしまったりすることも少なくありません。
適度なところで妥協することが大切です。
もし、もっとリアルにしたい、ということであれば、お金を出して実際に声優さんに文章を読み上げてもらうことも可能だったりします。なので、そのサービスを利用することも視野に入れておくことが限られた時間を使って取り組むなら大切な判断になってくるでしょう。
機械的な音声から人間的な音声への調整
また、VOICEVOXがいくら優れた音声読み上げソフトとはいえ、AIはAIなので、機械のような読み上げ方をするときがあります。その時はアクセントを変更することで改善しましょう。
下にアクセントの表示を添付しています。見方はとても簡単で、上になっているところが高い発音でアクセントが置かれる位置。そして、下になっているところがアクセントがない発音となります。
下のほうにアクセントの設定画面がありますので、その縦棒のところを変更すればアクセントの位置を変更できます。
また、文字と文字、縦棒と縦棒の間をクリックすると間をとったり間を消してつないだりできますので聞き心地の良い音声に調整していくことができます。
上の図で、ハジメ、マシテ、シコクメタンデスの3つに分割されていると思います。この3つの3つの塊、それぞれをフレーズといいます。
上の例では、フレーズが3つある、ということになります。
フレーズとフレーズの間が空いているところでクリックすると、前後のフレーズが合体して二つのフレーズが一つになります。
反対に文字と文字の間をクリックすれば、二つのフレーズに分割することができます。
アクセントだけでうまくいかないときはこのフレーズの結合や分離でうまくいくことがあります。
初心者の内はイントネーションは触らない
初心者のうちは、アクセントの下にある「イントネーション」を触らないほうがいいです。
一文字ずつ声の高さを設定できるので、アクセントより細かく設定できるのですが、慣れないうちに触ると泥沼にはまって、最終的には最初のほうがよかった、という結末にたどり着くことが少なくありません。
操作に慣れてきて、中級者以上になったときの機能としてもっと良い音声に変化させたいというときに利用しましょう。
長さも触らない
イントネーションと同じように、一文字の発音する長さを調整することができます。
とはいえ、これも慣れないうちに触り始めると、最初のほうがよかった、という結果になることが少なくないでしょう。
中級者以上の機能として慣れてきたら使う、というようにしたほうが良い機能ですが読点「、」に限ってなら、その長さなら初心者でも比較的利用しやすい部分。
「、」の位置のせいでなにか違和感があるときは触ってみても良いかもしれません。
それでは次に右側コンソールの内容について説明していきます。
話速は話す速度の調整
話す速度を調整できて、下げるとゆっくりな話し方になり、あげると早い話し方になります。
キャラクターごとに初期設定された話速が決まっており、もともとゆっくり話すキャラクターは速度を上げても遅いですし、早口のキャラクターは下げても比較的早口だったり、早すぎて声がつぶれて聴き取れなかったりしますので注意してください。
音高は声そのものの高さを変える
温厚を高くすると全体的に声質が高くなり、下げると逆に低い声になります。
これもキャラクターごとに初期値が異なりますし、やりすぎると声がかすれたりしますから、それぞれ限界値を見ておくことをおすすめします。
抑揚は話し方のテンション
抑揚は話すテンションを変化させます。
抑揚を上げると発音の高低差が大きくなります。抑揚を下げると棒読みのような感じに仕上がります。慣れないうちはうまく使うことが難しいかもしれません。
使い方に慣れてくれば、音高と合わせてうまく使うことができれば、感情を表現することも可能になる便利な機能です。
音量は出力音声に直結する
音量は作成した音声の大きさを調整する機能で、出力する音声について設定することになります。
この部分もキャラクターごとに初期設定値が異なりますから、これが最適、というものはありません。使うキャラクターごとに設定値を試してみて最適な値を見つけていきましょう。
開始無音と終了無音
開始時の無音時間と終了時の無音時間を設定する項目で単位は秒です。
基本的には初期値が0.1で設定されます。使いたい長さで設定して問題ありませんので、用途に応じて好きな長さで設定して大丈夫です。
モーフィング
音声を二つ重ねる合成音声作成機能で合成したい音声キャラクターを選んで、その強度となる数値を設定します。
数値を下げると元のキャラクターの音声が強くなり、数値を上げると、モーフィングで選んだキャラクターの音声が強くなります。
クレジット表記は重ねる前のキャラクターの分と重ねた後のキャラクターの分、二つのクレジット表記が必要になるので注意しましょう。
音声出力
作成した音声を出力する方法は3つあります。
それぞれ特徴があるので、用途に応じた出力方法を利用するとよいでしょう。
・音声書き出し
それぞれの行をそれぞれ別ファイルとして音声出力します。
・一つだけ書き出し
入力した行の一つだけ、音声ファイルとして音声出力します。
・音声を繋げて書き出し
すべての行を一つの音声ファイルとして音声出力します。
ビジネス利用に適しているVOICEVOX Nemo
VOICEVOX Nemoは現時点で女性音声が6種類、男性音声が3種類のキャラクターがいないので、ビジネスシーンでも使い勝手がよくなります。
Nemoの音声はキャラクターがいないので立ち絵はありません。ただ、その分先入観なく利用できるのがメリット、といえるでしょう。
使い方はVOICEVOXのソフトに音声データとしてインストールすることになります。
VOICEVOXの追加音声データとして使うことになりますので使い方はVOICEVOXと同じになります。
ちなみにNemoとは誰でもない、誰もいない、人間がいない、何もいないという意味のラテン語で英語のNobodyに相当する言葉です。誰でもないからこそ、誰でもなれる、という意味が込められているそうです。
■Voicevox Nemo:https://voicevox.hiroshiba.jp/nemo/
導入方法は公式サイトのトップページからデータをダウンロードします。
Nemoの設定方法1 VOICEVOXのオプション変更
まずはVOICEVOXのオプションにある高度な設定から「マルチエンジン機能」をONにします。
この設定をONにすることでNemoの音声ファイルを使用することができるようになります。
Nemoの設定方法1 ファイルのダウンロード
導入方法は公式サイトのトップページからデータをダウンロードします。
「Nemoエンジンダウンロード」のボタンをクリックしましょう。
そうすると、OSと対応モードを選ぶよう指示されますので、VOICEVOXの時と同様、ご自身のパソコンのOSを選び、対応モードは「CPU」を選択して「ダウンロード」をクリックします。
すると「voicevox_engine-windows-cpu-0.14.0.vvpp」というファイルがダウンロードされるので、それを起動させます。
「エンジン」から「エンジンの管理」を選択して、「追加」ボタンをクリックします。
するとダイアログボックスが開きますので、VVPPファイルであることを確認し、ファイルマークをクリックして、先ほどダウンロードしたファイルを選びます。
それができたら、右下にある「追加」ボタンをクリックします。
警告が出ることもありますが、性器ファイルのダウンロードあれば問題ないので、そのまま続行します。
すると、再読み込みが必要、との表示が出ますので、「再読み込み」のボタンをクリックしましょう。
再読み込みが終わると、最初の立ち上げページである「追加キャラクターの紹介」が表示されますので、追加した9種類のデータが入っていることを確認できます。
確認できたら右上の完了ボタンをクリックします。
すると再度、操作画面が表示され、新しいキャラクターが使えるようになります。
まとめ
今回は最近はやりのAIを使った音声生成ソフト、VOICEVOXの使い方について、インストールから追加音声ファイルNemoの追加方法までをまとめてみました。
動画を作成したいけれど、生活音が入ってしまいうまく動画を作成できなかったり、音声ファイルを自分の声以外で作成したいときなどに無料で商用利用可能なVOICEVOXはとても役立つのではないでしょうか。
今回は、とりあえず使えるようになるまでのセットアップに重点を置いて説明しましたが、他にもいろんな使い方がありますので、触って試してみてください。
コメントを残す