【Fish Speech】Bert-Vits2の派生系らしいので試してみた

はじめに

最近日本語TTSといえばStyleBertVits2がブイブイ言わせていますが、実は元となったBertVits2の派生系は他にもいくつかあります。

今回はその中で、Fish Speechというサービスを試してみました。

これは Bert-VITS2のv2.1をベースに、感情や発話スタイルの強弱を設定できるようにしたものらしいです。

https://github.com/fishaudio/fish-speech

StyleBertVits2と比べてみる

どれほどのもの知るには、とりあえず兄弟のStyleBertVits2くんと比べてみるのが手取り早いかと思います。同じ文章を読ませて、比較してみました。

■ Fish Speechくん

■ StyleBertVits2くん

StyleBertVits2がイントネーションが自然です。

感情表現でも勝っているように思います。

最後に

以上、今回は簡単な検証でした。

現状日本語のTTSを使用する際はStyleBertVits2が良いと思います。

今年の2月に行われた日本語精度向上のアップデートが大きいと思います。

また、Fish Speechは今年はアップデートがなく、頻繁にメンテナンス/アップデートが行われているサービスを利用するのが良いかとは思います。


投稿日

カテゴリー:

投稿者:

タグ:

コメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

Discord Ch. 始めました! (内容: エンジニア/映像クリエイター向けになります)