はじめに
最近日本語TTSといえばStyleBertVits2がブイブイ言わせていますが、実は元となったBertVits2の派生系は他にもいくつかあります。
今回はその中で、Fish Speechというサービスを試してみました。
これは Bert-VITS2のv2.1をベースに、感情や発話スタイルの強弱を設定できるようにしたものらしいです。
StyleBertVits2と比べてみる
どれほどのもの知るには、とりあえず兄弟のStyleBertVits2くんと比べてみるのが手取り早いかと思います。同じ文章を読ませて、比較してみました。
■ Fish Speechくん
■ StyleBertVits2くん
StyleBertVits2がイントネーションが自然です。
感情表現でも勝っているように思います。
最後に
以上、今回は簡単な検証でした。
現状日本語のTTSを使用する際はStyleBertVits2が良いと思います。
今年の2月に行われた日本語精度向上のアップデートが大きいと思います。
また、Fish Speechは今年はアップデートがなく、頻繁にメンテナンス/アップデートが行われているサービスを利用するのが良いかとは思います。
コメントを残す