美容クリニックTikTok動画 — 比較テスト

現行版（完成）DONE

ElevenLabs音声 + Klingリップシンク + FFmpegテロップ/BGM

draft_v10_final.mp4 — 27秒、テロップ+BGM付き

Gemini APIでキャラ画像+テキスト→動画+音声+リップシンク一発生成。テキスト自動生成の問題あり。

test_veo31.mp4 — 8秒、Veo 3.1生成（1シーンのみ）

Style-BERT-VITS2（無料・ローカル）vs ElevenLabs（$5/月）

ElevenLabs (Kenzo):

Style-BERT-VITS2 (男性M1):

Style-BERT-VITS2 (女性F1):

ElevenLabs (男性 Minto):

現プランではネイティブ音声生成が使えない。キャラ画像も無視されてリアル人物が生成された。従来のaudio2videoリップシンクは引き続き使える。

1. 現行版（上の動画）の最終フィードバック
2. Veo 3.1の音声品質を聴いて判断
3. SBVITS2 vs ElevenLabsの音質比較
4. fal.aiサインアップでVEED Fabricリップシンクテスト可能に