【LINEプレゼント】FishAudioの詳細

FishAudioの使い方

FishAudioとは?

FishAudio(フィッシュオーディオ)は、Hanabi AI Inc. が運営する生成AI音声プラットフォームです。テキストから自然な音声を合成できるほか、短い音声サンプルから話者の声を再現するボイスクローン機能や、音声→テキスト変換(STT)API も提供しています。

FishAudioの主な機能

■テキスト→音声合成 (TTS)
13 言語対応の最新モデル Fish Speech 1.5/1.6 を採用。
WebSocket ストリーミングで約 150 ms の低遅延再生が可能。

■ボイスクローン
Instant Clone : 約 10–45 秒の音声サンプルで即時に声を再現。
Premium Clone : 30 分〜数時間の音声で学習し、多言語・感情表現まで対応。

■音声→テキスト変換 (STT)
言語自動判定付きの文字起こし API。手動で言語指定すれば精度をさらに向上できる。

FishAudioの料金プラン

■Free
価格 : $0/月
生成枠 : 音声生成 1 時間/月、最長 3 分/クリップ
速度 : 標準
利用範囲 : 個人・試用向け(商用不可)、API 利用なし

■Premium
価格 : 月払い $9.99 / 年払い換算 $6.66/月
生成枠 : Web UI では無制限(Fish Speech 1.5 / 1.6)、最長 30 分/生成
特典 : 優先生成、リファレンス音声の自動最適化、最新モデル先行提供、商用ライセンス、精密パラメータ制御、毎月 $10 の API クレジット+従量課金 API

■Pro(近日提供予定)
価格 : $99.99/月
内容 : Premium の全機能に加え、リファレンス音声の高度補正、新モデルの優先アクセスなど上位機能が追加予定

ボイスクローンの基本的な使い方

FishAudioサイトにアクセスし、メール、Googleアカウントでログイン

②「ボイスクローン」を選択し、「録音開始」ボタンを押して表示されている日本語を録音する。

③モデル情報を入力