로컬AI모아
2026.05.29
← 전체 모델

Chatterbox TTS

다국어·제로샷 TTS와 감정 강도 조절을 노리는 오픈 TTS 모델.

음성생성0.5B권장 VRAM 8GB최소 4GBfp16/로컬 TTS 기준

모델 다운로드 · 설치

Chatterbox TTS 가중치·설치 안내는 제조사/오픈소스 공식 페이지에서 확인하세요. Ollama·LM Studio 등은 해당 페이지의 안내를 따르면 됩니다.

공식 모델 페이지에서 받기

돌릴 수 있는 기기 (27) · 가격 낮은 순

L-TPS Index 벤치마크 표

Chatterbox TTS 호환 기기별 L-TPS Index — Q4 · 8K 컨텍스트 기준 상대 추정치
GeForce RTX 5060 Ti 16GB 그래픽카드🖥️ GPU
매우 쾌적1322
GeForce RTX 5070 12GB 그래픽카드🖥️ GPU
쾌적2032
GeForce RTX 4060 Ti 16GB 그래픽카드🖥️ GPU
매우 쾌적746
GeForce RTX 4070 Ti SUPER 16GB 그래픽카드🖥️ GPU
매우 쾌적1984
GeForce RTX 5070 Ti 16GB 그래픽카드🖥️ GPU
매우 쾌적2774
GeForce RTX 5080 16GB 그래픽카드🖥️ GPU
매우 쾌적3041
GeForce RTX 4080 SUPER 16GB 그래픽카드🖥️ GPU
매우 쾌적2226
APPLE 맥북에어15 M5 10코어 GPU 32GB 1TB🍎 Mac
매우 쾌적275

모델 스펙 (L-TPS 계산)

Chatterbox TTS L-TPS 계산용 모델 스펙
파라미터0.5B
L-TPS 계산 가중치0.3 GBparams_B × quant_bytes
필요 VRAM (추정)4.0 GBmax(model_weight × 1.2, 최소 VRAM)
권장 VRAM8GB
최소 VRAM4GB
양자화 기본값fp16/로컬 TTS 기준

VRAM 요구

Chatterbox TTS VRAM 요구 사양
항목설명
권장 VRAM8GB쾌적한 Q4~Q8 추론 구간
최소 VRAM4GB양자화 필수·터킹 가능 구간
양자화fp16/로컬 TTS 기준

추천 용도

  • 음성 생성
이 모델로 추천 받기목록으로

자주 묻는 질문

Chatterbox TTS을 로컬에서 돌리려면 VRAM이 얼마나 필요한가요?
최소 4GB, 권장 8GB입니다. 양자화 참고: fp16/로컬 TTS 기준.
로컬AI모아 L-TPS Index는 어떻게 읽나요?
로컬AI모아가 동일 조건(Q4 양자화·8K 컨텍스트)에서 기기 대역폭·VRAM 여유를 반영해 산출하는 상대 추론 속도 지표입니다. 벤치마크 대체가 아닌 카드·표 비교용 추정치입니다.
GeForce RTX 5060 Ti 16GB 그래픽카드에서 Chatterbox TTS을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 1322 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
GeForce RTX 5070 12GB 그래픽카드에서 Chatterbox TTS을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 2032 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
GeForce RTX 4060 Ti 16GB 그래픽카드에서 Chatterbox TTS을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 746 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
Mac mini M4에서 Chatterbox TTS을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 541 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
Chatterbox TTS에 가장 저렴하게 맞는 기기는?
GeForce RTX 5060 Ti 16GB 그래픽카드(🖥️ GPU) — ₩899,000, VRAM 적합도 「매우 쾌적」.