로컬AI모아
2026.05.29
← 추천

L-TPS Index 계산기

기기·모델·양자화·컨텍스트를 바꿔 보세요. 홈 추천 카드와 동일한 L-TPS Index 추정식을 사용합니다.

양자화
컨텍스트 길이

🍎 Mac · M3 Ultra 60-core GPU

1651tok/s

L-TPS Index 추정 · Q4_K_M · 8K

VRAM 매우 쾌적
계산 근거
params_B0.5B
quant_bytes0.5
model_weight0.25 GB (= 0.5 × 0.5)
required_vram4.0 GB (weight × 1.2, 최소 VRAM 반영)
사용 가능 메모리96 GB
memory_factor1
context_factor0.9

추정치이며 실제 속도는 드라이버, 런타임(llama.cpp·Ollama 등), 컨텍스트, 양자화 구현에 따라 달라질 수 있습니다.