로컬AI모아
2026.05.29
← 전체 기기

NVIDIA A100 80GB

80GB HBM2e VRAM과 높은 메모리 대역폭으로 대형 텍스트 모델 추론에 여유가 있는 Ampere GPU.

🗄️ 서버 GPUVRAM 80GB2,039 GB/s

구매 링크

돌릴 수 있는 모델 (28) · VRAM 낮은 순

L-TPS Index 벤치마크 표

NVIDIA A100 80GB에서 호환 모델별 L-TPS Index — Q4 · 8K 컨텍스트 기준 상대 추정치
Kokoro 82M82M
매우 쾌적321
NVIDIA Parakeet TDT 0.6B v30.6B
매우 쾌적4282
Whisper Large v3 Turbo809M
매우 쾌적321
Chatterbox TTS0.5B
매우 쾌적5138
Microsoft Phi-4 Mini Reasoning4B
매우 쾌적642
Google Gemma 4 E2B ITE2B
매우 쾌적1285
Google Gemma 4 E4B ITE4B
매우 쾌적642
Stable Audio Open 1.0audio-large
매우 쾌적321

추론 스펙 요약

NVIDIA A100 80GB 로컬 LLM 추론 관련 스펙
카테고리🗄️ 서버 GPU
GPU · 칩A100 80GB
VRAM80GB
메모리 대역폭2,039 GB/s관리자 입력값
추론 효율 계수70%L-TPS 상대 비교용
카드·목록 칩VRAM 80GB · A100 80GB

로컬 AI에 적합한 이유

80GB HBM2e VRAM과 높은 메모리 대역폭으로 대형 텍스트 모델 추론에 여유가 있는 Ampere GPU.

연관 기기 (6)

목록으로

자주 묻는 질문

NVIDIA A100 80GB으로 로컬 LLM을 돌리려면 어떤 스펙이 중요한가요?
🗄️ 서버 GPU 기준으로 GPU/칩(A100 80GB), 메모리(VRAM 80GB)가 핵심입니다. L-TPS는 메모리 대역폭·추론 효율·모델 가중치로 상대 비교합니다.
로컬AI모아 L-TPS Index란 무엇인가요?
로컬AI모아가 동일 조건(Q4 양자화·8K 컨텍스트)에서 기기 대역폭·VRAM 여유를 반영해 산출하는 상대 추론 속도 지표입니다. 벤치마크 대체가 아닌 카드·표 비교용 추정치입니다.
NVIDIA A100 80GB에서 Kokoro 82M을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 321 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
NVIDIA A100 80GB에서 NVIDIA Parakeet TDT 0.6B v3을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 4282 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
NVIDIA A100 80GB에서 Whisper Large v3 Turbo을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 321 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
NVIDIA A100 80GB에서 Kokoro 82M VRAM 적합도는?
최소 1GB · 권장 2GB 모델 기준 적합도는 「매우 쾌적」입니다.