로컬AI모아
2026.05.29
← 전체 기기

NVIDIA B200 180GB

180GB HBM3e VRAM과 Blackwell 대역폭으로 초대형 모델 단일 GPU 구동 후보군까지 넓히는 GPU.

🗄️ 서버 GPUVRAM 180GB8,000 GB/s

구매 링크

돌릴 수 있는 모델 (40) · VRAM 낮은 순

L-TPS Index 벤치마크 표

NVIDIA B200 180GB에서 호환 모델별 L-TPS Index — Q4 · 8K 컨텍스트 기준 상대 추정치
Kokoro 82M82M
매우 쾌적1710
NVIDIA Parakeet TDT 0.6B v30.6B
매우 쾌적22800
Whisper Large v3 Turbo809M
매우 쾌적1710
Chatterbox TTS0.5B
매우 쾌적27360
Microsoft Phi-4 Mini Reasoning4B
매우 쾌적3420
Google Gemma 4 E2B ITE2B
매우 쾌적6840
Google Gemma 4 E4B ITE4B
매우 쾌적3420
Stable Audio Open 1.0audio-large
매우 쾌적1710

추론 스펙 요약

NVIDIA B200 180GB 로컬 LLM 추론 관련 스펙
카테고리🗄️ 서버 GPU
GPU · 칩B200 180GB
VRAM180GB
메모리 대역폭8,000 GB/s관리자 입력값
추론 효율 계수95%L-TPS 상대 비교용
카드·목록 칩VRAM 180GB · B200 180GB

로컬 AI에 적합한 이유

180GB HBM3e VRAM과 Blackwell 대역폭으로 초대형 모델 단일 GPU 구동 후보군까지 넓히는 GPU.

연관 기기 (6)

목록으로

자주 묻는 질문

NVIDIA B200 180GB으로 로컬 LLM을 돌리려면 어떤 스펙이 중요한가요?
🗄️ 서버 GPU 기준으로 GPU/칩(B200 180GB), 메모리(VRAM 180GB)가 핵심입니다. L-TPS는 메모리 대역폭·추론 효율·모델 가중치로 상대 비교합니다.
로컬AI모아 L-TPS Index란 무엇인가요?
로컬AI모아가 동일 조건(Q4 양자화·8K 컨텍스트)에서 기기 대역폭·VRAM 여유를 반영해 산출하는 상대 추론 속도 지표입니다. 벤치마크 대체가 아닌 카드·표 비교용 추정치입니다.
NVIDIA B200 180GB에서 Kokoro 82M을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 1710 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
NVIDIA B200 180GB에서 NVIDIA Parakeet TDT 0.6B v3을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 22800 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
NVIDIA B200 180GB에서 Whisper Large v3 Turbo을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 1710 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
NVIDIA B200 180GB에서 Kokoro 82M VRAM 적합도는?
최소 1GB · 권장 2GB 모델 기준 적합도는 「매우 쾌적」입니다.