로컬AI모아
2026.05.29
← 전체 모델

DeepSeek V4 Pro

1M 컨텍스트와 고난도 추론을 겨냥한 DeepSeek V4 상위 MoE 모델.

대형모델1.6T-A49B권장 VRAM 256GB최소 128GBFP4/FP8 mixed, 대용량 메모리·오프로딩 권장

모델 다운로드 · 설치

DeepSeek V4 Pro 가중치·설치 안내는 제조사/오픈소스 공식 페이지에서 확인하세요. Ollama·LM Studio 등은 해당 페이지의 안내를 따르면 됩니다.

공식 모델 페이지에서 받기

돌릴 수 있는 기기 (5) · 가격 낮은 순

L-TPS Index 벤치마크 표

DeepSeek V4 Pro 호환 기기별 L-TPS Index — Q4 · 8K 컨텍스트 기준 상대 추정치
ASUS Ascent GX10 128GB📦 AI 미니
턱걸이1.5
HP Z2 Mini G1a Ryzen AI Max+ PRO 395 128GB📦 AI 미니
턱걸이0.9
NVIDIA DGX Spark 128GB📦 AI 미니
턱걸이1.5
NVIDIA H200 NVL 141GB🗄️ 서버 GPU
최소 이상46
NVIDIA B200 180GB🗄️ 서버 GPU
최소 이상94

모델 스펙 (L-TPS 계산)

DeepSeek V4 Pro L-TPS 계산용 모델 스펙
파라미터1.6T-A49B
L-TPS 계산 가중치72.5 GBparams_B × quant_bytes
필요 VRAM (추정)128.0 GBmax(model_weight × 1.2, 최소 VRAM)
권장 VRAM256GB
최소 VRAM128GB
양자화 기본값FP4/FP8 mixed, 대용량 메모리·오프로딩 권장

VRAM 요구

DeepSeek V4 Pro VRAM 요구 사양
항목설명
권장 VRAM256GB쾌적한 Q4~Q8 추론 구간
최소 VRAM128GB양자화 필수·터킹 가능 구간
양자화FP4/FP8 mixed, 대용량 메모리·오프로딩 권장

추천 용도

  • 연구
  • 코딩
  • 추론
  • 에이전트
이 모델로 추천 받기목록으로

자주 묻는 질문

DeepSeek V4 Pro을 로컬에서 돌리려면 VRAM이 얼마나 필요한가요?
최소 128GB, 권장 256GB입니다. 양자화 참고: FP4/FP8 mixed, 대용량 메모리·오프로딩 권장.
로컬AI모아 L-TPS Index는 어떻게 읽나요?
로컬AI모아가 동일 조건(Q4 양자화·8K 컨텍스트)에서 기기 대역폭·VRAM 여유를 반영해 산출하는 상대 추론 속도 지표입니다. 벤치마크 대체가 아닌 카드·표 비교용 추정치입니다.
ASUS Ascent GX10 128GB에서 DeepSeek V4 Pro을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 1.5 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
HP Z2 Mini G1a Ryzen AI Max+ PRO 395 128GB에서 DeepSeek V4 Pro을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 0.9 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
NVIDIA DGX Spark 128GB에서 DeepSeek V4 Pro을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 1.5 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
DeepSeek V4 Pro에 가장 저렴하게 맞는 기기는?
ASUS Ascent GX10 128GB(📦 AI 미니) — ₩6,743,000, VRAM 적합도 「턱걸이」.