로컬AI모아
2026.05.29
← 전체 모델

DeepSeek V4 Flash

대형 MoE와 1M 컨텍스트를 겨냥한 실험실급 로컬/엣지 서버 후보.

대형모델284B-A13B권장 VRAM 128GB최소 96GBFP4/FP8 혼합 가중치 기준, 소비자 GPU 단독은 비권장

모델 다운로드 · 설치

DeepSeek V4 Flash 가중치·설치 안내는 제조사/오픈소스 공식 페이지에서 확인하세요. Ollama·LM Studio 등은 해당 페이지의 안내를 따르면 됩니다.

공식 모델 페이지에서 받기

돌릴 수 있는 기기 (8) · 가격 낮은 순

L-TPS Index 벤치마크 표

DeepSeek V4 Flash 호환 기기별 L-TPS Index — Q4 · 8K 컨텍스트 기준 상대 추정치
GMKtec EVO-X2 Ryzen AI Max+ 395 96GB📦 AI 미니
턱걸이
ASUS Ascent GX10 128GB📦 AI 미니
쾌적
HP Z2 Mini G1a Ryzen AI Max+ PRO 395 128GB📦 AI 미니
쾌적
APPLE 맥 스튜디오 M3 Ultra MU973KH/A 96GB 1TB🍎 Mac
턱걸이
NVIDIA DGX Spark 128GB📦 AI 미니
쾌적
NVIDIA RTX PRO 6000 Blackwell 96GB🗄️ 서버 GPU
턱걸이
NVIDIA H200 NVL 141GB🗄️ 서버 GPU
매우 쾌적
NVIDIA B200 180GB🗄️ 서버 GPU
매우 쾌적31

모델 스펙 (L-TPS 계산)

DeepSeek V4 Flash L-TPS 계산용 모델 스펙
파라미터284B-A13B
L-TPS 계산 가중치142.0 GBparams_B × quant_bytes
필요 VRAM (추정)170.4 GBmax(model_weight × 1.2, 최소 VRAM)
권장 VRAM128GB
최소 VRAM96GB
양자화 기본값FP4/FP8 혼합 가중치 기준, 소비자 GPU 단독은 비권장

VRAM 요구

DeepSeek V4 Flash VRAM 요구 사양
항목설명
권장 VRAM128GB쾌적한 Q4~Q8 추론 구간
최소 VRAM96GB양자화 필수·터킹 가능 구간
양자화FP4/FP8 혼합 가중치 기준, 소비자 GPU 단독은 비권장

추천 용도

  • 연구
  • 코딩
이 모델로 추천 받기목록으로

자주 묻는 질문

DeepSeek V4 Flash을 로컬에서 돌리려면 VRAM이 얼마나 필요한가요?
최소 96GB, 권장 128GB입니다. 양자화 참고: FP4/FP8 혼합 가중치 기준, 소비자 GPU 단독은 비권장.
로컬AI모아 L-TPS Index는 어떻게 읽나요?
로컬AI모아가 동일 조건(Q4 양자화·8K 컨텍스트)에서 기기 대역폭·VRAM 여유를 반영해 산출하는 상대 추론 속도 지표입니다. 벤치마크 대체가 아닌 카드·표 비교용 추정치입니다.
GMKtec EVO-X2 Ryzen AI Max+ 395 96GB에서 DeepSeek V4 Flash을 돌리면 속도가 어떻게 나오나요?
L-TPS Index 기준으로는 VRAM이 부족해 실행이 어렵다고 추정됩니다.
ASUS Ascent GX10 128GB에서 DeepSeek V4 Flash을 돌리면 속도가 어떻게 나오나요?
L-TPS Index 기준으로는 VRAM이 부족해 실행이 어렵다고 추정됩니다.
HP Z2 Mini G1a Ryzen AI Max+ PRO 395 128GB에서 DeepSeek V4 Flash을 돌리면 속도가 어떻게 나오나요?
L-TPS Index 기준으로는 VRAM이 부족해 실행이 어렵다고 추정됩니다.
DeepSeek V4 Flash에 가장 저렴하게 맞는 기기는?
GMKtec EVO-X2 Ryzen AI Max+ 395 96GB(📦 AI 미니) — ₩4,192,000, VRAM 적합도 「턱걸이」.