로컬AI모아
2026.05.29
← 전체 모델

Meta Llama 4 Maverick 17B 128E

대형 MoE 멀티모달 실험용 모델로 일반 소비자 GPU보다는 워크스테이션용.

대형모델17B-128E권장 VRAM 256GB최소 128GB저비트 양자화도 대용량 메모리 필요

모델 다운로드 · 설치

Meta Llama 4 Maverick 17B 128E 가중치·설치 안내는 제조사/오픈소스 공식 페이지에서 확인하세요. Ollama·LM Studio 등은 해당 페이지의 안내를 따르면 됩니다.

공식 모델 페이지에서 받기

돌릴 수 있는 기기 (5) · 가격 낮은 순

L-TPS Index 벤치마크 표

Meta Llama 4 Maverick 17B 128E 호환 기기별 L-TPS Index — Q4 · 8K 컨텍스트 기준 상대 추정치
ASUS Ascent GX10 128GB📦 AI 미니
턱걸이13
HP Z2 Mini G1a Ryzen AI Max+ PRO 395 128GB📦 AI 미니
턱걸이7.9
NVIDIA DGX Spark 128GB📦 AI 미니
턱걸이13
NVIDIA H200 NVL 141GB🗄️ 서버 GPU
최소 이상389
NVIDIA B200 180GB🗄️ 서버 GPU
최소 이상805

모델 스펙 (L-TPS 계산)

Meta Llama 4 Maverick 17B 128E L-TPS 계산용 모델 스펙
파라미터17B-128E
L-TPS 계산 가중치8.5 GBparams_B × quant_bytes
필요 VRAM (추정)128.0 GBmax(model_weight × 1.2, 최소 VRAM)
권장 VRAM256GB
최소 VRAM128GB
양자화 기본값저비트 양자화도 대용량 메모리 필요

VRAM 요구

Meta Llama 4 Maverick 17B 128E VRAM 요구 사양
항목설명
권장 VRAM256GB쾌적한 Q4~Q8 추론 구간
최소 VRAM128GB양자화 필수·터킹 가능 구간
양자화저비트 양자화도 대용량 메모리 필요

추천 용도

  • 채팅
  • 연구
이 모델로 추천 받기목록으로

자주 묻는 질문

Meta Llama 4 Maverick 17B 128E을 로컬에서 돌리려면 VRAM이 얼마나 필요한가요?
최소 128GB, 권장 256GB입니다. 양자화 참고: 저비트 양자화도 대용량 메모리 필요.
로컬AI모아 L-TPS Index는 어떻게 읽나요?
로컬AI모아가 동일 조건(Q4 양자화·8K 컨텍스트)에서 기기 대역폭·VRAM 여유를 반영해 산출하는 상대 추론 속도 지표입니다. 벤치마크 대체가 아닌 카드·표 비교용 추정치입니다.
ASUS Ascent GX10 128GB에서 Meta Llama 4 Maverick 17B 128E을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 13 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
HP Z2 Mini G1a Ryzen AI Max+ PRO 395 128GB에서 Meta Llama 4 Maverick 17B 128E을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 7.9 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
NVIDIA DGX Spark 128GB에서 Meta Llama 4 Maverick 17B 128E을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 13 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
Meta Llama 4 Maverick 17B 128E에 가장 저렴하게 맞는 기기는?
ASUS Ascent GX10 128GB(📦 AI 미니) — ₩6,743,000, VRAM 적합도 「턱걸이」.