로컬AI모아
2026.05.29
← 전체 모델

Moonshot Kimi K2.6

장기 코딩·에이전트·멀티모달 작업을 겨냥한 Moonshot의 open-weight MoE 모델.

대형모델1T-A32B권장 VRAM 192GB최소 128GBNative INT4/저비트, 대용량 통합 메모리·오프로딩 권장

모델 다운로드 · 설치

Moonshot Kimi K2.6 가중치·설치 안내는 제조사/오픈소스 공식 페이지에서 확인하세요. Ollama·LM Studio 등은 해당 페이지의 안내를 따르면 됩니다.

공식 모델 페이지에서 받기

돌릴 수 있는 기기 (5) · 가격 낮은 순

L-TPS Index 벤치마크 표

Moonshot Kimi K2.6 호환 기기별 L-TPS Index — Q4 · 8K 컨텍스트 기준 상대 추정치
ASUS Ascent GX10 128GB📦 AI 미니
턱걸이2.4
HP Z2 Mini G1a Ryzen AI Max+ PRO 395 128GB📦 AI 미니
턱걸이1.5
NVIDIA DGX Spark 128GB📦 AI 미니
턱걸이2.4
NVIDIA H200 NVL 141GB🗄️ 서버 GPU
최소 이상72
NVIDIA B200 180GB🗄️ 서버 GPU
최소 이상149

모델 스펙 (L-TPS 계산)

Moonshot Kimi K2.6 L-TPS 계산용 모델 스펙
파라미터1T-A32B
L-TPS 계산 가중치46.0 GBparams_B × quant_bytes
필요 VRAM (추정)128.0 GBmax(model_weight × 1.2, 최소 VRAM)
권장 VRAM192GB
최소 VRAM128GB
양자화 기본값Native INT4/저비트, 대용량 통합 메모리·오프로딩 권장

VRAM 요구

Moonshot Kimi K2.6 VRAM 요구 사양
항목설명
권장 VRAM192GB쾌적한 Q4~Q8 추론 구간
최소 VRAM128GB양자화 필수·터킹 가능 구간
양자화Native INT4/저비트, 대용량 통합 메모리·오프로딩 권장

추천 용도

  • 코딩
  • 에이전트
  • 추론
  • 연구
이 모델로 추천 받기목록으로

자주 묻는 질문

Moonshot Kimi K2.6을 로컬에서 돌리려면 VRAM이 얼마나 필요한가요?
최소 128GB, 권장 192GB입니다. 양자화 참고: Native INT4/저비트, 대용량 통합 메모리·오프로딩 권장.
로컬AI모아 L-TPS Index는 어떻게 읽나요?
로컬AI모아가 동일 조건(Q4 양자화·8K 컨텍스트)에서 기기 대역폭·VRAM 여유를 반영해 산출하는 상대 추론 속도 지표입니다. 벤치마크 대체가 아닌 카드·표 비교용 추정치입니다.
ASUS Ascent GX10 128GB에서 Moonshot Kimi K2.6을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 2.4 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
HP Z2 Mini G1a Ryzen AI Max+ PRO 395 128GB에서 Moonshot Kimi K2.6을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 1.5 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
NVIDIA DGX Spark 128GB에서 Moonshot Kimi K2.6을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 2.4 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
Moonshot Kimi K2.6에 가장 저렴하게 맞는 기기는?
ASUS Ascent GX10 128GB(📦 AI 미니) — ₩6,743,000, VRAM 적합도 「턱걸이」.