로컬AI모아
2026.05.29
← 전체 모델

StepFun Step 3.7 Flash

비전·검색·추론을 함께 쓰는 에이전트형 워크플로를 겨냥한 StepFun 대형 VLM.

대형모델198B권장 VRAM 128GB최소 96GBBF16/저비트 변환 기준, VLM 대형 모델

모델 다운로드 · 설치

StepFun Step 3.7 Flash 가중치·설치 안내는 제조사/오픈소스 공식 페이지에서 확인하세요. Ollama·LM Studio 등은 해당 페이지의 안내를 따르면 됩니다.

공식 모델 페이지에서 받기

돌릴 수 있는 기기 (8) · 가격 낮은 순

L-TPS Index 벤치마크 표

StepFun Step 3.7 Flash 호환 기기별 L-TPS Index — Q4 · 8K 컨텍스트 기준 상대 추정치
GMKtec EVO-X2 Ryzen AI Max+ 395 96GB📦 AI 미니
턱걸이
ASUS Ascent GX10 128GB📦 AI 미니
쾌적1.1
HP Z2 Mini G1a Ryzen AI Max+ PRO 395 128GB📦 AI 미니
쾌적0.7
APPLE 맥 스튜디오 M3 Ultra MU973KH/A 96GB 1TB🍎 Mac
턱걸이
NVIDIA DGX Spark 128GB📦 AI 미니
쾌적1.1
NVIDIA RTX PRO 6000 Blackwell 96GB🗄️ 서버 GPU
턱걸이
NVIDIA H200 NVL 141GB🗄️ 서버 GPU
매우 쾌적33
NVIDIA B200 180GB🗄️ 서버 GPU
매우 쾌적69

모델 스펙 (L-TPS 계산)

StepFun Step 3.7 Flash L-TPS 계산용 모델 스펙
파라미터198B
L-TPS 계산 가중치99.0 GBparams_B × quant_bytes
필요 VRAM (추정)118.8 GBmax(model_weight × 1.2, 최소 VRAM)
권장 VRAM128GB
최소 VRAM96GB
양자화 기본값BF16/저비트 변환 기준, VLM 대형 모델

VRAM 요구

StepFun Step 3.7 Flash VRAM 요구 사양
항목설명
권장 VRAM128GB쾌적한 Q4~Q8 추론 구간
최소 VRAM96GB양자화 필수·터킹 가능 구간
양자화BF16/저비트 변환 기준, VLM 대형 모델

추천 용도

  • 에이전트
  • 추론
  • 연구
이 모델로 추천 받기목록으로

자주 묻는 질문

StepFun Step 3.7 Flash을 로컬에서 돌리려면 VRAM이 얼마나 필요한가요?
최소 96GB, 권장 128GB입니다. 양자화 참고: BF16/저비트 변환 기준, VLM 대형 모델.
로컬AI모아 L-TPS Index는 어떻게 읽나요?
로컬AI모아가 동일 조건(Q4 양자화·8K 컨텍스트)에서 기기 대역폭·VRAM 여유를 반영해 산출하는 상대 추론 속도 지표입니다. 벤치마크 대체가 아닌 카드·표 비교용 추정치입니다.
GMKtec EVO-X2 Ryzen AI Max+ 395 96GB에서 StepFun Step 3.7 Flash을 돌리면 속도가 어떻게 나오나요?
L-TPS Index 기준으로는 VRAM이 부족해 실행이 어렵다고 추정됩니다.
ASUS Ascent GX10 128GB에서 StepFun Step 3.7 Flash을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 1.1 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
HP Z2 Mini G1a Ryzen AI Max+ PRO 395 128GB에서 StepFun Step 3.7 Flash을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 0.7 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
StepFun Step 3.7 Flash에 가장 저렴하게 맞는 기기는?
GMKtec EVO-X2 Ryzen AI Max+ 395 96GB(📦 AI 미니) — ₩4,192,000, VRAM 적합도 「턱걸이」.