← 전체 모델
Google Gemma 4 12B IT
인코더 없는 12B 멀티모달 Gemma 4 모델로 텍스트·이미지·오디오 입력과 로컬 에이전트 작업에 적합.
텍스트12B권장 VRAM 16GB최소 8GBQ4_0 기준 최소 8GB, SFP8/긴 컨텍스트는 16GB 권장
추천 용도
- 채팅
- 코딩
- 추론
- 에이전트
이 모델로 추천 받기목록으로
자주 묻는 질문
- Google Gemma 4 12B IT을 로컬에서 돌리려면 VRAM이 얼마나 필요한가요?
- 최소 8GB, 권장 16GB입니다. 양자화 참고: Q4_0 기준 최소 8GB, SFP8/긴 컨텍스트는 16GB 권장.
- 로컬AI모아 L-TPS Index는 어떻게 읽나요?
- 로컬AI모아가 동일 조건(Q4 양자화·8K 컨텍스트)에서 기기 대역폭·VRAM 여유를 반영해 산출하는 상대 추론 속도 지표입니다. 벤치마크 대체가 아닌 카드·표 비교용 추정치입니다.
- GeForce RTX 5060 Ti 16GB 그래픽카드에서 Google Gemma 4 12B IT을 돌리면 속도가 어떻게 나오나요?
- 로컬AI모아 L-TPS Index 추정치는 약 55 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
- GeForce RTX 5070 12GB 그래픽카드에서 Google Gemma 4 12B IT을 돌리면 속도가 어떻게 나오나요?
- 로컬AI모아 L-TPS Index 추정치는 약 85 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
- GeForce RTX 4060 Ti 16GB 그래픽카드에서 Google Gemma 4 12B IT을 돌리면 속도가 어떻게 나오나요?
- 로컬AI모아 L-TPS Index 추정치는 약 31 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
- Mac mini M4에서 Google Gemma 4 12B IT을 돌리면 속도가 어떻게 나오나요?
- 로컬AI모아 L-TPS Index 추정치는 약 23 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
- Google Gemma 4 12B IT에 가장 저렴하게 맞는 기기는?
- GeForce RTX 5060 Ti 16GB 그래픽카드(🖥️ GPU) — ₩899,000, VRAM 적합도 「쾌적」.