Google Gemma 4 E2B IT을 로컬에서 돌리려면 VRAM이 얼마나 필요한가요?

최소 6GB, 권장 8GB입니다. 양자화 참고: Q4_K_M 기준 단일 기기.

로컬AI모아 L-TPS Index는 어떻게 읽나요?

로컬AI모아가 동일 조건(Q4 양자화·8K 컨텍스트)에서 기기 대역폭·VRAM 여유를 반영해 산출하는 상대 추론 속도 지표입니다. 벤치마크 대체가 아닌 카드·표 비교용 추정치입니다.

로컬AI모아 L-TPS Index 추정치는 약 331 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.

로컬AI모아 L-TPS Index 추정치는 약 508 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.

로컬AI모아 L-TPS Index 추정치는 약 187 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.

로컬AI모아 L-TPS Index 추정치는 약 135 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.

GeForce RTX 5060 Ti 16GB 그래픽카드(🖥️ GPU) — ₩906,000, VRAM 적합도 「매우 쾌적」.

초소형 멀티모달과 음성 입력까지 다루는 온디바이스 후보.

텍스트E2B권장 VRAM 8GB최소 6GBQ4_K_M 기준 단일 기기

Google Gemma 4 E2B IT 가중치·설치 안내는 제조사/오픈소스 공식 페이지에서 확인하세요. Ollama·LM Studio 등은 해당 페이지의 안내를 따르면 됩니다.

Google Gemma 4 E2B IT 호환 기기별 L-TPS Index — Q4 · 8K 컨텍스트 기준 상대 추정치

GeForce RTX 5060 Ti 16GB 그래픽카드🖥️ GPU

매우 쾌적331

GeForce RTX 5070 12GB 그래픽카드🖥️ GPU

쾌적508

GeForce RTX 4060 Ti 16GB 그래픽카드🖥️ GPU

매우 쾌적187

GeForce RTX 5070 Ti 16GB 그래픽카드🖥️ GPU

매우 쾌적694

GeForce RTX 4070 Ti SUPER 16GB 그래픽카드🖥️ GPU

매우 쾌적496

GeForce RTX 5080 16GB 그래픽카드🖥️ GPU

매우 쾌적760

AMD Radeon AI PRO R9700 32GB🗄️ 서버 GPU

매우 쾌적219

APPLE 맥북에어15 M5 10코어 GPU 32GB 1TB🍎 Mac

매우 쾌적69

Google Gemma 4 E2B IT 호환 기기별 L-TPS Index — Q4 · 8K 컨텍스트 기준 상대 추정치
이름	VRAM 적합	L-TPS Index
GeForce RTX 5060 Ti 16GB 그래픽카드🖥️ GPU	매우 쾌적	331
GeForce RTX 5070 12GB 그래픽카드🖥️ GPU	쾌적	508
GeForce RTX 4060 Ti 16GB 그래픽카드🖥️ GPU	매우 쾌적	187
GeForce RTX 5070 Ti 16GB 그래픽카드🖥️ GPU	매우 쾌적	694
GeForce RTX 4070 Ti SUPER 16GB 그래픽카드🖥️ GPU	매우 쾌적	496
GeForce RTX 5080 16GB 그래픽카드🖥️ GPU	매우 쾌적	760
AMD Radeon AI PRO R9700 32GB🗄️ 서버 GPU	매우 쾌적	219
APPLE 맥북에어15 M5 10코어 GPU 32GB 1TB🍎 Mac	매우 쾌적	69

Google Gemma 4 E2B IT을 로컬에서 돌리려면 VRAM이 얼마나 필요한가요?: 최소 6GB, 권장 8GB입니다. 양자화 참고: Q4_K_M 기준 단일 기기.
로컬AI모아 L-TPS Index는 어떻게 읽나요?: 로컬AI모아가 동일 조건(Q4 양자화·8K 컨텍스트)에서 기기 대역폭·VRAM 여유를 반영해 산출하는 상대 추론 속도 지표입니다. 벤치마크 대체가 아닌 카드·표 비교용 추정치입니다.
GeForce RTX 5060 Ti 16GB 그래픽카드에서 Google Gemma 4 E2B IT을 돌리면 속도가 어떻게 나오나요?: 로컬AI모아 L-TPS Index 추정치는 약 331 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
GeForce RTX 5070 12GB 그래픽카드에서 Google Gemma 4 E2B IT을 돌리면 속도가 어떻게 나오나요?: 로컬AI모아 L-TPS Index 추정치는 약 508 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
GeForce RTX 4060 Ti 16GB 그래픽카드에서 Google Gemma 4 E2B IT을 돌리면 속도가 어떻게 나오나요?: 로컬AI모아 L-TPS Index 추정치는 약 187 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
Mac mini M4에서 Google Gemma 4 E2B IT을 돌리면 속도가 어떻게 나오나요?: 로컬AI모아 L-TPS Index 추정치는 약 135 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
Google Gemma 4 E2B IT에 가장 저렴하게 맞는 기기는?: GeForce RTX 5060 Ti 16GB 그래픽카드(🖥️ GPU) — ₩906,000, VRAM 적합도 「매우 쾌적」.