로컬AI모아
2026.05.29
← 전체 기기

NVIDIA L40S 48GB

48GB VRAM으로 이미지·비디오 생성과 중형 LLM을 함께 노릴 수 있는 Ada 세대 GPU.

🗄️ 서버 GPUVRAM 48GB864 GB/s

구매 링크

돌릴 수 있는 모델 (25) · VRAM 낮은 순

L-TPS Index 벤치마크 표

NVIDIA L40S 48GB에서 호환 모델별 L-TPS Index — Q4 · 8K 컨텍스트 기준 상대 추정치
Kokoro 82M82M
매우 쾌적121
NVIDIA Parakeet TDT 0.6B v30.6B
매우 쾌적1607
Whisper Large v3 Turbo809M
매우 쾌적121
Chatterbox TTS0.5B
매우 쾌적1928
Microsoft Phi-4 Mini Reasoning4B
매우 쾌적241
Google Gemma 4 E2B ITE2B
매우 쾌적482
Google Gemma 4 E4B ITE4B
매우 쾌적241
Stable Audio Open 1.0audio-large
매우 쾌적121

추론 스펙 요약

NVIDIA L40S 48GB 로컬 LLM 추론 관련 스펙
카테고리🗄️ 서버 GPU
GPU · 칩L40S 48GB
VRAM48GB
메모리 대역폭864 GB/s관리자 입력값
추론 효율 계수62%L-TPS 상대 비교용
카드·목록 칩VRAM 48GB · L40S 48GB

로컬 AI에 적합한 이유

48GB VRAM으로 이미지·비디오 생성과 중형 LLM을 함께 노릴 수 있는 Ada 세대 GPU.

연관 기기 (6)

목록으로

자주 묻는 질문

NVIDIA L40S 48GB으로 로컬 LLM을 돌리려면 어떤 스펙이 중요한가요?
🗄️ 서버 GPU 기준으로 GPU/칩(L40S 48GB), 메모리(VRAM 48GB)가 핵심입니다. L-TPS는 메모리 대역폭·추론 효율·모델 가중치로 상대 비교합니다.
로컬AI모아 L-TPS Index란 무엇인가요?
로컬AI모아가 동일 조건(Q4 양자화·8K 컨텍스트)에서 기기 대역폭·VRAM 여유를 반영해 산출하는 상대 추론 속도 지표입니다. 벤치마크 대체가 아닌 카드·표 비교용 추정치입니다.
NVIDIA L40S 48GB에서 Kokoro 82M을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 121 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
NVIDIA L40S 48GB에서 NVIDIA Parakeet TDT 0.6B v3을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 1607 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
NVIDIA L40S 48GB에서 Whisper Large v3 Turbo을 돌리면 속도가 어떻게 나오나요?
로컬AI모아 L-TPS Index 추정치는 약 121 tok/s (Q4·8K 컨텍스트, 상대 비교용)입니다.
NVIDIA L40S 48GB에서 Kokoro 82M VRAM 적합도는?
최소 1GB · 권장 2GB 모델 기준 적합도는 「매우 쾌적」입니다.