Kalkulator GPU — LLM na RTX 3090

Symulacja kosztów uruchomienia modeli open-source | Platform X99 Xeon Dual | luty 2026

Model	Typ	VRAM Q4	Liczba RTX 3090	Łączny VRAM	Koszt kart	Prędkość gen.	Ocena
Qwen3.5-27B	dense	~17 GB	1×	24 GB	3 200 zł	~33 t/s	✅ Świetnie
Qwen3.5-35B-A3B	MoE	~20 GB	1×	24 GB	3 200 zł	~111 t/s	✅ Rewelacja!
Qwen3-TTS CustomVoice	TTS	~4 GB	1×	24 GB	3 200 zł	realtime ⚡	✅ Świetnie
Nvidia PersonaPlex-7B	TTS	~7 GB	1×	24 GB	3 200 zł	realtime ⚡	✅ Świetnie
Qwen3.5-122B-A10B	MoE	~62 GB	3×	72 GB	9 600 zł	~45 t/s	⚠️ Wykonalne
Qwen3.5-397B-A17B	MoE	~94 GB (Unsloth Q4)	4×	96 GB	12 800 zł	~20 t/s	⚠️ Powolne PCIe
Kimi K2.5 (171B)	MoE	~86 GB (INT4)	4×	96 GB	12 800 zł	~18 t/s	⚠️ Powolne PCIe
MiniMax-M2.5 (229B)	MoE	~115 GB (Q4)	5×	120 GB	16 000 zł	~12 t/s	❌ Bardzo wolne
GLM-5 (744B)	MoE	~372 GB (Q4)	16×	384 GB	51 200 zł	~3 t/s 🐌	❌ Mega-klaster

⚡ RTX 3090 — specyfikacja

24 GB GDDR6X VRAM na kartę
936 GB/s bandwidth pamięci
350–370W TDP
Zasilanie: 3× 8-pin
PCIe 4.0 x16 (na X99 działają jako 3.0 x16)
NVLink: tylko 2 karty razem!

🖥️ X99 Xeon Dual-Socket

2× Xeon E5-2xxx v3/v4 = ~80 linii PCIe
Maksymalnie ~4 karty w x16 lub 8 kart w x8
PCIe 3.0 (nie 4.0!) — wąskie gardło
Prędkość inter-GPU: ~15 GB/s (PCIe 3.0 x16)
Zasilanie: potrzebujesz dużego PSU!
Zalecane chłodzenie aktywne (data center lub noctua)

⚡ Prąd — koszty eksploatacji

1× RTX 3090: ~350W → ~50 zł/mies.
2× RTX 3090: ~700W → ~100 zł/mies.
4× RTX 3090: ~1400W → ~200 zł/mies.
8× RTX 3090: ~2800W → ~400 zł/mies.
16× RTX 3090: ~5600W → ~800 zł/mies.
(przy taryfie ~0.80 zł/kWh, 24h/7)

⚠️ Ograniczenia multi-GPU

Powyżej 2 kart: tylko PCIe bandwidth
Nie ma NVLink dla 3-4 kart konsumenckich
llama.cpp tnie VRAM przez PCIe — wolniej
vLLM wymaga NVLink dla dobrych wyników
Alternatywa: exllamav2 lepiej skaluje PCIe
Do 4 kart: akceptowalna wydajność

Konfiguracja	Karty	Koszt kart	PSU (szacunek)	Akcesoria	RAZEM	Prąd/mies.
Starter: 1× RTX 3090 Qwen3.5-35B, TTS	1×	3 200 zł	już masz ✅	0 zł	~3 200 zł	~50 zł
Komfort: 2× RTX 3090 większe modele + NVLink	2×	6 400 zł	1200W PSU: 500 zł	NVLink: 300 zł	~7 200 zł	~100 zł
Zaawansowany: 4× RTX 3090 397B-A17B Qwen, Kimi K2.5	4×	12 800 zł	2× 1600W PSU: 1200 zł	Risery, chłodzenie: 500 zł	~14 500 zł	~200 zł
Hardcore: 8× RTX 3090 mniejsze wariacje dużych modeli	8×	25 600 zł	4× 1600W: 2400 zł	Rack, chłodzenie: 1500 zł	~29 500 zł	~400 zł
Server: 16× RTX 3090 GLM-5 744B (marginalna jakość)	16×	51 200 zł	Dedicated PDU: 5000 zł	Rack, infra: 3000 zł	~59 200 zł	~800 zł

🏆 Rekomendacja dla Twojej platformy X99

💚 Najlepsza inwestycja

2× RTX 3090 z NVLink → uruchamia Qwen3.5-35B-A3B (111 t/s!) + Qwen3-TTS jednocześnie

~7 200 zł

🎯 Najlepszy model/cena

Qwen3.5-35B-A3B MoE — 1 karta, 111 t/s, mieści się w 24GB, bije modele 2-3x większe!

3 200 zł

⚡ Jeśli chcesz flagowca

4× RTX 3090 → Qwen3.5-397B-A17B Q4 (94GB) przez PCIe. ~20 t/s — wolne ale działa!

14 500 zł

⚠️ GLM-5 744B lokalnie

16× RTX 3090 — technicznie możliwe ale nieekonomiczne. Lepiej przez API ($0.80/1M tokenów)

59 200 zł ❌

🔌 X99 Xeon Dual

Świetna platforma! Dużo linii PCIe, ale pamiętaj: PCIe 3.0, nie 4.0. Do 4 kart — optymalne

✅ OK

💡 Ceny OLX.pl (luty 2026): MSI Gaming X Trio 3 700 zł | Zotac Trinity 3 100 zł | Gainward GS 3 200 zł | MSI Trio X 2 900 zł
🔋 Zasilanie: Każda RTX 3090 potrzebuje 3× 8-pin = 350W. 4 karty = 1400W tylko na GPU!
🔗 NVLink: Działa tylko dla par (2 karty). Powyżej 2 kart → llama.cpp / exllamav2 przez PCIe.

🖥️ Kalkulator GPU — LLM na RTX 3090

⚡ RTX 3090 — specyfikacja

🖥️ X99 Xeon Dual-Socket

⚡ Prąd — koszty eksploatacji

⚠️ Ograniczenia multi-GPU

🏆 Rekomendacja dla Twojej platformy X99