Symulacja kosztów uruchomienia modeli open-source | Platform X99 Xeon Dual | luty 2026
| Model | Typ | VRAM Q4 | Liczba RTX 3090 | Łączny VRAM | Koszt kart | Prędkość gen. | Ocena |
|---|---|---|---|---|---|---|---|
| Qwen3.5-27B | dense | ~17 GB | 1× | 24 GB | 3 200 zł | ~33 t/s | ✅ Świetnie |
| Qwen3.5-35B-A3B | MoE | ~20 GB | 1× | 24 GB | 3 200 zł | ~111 t/s | ✅ Rewelacja! |
| Qwen3-TTS CustomVoice | TTS | ~4 GB | 1× | 24 GB | 3 200 zł | realtime ⚡ | ✅ Świetnie |
| Nvidia PersonaPlex-7B | TTS | ~7 GB | 1× | 24 GB | 3 200 zł | realtime ⚡ | ✅ Świetnie |
| Qwen3.5-122B-A10B | MoE | ~62 GB | 3× | 72 GB | 9 600 zł | ~45 t/s | ⚠️ Wykonalne |
| Qwen3.5-397B-A17B | MoE | ~94 GB (Unsloth Q4) | 4× | 96 GB | 12 800 zł | ~20 t/s | ⚠️ Powolne PCIe |
| Kimi K2.5 (171B) | MoE | ~86 GB (INT4) | 4× | 96 GB | 12 800 zł | ~18 t/s | ⚠️ Powolne PCIe |
| MiniMax-M2.5 (229B) | MoE | ~115 GB (Q4) | 5× | 120 GB | 16 000 zł | ~12 t/s | ❌ Bardzo wolne |
| GLM-5 (744B) | MoE | ~372 GB (Q4) | 16× | 384 GB | 51 200 zł | ~3 t/s 🐌 | ❌ Mega-klaster |
| Konfiguracja | Karty | Koszt kart | PSU (szacunek) | Akcesoria | RAZEM | Prąd/mies. |
|---|---|---|---|---|---|---|
| Starter: 1× RTX 3090 Qwen3.5-35B, TTS |
1× | 3 200 zł | już masz ✅ | 0 zł | ~3 200 zł | ~50 zł |
| Komfort: 2× RTX 3090 większe modele + NVLink |
2× | 6 400 zł | 1200W PSU: 500 zł | NVLink: 300 zł | ~7 200 zł | ~100 zł |
| Zaawansowany: 4× RTX 3090 397B-A17B Qwen, Kimi K2.5 |
4× | 12 800 zł | 2× 1600W PSU: 1200 zł | Risery, chłodzenie: 500 zł | ~14 500 zł | ~200 zł |
| Hardcore: 8× RTX 3090 mniejsze wariacje dużych modeli |
8× | 25 600 zł | 4× 1600W: 2400 zł | Rack, chłodzenie: 1500 zł | ~29 500 zł | ~400 zł |
| Server: 16× RTX 3090 GLM-5 744B (marginalna jakość) |
16× | 51 200 zł | Dedicated PDU: 5000 zł | Rack, infra: 3000 zł | ~59 200 zł | ~800 zł |