📊 Metodologia testu
Metryka: Separacja = avg(podobieństwo do powiązanych) - avg(podobieństwo do niepowiązanych). Im wyższa separacja, tym model lepiej odróżnia tematy.
Zapytanie: "trenowanie modeli text-to-speech po polsku"
Powiązane (3): Qwen3-TTS, fine-tuning TTS, CosyVoice/XTTS
Niepowiązane (3): Drukarka 3D Klipper, algorytmy sortowania, przepis na bigos
Zapytanie: "trenowanie modeli text-to-speech po polsku"
Powiązane (3): Qwen3-TTS, fine-tuning TTS, CosyVoice/XTTS
Niepowiązane (3): Drukarka 3D Klipper, algorytmy sortowania, przepis na bigos
🏆 Ranking modeli
SEPARACJA (wyższa = lepsza) — skala 0→0.50
🥇 text-embedding-3-large
🥈 text-embedding-3-small
🥉 bge-m3 (Ollama)
4️⃣ mxbai-embed-large
5️⃣ nomic-embed-text
💀 hermes-3 (poprzedni)
🥇
openai/text-embedding-3-large
via OpenRouter API • 3072 wymiary • $0.13/1M tokenów
0.4482
separacja
🥈
openai/text-embedding-3-small
via OpenRouter API • 1536 wymiary • $0.02/1M tokenów
0.4405
separacja
🥉
BAAI/bge-m3
Ollama lokalnie • 1024 wymiary • DARMOWY • 1.2GB
0.2993
separacja
4️⃣
mxbai-embed-large
Ollama lokalnie • 1024 wymiary • DARMOWY • 638MB
0.2476
separacja
5️⃣
nomic-embed-text
Ollama lokalnie • 768 wymiary • DARMOWY • 261MB
0.2282
separacja
🔬 Szczegółowe wyniki
💡 Rekomendacje
🏆 Jakość > Koszt
- text-embedding-3-large via OpenRouter
- Separacja 0.4482 — najlepsza jakość
- $0.13/1M tokenów — tanie przy małym RAG
- Wymiary 3072 — więcej pamięci na embeddingi
- Rekomendowane do RAG Kolora
⭐ Złoty środek
- text-embedding-3-small via OpenRouter
- Separacja 0.4405 — prawie identyczna jakość
- 6x tańszy niż large ($0.02/1M)
- Wymiary 1536 — połowa pamięci
- Najlepsza cena/jakość dla polskiego
🔒 Lokalnie / Offline
- bge-m3 via Ollama (nowo zainstalowany!)
- Separacja 0.2993 — najlepszy darmowy
- 1.2GB, 100+ języków, działa offline
- 8192 tokenów kontekstu — długie dokumenty
- Polecany gdy nie chcesz API
⚠️ Nie używaj do polskiego
- hermes-3 — separacja tylko 0.058
- To jest model językowy, nie embedding
- Poprzednia konfiguracja RAG Kolora
- mxbai/nomic — OK dla angielskiego
- Dla polskiego oddają zbyt wysokie podobieństwo
🎯 Finalne zalecenie dla RAG Kolora
Przełącz się z hermes-3 na openai/text-embedding-3-small via OpenRouter — separacja wzrośnie z 0.058 do 0.4405, czyli prawie 8-krotna poprawa! Koszt przy 29 wpisach RAG to dosłownie grosze. Alternatywnie — zainstalowany bge-m3 jest darmowy i działa offline z separacją 0.2993.