112 KiB
🚀 OmniRoute — darmowa bramka AI
Nigdy nie przestawaj kodować. Inteligentne przekierowywanie do BEZPŁATNYCH i tanich modeli AI z automatycznym powrotem.
Twój uniwersalny serwer proxy API — jeden punkt końcowy, ponad 67 dostawców, zero przestojów. Teraz z orkiestracją agentów MCP i A2A.
Ukończenie czatu • Osadzanie • Generowanie obrazu • Wideo • Muzyka • Dźwięk • Zmiana rankingu • Wyszukiwanie w Internecie • Serwer MCP • Protokół A2A • 100% TypeScript
🌐 Website • 🚀 Quick Start • 💡 Features • 📖 Docs • 💰 Pricing • 💬 WhatsApp
🌐 Dostępne w: 🇺🇸 English | 🇧🇷 Português (Brasil) | 🇪🇸 Español | 🇫🇷 Français | 🇮🇹 Italiano | 🇷🇺 Русский | 🇨🇳 中文 (简体) | 🇩🇪 Deutsch | 🇮🇳 हिन्दी | 🇹🇭 ไทย | 🇺🇦 Українська | 🇸🇦 العربية | 🇯🇵 日本語 | 🇻🇳 Tiếng Việt | 🇧🇬 Български | 🇩🇰 Dansk | 🇫🇮 Suomi | 🇮🇱 עברית | 🇭🇺 Magyar | 🇮🇩 Bahasa Indonesia | 🇰🇷 한국어 | 🇲🇾 Bahasa Melayu | 🇳🇱 Nederlands | 🇳🇴 Norsk | 🇵🇹 Português (Portugal) | 🇷🇴 Română | 🇵🇱 Polski | 🇸🇰 Slovenčina | 🇸🇪 Svenska | 🇵🇭 Filipino | 🇨🇿 Čeština
🆕 Co nowego w wersji 3.0.0
Aktualizacja z wersji 2.9.5? — Wszystkie zmiany znajdziesz w full CHANGELOG.
| Powierzchnia | Zmień |
|---|---|
| 🔒 Bezpieczeństwo CodeQL | Naprawiono ponad 10 alertów CodeQL: ponowne wykonanie wielomianu, niepewna losowość, naprawa poprzez wstrzykiwanie powłoki |
| ✅ Weryfikacja trasy | Wszystkie 176 tras API zostało teraz zweryfikowanych przy użyciu schematów Zoda + validateBody() — CI check:route-validation:t06 karnety |
| 🐛 Wyciek tagu omniModel | Wewnętrzne tagi <omniModel> nie wyciekają już do klientów w odpowiedziach strumieniowych SSE (#585) |
| 🔑 API kluczy zarejestrowanych | Automatyczne udostępnianie kluczy API za pośrednictwem POST /api/v1/registered-keys z egzekwowaniem limitów dla dostawcy/konta, idempotencją, pamięcią SHA-256 i opcjonalnym raportowaniem problemów w serwisie GitHub |
| 🎨 Ikony dostawców | Ponad 130 logo dostawców za pośrednictwem @lobehub/icons (SVG) w formacie PNG → ogólny łańcuch awaryjny |
| 🔄 Automatyczna synchronizacja modelu | 24-godzinny harmonogram i ręczny przełącznik interfejsu użytkownika do synchronizacji list modeli dla wbudowanych i niestandardowych dostawców kompatybilnych z OpenAI |
| 🌐 OpenCode Zen/Go | Dwóch nowych dostawców od @kang-heewon poprzez PR #530: poziom bezpłatny + poziom subskrypcji przez OpencodeExecutor |
| 🐛 Gemini CLI OAuth | Błąd, który można podjąć, gdy w Dockerze brakuje GEMINI_OAUTH_CLIENT_SECRET (był to tajemniczy błąd Google) |
| 🐛 Konfiguracja OpenCode | saveOpenCodeConfig() teraz poprawnie zapisuje TOML do XDG_CONFIG_HOME |
| 🐛 Nadpisanie przypiętego modelu | body.model poprawnie ustawiony na pinnedModel w przypadku ochrony pamięci podręcznej kontekstu |
| 🐛 Kodeks/pętla Claude | tool_result bloki są teraz konwertowane na tekst, aby zatrzymać nieskończone pętle |
| 🐛 Przekierowanie logowania | Logowanie nie zawiesza się już po pominięciu konfiguracji hasła |
| 🐛 Ścieżki systemu Windows | Ścieżki MSYS2/Git-Bash (/c/...) automatycznie znormalizowane do C:\... |
🖼️ Panel główny
📸 Podgląd panelu
Kliknij, aby zobaczyć zrzuty ekranu panelu kontrolnego
| Strona | Zrzut ekranu |
|---|---|
| Dostawcy | ![]() |
| Kombinacje | ![]() |
| Analiza | ![]() |
| Zdrowie | ![]() |
| Tłumacz | ![]() |
| Ustawienia | ![]() |
| Narzędzia CLI | ![]() |
| Dzienniki użytkowania | ![]() |
| Punkty końcowe | ![]() |
🤖 Bezpłatny dostawca AI dla Twoich ulubionych agentów kodujących
Połącz dowolne narzędzie IDE lub CLI oparte na sztucznej inteligencji poprzez OmniRoute — bezpłatną bramę API dla nieograniczonego kodowania.
|
OpenClaw ⭐ 205K |
NanoBot ⭐ 20.9K |
PicoClaw ⭐ 14.6K |
ZeroClaw ⭐ 9.9K |
IronClaw ⭐ 2.1K |
|
OpenCode ⭐ 106K |
Codex CLI ⭐ 60.8K |
Claude Code ⭐ 67.3K |
Gemini CLI ⭐ 94.7K |
Kilo Code ⭐ 15.5K |
📡 Wszyscy agenci łączą się przez http://localhost:20128/v1 lub http://cloud.omniroute.online/v1 — jedna konfiguracja, nieograniczona liczba modeli i limit
🤔 Dlaczego OmniRoute?
Przestań marnować pieniądze i przekraczać limity:
Limit subskrypcji wygasa niewykorzystany co miesiąc
Limity szybkości zatrzymują Cię w połowie kodowania
Drogie interfejsy API (20-50 USD miesięcznie na dostawcę)
Ręczne przełączanie pomiędzy dostawcami
OmniRoute rozwiązuje ten problem:
- ✅ Maksymalizuj liczbę subskrypcji - Śledź limit, wykorzystaj każdy bit przed zresetowaniem
- ✅ Automatyczny powrót - Subskrypcja → Klucz API → Tani → Bezpłatny, zero przestojów
- ✅ Wiele kont - Praca okrężna pomiędzy kontami każdego dostawcy
- ✅ Uniwersalny - Działa z Claude Code, Codex, Gemini CLI, Cursor, Cline, OpenClaw i dowolnym narzędziem CLI
📧 Wsparcie
💬 Dołącz do naszej społeczności! WhatsApp Group — Uzyskaj pomoc, dziel się wskazówkami i bądź na bieżąco.
- Strona internetowa: omniroute.online
- GitHub: github.com/diegosouzapw/OmniRoute
- Problemy: github.com/diegosouzapw/OmniRoute/issues
- WhatsApp: Community Group
- Wspieranie: zobacz CONTRIBUTING.md, otwórz PR lub wybierz
good first issue - Oryginalny projekt: 9router by decolua
🐛 Zgłaszasz błąd?
Otwierając zgłoszenie, uruchom komendę system-info i załącz wygenerowany plik:
npm run system-info
Spowoduje to wygenerowanie pliku system-info.txt z wersją Node.js, wersją OmniRoute, szczegółami systemu operacyjnego, zainstalowanymi narzędziami CLI (iflow, gemini, claude, codex, antygrawitacja, droid itp.), statusem Docker/PM2 i pakietami systemowymi — wszystko, czego potrzebujemy, aby szybko odtworzyć problem. Dołącz plik bezpośrednio do swojego zgłoszenia w GitHubie.
🔄 Jak to działa
┌─────────────┐
│ Your CLI │ (Claude Code, Codex, Gemini CLI, OpenClaw, Cursor, Cline...)
│ Tool │
└──────┬──────┘
│ http://localhost:20128/v1
↓
┌─────────────────────────────────────────┐
│ OmniRoute (Smart Router) │
│ • Format translation (OpenAI ↔ Claude) │
│ • Quota tracking + Embeddings + Images │
│ • Auto token refresh │
└──────┬──────────────────────────────────┘
│
├─→ [Tier 1: SUBSCRIPTION] Claude Code, Codex, Gemini CLI
│ ↓ quota exhausted
├─→ [Tier 2: API KEY] DeepSeek, Groq, xAI, Mistral, NVIDIA NIM, etc.
│ ↓ budget limit
├─→ [Tier 3: CHEAP] GLM ($0.6/1M), MiniMax ($0.2/1M)
│ ↓ budget limit
└─→ [Tier 4: FREE] iFlow, Qwen, Kiro (unlimited)
Result: Never stop coding, minimal cost
🎯 Co rozwiązuje OmniRoute — 30 rzeczywistych problemów i przypadków użycia
Każdy programista korzystający z narzędzi AI codziennie spotyka się z tymi problemami. OmniRoute został stworzony, aby rozwiązać je wszystkie — od przekroczeń kosztów po blokady regionalne, od zepsutych przepływów OAuth po operacje protokołów i obserwowalność przedsiębiorstwa.
💸 1. „Płacę za kosztowną subskrypcję, ale nadal przeszkadzają mi limity”
Programiści płacą 20–200 USD miesięcznie za Claude Pro, Codex Pro lub GitHub Copilot. Nawet płacąc, limit ma pułap – 5 godzin użytkowania, limity tygodniowe lub limity stawek za minutę. W połowie sesji kodowania dostawca przestaje odpowiadać, a programista traci płynność i produktywność.
Jak rozwiązuje to OmniRoute:
- Inteligentny 4-poziomowy powrót — Jeśli limit subskrypcji się wyczerpie, automatycznie przekierowuje do klucza API → Tani → Bezpłatny bez ręcznej interwencji
- Śledzenie limitów w czasie rzeczywistym — Pokazuje zużycie tokenów w czasie rzeczywistym z resetowanym odliczaniem (5 godzin, codziennie, co tydzień)
- Obsługa wielu kont — Wiele kont na dostawcę z funkcją automatycznego przełączania między kontami — gdy skończy się jedno, następuje przejście do następnego
- Niestandardowe kombinacje — Konfigurowalne łańcuchy rezerwowe z 6 strategiami równoważenia (pierwsze wypełnienie, działanie okrężne, P2C, losowe, najrzadziej używane, zoptymalizowane pod względem kosztów)
- Przydziały biznesowe Kodeksu — monitorowanie przydziałów przestrzeni roboczej firmy/zespołu bezpośrednio na pulpicie nawigacyjnym
🔌 2. „Muszę korzystać z wielu dostawców, ale każdy ma inny interfejs API”
OpenAI używa jednego formatu, Claude (Anthropic) używa innego, Gemini jeszcze innego. Jeśli programista chce przetestować modele od różnych dostawców lub korzystać z nich w trybie awaryjnym, musi ponownie skonfigurować pakiety SDK, zmienić punkty końcowe i poradzić sobie z niekompatybilnymi formatami. Dostawcy niestandardowi (FriendLI, NIM) mają niestandardowe punkty końcowe modelu.
Jak rozwiązuje to OmniRoute:
- Ujednolicony punkt końcowy — pojedynczy
http://localhost:20128/v1służy jako serwer proxy dla wszystkich ponad 67 dostawców - Tłumaczenie formatu — Automatyczne i przejrzyste: OpenAI ↔ Claude ↔ Gemini ↔ API odpowiedzi
- Oczyszczanie odpowiedzi — usuwa niestandardowe pola (
x_groq,usage_breakdown,service_tier), które psują OpenAI SDK v1.83+ - Normalizacja ról — Konwertuje
developer→systemdla dostawców innych niż OpenAI;system→userdla GLM/ERNIE - Pomyśl o ekstrakcji tagów — wyodrębnia bloki
<think>z modeli takich jak DeepSeek R1 do standaryzowanegoreasoning_content - Strukturalne dane wyjściowe dla Gemini —
json_schema→responseMimeType/responseSchemaautomatyczna konwersja streamdomyślnie tofalse— Zgodność ze specyfikacją OpenAI, unikanie nieoczekiwanego SSE w pakietach SDK Python/Rust/Go
🌐 3. „Mój dostawca AI blokuje mój region/kraj”
Dostawcy tacy jak OpenAI/Codex blokują dostęp z określonych regionów geograficznych. Podczas połączeń OAuth i API użytkownicy otrzymują błędy takie jak unsupported_country_region_territory. Jest to szczególnie frustrujące dla programistów z krajów rozwijających się.
Jak rozwiązuje to OmniRoute:
- 3-poziomowa konfiguracja serwera proxy — Konfigurowalny serwer proxy na 3 poziomach: globalny (cały ruch), na dostawcę (tylko jeden dostawca) i na połączenie/klucz
- Oznaczone kolorami identyfikatory proxy — Wskaźniki wizualne: 🟢 globalny serwer proxy, 🟡 serwer proxy dostawcy, 🔵 serwer proxy połączenia, zawsze pokazujący adres IP
- Wymiana tokenów OAuth przez serwer proxy — Przepływ OAuth przechodzi również przez serwer proxy, rozwiązując problem
unsupported_country_region_territory - Test połączenia przez serwer proxy — Testy połączenia wykorzystują skonfigurowany serwer proxy (koniec z bezpośrednim obejściem)
- Obsługa SOCKS5 — Pełna obsługa proxy SOCKS5 dla routingu wychodzącego
- Podrabianie odcisków palców TLS — Odcisk palca TLS podobny do przeglądarki za pośrednictwem
wreq-jsw celu ominięcia wykrywania botów - 🔏 Dopasowanie odcisków palców CLI — zmienia kolejność nagłówków i pól treści, aby dopasować je do natywnych podpisów binarnych CLI, drastycznie zmniejszając ryzyko oznaczania konta. Adres IP serwera proxy zostaje zachowany — jednocześnie uzyskujesz maskowanie IP ** i** IP
🆓 4. „Chcę używać AI do kodowania, ale nie mam pieniędzy”
Nie każdy może zapłacić 20–200 USD miesięcznie za subskrypcje AI. Studenci, programiści z krajów wschodzących, hobbyści i freelancerzy potrzebują dostępu do wysokiej jakości modeli po zerowych kosztach.
Jak rozwiązuje to OmniRoute:
- Wbudowani dostawcy Free Tier — Natywne wsparcie dla w 100% darmowych dostawców: iFlow (5 nieograniczonych modeli przez OAuth: kimi-k2-thinking, qwen3-coder-plus, deepseek-r1, minimax-m2, kimi-k2), Qwen (4 nieograniczone modele: qwen3-coder-plus, qwen3-coder-flash, qwen3-coder-next, Vision-model), Kiro (Claude + AWS Builder ID za darmo), Gemini CLI (180 tys. tokenów miesięcznie za darmo)
- Ollama Cloud — modele Ollama hostowane w chmurze pod adresem
api.ollama.comz bezpłatnym poziomem „Lekkie użycie”; użyj przedrostkaollamacloud/<model> - Kombinacje dostępne wyłącznie bezpłatnie — Łańcuch
gc/gemini-3-flash → if/kimi-k2-thinking → qw/qwen3-coder-plus= 0 USD/miesiąc z zerowymi przestojami - Bezpłatny dostęp do NVIDIA NIM — bezpłatny dostęp dla deweloperów przy ~40 obr./min na zawsze do ponad 70 modeli na stronie build.nvidia.com (przejście z kredytów na same limity szybkości)
- Strategia zoptymalizowana pod względem kosztów — Strategia routingu, która automatycznie wybiera najtańszego dostępnego dostawcę
🔒 5. „Muszę chronić moją bramę AI przed nieautoryzowanym dostępem”
Podczas udostępniania bramy AI w sieci (LAN, VPS, Docker) każda osoba posiadająca adres może wykorzystać tokeny/przydział programisty. Bez ochrony interfejsy API są podatne na niewłaściwe użycie, natychmiastowe wstrzyknięcie i nadużycia.
Jak rozwiązuje to OmniRoute:
- Zarządzanie kluczami API — generowanie, rotacja i ustalanie zakresu dla każdego dostawcy z dedykowaną stroną
/dashboard/api-manager - Uprawnienia na poziomie modelu — Ogranicz klucze API do określonych modeli (
openai/*, wzorce symboli wieloznacznych), za pomocą przełącznika Zezwalaj na wszystko/Ogranicz - API Endpoint Protection — Wymagaj klucza dla
/v1/modelsi blokuj określonych dostawców na liście - Auth Guard + ochrona CSRF — Wszystkie trasy pulpitu nawigacyjnego chronione za pomocą oprogramowania pośredniego
withAuth+ tokenów CSRF - Rate Limiter — Ograniczanie szybkości na IP z konfigurowalnymi oknami
- Filtrowanie IP — Lista dozwolonych/blokowanych do kontroli dostępu
- Szybka ochrona przed wstrzyknięciem — Oczyszczanie przed złośliwymi wzorcami podpowiedzi
- Szyfrowanie AES-256-GCM — Poświadczenia szyfrowane w stanie spoczynku
🛑 6. „Mój dostawca przestał działać i straciłem płynność kodowania”
Dostawcy sztucznej inteligencji mogą stać się niestabilni, zwracać błędy 5xx lub przekraczać tymczasowe limity szybkości. Jeśli programista jest zależny od jednego dostawcy, jego praca jest przerywana. Bez wyłączników automatycznych wielokrotne próby mogą spowodować awarię aplikacji.
Jak rozwiązuje to OmniRoute:
- Wyłącznik w zależności od modelu — Automatyczne otwieranie/zamykanie z konfigurowalnymi progami i czasem schładzania (zamknięty/otwarty/półotwarty), zakres zależny od modelu, aby uniknąć blokad kaskadowych
- Wykładniczy wycofywanie — Stopniowe opóźnienia ponownych prób
- Anti-Thundering Herd — Mutex + ochrona semaforów przed równoczesnymi burzami ponownych prób
- Łańcuchy awaryjne typu Combo — jeśli główny dostawca zawiedzie, automatycznie przejdzie przez łańcuch bez interwencji
- Wyłącznik automatyczny — automatycznie wyłącza niesprawnych dostawców w łańcuchu combo
- Panel stanu — Monitorowanie czasu pracy, stany wyłączników, blokady, statystyki pamięci podręcznej, opóźnienia p50/p95/p99
🔧 7. „Konfigurowanie każdego narzędzia AI jest żmudne i powtarzalne”
Programiści używają Cursor, Claude Code, Codex CLI, OpenClaw, Gemini CLI, Kilo Code... Każde narzędzie wymaga innej konfiguracji (punkt końcowy API, klucz, model). Ponowna konfiguracja w przypadku zmiany dostawcy lub modelu jest stratą czasu.
Jak rozwiązuje to OmniRoute:
- ** Panel narzędzi CLI** — Dedykowana strona z konfiguracją jednym kliknięciem dla Claude Code, Codex CLI, OpenClaw, Kilo Code, Antigravity, Cline
- Generator konfiguracji GitHub Copilot — Generuje
chatLanguageModels.jsondla kodu VS z zbiorczym wyborem modelu - Kreator wprowadzenia — konfiguracja w 4 krokach dla początkujących użytkowników
- Jeden punkt końcowy, wszystkie modele — Skonfiguruj
http://localhost:20128/v1raz, uzyskaj dostęp do ponad 67 dostawców
🔑 8. „Zarządzanie tokenami OAuth od wielu dostawców to piekło”
Claude Code, Codex, Gemini CLI, Copilot — wszystkie korzystają z OAuth 2.0 z wygasającymi tokenami. Programiści muszą stale przeprowadzać ponowne uwierzytelnianie, radzić sobie z client_secret is missing, redirect_uri_mismatch i awariami na zdalnych serwerach. Szczególnie problematyczny jest protokół OAuth w sieci LAN/VPS.
Jak rozwiązuje to OmniRoute:
- Automatyczne odświeżanie tokenu — tokeny OAuth odświeżają się w tle przed wygaśnięciem
- Wbudowany OAuth 2.0 (PKCE) — Automatyczny przepływ dla Claude Code, Codex, Gemini CLI, Copilot, Kiro, Qwen, iFlow
- Wielokontowy OAuth — wiele kont na dostawcę poprzez ekstrakcję tokenów JWT/ID
- OAuth LAN/Remote Fix — Wykrywanie prywatnego adresu IP dla
redirect_uri+ ręczny tryb adresu URL dla serwerów zdalnych - OAuth Behind Nginx — Używa
window.location.originw celu zapewnienia zgodności z odwrotnym proxy - Przewodnik po zdalnym OAuth — szczegółowy przewodnik dotyczący danych uwierzytelniających Google Cloud na platformie VPS/Docker
📊 9. „Nie wiem, ile i gdzie wydaję”
Programiści korzystają z wielu płatnych dostawców, ale nie mają jednolitego widoku wydatków. Każdy dostawca ma własny pulpit rozliczeniowy, ale nie ma widoku skonsolidowanego. Nieoczekiwane koszty mogą się kumulować.
Jak rozwiązuje to OmniRoute:
- Panel analizy kosztów — śledzenie kosztów według tokenu i zarządzanie budżetem dla każdego dostawcy
- Limity budżetowe na poziom — Pułap wydatków na poziom, który uruchamia automatyczne wycofanie
- Konfiguracja cen dla poszczególnych modeli — Ceny dla poszczególnych modeli można konfigurować
- Statystyki użytkowania na klucz API — Liczba żądań i znacznik czasu ostatniego użycia na klucz
- Panel analityczny — karty statystyk, wykres wykorzystania modelu, tabela dostawców ze wskaźnikami powodzenia i opóźnieniami
🐛 10. „Nie mogę diagnozować błędów i problemów w wywołaniach AI”
Gdy połączenie nie powiedzie się, programista nie wie, czy był to limit szybkości, wygasły token, nieprawidłowy format czy błąd dostawcy. Fragmentaryczne dzienniki na różnych terminalach. Bez obserwowalności debugowanie odbywa się metodą prób i błędów.
Jak rozwiązuje to OmniRoute:
- Ujednolicony pulpit nawigacyjny — 4 karty: Dzienniki żądań, Dzienniki proxy, Dzienniki audytu, Konsola
- Przeglądarka logów w konsoli — Przeglądarka działająca w stylu terminala w czasie rzeczywistym z poziomami oznaczonymi kolorami, automatycznym przewijaniem, wyszukiwaniem i filtrowaniem
- Dzienniki proxy SQLite — trwałe dzienniki, które przetrwają ponowne uruchomienie serwera
- Plac zabaw dla tłumaczy — 4 tryby debugowania: Plac zabaw (tłumaczenie formatu), Tester czatu (w obie strony), Stanowisko testowe (wsadowe), Monitor na żywo (w czasie rzeczywistym)
- Żądanie telemetrii — opóźnienie p50/p95/p99 + śledzenie identyfikatora X-Request-Id
- Logowanie oparte na plikach z rotacją — Przechwytywacz konsoli przechwytuje wszystko do dziennika JSON z rotacją na podstawie rozmiaru
- Raport informacji o systemie —
npm run system-infogenerujesystem-info.txtz pełnym środowiskiem (wersja węzła, wersja OmniRoute, system operacyjny, narzędzia CLI, stan Docker/PM2). Dołącz go podczas zgłaszania problemów w celu natychmiastowej selekcji.
🏗️ 11. „Wdrażanie i konserwacja bramy jest skomplikowane”
Instalacja, konfiguracja i utrzymanie serwera proxy AI w różnych środowiskach (lokalnym, VPS, Docker, chmura) jest pracochłonne. Problemy takie jak zakodowane na stałe ścieżki, EACCES w katalogach, konflikty portów i kompilacje międzyplatformowe zwiększają tarcia.
Jak rozwiązuje to OmniRoute:
- npm globalna instalacja —
npm install -g omniroute && omniroute— gotowe - Docker Multi-platform — natywny AMD64 + ARM64 (Apple Silicon, AWS Graviton, Raspberry Pi)
- Profile Docker Compose —
base(bez narzędzi CLI) icli(z Claude Code, Codex, OpenClaw) - Electron Desktop App — Natywna aplikacja dla systemów Windows/macOS/Linux z zasobnikiem systemowym, automatycznym uruchamianiem i trybem offline
- Tryb Split-Port — API i pulpit nawigacyjny na oddzielnych portach dla zaawansowanych scenariuszy (odwrotne proxy, sieć kontenerowa)
- Cloud Sync — skonfiguruj synchronizację między urządzeniami za pośrednictwem Cloudflare Workers
- Kopie zapasowe DB — Automatyczne tworzenie kopii zapasowych, przywracanie, eksportowanie i importowanie wszystkich ustawień
🌍 12. „Interfejs jest wyłącznie w języku angielskim, a mój zespół nie mówi po angielsku”
Zespoły w krajach nieanglojęzycznych, szczególnie w Ameryce Łacińskiej, Azji i Europie, mają trudności z interfejsami dostępnymi wyłącznie w języku angielskim. Bariery językowe ograniczają wdrażanie i zwiększają liczbę błędów konfiguracyjnych.
Jak rozwiązuje to OmniRoute:
- ** Panel i18n — 30 języków** — Przetłumaczono ponad 500 klawiszy, w tym arabski, bułgarski, duński, niemiecki, hiszpański, fiński, francuski, hebrajski, hindi, węgierski, indonezyjski, włoski, japoński, koreański, malajski, holenderski, norweski, polski, portugalski (PT/BR), rumuński, rosyjski, słowacki, szwedzki, tajski, ukraiński, wietnamski, chiński, filipiński, angielski
- Obsługa RTL — obsługa tekstu od prawej do lewej w języku arabskim i hebrajskim
- Wielojęzyczne pliki README — 30 kompletnych tłumaczeń dokumentacji
- Wybór języka — Ikona kuli ziemskiej w nagłówku umożliwiająca przełączanie w czasie rzeczywistym
🔄 13. „Potrzebuję czegoś więcej niż tylko czatu — potrzebuję osadzania, obrazów i dźwięku”
Sztuczna inteligencja to nie tylko ukończenie czatu. Twórcy muszą generować obrazy, transkrybować dźwięk, tworzyć osadzania dla RAG, zmieniać rangę dokumentów i moderować treści. Każdy interfejs API ma inny punkt końcowy i format.
Jak rozwiązuje to OmniRoute:
- Osadzanie —
/v1/embeddingsz 6 dostawcami i ponad 9 modelami - Generowanie obrazu —
/v1/images/generationsz 10 dostawcami i ponad 20 modelami (OpenAI, xAI, Together, Fireworks, Nebius, Hyperbolic, NanoBanana, Antigravity, SD WebUI, ComfyUI) - Tekst na wideo —
/v1/videos/generations— ComfyUI (AnimateDiff, SVD) i SD WebUI - Tekst na muzykę —
/v1/music/generations— ComfyUI (Stable Audio Open, MusicGen) - Transkrypcja audio —
/v1/audio/transcriptions— Whisper + Nvidia NIM, HuggingFace, Qwen3 - Zamiana tekstu na mowę —
/v1/audio/speech— ElevenLabs, Nvidia NIM, HuggingFace, Coqui, Tortoise, Qwen3, Inworld, Cartesia, PlayHT, + obecni dostawcy - Moderacje —
/v1/moderations— Sprawdzanie bezpieczeństwa treści - Reranking —
/v1/rerank— Zmiana rankingu trafności dokumentu - Responses API — Pełna obsługa
/v1/responsesdla Codexu
🧪 14. „Nie mam możliwości przetestowania i porównania jakości różnych modeli”
Programiści chcą wiedzieć, który model jest najlepszy dla ich przypadku użycia — kodu, tłumaczenia, rozumowania — ale ręczne porównywanie jest powolne. Nie istnieją żadne zintegrowane narzędzia eval.
Jak rozwiązuje to OmniRoute:
- Oceny LLM — Testowanie złotego zestawu z 10 fabrycznie załadowanymi skrzynkami obejmującymi pozdrowienia, matematykę, geografię, generowanie kodu, zgodność z JSON, tłumaczenie, przeceny, odmowy ze względów bezpieczeństwa
- 4 Strategie dopasowywania —
exact,contains,regex,custom(funkcja JS) - Stolik testowy dla tłumaczy — Testowanie wsadowe z wieloma danymi wejściowymi i oczekiwanymi wynikami, porównanie różnych dostawców
- Tester czatu — Pełna podróż w obie strony z renderowaniem odpowiedzi wizualnych
- Live Monitor — Strumień w czasie rzeczywistym wszystkich żądań przepływających przez serwer proxy
📈 15. „Muszę skalować bez utraty wydajności”
W miarę wzrostu liczby żądań bez buforowania tych samych pytań generowane są podwójne koszty. Bez idempotencji zduplikowane żądania przetwarzania odpadów. Należy przestrzegać limitów stawek dla poszczególnych dostawców.
Jak rozwiązuje to OmniRoute:
- Semantyczna pamięć podręczna — Dwuwarstwowa pamięć podręczna (podpis + semantyka) zmniejsza koszty i opóźnienia
- Request Idempotency — okno deduplikacji 5 s dla identycznych żądań
- Wykrywanie limitów szybkości — RPM na dostawcę, minimalna przerwa i maksymalne jednoczesne śledzenie
- Edytowalne limity szybkości — Konfigurowalne ustawienia domyślne w Ustawieniach → Odporność z trwałością
- API Key Validation Cache — 3-warstwowa pamięć podręczna zapewniająca wydajność produkcyjną
- Panel kontrolny stanu z telemetrią — opóźnienia p50/p95/p99, statystyki pamięci podręcznej, czas pracy
🤖 16. „Chcę kontrolować zachowanie modelu globalnie”
Deweloperzy, którzy chcą wszystkich odpowiedzi w określonym języku, w określonym tonie lub chcą ograniczyć tokeny rozumowania. Konfigurowanie tego w każdym narzędziu/żądaniu jest niepraktyczne.
Jak rozwiązuje to OmniRoute:
- Wstrzykiwanie monitu systemowego — monit globalny stosowany do wszystkich żądań
- Przemyślana walidacja budżetu — Kontrola alokacji tokenów rozumowania na każde żądanie (przejściowe, automatyczne, niestandardowe, adaptacyjne)
- 6 Strategii routingu — Globalne strategie określające sposób dystrybucji żądań
- Wildcard Router —
provider/*wzorce przesyłają dynamicznie do dowolnego dostawcy - Przełączanie kombinacji włącz/wyłącz — przełączaj kombinacje bezpośrednio z pulpitu nawigacyjnego
- Przełączanie dostawcy — Włącz/wyłącz wszystkie połączenia dla dostawcy jednym kliknięciem
- Zablokowani dostawcy — wyklucz określonych dostawców z listy
/v1/models
🧰 17. „Potrzebuję narzędzi MCP jako produktów najwyższej klasy”
Wiele bram AI ujawnia MCP jedynie jako ukryty szczegół implementacji. Zespoły potrzebują widocznej, zarządzalnej warstwy operacyjnej.
Jak rozwiązuje to OmniRoute:
- MCP pojawia się w panelu nawigacji na desce rozdzielczej i w zakładce protokołu punktu końcowego
- Dedykowana strona zarządzania MCP z procesem, narzędziami, zakresami i audytem
- Wbudowany szybki start dla
omniroute --mcpi dołączania klientów
🧠 18. „Potrzebuję orkiestracji A2A ze ścieżkami zadań synchronizacji i strumienia”
Przepływy pracy agentów wymagają zarówno bezpośrednich odpowiedzi, jak i długotrwałego wykonywania strumieniowego z kontrolą cyklu życia.
Jak rozwiązuje to OmniRoute:
- Punkt końcowy A2A JSON-RPC (
POST /a2a) zmessage/sendimessage/stream - Przesyłanie strumieniowe SSE z propagacją stanu terminala
- Interfejsy API cyklu życia zadań dla
tasks/getitasks/cancel
🛰️ 19. „Potrzebuję prawdziwego stanu procesu MCP, a nie zgadywanego statusu”
Zespoły operacyjne muszą wiedzieć, czy MCP rzeczywiście żyje, a nie tylko, czy można uzyskać dostęp do interfejsu API.
Jak rozwiązuje to OmniRoute:
- Plik pulsu środowiska wykonawczego z PID, znacznikami czasu, transportem, liczbą narzędzi i trybem zakresu
- API statusu MCP łączące puls + ostatnią aktywność
- Karty stanu interfejsu użytkownika dotyczące świeżości procesów/czasu pracy/bicia serca
📋 20. „Potrzebuję wykonania narzędzia MCP z możliwością audytu”
Gdy narzędzia modyfikują konfigurację lub uruchamiają działania operacyjne, zespoły potrzebują identyfikowalności kryminalistycznej.
Jak rozwiązuje to OmniRoute:
- Rejestrowanie audytu wspierane przez SQLite dla wywołań narzędzi MCP
- Filtruje według narzędzia, sukcesu/porażki, klucza API i paginacji
- Tabela audytu pulpitu nawigacyjnego + punkty końcowe statystyk dla automatyzacji
🔐 21. „Potrzebuję uprawnień MCP o określonym zakresie na integrację”
Różni klienci powinni mieć najniższy dostęp do kategorii narzędzi.
Jak rozwiązuje to OmniRoute:
- 9 szczegółowych zakresów MCP zapewniających kontrolowany dostęp do narzędzi
- Egzekwowanie zakresu i widoczność w interfejsie zarządzania MCP
- Bezpieczna domyślna pozycja dla narzędzi operacyjnych
⚙️ 22. „Potrzebuję kontroli operacyjnej bez ponownego wdrażania”
Zespoły potrzebują szybkich zmian w czasie działania podczas incydentów lub zdarzeń kosztowych.
Jak rozwiązuje to OmniRoute:
- Aktywacja kombinacji przełączników bezpośrednio z pulpitu nawigacyjnego MCP
- Zastosuj profile odporności ze wstępnie zdefiniowanych pakietów zasad
- Zresetuj stan wyłącznika automatycznego z tego samego panelu operacyjnego
🔄 23. „Potrzebuję widoczności i anulowania cyklu życia zadania A2A na żywo”
Bez widoczności cyklu życia zdarzenia związane z zadaniami stają się trudne do segregacji.
Jak rozwiązuje to OmniRoute:
- Lista zadań/filtrowanie według stanu/umiejętności z paginacją
- Szczegółowa analiza metadanych zadań, zdarzeń i artefaktów
- Punkt końcowy anulowania zadania i akcja interfejsu użytkownika z potwierdzeniem
🌊 24. „Potrzebuję metryk aktywnego strumienia dla obciążenia A2A”
Przepływy pracy związane z przesyłaniem strumieniowym wymagają operacyjnego wglądu w współbieżność i połączenia na żywo.
Jak rozwiązuje to OmniRoute:
- Aktywne liczniki strumieni zintegrowane ze statusem A2A
- Znacznik czasu ostatniego zadania i liczba stanów
- Karty pulpitu A2A do monitorowania operacji w czasie rzeczywistym
🪪 25. „Potrzebuję standardowego wyszukiwania agentów dla klientów”
Zewnętrzni klienci i koordynatorzy potrzebują metadanych do odczytu maszynowego na potrzeby wdrożenia.
Jak rozwiązuje to OmniRoute:
- Karta Agenta ujawniona w
/.well-known/agent.json - Możliwości i umiejętności pokazane w interfejsie zarządzania
- Interfejs API stanu A2A zawiera metadane wykrywania do automatyzacji
🧭 26. „Potrzebuję wykrywalności protokołu w UX produktu”
Jeśli użytkownicy nie mogą odkryć powierzchni protokołu, spada jakość przyjęcia i wsparcia.
Jak rozwiązuje to OmniRoute:
- Skonsolidowana strona Punkty końcowe z zakładkami dla punktów końcowych proxy, MCP, A2A i API
- Przełączniki stanu usługi Inline (Online/Offline) dla MCP i A2A
- Linki z przeglądu do dedykowanych zakładek zarządzania
🧪 27. „Potrzebuję kompleksowej weryfikacji protokołu z prawdziwymi klientami”
Testy próbne nie wystarczą do sprawdzenia zgodności protokołu przed wydaniem.
Jak rozwiązuje to OmniRoute:
- Pakiet E2E, który uruchamia aplikację i wykorzystuje prawdziwy transport klienta MCP SDK
- Testy klienta A2A pod kątem wykrywania, wysyłania, przesyłania strumieniowego, pobierania i anulowania przepływów
- Sprawdzaj twierdzenia względem interfejsów API audytu MCP i zadań A2A
📡 28. „Potrzebuję ujednoliconej obserwowalności we wszystkich interfejsach”
Podział obserwowalności według protokołu tworzy martwe punkty i wydłuża MTTR.
Jak rozwiązuje to OmniRoute:
- Ujednolicone dashboardy/dzienniki/analizy w jednym produkcie
- Stan + audyt + telemetria żądań w warstwach OpenAI, MCP i A2A
- Operacyjne interfejsy API dla statusu i automatyzacji
💼 29. „Potrzebuję jednego środowiska wykonawczego dla serwera proxy + narzędzi + orkiestracji agenta”
Uruchamianie wielu oddzielnych usług zwiększa koszty operacyjne i tryby awarii.
Jak rozwiązuje to OmniRoute:
- Serwer proxy zgodny z OpenAI, serwer MCP i serwer A2A w jednym stosie
- Wspólne uwierzytelnianie, odporność, magazyn danych i obserwowalność
- Spójny model polityki na wszystkich płaszczyznach interakcji
🚀 30. „Muszę dostarczać przepływy pracy agenta bez niepotrzebnego tworzenia kodu klejącego”
Zespoły tracą prędkość podczas łączenia wielu usług i skryptów ad hoc.
Jak rozwiązuje to OmniRoute:
- Ujednolicona strategia dotycząca punktów końcowych dla klientów i agentów
- Wbudowane interfejsy zarządzania protokołami i ścieżki sprawdzania dymu
- Podstawy gotowe do produkcji (bezpieczeństwo, logowanie, odporność, kopie zapasowe)
Przykładowe podręczniki (zintegrowane przypadki użycia)
Poradnik A: maksymalizuj płatną subskrypcję + tanią kopię zapasową
Combo: "maximize-claude"
1. cc/claude-opus-4-6
2. glm/glm-4.7
3. if/kimi-k2-thinking
Monthly cost: $20 + small backup spend
Outcome: higher quality, near-zero interruption
Poradnik B: stos kodowania o zerowym koszcie
Combo: "free-forever"
1. gc/gemini-3-flash
2. if/kimi-k2-thinking
3. qw/qwen3-coder-plus
Monthly cost: $0
Outcome: stable free coding workflow
Poradnik C: łańcuch awaryjny działający 24 godziny na dobę, 7 dni w tygodniu
Combo: "always-on"
1. cc/claude-opus-4-6
2. cx/gpt-5.2-codex
3. glm/glm-4.7
4. minimax/MiniMax-M2.1
5. if/kimi-k2-thinking
Outcome: deep fallback depth for deadline-critical workloads
Poradnik D: Operacje agenta z MCP + A2A
1) Start MCP transport (`omniroute --mcp`) for tool-driven operations
2) Run A2A tasks via `message/send` and `message/stream`
3) Observe via /dashboard/endpoint (MCP and A2A tabs)
4) Toggle services via inline status controls
🆓 Zacznij bezpłatnie — zerowy koszt konfiguracji
Skonfiguruj kodowanie AI w ciągu kilku minut w cenie 0 USD/miesiąc. Połącz te bezpłatne konta i korzystaj z wbudowanej kombinacji Free Stack.
| Krok | Akcja | Dostawcy odblokowani |
|---|---|---|
| 1 | Połącz Kiro (identyfikator AWS Builder OAuth) | Claude Sonnet 4.5, Haiku 4.5 — bez ograniczeń |
| 2 | Połącz iFlow (Google OAuth) | myślenie kimi-k2, qwen3-coder-plus, deepseek-r1... — bez ograniczeń |
| 3 | Połącz Qwen (kod urządzenia) | qwen3-coder-plus, qwen3-coder-flash... — bez ograniczeń |
| 4 | Połącz Gemini CLI (Google OAuth) | gemini-3-flash, gemini-2.5-pro — 180 tys./mc za darmo |
| 5 | /dashboard/combos → Szablon darmowego stosu (0 USD) |
Automatycznie okrężnie wszystkich bezpłatnych dostawców |
Wskaż dowolne IDE/CLI na: http://localhost:20128/v1 · Klucz API: any-string · Gotowe.
Opcjonalna dodatkowa ochrona (również bezpłatna): Klucz API Groq (30 obr./min za darmo), NVIDIA NIM (40 obr./min za darmo, ponad 70 modeli), Cerebras (1 mln tok/dzień), Klucz API LongCat (50 mln tokenów dziennie!), Cloudflare Workers AI (10 tys. neuronów/dzień, ponad 50 modeli).
⚡ Szybki start
1) Zainstaluj i uruchom
npm install -g omniroute
omniroute
Użytkownicy pnpm: Uruchom
pnpm approve-builds -gpo instalacji, aby włączyć natywne skrypty kompilacji wymagane przezbetter-sqlite3i@swc/core:pnpm install -g omniroute pnpm approve-builds -g # Select all packages → approve omniroute
Panel otwiera się pod adresem http://localhost:20128, a podstawowy adres URL interfejsu API to http://localhost:20128/v1.
| Polecenie | Opis |
|---|---|
omniroute |
Uruchom serwer (PORT=20128, API i pulpit nawigacyjny na tym samym porcie) |
omniroute --port 3000 |
Ustaw port kanoniczny/API na 3000 |
omniroute --mcp |
Uruchom serwer MCP (transport stdio) |
omniroute --no-open |
Nie otwieraj automatycznie przeglądarki |
omniroute --help |
Pokaż pomoc |
Opcjonalny tryb podzielonego portu:
PORT=20128 DASHBOARD_PORT=20129 omniroute
# API: http://localhost:20128/v1
# Dashboard: http://localhost:20129
2) Połącz dostawców i utwórz swój klucz API
- Otwórz Panel →
Providersi podłącz co najmniej jednego dostawcę (klucz OAuth lub API). - Otwórz Panel →
Endpointsi utwórz klucz API. - (Opcjonalnie) Otwórz Panel →
Combosi ustaw łańcuch awaryjny.
3) Skieruj swoje narzędzie do kodowania na OmniRoute
Base URL: http://localhost:20128/v1
API Key: [copy from Endpoint page]
Model: if/kimi-k2-thinking (or any provider/model prefix)
Współpracuje z Claude Code, Codex CLI, Gemini CLI, Cursor, Cline, OpenClaw, OpenCode i pakietami SDK kompatybilnymi z OpenAI.
4) Włącz i sprawdź protokoły (v2.0)
MCP (dla operacji opartych na narzędziach):
omniroute --mcp
Następnie podłącz swojego klienta MCP przez stdio i przetestuj narzędzia takie jak:
omniroute_get_healthomniroute_list_combos
A2A (dla przepływów pracy między agentami):
curl http://localhost:20128/.well-known/agent.json
curl -X POST http://localhost:20128/a2a \
-H 'content-type: application/json' \
-d '{"jsonrpc":"2.0","id":"quickstart","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Give me a short quota summary."}]}}'
5) Sprawdź wszystko od początku do końca (zalecane)
npm run test:protocols:e2e
Ten pakiet sprawdza rzeczywiste przepływy klientów MCP i A2A w porównaniu z działającą aplikacją.
Alternatywa: uruchamianie ze źródła
cp .env.example .env
npm install
PORT=20128 DASHBOARD_PORT=20129 NEXT_PUBLIC_BASE_URL=http://localhost:20129 npm run dev
🐳 Doker
OmniRoute jest dostępny jako publiczny obraz Dockera na Docker Hub.
Szybki bieg:
docker run -d \
--name omniroute \
--restart unless-stopped \
-p 20128:20128 \
-v omniroute-data:/app/data \
diegosouzapw/omniroute:latest
Z plikiem środowiska:
# Copy and edit .env first
cp .env.example .env
docker run -d \
--name omniroute \
--restart unless-stopped \
--env-file .env \
-p 20128:20128 \
-v omniroute-data:/app/data \
diegosouzapw/omniroute:latest
Korzystanie z Docker Compose:
# Base profile (no CLI tools)
docker compose --profile base up -d
# CLI profile (Claude Code, Codex, OpenClaw built-in)
docker compose --profile cli up -d
| Obraz | Oznacz | Rozmiar | Opis |
|---|---|---|---|
diegosouzapw/omniroute |
latest |
~250 MB | Najnowsza stabilna wersja |
diegosouzapw/omniroute |
1.0.3 |
~250 MB | Aktualna wersja |
🖥️ Aplikacja komputerowa — offline i zawsze włączona
🆕 NOWOŚĆ! OmniRoute jest teraz dostępny jako natywna aplikacja komputerowa dla systemów Windows, macOS i Linux.
Uruchom OmniRoute jako samodzielną aplikację komputerową — bez terminala, bez przeglądarki i bez Internetu w przypadku modeli lokalnych. Aplikacja oparta na elektronach obejmuje:
- 🖥️ Okno natywne — dedykowane okno aplikacji z integracją z zasobnikiem systemowym
- 🔄 Auto-Start — Uruchom OmniRoute po zalogowaniu się do systemu
- 🔔 Powiadomienia natywne — otrzymuj powiadomienia o wyczerpaniu limitu lub problemach z dostawcami
- ⚡ Instalacja jednym kliknięciem — NSIS (Windows), DMG (macOS), AppImage (Linux)
- 🌐 Tryb offline — Działa całkowicie offline z dołączonym serwerem
Szybki start
# Development mode
npm run electron:dev
# Build for your platform
npm run electron:build # Current platform
npm run electron:build:win # Windows (.exe)
npm run electron:build:mac # macOS (.dmg) — x64 & arm64
npm run electron:build:linux # Linux (.AppImage)
Taca systemowa
Po zminimalizowaniu OmniRoute znajduje się w zasobniku systemowym i oferuje szybkie akcje:
- Otwórz pulpit nawigacyjny
- Zmień port serwera
- Zamknij aplikację
📖 Pełna dokumentacja: OMNI_TOKEN_153
💰 Ceny w skrócie
| Poziom | Dostawca | Koszt | Reset przydziału | Najlepsze dla |
|---|---|---|---|---|
| 💳 SUBSKRYPCJA | Claude Code (Pro) | 20 USD/mies. | 5h + tygodniowo | Już subskrybujesz |
| Kodeks (Plus/Pro) | 20-200 $/mies. | 5h + tygodniowo | Użytkownicy OpenAI | |
| Bliźnięta CLI | BEZPŁATNE | 180 tys./mies. + 1 tys./dzień | Wszyscy! | |
| Drugi pilot GitHuba | 10–19 USD/mies. | Miesięczne | Użytkownicy GitHuba | |
| 🔑 KLUCZ API | NVIDIA NIM | BEZPŁATNE (na zawsze) | ~40 obr/min | Ponad 70 otwartych modeli |
| Cerebra | BEZPŁATNE (1 mln tok/dzień) | 60 tys. TPM / 30 obr./min | Najszybszy na świecie | |
| Groq | BEZPŁATNE (30 obr./min) | 14,4 tys. RPD | Ultraszybka Lama/Gemma | |
| DeepSeek V3.2 | 0,27 USD/1,10 USD za 1 mln | Brak | Najlepsze uzasadnienie ceny/jakości | |
| xAI Grok-4 Szybki | 0,20 USD/0,50 USD za 1 milion 🆕 | Brak | Najszybsze + wywoływanie narzędzi, ultraniskie | |
| xAI Grok-4 (standard) | 0,20 USD/1,50 USD za 1 milion 🆕 | Brak | Rozsądny flagowiec od xAI | |
| Mistral | Bezpłatny okres próbny + płatny | Stawka ograniczona | Europejska sztuczna inteligencja | |
| OtwórzRouter | Płatność za użycie | Brak | Łącznie ponad 100 modeli | |
| 💰 TANIO | GLM-5 (przez Z.AI) 🆕 | 0,5 USD/1 mln | Codziennie 10:00 | Wyjście 128K, najnowszy flagowiec |
| GLM-4.7 | 0,6 USD/1 mln | Codziennie 10:00 | Kopia zapasowa budżetu | |
| MiniMax M2.5 🆕 | Wejście 0,3 USD/1 mln | 5-godzinne toczenie | Rozumowanie + zadania agentyczne | |
| MiniMax M2.1 | 0,2 USD/1 mln | 5-godzinne toczenie | Najtańsza opcja | |
| Kimi K2.5 (Moonshot API) 🆕 | Płatność za użycie | Brak | Bezpośredni dostęp do API Moonshot | |
| Kimi K2 | 9 USD miesięcznie | 10 mln tokenów/mies. | Przewidywalny koszt | |
| 🆓 DARMOWE | iFlow | $0 | Nieograniczony | 5 modeli bez ograniczeń |
| Qwen | $0 | Nieograniczony | 4 modele bez ograniczeń | |
| Kiro | $0 | Nieograniczony | Claude Sonnet/Haiku (konstruktor AWS) | |
| LongCat Flash-Lite 🆕 | 0 $ (50 mln tok/dzień 🔥) | 1 RPS | Największy darmowy limit na Ziemi | |
| Zapylanie AI 🆕 | $0 (nie jest potrzebny klucz) | 1 zapotrzebowanie/15 s | GPT-5, Claude, DeepSeek, Lama 4 | |
| AI pracowników Cloudflare 🆕 | 0 $ (10 tys. neuronów/dzień) | ~150 odp/dzień | Ponad 50 modeli, globalna przewaga | |
| Scaleway AI 🆕 | $0 (łącznie 1 milion tokenów) | Stawka ograniczona | UE/RODO, Qwen3 235B, Lama 70B |
🆕 Dodano nowe modele (marzec 2026 r.): Rodzina Grok-4 Fast w cenie 0,20 USD/0,50 USD/M (w porównaniu z czasem 1143 ms — 30% szybciej niż Gemini 2.5 Flash), GLM-5 przez Z.AI z mocą wyjściową 128 tys., rozumowanie MiniMax M2.5, zaktualizowana cena DeepSeek V3.2, Kimi K2.5 poprzez bezpośrednie API Moonshot.
💡 Stos kombinacji 0 $ — kompletna bezpłatna konfiguracja:
# 🆓 Ultimate Free Stack 2026 — 11 Providers, $0 Forever
Kiro (kr/) → Claude Sonnet/Haiku UNLIMITED
iFlow (if/) → kimi-k2-thinking, qwen3-coder-plus, deepseek-r1 UNLIMITED
LongCat Lite (lc/) → LongCat-Flash-Lite — 50M tokens/day 🔥
Pollinations (pol/) → GPT-5, Claude, DeepSeek, Llama 4 — no key needed
Qwen (qw/) → qwen3-coder-plus, qwen3-coder-flash, qwen3-coder-next UNLIMITED
Gemini (gemini/) → Gemini 2.5 Flash — 1,500 req/day free API key
Cloudflare AI (cf/) → Llama 70B, Gemma 3, Mistral — 10K Neurons/day
Scaleway (scw/) → Qwen3 235B, Llama 70B — 1M free tokens (EU)
Groq (groq/) → Llama/Gemma ultra-fast — 14.4K req/day
NVIDIA NIM (nvidia/) → 70+ open models — 40 RPM forever
Cerebras (cerebras/) → Llama/Qwen world-fastest — 1M tok/day
Zerowy koszt. Kodowanie nigdy się nie kończy. Skonfiguruj to jako jedną kombinację OmniRoute, a wszystkie zmiany awaryjne będą odbywać się automatycznie — bez konieczności ręcznego przełączania.
🆓 Darmowe modele — co tak naprawdę otrzymujesz
Wszystkie poniższe modele są 100% bezpłatne i nie wymagają żadnej karty kredytowej. OmniRoute automatycznie wyznacza trasy między nimi, gdy skończy się jeden limit — połącz je wszystkie, aby uzyskać niezniszczalną kombinację za 0 USD.
🔵 MODELE CLAUDE (przez Kiro — identyfikator AWS Builder)
| Modelka | Przedrostek | Limit | Limit stawki |
|---|---|---|---|
claude-sonnet-4.5 |
kr/ |
Nieograniczony | Brak raportu dziennego limitu |
claude-haiku-4.5 |
kr/ |
Nieograniczony | Brak raportu dziennego limitu |
claude-opus-4.6 |
kr/ |
Nieograniczony | Najnowsze Opus przez Kiro |
🟢 MODELE IFLOW (bezpłatny OAuth — bez karty kredytowej)
| Modelka | Przedrostek | Limit | Limit stawki |
|---|---|---|---|
kimi-k2-thinking |
if/ |
Nieograniczony | Brak zgłoszonego limitu |
qwen3-coder-plus |
if/ |
Nieograniczony | Brak zgłoszonego limitu |
deepseek-r1 |
if/ |
Nieograniczony | Brak zgłoszonego limitu |
minimax-m2.1 |
if/ |
Nieograniczony | Brak zgłoszonego limitu |
kimi-k2 |
if/ |
Nieograniczony | Brak zgłoszonego limitu |
🟡 MODELE QWEN (autoryzacja kodu urządzenia)
| Modelka | Przedrostek | Limit | Limit stawki |
|---|---|---|---|
qwen3-coder-plus |
qw/ |
Nieograniczony | Brak zgłoszonego limitu |
qwen3-coder-flash |
qw/ |
Nieograniczony | Brak zgłoszonego limitu |
qwen3-coder-next |
qw/ |
Nieograniczony | Brak zgłoszonego limitu |
vision-model |
qw/ |
Nieograniczony | Multimodalny (zdjęcia) |
🟣 GEMINI CLI (Google OAuth)
| Modelka | Przedrostek | Limit | Limit stawki |
|---|---|---|---|
gemini-3-flash-preview |
gc/ |
180 tys. tok/miesiąc + 1 tys./dzień | Reset miesięczny |
gemini-2.5-pro |
gc/ |
180 tys./miesiąc (wspólna pula) | Wysoka jakość |
⚫ NVIDIA NIM (bezpłatny klucz API — build.nvidia.com)
| Poziom | Limit dzienny | Limit stawki | Notatki |
|---|---|---|---|
| Bezpłatny (wersja deweloperska) | Brak limitu tokenów | ~40 obr/min | Ponad 70 modeli; przejście na czyste limity stawek w połowie 2025 r. |
Popularne darmowe modele: moonshotai/kimi-k2.5 (Kimi K2.5), z-ai/glm4.7 (GLM 4.7), deepseek-ai/deepseek-v3.2 (DeepSeek V3.2), nvidia/llama-3.3-70b-instruct, deepseek/deepseek-r1
⚪ CEREBRAS (bezpłatny klucz API — inference.cerebras.ai)
| Poziom | Limit dzienny | Limit stawki | Notatki |
|---|---|---|---|
| Bezpłatne | 1 mln tokenów dziennie | 60 tys. TPM / 30 obr./min | Najszybsze na świecie wnioskowanie LLM; resetuje się codziennie |
Dostępne bezpłatnie: llama-3.3-70b, llama-3.1-8b, deepseek-r1-distill-llama-70b
🔴 GROQ (bezpłatny klucz API — console.groq.com)
| Poziom | Limit dzienny | Limit stawki | Notatki |
|---|---|---|---|
| Bezpłatne | 14,4 tys. RPD | 30 obr./min na model | Brak karty kredytowej; 429 w limicie, bez opłat |
Dostępne bezpłatnie: llama-3.3-70b-versatile, gemma2-9b-it, mixtral-8x7b, whisper-large-v3
🔴 LONGCAT AI (bezpłatny klucz API — longcat.chat) 🆕
| Modelka | Przedrostek | Dzienny bezpłatny limit | Notatki |
|---|---|---|---|
LongCat-Flash-Lite |
lc/ |
50 milionów tokenów 💥 | Największy darmowy limit w historii |
LongCat-Flash-Chat |
lc/ |
500 tys. tokenów | Czat wieloobrotowy |
LongCat-Flash-Thinking |
lc/ |
500 tys. tokenów | Rozumowanie / CoT |
LongCat-Flash-Thinking-2601 |
lc/ |
500 tys. tokenów | Wersja ze stycznia 2026 r. |
LongCat-Flash-Omni-2603 |
lc/ |
500 tys. tokenów | Multimodalny |
100% za darmo w publicznej wersji beta. Zarejestruj się na longcat.chat za pomocą e-maila lub telefonu. Resetuje się codziennie o godzinie 00:00 UTC.
🟢Zapylanie AI (nie jest wymagany klucz API) 🆕
| Modelka | Przedrostek | Limit stawki | Dostawca za |
|---|---|---|---|
openai |
pol/ |
1 zapotrzebowanie/15 s | GPT-5 |
claude |
pol/ |
1 zapotrzebowanie/15 s | Antropiczny Claude |
gemini |
pol/ |
1 zapotrzebowanie/15 s | Google Bliźnięta |
deepseek |
pol/ |
1 zapotrzebowanie/15 s | DeepSeek V3 |
llama |
pol/ |
1 zapotrzebowanie/15 s | Meta Lama 4 Zwiadowca |
mistral |
pol/ |
1 zapotrzebowanie/15 s | AI Mistrala |
✨ Zero tarcia: Bez rejestracji, bez klucza API. Dodaj dostawcę Pollinations z pustym polem klucza i zacznie działać natychmiast.
🟠 CLOUDFLARE WORKERS AI (bezpłatny klucz API — cloudflare.com) 🆕
| Poziom | Codzienne neurony | Równoważne użycie | Notatki |
|---|---|---|---|
| Bezpłatne | 10 000 | ~150 LLM odpowiednio / 500 s audio / 15 000 osadzonych | Globalna przewaga, ponad 50 modeli |
Popularne bezpłatne modele: @cf/meta/llama-3.3-70b-instruct, @cf/google/gemma-3-12b-it, @cf/openai/whisper-large-v3-turbo (darmowy dźwięk!), @cf/qwen/qwen2.5-coder-15b-instruct
Wymaga tokenu API + identyfikatora konta od dash.cloudflare.com. Zapisz identyfikator konta w ustawieniach dostawcy.
🟣 SCALEWAY AI (1 milion darmowych tokenów — Scaleway.com) 🆕
| Poziom | Bezpłatny limit | Lokalizacja | Notatki |
|---|---|---|---|
| Bezpłatne | 1M tokenów | 🇫🇷 Paryż, UE | W ramach limitów nie jest wymagana karta kredytowa |
Dostępne bezpłatnie: qwen3-235b-a22b-instruct-2507 (Qwen3 235B!), llama-3.1-70b-instruct, mistral-small-3.2-24b-instruct-2506, deepseek-v3-0324
Zgodny z UE/RODO. Uzyskaj klucz API pod adresem console.scaleway.com.
💡 Najlepszy darmowy stos (11 dostawców, 0 $ na zawsze):
Kiro (kr/) → Claude Sonnet/Haiku UNLIMITED iFlow (if/) → kimi-k2-thinking, qwen3-coder-plus, deepseek-r1 UNLIMITED LongCat Lite (lc/) → LongCat-Flash-Lite — 50M tokens/day 🔥 Pollinations (pol/) → GPT-5, Claude, DeepSeek, Llama 4 — no key needed Qwen (qw/) → qwen3-coder models UNLIMITED Gemini (gemini/) → Gemini 2.5 Flash — 1,500 req/day free Cloudflare AI (cf/) → 50+ models — 10K Neurons/day Scaleway (scw/) → Qwen3 235B, Llama 70B — 1M free tokens (EU) Groq (groq/) → Llama/Gemma — 14.4K req/day ultra-fast NVIDIA NIM (nvidia/) → 70+ open models — 40 RPM forever Cerebras (cerebras/) → Llama/Qwen world-fastest — 1M tok/day
🎙️ Zestaw bezpłatnej transkrypcji
Transkrypcja dowolnego audio/wideo za 0 USD — Deepgram prowadzi z 200 USD za darmo, awaryjnie AssemblyAI 50 USD, Groq Whisper jako nieograniczona kopia zapasowa w sytuacjach awaryjnych.
| Dostawca | Darmowe kredyty | Najlepszy Model | Limit stawki |
|---|---|---|---|
| 🟢 Deepgram | 200 $ za darmo (rejestracja) | nova-3 — najwyższa dokładność, ponad 30 języków |
Brak limitu obrotów na darmowe kredyty |
| 🔵 AssemblyAI | 50 $ za darmo (rejestracja) | universal-3-pro — rozdziały, sentyment, PII |
Brak limitu obrotów na darmowe kredyty |
| 🔴 Grok | Za darmo na zawsze | whisper-large-v3 — Szept OpenAI |
30 obr./min (ograniczona prędkość) |
Sugerowana kombinacja w /dashboard/combos:
Name: free-transcription
Strategy: Priority
Nodes:
[1] deepgram/nova-3 → uses $200 free first
[2] assemblyai/universal-3-pro → fallback when Deepgram credits run out
[3] groq/whisper-large-v3 → free forever, emergency fallback
Następnie w /dashboard/media → zakładka Transkrypcja: prześlij dowolny plik audio lub wideo → wybierz punkt końcowy combo → uzyskaj transkrypcję w obsługiwanych formatach.
💡 Kluczowe funkcje
OmniRoute v2.0 został zbudowany jako platforma operacyjna, a nie tylko pośrednik przekazujący.
🆕 Nowość — ulepszenia inspirowane ClawRouterem (marzec 2026)
| Funkcja | Co to robi |
|---|---|
| ⚡ Grok-4 Szybka Rodzina | Modele xAI w cenie 0,20 USD/0,50 USD/M — w teście porównawczym 1143 ms (30% szybsze niż Gemini 2.5 Flash) |
| 🧠 GLM-5 przez Z.AI | Kontekst wyjściowy 128 tys., 0,5/1 mln USD — najnowszy flagowiec z rodziny GLM |
| 🔮 MiniMax M2.5 | Rozumowanie + zadania agenta za 0,30 USD/1 milion — znacząca aktualizacja z M2.1 |
| 🎯 ToolCalling Flag na model | Dla każdego modelu toolCalling: true/false w rejestrze — AutoCombo pomija modele, które nie obsługują narzędzia |
| 🌍 Wielojęzyczne wykrywanie intencji | Słowa kluczowe PT/ZH/ES/AR w punktacji AutoCombo — lepszy wybór modelu dla treści innych niż angielski |
| 📊 Rezerwacje oparte na testach | Rzeczywiste opóźnienie p95 na podstawie punktacji kombinacji kanałów żądań na żywo — AutoCombo uczy się na podstawie rzeczywistych danych |
| 🔁 Poproś o deduplikację | Okno deduplikacji oparte na skrótach treści — bezpieczne dla wielu agentów, zapobiega duplikacjom opłat |
| 🔌 Strategia routera z wtyczką | Rozszerzalny interfejs RouterStrategy — dodaj niestandardową logikę routingu jako wtyczki |
🚀 Poprzednia wersja 2.0.9+ — Plac zabaw, odciski palców CLI i ACP
| Funkcja | Co to robi |
|---|---|
| 🎮 Modelowy plac zabaw | Strona panelu kontrolnego do bezpośredniego testowania dowolnego modelu — selektory dostawcy/modelu/punktu końcowego, edytor Monako, przesyłanie strumieniowe, przerywanie, synchronizacja |
| 🔏 Dopasowanie odcisków palców CLI | Kolejność nagłówków/treści poszczególnych dostawców zgodna z natywnymi podpisami CLI — przełącz dla każdego dostawcy w Ustawieniach > Zabezpieczenia. Twój adres IP proxy zostanie zachowany |
| 🤝 Wsparcie ACP (protokół klienta agenta) | Wykrywanie agenta CLI (Codex, Claude, Goose, Gemini CLI, OpenClaw + 9 innych), generator procesów, punkt końcowy /api/acp/agents |
| 🤖 Panel agentów AKP | Debugowanie › Strona Agenty — siatka 14 agentów ze statusem instalacji, wersją i niestandardowym formularzem agenta dla dowolnego narzędzia CLI. Użytkownicy OpenCode otrzymują przycisk „Pobierz opencode.json”, który automatycznie generuje gotową do użycia konfigurację ze wszystkimi dostępnymi modelami. |
🔧 Model niestandardowy apiFormat Trasowanie |
Modele niestandardowe z apiFormat: "responses" teraz prawidłowo kierują do tłumacza interfejsu API odpowiedzi |
| 🏢 Izolacja przestrzeni roboczej w Kodeksie | Wiele obszarów roboczych Codex na e-mail — OAuth poprawnie rozdziela połączenia według identyfikatora obszaru roboczego |
| 🔄 Automatyczna aktualizacja elektronów | Aplikacja komputerowa sprawdza dostępność aktualizacji + automatyczna instalacja przy ponownym uruchomieniu |
🤖 Operacje agentowe i protokołowe (wersja 2.0)
| Funkcja | Co to robi |
|---|---|
| 🔧 Serwer MCP (16 narzędzi) | Narzędzia IDE/agent za pośrednictwem 3 transportów: stdio, SSE (/api/mcp/sse), strumieniowy HTTP (/api/mcp/stream) |
| 🤝 Serwer A2A (JSON-RPC + SSE) | Wykonywanie zadań między agentami z przepływami synchronizacji i przesyłania strumieniowego |
| 🧭 Strona skonsolidowanych punktów końcowych | Strona zarządzania z zakładkami z zakładkami Endpoint Proxy, MCP, A2A i API Endpoints |
| 🎚️ Przełącza włączanie/wyłączanie usługi | Przełączniki ON/OFF dla MCP i A2A z trwałością ustawień (domyślnie: OFF) |
| 🛰️ Bicie serca środowiska wykonawczego MCP | Rzeczywisty status procesu (pid, czas pracy, wiek pulsu, transport, tryb zakresu) |
| 📋 Ścieżka audytu MCP | Filtrowane dzienniki audytu z informacją o powodzeniu/porażce i przypisaniu klucza |
| 🔐 Egzekwowanie zakresu MCP | 9 szczegółowych uprawnień zakresu dla kontrolowanego dostępu do narzędzi |
| 📡 Zarządzanie cyklem życia zadań A2A | Wyświetlaj/filtruj zadania, sprawdzaj zdarzenia/artefakty, anuluj uruchomione zadania |
| 📋 Odkrycie karty agenta | /.well-known/agent.json do automatycznego wykrywania klienta |
| 🧪 Uprząż testowa protokołu E2E | Prawdziwy klient MCP SDK + A2A przepływa w test:protocols:e2e |
| ⚙️ Kontrola operacyjna | Kombinacja przełączników, zastosuj profile odporności, zresetuj wyłączniki z jednej powierzchni sterującej |
🧠 Trasowanie i inteligencja
| Funkcja | Co to robi |
|---|---|
| 🎯 Inteligentny 4-poziomowy powrót | Auto-trasa: Subskrypcja → Klucz API → Tanie → Bezpłatne |
| 📊 Śledzenie limitów w czasie rzeczywistym | Liczba tokenów na żywo + odliczanie resetowania dla każdego dostawcy |
| 🔄 Tłumaczenie formatu | OpenAI ↔ Claude ↔ Gemini ↔ Odpowiedzi z konwersjami bezpiecznymi dla schematu |
| 👥 Obsługa wielu kont | Wiele kont na dostawcę z inteligentnym wyborem |
| 🔄 Automatyczne odświeżanie tokena | Tokeny OAuth odświeżają się automatycznie przy ponownej próbie |
| 🎨 Niestandardowe kombinacje | 6 strategii równoważenia + kontrola łańcucha awaryjnego |
| 🌐 Router z dziką kartą | provider/* routing dynamiczny |
| 🧠 Myślenie o kontroli budżetu | Limity rozumowania passthrough, automatycznego, niestandardowego i adaptacyjnego |
| 🔀 Aliasy modeli | Wbudowane + niestandardowe aliasing modelu i bezpieczeństwo migracji |
| ⚡ Degradacja tła | Kieruj zadania w tle o niskim priorytecie do tańszych modeli |
| 🧪 Inteligentny routing uwzględniający zadania | Automatyczny wybór modelu według rodzaju treści (kodowanie/wizja/analiza/podsumowanie) |
| 💬 Wstrzyknięcie monitu systemowego | Globalna kontrola zachowania stosowana konsekwentnie |
| 📄 Zgodność API odpowiedzi | Pełna obsługa /v1/responses Codexu i zaawansowanych przepływów pracy agentów |
🎵 Wielomodalne interfejsy API
| Funkcja | Co to robi |
|---|---|
| 🖼️ Generowanie obrazu | /v1/images/generations z backendem w chmurze i lokalnym |
| 📐 Osadzenia | /v1/embeddings dla rurociągów wyszukiwania i RAG |
| 🎤 Transkrypcja audio | /v1/audio/transcriptions — 7 dostawców (Deepgram Nova 3, AssemblyAI, Groq Whisper, HuggingFace, ElevenLabs, OpenAI, Azure), automatyczne wykrywanie języka, obsługa MP4/MP3/WAV |
| 🔊 Zamiana tekstu na mowę | /v1/audio/speech — 10 dostawców (ElevenLabs, OpenAI, Deepgram, Cartesia, PlayHT, HuggingFace, Nvidia NIM, Inworld, Coqui, Tortoise) z poprawnymi komunikatami o błędach |
| 🎬 Generowanie wideo | /v1/videos/generations (przepływy pracy ComfyUI + SD WebUI) |
| 🎵 Pokolenie muzyki | /v1/music/generations (Przepływy pracy w ComfyUI) |
| 🛡️ Moderacje | /v1/moderations kontrole bezpieczeństwa |
| 🔀 Ponowna pozycja | /v1/rerank dla punktacji trafności |
| 🔍 Wyszukiwarka internetowa 🆕 | /v1/search — 5 dostawców (Serper, Brave, Perplexity, Exa, Tavily), ponad 6500 bezpłatnych miesięcznie, automatyczne przełączanie awaryjne, pamięć podręczna |
🛡️ Odporność, bezpieczeństwo i zarządzanie
| Funkcja | Co to robi |
|---|---|
| 🔌 Wyłączniki | Wyłączenie/odzyskiwanie dla każdego modelu z kontrolą progów |
| 🎯 Modele obsługujące punkt końcowy | Modele niestandardowe deklarują obsługiwane punkty końcowe + format API |
| 🛡️ Stado Przeciw Gromom | Mutex + zabezpieczenia semaforów przy zdarzeniach ponawiania/oceniania |
| 🧠 Semantyczna + pamięć podręczna podpisów | Redukcja kosztów/opóźnień dzięki dwóm warstwom pamięci podręcznej |
| ⚡ Poproś o idempotencję | Zduplikowane okno ochrony |
| 🔒 Podrabianie odcisków palców TLS | Odcisk palca TLS podobny do przeglądarki — ogranicza wykrywanie botów i oznaczanie kont |
| 🔏 Dopasowanie odcisków palców CLI | Pasuje do natywnych sygnatur żądań CLI — zmniejsza ryzyko bana, zachowując jednocześnie adres IP proxy |
| 🌐 Filtrowanie IP | Kontrola listy dozwolonych/blokowanych w przypadku ujawnionych wdrożeń |
| 📊 Edytowalne limity stawek | Konfigurowalne limity na poziomie globalnym/dostawcy z trwałością |
| 🔑 Zarządzanie kluczami API + zakres | Bezpieczne wydawanie/rotacja kluczy oraz kontrola modelu/dostawcy |
🛡️ Chronione /models |
Opcjonalne bramkowanie uwierzytelniania i ukrywanie dostawcy dla katalogu modeli |
📊 Obserwacja i analityka
| Funkcja | Co to robi |
|---|---|
| 📝 Żądanie + rejestrowanie proxy | Pełne rejestrowanie żądań/odpowiedzi i proxy |
| 📋 Ujednolicony panel dzienników | Widoki żądań, proxy, audytu i konsoli na jednej stronie |
| 🔍 Poproś o telemetrię | Opóźnienie p50/p95/p99 i śledzenie żądań |
| 🏥 Panel zdrowia | Czas pracy, stany wyłączników, blokady, statystyki pamięci podręcznej |
| 💰 Śledzenie kosztów | Kontrola budżetu i widoczność cen dla poszczególnych modeli |
| 📈 Wizualizacje analityczne | Informacje o użyciu modelu/dostawcy i widoki trendów |
| 🧪 Ramy oceny | Testowanie złotego zestawu z konfigurowalnymi strategiami dopasowania |
☁️ Wdrożenie i platforma
| Funkcja | Co to robi |
|---|---|
| 🌐 Wdrażaj gdziekolwiek | Localhost, VPS, Docker, środowiska chmurowe |
| 💾 Synchronizacja z chmurą | Synchronizacja konfiguracji za pośrednictwem pracownika w chmurze |
| 🔄 Kopia zapasowa/Przywracanie | Przepływy eksportu/importu i odzyskiwania po awarii |
| 🧙 Kreator wdrażania | Konfiguracja z przewodnikiem po pierwszym uruchomieniu |
| 🔧 Panel narzędzi CLI | Konfiguracja popularnych narzędzi do kodowania jednym kliknięciem |
| 🎮 Modelowy plac zabaw | Przetestuj dowolnego dostawcę/model/punkt końcowy z poziomu pulpitu nawigacyjnego |
| 🔏 Przełączanie linii papilarnych CLI | Dopasowywanie odcisków palców poszczególnych dostawców w Ustawieniach > Bezpieczeństwo |
| 🌐 i18n (30 języków) | Pełny pulpit nawigacyjny + obsługa języków dokumentów z pokryciem RTL |
| 🧹 Wyczyść wszystkie modele | Czyszczenie listy modeli jednym kliknięciem w szczegółach dostawcy |
| 📋 Szablony wydania | Standaryzowane szablony GitHub dla błędów i funkcji |
| 📂 Niestandardowy katalog danych | DATA_DIR zastąpienie lokalizacji przechowywania |
Funkcja Głębokie nurkowanie
Inteligentne rozwiązanie awaryjne z praktyczną kontrolą kosztów
Combo: "my-coding-stack"
1. cc/claude-opus-4-6
2. nvidia/llama-3.3-70b
3. glm/glm-4.7
4. if/kimi-k2-thinking
W przypadku spadku limitu, szybkości lub kondycji OmniRoute automatycznie przechodzi do następnego kandydata bez konieczności ręcznego przełączania.
Zarządzanie protokołami, które jest widoczne i obsługiwane
- MCP + A2A można znaleźć w interfejsie użytkownika i dokumentach (nie są ukryte)
- Interfejsy API stanu protokołu udostępniają aktualne dane operacyjne (
/api/mcp/*,/api/a2a/*) - Pulpity nawigacyjne zawierają działania dla operacji dnia 2 (przełączniki kombinacji, resetowanie wyłączników, anulowanie zadań)
Tłumacz + przepływ pracy z walidacją
Obszar Tłumacza obejmuje:
- Plac zabaw: poproś o sprawdzenie transformacji
- Tester czatu: pełne żądanie/odpowiedź w obie strony
- Stanowisko testowe: wiele przypadków w jednym przebiegu
- Monitor na żywo: podgląd ruchu drogowego w czasie rzeczywistym
Plus weryfikacja protokołu z prawdziwymi klientami za pośrednictwem npm run test:protocols:e2e.
📖 MCP Server README — Informacje o narzędziach, konfiguracje IDE i przykłady klientów
📖 A2A Server README — Umiejętności, metody JSON-RPC, przesyłanie strumieniowe i cykl życia zadań
🧪 Oceny (Ewaluacje)
OmniRoute zawiera wbudowaną platformę ewaluacyjną do testowania jakości odpowiedzi LLM na podstawie złotego zestawu. Uzyskaj do niego dostęp poprzez Analytics → Evals na pulpicie nawigacyjnym.
Wbudowany złoty zestaw
Fabrycznie załadowany „Złoty zestaw OmniRoute” zawiera przypadki testowe dla:
- Pozdrowienia, matematyka, geografia, generowanie kodu
- Zgodność z formatem JSON, tłumaczenie, generowanie przecen
- Odmowa bezpieczeństwa (szkodliwa treść), liczenie, logika boolowska
Strategie oceny
| Strategia | Opis | Przykład |
|---|---|---|
exact |
Dane wyjściowe muszą dokładnie odpowiadać | "4" |
contains |
Dane wyjściowe muszą zawierać podciąg (wielkość liter nie ma znaczenia) | "Paris" |
regex |
Dane wyjściowe muszą pasować do wzorca wyrażenia regularnego | "1.*2.*3" |
custom |
Niestandardowa funkcja JS zwraca wartość prawda/fałsz | (output) => output.length > 10 |
📖 Przewodnik konfiguracji
Konfiguracja protokołu (MCP + A2A)
🧩 Konfiguracja MCP (protokół kontekstu modelu)
Uruchom transport MCP w trybie stdio:
omniroute --mcp
Zalecany przebieg walidacji:
- Podłącz klienta MCP przez stdio.
- Uruchom
omniroute_get_health. - Uruchom
omniroute_list_combos. - Otwórz
/dashboard/mcp, aby potwierdzić puls, aktywność i audyt.
Przydatne API do automatyzacji:
GET /api/mcp/statusGET /api/mcp/toolsGET /api/mcp/auditGET /api/mcp/audit/stats
🤝 Konfiguracja A2A (Agent2Agent)
Odkryj agenta:
curl http://localhost:20128/.well-known/agent.json
Wyślij zadanie:
curl -X POST http://localhost:20128/a2a \
-H 'content-type: application/json' \
-d '{"jsonrpc":"2.0","id":"setup-a2a","method":"message/send","params":{"skill":"quota-management","messages":[{"role":"user","content":"Summarize quota status."}]}}'
Zarządzaj cyklem życia:
GET /api/a2a/statusGET /api/a2a/tasksGET /api/a2a/tasks/:idPOST /api/a2a/tasks/:id/cancel
Interfejs operacyjny:
/dashboard/a2adla obserwowalności zadania/stanu/strumienia i działań dymnych
🧪 Kompleksowa walidacja protokołu
Sprawdź oba protokoły u prawdziwych klientów:
npm run test:protocols:e2e
To weryfikuje:
- Klient MCP SDK łączy/listuje/wywołuje
- Wykrywanie/wysyłanie/przesyłanie strumieniowe/pobieranie/anulowanie A2A
- Sprawdzaj dane w interfejsach API audytu MCP i zarządzania zadaniami A2A
💳 Dostawcy subskrypcji
Kod Claude’a (Pro/Max)
Dashboard → Providers → Connect Claude Code
→ OAuth login → Auto token refresh
→ 5-hour + weekly quota tracking
Models:
cc/claude-opus-4-6
cc/claude-sonnet-4-5-20250929
cc/claude-haiku-4-5-20251001
Wskazówka dla profesjonalistów: używaj Opus do skomplikowanych zadań, a Sonnet do szybkości. OmniRoute śledzi limit na model!
Kodeks OpenAI (Plus/Pro)
Dashboard → Providers → Connect Codex
→ OAuth login (port 1455)
→ 5-hour + weekly reset
Models:
cx/gpt-5.2-codex
cx/gpt-5.1-codex-max
Zarządzanie limitami konta Codex (5h + tygodniowo)
Każde konto Codexu ma teraz przełączniki zasad w Dashboard -> Providers:
5h(ON/OFF): wymusza politykę 5-godzinnego progu okna.Weekly(WŁ./WYŁ.): wymuszanie polityki cotygodniowego progu okna.- Zachowanie progowe: gdy włączone okno osiągnie >=90% wykorzystania, to konto zostanie pominięte.
- Zachowanie rotacyjne: OmniRoute automatycznie kieruje do następnego kwalifikującego się konta Codex.
- Resetowanie zachowania: kiedy dostawca
resetAtupłynie czas, konto automatycznie stanie się ponownie kwalifikowalne.
Scenariusze:
5h ON+Weekly ON: konto jest pomijane, gdy którekolwiek okno osiągnie próg.5h OFF+Weekly ON: tylko użycie tygodniowe może zablokować konto.5h ON+Weekly OFF: tylko 5-godzinne użytkowanie może zablokować konto.resetAtzaliczony: konto automatycznie ponownie wchodzi do rotacji (nie można go ponownie włączyć ręcznie).
Gemini CLI (DARMOWE 180 tys./miesiąc!)
Dashboard → Providers → Connect Gemini CLI
→ Google OAuth
→ 180K completions/month + 1K/day
Models:
gc/gemini-3-flash-preview
gc/gemini-2.5-pro
Najlepsza wartość: Ogromny darmowy poziom! Użyj tego przed płatnymi poziomami.
Drugi pilot GitHuba
Dashboard → Providers → Connect GitHub
→ OAuth via GitHub
→ Monthly reset (1st of month)
Models:
gh/gpt-5
gh/claude-4.5-sonnet
gh/gemini-3-pro
🔑 Dostawcy kluczy API
NVIDIA NIM (DARMOWY dostęp dla programistów — ponad 70 modeli)
- Zarejestruj się: build.nvidia.com
- Uzyskaj bezpłatny klucz API (w cenie 1000 kredytów)
- Panel kontrolny → Dodaj dostawcę → NVIDIA NIM:
- Klucz API:
nvapi-your-key
- Klucz API:
Modele: nvidia/llama-3.3-70b-instruct, nvidia/mistral-7b-instruct i ponad 50 innych
Wskazówka dla profesjonalistów: API zgodne z OpenAI — działa bezproblemowo z tłumaczeniem formatu OmniRoute!
DeepSeek
- Zarejestruj się: platform.deepseek.com
- Zdobądź klucz API
- Panel kontrolny → Dodaj dostawcę → DeepSeek
Modele: deepseek/deepseek-chat, deepseek/deepseek-coder
Groq (dostępny bezpłatny poziom!)
- Zarejestruj się: console.groq.com
- Uzyskaj klucz API (w cenie bezpłatna warstwa)
- Panel kontrolny → Dodaj dostawcę → Groq
Modele: groq/llama-3.3-70b, groq/mixtral-8x7b
Wskazówka dla profesjonalistów: Ultraszybkie wnioskowanie — najlepsze do kodowania w czasie rzeczywistym!
OpenRouter (ponad 100 modeli)
- Zarejestruj się: openrouter.ai
- Zdobądź klucz API
- Panel kontrolny → Dodaj dostawcę → OpenRouter
Modele: Uzyskaj dostęp do ponad 100 modeli wszystkich głównych dostawców za pomocą jednego klucza API.
💰 Tani dostawcy (kopia zapasowa)
GLM-4.7 (reset dzienny, 0,6 USD/1 mln)
- Zarejestruj się: Zhipu AI
- Uzyskaj klucz API z planu kodowania
- Panel → Dodaj klucz API:
- Dostawca:
glm - Klucz API:
your-key
- Dostawca:
Użyj: glm/glm-4.7
Wskazówka dla profesjonalistów: Plan kodowania oferuje 3× limit przy cenie 1/7! Resetuj codziennie o 10:00.
MiniMax M2.1 (reset 5 godz., 0,20 USD/1 mln)
- Zarejestruj się: MiniMax
- Zdobądź klucz API
- Panel → Dodaj klucz API
Użyj: minimax/MiniMax-M2.1
Wskazówka dla profesjonalistów: Najtańsza opcja dla długiego kontekstu (1 milion tokenów)!
Kimi K2 (9 USD miesięcznie)
- Subskrybuj: Moonshot AI
- Zdobądź klucz API
- Panel → Dodaj klucz API
Użyj: kimi/kimi-latest
Wskazówka dla profesjonalistów: Naprawiono 9 USD miesięcznie za 10 mln tokenów = efektywny koszt 0,90 USD/1 mln!
🆓 BEZPŁATNI dostawcy (awaryjna kopia zapasowa)
iFlow (5 DARMOWYCH modeli przez OAuth)
Dashboard → Connect iFlow
→ iFlow OAuth login
→ Unlimited usage
Models:
if/kimi-k2-thinking
if/qwen3-coder-plus
if/glm-4.7
if/minimax-m2
if/deepseek-r1
Qwen (4 DARMOWE modele poprzez kod urządzenia)
Dashboard → Connect Qwen
→ Device code authorization
→ Unlimited usage
Models:
qw/qwen3-coder-plus
qw/qwen3-coder-flash
Kiro (Claude ZA DARMO)
Dashboard → Connect Kiro
→ AWS Builder ID or Google/GitHub
→ Unlimited usage
Models:
kr/claude-sonnet-4.5
kr/claude-haiku-4.5
🎨 Twórz kombinacje
Przykład 1: Maksymalizuj subskrypcję → Tania kopia zapasowa
Dashboard → Combos → Create New
Name: premium-coding
Models:
1. cc/claude-opus-4-6 (Subscription primary)
2. glm/glm-4.7 (Cheap backup, $0.6/1M)
3. minimax/MiniMax-M2.1 (Cheapest fallback, $0.20/1M)
Use in CLI: premium-coding
Przykład 2: Tylko bezpłatny (zero kosztów)
Name: free-combo
Models:
1. gc/gemini-3-flash-preview (180K free/month)
2. if/kimi-k2-thinking (unlimited)
3. qw/qwen3-coder-plus (unlimited)
Cost: $0 forever!
🔧 Integracja z CLI
IDE kursora
Settings → Models → Advanced:
OpenAI API Base URL: http://localhost:20128/v1
OpenAI API Key: [from OmniRoute dashboard]
Model: cc/claude-opus-4-6
Kod Claude’a
Użyj strony Narzędzia CLI w panelu kontrolnym, aby dokonać konfiguracji jednym kliknięciem, lub edytuj ręcznie ~/.claude/settings.json.
Interfejs wiersza polecenia Kodeksu
export OPENAI_BASE_URL="http://localhost:20128"
export OPENAI_API_KEY="your-omniroute-api-key"
codex "your prompt"
OpenClaw
Opcja 1 — Panel kontrolny (zalecany):
Dashboard → CLI Tools → OpenClaw → Select Model → Apply
Opcja 2 — Ręcznie: Edytuj ~/.openclaw/openclaw.json:
{
"models": {
"providers": {
"omniroute": {
"baseUrl": "http://127.0.0.1:20128/v1",
"apiKey": "sk_omniroute",
"api": "openai-completions"
}
}
}
}
Uwaga: OpenClaw działa tylko z lokalnym OmniRoute. Użyj
127.0.0.1zamiastlocalhost, aby uniknąć problemów z rozdzielczością IPv6.
Kliknij / Kontynuuj / RooCode
Settings → API Configuration:
Provider: OpenAI Compatible
Base URL: http://localhost:20128/v1
API Key: [from OmniRoute dashboard]
Model: if/kimi-k2-thinking
Otwarty kod
Krok 1: Dodaj OmniRoute jako niestandardowego dostawcę:
opencode
/connect
# Select "Other" → Enter ID: "omniroute" → Enter your OmniRoute API key
Krok 2: Utwórz/edytuj opencode.json w katalogu głównym projektu:
{
"$schema": "https://opencode.ai/config.json",
"provider": {
"omniroute": {
"npm": "@ai-sdk/openai-compatible",
"name": "OmniRoute",
"options": {
"baseURL": "http://localhost:20128/v1"
},
"models": {
"cc/claude-sonnet-4-20250514": { "name": "Claude Sonnet 4" },
"gg/gemini-2.5-pro": { "name": "Gemini 2.5 Pro" },
"if/kimi-k2-thinking": { "name": "Kimi K2 (Free)" }
}
}
}
}
Krok 3: Wybierz model w OpenCode:
/models
# Select any OmniRoute model from the list
Wskazówka: dodaj dowolny model dostępny w punkcie końcowym OmniRoute
/v1/modelsdo sekcjimodels. Użyj formatuprovider/model-idw panelu kontrolnym OmniRoute.
🐛 Rozwiązywanie problemów
Kliknij, aby rozwinąć przewodnik rozwiązywania problemów
„Model językowy nie dostarczał komunikatów”
- Wyczerpany limit dostawcy → Sprawdź moduł śledzenia limitów na pulpicie nawigacyjnym
- Rozwiązanie: użyj kombinacji zastępczej lub przejdź na tańszy poziom
Ograniczenie szybkości
- Limit subskrypcji wyczerpany → Powrót do GLM/MiniMax
- Dodaj kombinację:
cc/claude-opus-4-6 → glm/glm-4.7 → if/kimi-k2-thinking
Token OAuth wygasł
- Automatyczne odświeżanie przez OmniRoute
- Jeśli problemy nadal występują: Panel kontrolny → Dostawca → Połącz ponownie
Wysokie koszty
- Sprawdź statystyki użytkowania w Panelu → Koszty
- Zmień model podstawowy na GLM/MiniMax
- Korzystaj z bezpłatnej warstwy (Gemini CLI, iFlow) do zadań niekrytycznych
Porty pulpitu nawigacyjnego/API są nieprawidłowe
PORTto kanoniczny port bazowy (i domyślnie port API)API_PORTzastępuje tylko odbiornik API zgodny z OpenAIDASHBOARD_PORTzastępuje tylko pulpit nawigacyjny/nasłuchiwanie Next.js- Ustaw
NEXT_PUBLIC_BASE_URLna swój pulpit nawigacyjny/publiczny adres URL (w przypadku wywołań zwrotnych OAuth)
Błędy synchronizacji z chmurą
- Sprawdź, czy
BASE_URLwskazuje na działającą instancję - Sprawdź, czy
CLOUD_URLwskazuje na oczekiwany punkt końcowy w chmurze - Zachowaj wyrównanie wartości
NEXT_PUBLIC_*z wartościami po stronie serwera
Pierwsze logowanie nie działa
- Sprawdź
INITIAL_PASSWORDw.env - Jeśli nieustawione, hasło zastępcze to
123456
Brak dzienników żądań
- Ustaw
ENABLE_REQUEST_LOGS=truew.env
Test połączenia pokazuje „Nieprawidłowy” dla dostawców kompatybilnych z OpenAI
- Wielu dostawców nie udostępnia punktu końcowego
/models - OmniRoute v1.0.6+ zawiera weryfikację awaryjną poprzez uzupełnianie czatu
- Upewnij się, że podstawowy adres URL zawiera przyrostek
/v1
🔐 OAuth na zdalnym serwerze
⚠️ Ważne dla użytkowników korzystających z OmniRoute na VPS, Dockerze lub dowolnym serwerze zdalnym
Dlaczego Antigravity / Gemini CLI OAuth nie działa na zdalnych serwerach?
Dostawcy Antigravity i Gemini CLI korzystają z Google OAuth 2.0. Google wymaga, aby wartość redirect_uri w przepływie OAuth dokładnie odpowiadała jednemu z wcześniej zarejestrowanych identyfikatorów URI w Google Cloud Console aplikacji.
Poświadczenia OAuth zawarte w OmniRoute są zarejestrowane tylko dla localhost. Gdy uzyskujesz dostęp do OmniRoute na zdalnym serwerze (np. https://omniroute.myserver.com), Google odrzuca uwierzytelnienie za pomocą:
Error 400: redirect_uri_mismatch
Rozwiązanie: skonfiguruj własne dane uwierzytelniające OAuth
Musisz utworzyć Identyfikator klienta OAuth 2.0 w Google Cloud Console przy użyciu identyfikatora URI swojego serwera.
Krok po kroku
1. Otwórz konsolę Google Cloud
Przejdź do: https://console.cloud.google.com/apis/credentials
2. Utwórz nowy identyfikator klienta OAuth 2.0
- Kliknij "+ Utwórz dane uwierzytelniające" → "Identyfikator klienta OAuth"
- Typ aplikacji: "Aplikacja internetowa"
- Imię: dowolne (np.
OmniRoute Remote)
3. Dodaj autoryzowane identyfikatory URI przekierowań
W polu „Autoryzowane identyfikatory URI przekierowań” dodaj:
https://your-server.com/callback
Zamień
your-server.comna domenę lub adres IP swojego serwera (w razie potrzeby podaj port, np.http://45.33.32.156:20128/callback).
4. Zapisz i skopiuj dane uwierzytelniające
Po utworzeniu Google wyświetli Identyfikator klienta i Tajemnica klienta.
5. Ustaw zmienne środowiskowe
W .env (lub zmiennych środowiskowych Dockera):
# For Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=your-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-your-secret
# For Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=your-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-your-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-your-secret
6. Uruchom ponownie OmniRoute
# npm:
npm run dev
# Docker:
docker restart omniroute
7. Spróbuj połączyć się ponownie
Panel kontrolny → Dostawcy → Antygrawitacja (lub Gemini CLI) → OAuth
Google będzie teraz poprawnie przekierowywać do https://your-server.com/callback.
Tymczasowe obejście (bez niestandardowych poświadczeń)
Jeśli nie chcesz teraz konfigurować własnych danych uwierzytelniających, nadal możesz skorzystać z ręcznego przepływu adresów URL:
- OmniRoute otwiera adres URL autoryzacji Google
- Po autoryzacji Google próbuje przekierować do
localhost(co kończy się niepowodzeniem na serwerze zdalnym) - Skopiuj pełny adres URL z paska adresu przeglądarki (nawet jeśli strona się nie ładuje)
- Wklej ten adres URL w polu pokazanym w trybie połączenia OmniRoute
- Kliknij „Połącz”
Działa to, ponieważ kod autoryzacyjny w adresie URL jest ważny niezależnie od tego, czy załadowana została strona przekierowująca.
🇧🇷 Wersja w języku portugalskim
Por que o OAuth do Antigravity / Gemini CLI falha na zdalnych serwerach?
Sprawdzone Antigravity i Gemini CLI używane Google OAuth 2.0 dla autentyczności. O Google, możesz to zrobić redirect_uri bez zmiany OAuth seja exatamente uma das URI pre-cadastradas no Google Cloud Console do aplikacji.
Jako uwierzytelnienie OAuth zostało wydane przez OmniRoute w cadastradas apenas dla localhost. Możesz uzyskać dostęp do OmniRoute na serwerze zdalnym (np.: https://omniroute.meuservidor.com), lub Google rejeita a autenticação com:
Error 400: redirect_uri_mismatch
Rozwiązanie: Skonfiguruj suas próprias credenciais OAuth
Precyzyjne żądanie Identyfikator klienta OAuth 2.0 nie Google Cloud Console poprzez URI do tego serwera.
Passo za passo
1. Dostęp do konsoli Google Cloud
Abra: https://console.cloud.google.com/apis/credentials
2. Wezwij nowy identyfikator klienta OAuth 2.0
- Kliknij "+ Utwórz dane uwierzytelniające" → "Identyfikator klienta OAuth"
- Typ aplikacji: "Aplikacja internetowa"
- Nazwa: escolha qualquer nom (np.:
OmniRoute Remote)
3. Adicione jako autoryzowane identyfikatory URI przekierowań
Bez komentarza „Autoryzowane identyfikatory URI przekierowań”, rada:
https://seu-servidor.com/callback
Substitua
seu-servidor.compelo domínio lub IP do seu servidor (w tym porta se necessário, np.:http://45.33.32.156:20128/callback).
4. Zapisz i skopiuj jako poświadczenie
Após criar, o Google mostrará o Identyfikator klienta i o Tajemnica klienta.
5. Skonfiguruj jako variáveis de ambiente
Nie seu .env (lub nas variáveis de ambiente do Docker):
# Para Antigravity:
ANTIGRAVITY_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
ANTIGRAVITY_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
# Para Gemini CLI:
GEMINI_OAUTH_CLIENT_ID=seu-client-id.apps.googleusercontent.com
GEMINI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
GEMINI_CLI_OAUTH_CLIENT_SECRET=GOCSPX-seu-secret
6. Reinicie lub OmniRoute
# Se usando npm:
npm run dev
# Se usando Docker:
docker restart omniroute
7. Tente conectar novamente
Panel kontrolny → Dostawcy → Antygrawitacja (lub Gemini CLI) → OAuth
Agora o Google redirecionará corretamente dla https://seu-servidor.com/callback i autentyczna funkcja.
Obejście tymczasowe (sem configurar credenciais prróprias)
Jeśli chcesz uzyskać dostęp do podręcznika URL:
- OmniRoute abrirá adres URL autoryzacji w Google
- Após você autorizar, o Google tentará redirecionar para
localhost(que falha no servidor remoto) - Skopiuj kompletny adres URL da barra de endereço do seu przeglądarki (wiadomość que a página não carregue)
- Cole essa URL no campo que aparece no modal de conexão do OmniRoute
- Kliknij je „Połącz”
To obejście funkcji porque o kodigo de autorização na URL é válido niezależny do przekierowania ter carregado ou não.
🛠️ Stos technologii
Kliknij, aby rozwinąć szczegóły stosu technologii
- Środowisko wykonawcze: Node.js 18–22 LTS (⚠️ Node.js 24+ jest nieobsługiwany —
better-sqlite3natywne pliki binarne są niekompatybilne) - Język: TypeScript 5.9 — 100% TypeScript w
src/iopen-sse/(zeroanyw modułach podstawowych od wersji 2.0) - Framework: Next.js 16 + React 19 + Tailwind CSS 4
- Baza danych: LowDB (JSON) + SQLite (stan domeny + logi proxy + audyt MCP + decyzje dotyczące routingu)
- Schematy: Zod (walidacja we/wy narzędzia MCP, kontrakty API)
- Protokoły: MCP (stdio/HTTP) + A2A v0.3 (JSON-RPC 2.0 + SSE)
- Streaming: zdarzenia wysyłane przez serwer (SSE)
- Auth: OAuth 2.0 (PKCE) + JWT + klucze API + autoryzacja w zakresie MCP
- Testowanie: Uruchomienie testów Node.js + Vitest (ponad 900 testów, w tym testy jednostkowe, integracyjne, E2E)
- CI/CD: Akcje GitHub (automatyczne publikowanie npm + Docker Hub w momencie wydania)
- Strona internetowa: omniroute.online
- Pakiet: npmjs.com/package/omniroute
- Doker: hub.docker.com/r/diegosouzapw/omniroute
- Odporność: wyłącznik automatyczny, wykładnicze wycofywanie, stado przeciwgrzmotowe, fałszowanie TLS, samonaprawianie automatycznej kombinacji
📖 Dokumentacja
| Dokument | Opis |
|---|---|
| User Guide | Dostawcy, kombinacje, integracja CLI, wdrożenie |
| API Reference | Wszystkie punkty końcowe z przykładami |
| MCP Server | 16 narzędzi MCP, konfiguracje IDE, klienci Python/TS/Go |
| A2A Server | Protokół JSON-RPC 2.0, umiejętności, streaming, zarządzanie zadaniami |
| Auto-Combo Engine | Punktacja 6-czynnikowa, pakiety trybów, samoleczenie |
| Troubleshooting | Typowe problemy i rozwiązania |
| Architecture | Architektura systemu i elementy wewnętrzne |
| Contributing | Konfiguracja i wytyczne dotyczące programowania |
| OpenAPI Spec | Specyfikacja OpenAPI 3.0 |
| Security Policy | Zgłaszanie luk w zabezpieczeniach i praktyki bezpieczeństwa |
| VM Deployment | Kompletny przewodnik: konfiguracja VM + nginx + Cloudflare |
| Features Gallery | Wizualna wycieczka po panelu ze zrzutami ekranu |
| Release Checklist | Etapy sprawdzania poprawności przed wydaniem |
🗺️ Plan działania
OmniRoute ma ponad 210 funkcji zaplanowanych w wielu fazach rozwoju. Oto kluczowe obszary:
| Kategoria | Planowane funkcje | Najważniejsze |
|---|---|---|
| 🧠 Routing i inteligencja | 25+ | Routing z najmniejszym opóźnieniem, routing oparty na tagach, wstępna inspekcja przydziału, wybór konta P2C |
| 🔒 Bezpieczeństwo i zgodność | 20+ | Wzmocnienie SSRF, maskowanie poświadczeń, limit szybkości na punkt końcowy, zakres kluczy zarządzania |
| 📊 Obserwowalność | 15+ | Integracja OpenTelemetry, monitorowanie kwot w czasie rzeczywistym, śledzenie kosztów według modelu |
| 🔄 Integracja dostawców | 20+ | Rejestr modeli dynamicznych, czasy odnowienia dostawcy, Kodeks dla wielu kont, analiza przydziału Copilot |
| ⚡ Wydajność | 15+ | Podwójna warstwa pamięci podręcznej, pamięć podręczna podpowiedzi, pamięć podręczna odpowiedzi, utrzymywanie transmisji strumieniowej, wsadowe API |
| 🌐 Ekosystem | 10+ | WebSocket API, ładowanie konfiguracji na gorąco, rozproszony magazyn konfiguracji, tryb komercyjny |
🔜 Już wkrótce
- 🔗 Integracja OpenCode — natywna obsługa dostawców dla IDE kodowania OpenCode AI
- 🔗 Integracja z TRAE — Pełne wsparcie dla platformy rozwojowej TRAE AI
- 📦 Batch API — Asynchroniczne przetwarzanie wsadowe dla żądań masowych
- 🎯 Routing oparty na tagach — Kieruj żądania na podstawie niestandardowych tagów i metadanych
- 💰 Strategia najniższych kosztów — Automatycznie wybierz najtańszego dostępnego dostawcę
📝 Pełna specyfikacja funkcji dostępna w OMNI_TOKEN_342 (217 szczegółowych specyfikacji)
👥 Współtwórcy
Jak wnieść swój wkład
- Forkuj repozytorium
- Utwórz gałąź funkcji (
git checkout -b feature/amazing-feature) - Zatwierdź zmiany (
git commit -m 'Add amazing feature') - Wciśnij do oddziału (
git push origin feature/amazing-feature) - Otwórz żądanie ściągnięcia
Szczegółowe wytyczne można znaleźć w CONTRIBUTING.md.
Wydanie nowej wersji
# Create a release — npm publish happens automatically
gh release create v2.0.0 --title "v2.0.0" --generate-notes
📊 Historia gwiazd
Obserwatorzy gwiazd w miarę upływu czasu
🙏 Podziękowania
Specjalne podziękowania dla 9router autorstwa decolua — oryginalnego projektu, który zainspirował ten widelec. OmniRoute opiera się na tym niesamowitym fundamencie dzięki dodatkowym funkcjom, wielomodalnym interfejsom API i pełnemu przepisaniu TypeScriptu.
Specjalne podziękowania dla CLIProxyAPI — oryginalnej implementacji Go, która zainspirowała ten port JavaScript.
📄 Licencja
Licencja MIT — szczegółowe informacje można znaleźć w LICENSE.
omniroute.online









