Zamijenite base URL.
Koristite OpenAI-kompatibilne endpointe za chat, embeddinge i usmjeravanje modela kako bi se postojeći SDK-alati mogli preseliti na lokalnu infrastrukturu.
Jedan privatni AI appliance s OpenAI-kompatibilnim API gateway-om, lokalnom inferencijom, RAG-om, agentima, MCP konektorima, audit logovima i Pure Mode-om. Potpisani manifest provodi što se izvršava gdje — i što ostaje unutar granice podrške.
Vanjski subjekti na vrhu. Appliance ispod. Granica podrške čisto odvaja certificiranu jezgru od svega što gradite u T3.
Developeri · analitičari · podrška · pravnici · operacije.
Preglednik · IDE · Slack/Teams · email · CLI.
Vaš postojeći IdP — federiramo ga, ne zamjenjujemo.
npr. Okta · Azure AD · Google · Ping.
Što god već koristite — chat, source control, ticketing, dokumenti, CRM, mail, pohrana.
TLS terminacija · reverse proxy · usmjeravanje · rate-limiting
Traefik · Kong · NGINX
Federirano s vašim IdP-om putem OIDC / SAML — nikad ga ne zamjenjuje · SCIM provisioning korisnika · mapiranje uloga (Admin / Korisnik / Auditor / Read-Only)
Keycloak · Authentik · Zitadel
OpenAI & Anthropic-kompatibilan API · usmjeravanje modela · proračuni po timu · audit logiranje
LiteLLM
Visokopropusno posluživanje modela · chat · kod · embeddinzi · klijentski fine-tunovi · učitano iz on-box potpisanog registra
SGLang · vLLM
Provjereni MCP katalog (T1) + verificirani partnerski konektori (T2). Sve vjerodajnice u on-box trezoru — nikad ne napuštaju appliance.
MCP serveri · chat · source control · ticketing · CRM · dokumenti · …
Agent runtime-ovi za višekoračne zadatke · zadani katalog agenata koje konfiguriramo · klijentski proširivo u T3
openclaw / nemoclaw
Automatizacija za citizen developere + planirani pozadinski workflow-ovi
n8n
Vector + RAG store unutar knowledge workspace-a · object storage · cache · opcionalni namjenski DB po dogovoru
AnythingLLM-vodi vektore · MinIO · Redis · (Postgres + pgvector)
LLM tracing · metrike · logovi — potpuno on-prem. Nijedna telemetrija ne napušta kutiju.
Langfuse · Grafana · Loki · Prometheus
Container orkestracija · VM upravljanje · OS · out-of-band management · signed-update i license daemon-i
Kubernetes · Portainer · Proxmox · Linux · BMC
Računalstvo · memorija · pohrana · mreža · napajanje · fizička sigurnost
Supermicro GPU(s) · CPU · NVMe · 25 / 100 GbE NIC · redundantni PSU · TPM · tamper senzori
Prilagođene aplikacije · prilagođeni konektori · prilagođeni workflow-ovi · klijentski trenirani modeli
Bez host privilegija · egress allowlist · izolirane tajne · ispad ovdje nikad ne blokira T1
Definirano od vas, vašim tempom — izvan našeg SLA-ja
Svaka komponenta je potpisana i označena. T1 se izvršava s host privilegijama. T2 u ograničenim kontejnerima. T3 sandboxiran bez host pristupa. Admin UI prikazuje tier oznake pored svake instalirane komponente — nikad dvosmisleno, nikad osporavano.
Jedan klik admin akcija koja onemogućuje svaku T2/T3 komponentu. Koristite je za sigurnosne incidente, dijagnostiku podrške („ako se reproducira u Pure Mode-u, naš je tiket") ili da audit ostane čist.
Chat, source control, ticketing, dokumenti, CRM, mail, pohrana — sve povezano kroz kurirane MCP servere. Svaka vjerodajnica živi u vašem on-box trezoru. Ništa ne napušta appliance.
LLM Machines daje inženjerskim timovima poznata sučelja, dok promet, vjerodajnice, modeli i logovi ostaju pod enterprise kontrolom.
Koristite OpenAI-kompatibilne endpointe za chat, embeddinge i usmjeravanje modela kako bi se postojeći SDK-alati mogli preseliti na lokalnu infrastrukturu.
Integrirajte privatne modele s IDE asistentima, internim aplikacijama, LangChain-style workflow-ovima, n8n automatizacijama i MCP serverima.
Držite logove zahtjeva, usmjeravanje modela, atribuciju korištenja, rate limite i metrike dostupnima adminima bez slanja telemetrije van.
Jedinstveni endpoint za sve LLM providere i lokalne modele. Praćenje korištenja, rate limiting, kontrola troškova.
Uglađeno, ChatGPT-style sučelje za sve krajnje korisnike. Bez potrebe za obukom.
Unos dokumenata, vektorsko pretraživanje i retrieval-augmented generation za enterprise baze znanja.
AI-pokretano istraživanje i sinteza znanja. Deep-dive izvještaji generirani automatski.
Autonomni agenti za složene, višekorake enterprise workflow-ove.
Automatska detekcija i redakcija osjetljivih podataka prije nego ikada dođu do modela.
Visokoperformantni engine za lokalno pokretanje open-weight modela — čisti OSS, bez NVIDIA AI Enterprise poreza.
Vezivno tkivo koje te projekte pretvara u jedan, deployabilan, produkcijski spreman appliance. Potpisani manifest, tier model, granica podrške, runbook.
Detalji koje sigurnosni, platformski i developer timovi obično pitaju prije odobravanja on-prem AI implementacije.
Da. Gateway izlaže OpenAI-kompatibilne endpointe, tako da aplikacije mogu pokazivati na appliance umjesto na javni cloud API, dok autentikacija, logiranje i usmjeravanje ostaju lokalni.
Da. Sigurnosno osjetljive implementacije mogu koristiti offline aktivaciju licence i lokalne registre modela, tako da osnovna inferencija, RAG i aplikacijske površine rade bez javnog internetskog pristupa.
Arhitektura je dizajnirana za open-weight familije modela kao što su Llama, Mistral i Qwen, s izborom modela dimenzioniranim prema vašim zahtjevima za hardver, latenciju i kvalitetu.
Vjerodajnice konektora žive u on-box trezoru unutar vašeg okruženja. MCP serveri i integracijske usluge koriste te vjerodajnice lokalno, umjesto da ih šalju našoj infrastrukturi.
Pure Mode onemogućuje T2/T3 prilagođene komponente i drži certificiranu T1 jezgru u radu. Koristan je za reakciju na incidente, dijagnostiku podrške i pripremu audita.
Podržani su potpisana certificirana jezgra, tier model, manifest, gateway, inferencijski servisi i dokumentirane T1/T2 komponente. Klijentske T3 ekstenzije ostaju izolirane od SLA-ja.
Pogledajte kako tehnologija sleti unutar vašeg okruženja — onboarding, cijene ili jednostavno razgovor s nama.