Tehnologija — LLM Machines

Mogu li postojeći OpenAI API klijenti koristiti LLM Machines?

Da. Gateway izlaže OpenAI-kompatibilne endpointe, tako da aplikacije mogu pokazivati na appliance umjesto na javni cloud API, dok autentikacija, logiranje i usmjeravanje ostaju lokalni.

Može li appliance raditi air-gapped?

Da. Sigurnosno osjetljive implementacije mogu koristiti offline aktivaciju licence i lokalne registre modela, tako da osnovna inferencija, RAG i aplikacijske površine rade bez javnog internetskog pristupa.

Koji se modeli mogu pokretati lokalno?

Arhitektura je dizajnirana za open-weight familije modela kao što su Llama, Mistral i Qwen, s izborom modela dimenzioniranim prema vašim zahtjevima za hardver, latenciju i kvalitetu.

Gdje se pohranjuju vjerodajnice konektora?

Vjerodajnice konektora žive u on-box trezoru unutar vašeg okruženja. MCP serveri i integracijske usluge koriste te vjerodajnice lokalno, umjesto da ih šalju našoj infrastrukturi.

Što radi Pure Mode?

Pure Mode onemogućuje T2/T3 prilagođene komponente i drži certificiranu T1 jezgru u radu. Koristan je za reakciju na incidente, dijagnostiku podrške i pripremu audita.

Što je unutar granice podrške?

Podržani su potpisana certificirana jezgra, tier model, manifest, gateway, inferencijski servisi i dokumentirane T1/T2 komponente. Klijentske T3 ekstenzije ostaju izolirane od SLA-ja.

Arhitektura on-prem AI appliance-a

Referentna arhitektura.

Edge / Gateway

Identitet i SSO

Aplikacijske površine · korisničke

Inference gateway

Inference serveri

Sloj alata / integracija

Agentski sloj

Workflow i orkestracija

Podaci

Observability i audit

Platforma

Hardver · enterprise / industry-grade

Klijentski BYO sandbox

T1 / T2 / T3 uz manifest enforcement.

Ugasite sve prilagođeno. Zadržite certificiranu jezgru.

Provjereni konektori odmah po isporuci.

Gradite protiv lokalne AI kao protiv standardnog API-ja.

Zamijenite base URL.

Radi s developer workflow-ovima.

Observabilno prema zadanim postavkama.

LiteLLM — Gateway i router

LibreChat — Korisničko sučelje

Knowledge RAG sloj — Retrieval engine

Open Notebook — Research agent

NemoClaw / OpenClaw — Agentic framework

Microsoft Presidio — PII anonimizacija

SGLang — Inference engine

LLM Machines — Sloj integracije

Pitanja o arhitekturi.