Kako je AI sustav sastavljen, posluživan i omeđen — od razine appliance-a do pojedinačnih protokola.
- On-prem on-premise
- Softver ili hardver koji se izvršava unutar vlastitog data centra ili privatnog oblaka organizacije, umjesto u javnom oblaku treće strane. Arhitektonska suprotnost SaaS-a.
- Appliance
- Pre-integrirana hardversko-softverska jedinica isporučena kao jedan proizvod. Mrežni firewalli, storage arrays i naša AI platforma — sve su to appliance-i; klijent ne sastavlja komponente.
- API gateway
- Usluga koja stoji između klijenata i backend AI modela, obavljajući autentikaciju, rate limiting, usmjeravanje, logiranje i observability. U našem stacku: LiteLLM koji izlaže OpenAI-kompatibilne endpointe.
- Endpoint
- Specifični URL na kojem se API može pozvati (npr.
/v1/chat/completions). "OpenAI-kompatibilni endpointi" znače da URL-ovi i format zahtjeva odgovaraju onome što OpenAI API očekuje, pa postojeći klijenti rade nepromijenjeni.
- RAG
- Retrieval-Augmented Generation. Arhitektura koja dohvaća relevantne dokumente iz baze znanja i ubacuje ih u prompt modela u trenutku upita, utemeljujući odgovore u pouzdanim podacima umjesto samo na pretreniranom znanju modela.
- MCP
- Model Context Protocol. Otvoreni standard koji je uveo Anthropic, koji omogućuje AI aplikacijama da se povežu s vanjskim alatima, izvorima podataka i uslugama kroz jedinstveno sučelje — zamjenjujući ad-hoc integracije jednim wire protokolom.
- Tier model T1 / T2 / T3
- LLM Machines sustav razina komponenti. T1 = certificirana jezgra, host-privilegirano; T2 = ograničeni kontejneri; T3 = sandbox-iran bez host pristupa. Svaka komponenta nosi potpisanu tier oznaku koju provodi manifest.
- Pure Mode
- Jedan klik admin akcija na appliance-u koja onemogućuje svaku T2 i T3 komponentu, ostavljajući samo certificiranu jezgru u radu. Koristi se tijekom sigurnosnih incidenata, audita ili dijagnostike podrške.
- Manifest enforcement
- Potpisana deklaracija što je svaka komponenta, kojoj razini pripada i koje privilegije može zatražiti. Appliance odbija učitati bilo što što nije na manifestu.
- Certificirana jezgra certified core
- Skup komponenti koje dolaze s appliance-om, potpisane od strane LLM Machines, i izvršavaju se na razini T1. Uključuje gateway, sloj inferencije, vector store i orkestrator.
- Agent agentski workflow
- AI sustav koji planira, odlučuje i poziva alate da završi višekorake zadatak — za razliku od jedne prompt-odgovor interakcije. Agentski sustavi koriste tool calling i često izvršavaju više LLM koraka po korisničkom zahtjevu.
- Tool calling function calling
- LLM sposobnost gdje model emitira strukturirane pozive vanjskim funkcijama ili API-jima (npr. pretraži bazu, pošalji email), omogućujući automatizaciju izvan čistog generiranja teksta.
- Workflow orchestration
- Koordiniranje višestrukih AI poziva, izvršavanja alata i ljudskih odobrenja u definiranom slijedu. n8n i slični engine-i pružaju vizualnu izgradnju workflow-ova unutar našeg appliance-a.
- Sandboxing
- Izvršavanje koda u izoliranom okruženju s ograničenim pristupom sustavu. T3 komponente u našem stacku su sandbox-irane tako da ne mogu vidjeti podatke drugih komponenti ili pobjeći na host.
- High availability HA
- Dizajn sustava koji tolerira pad komponente bez prekida usluge, obično putem redundancije i automatske failover. Obvezno za enterprise SLA-jeve.
- LiteLLM · AnythingLLM · vLLM · SGLang · open-webui · Presidio
- Komponente stacka koje isporučujemo na razini T1. LiteLLM je API gateway; AnythingLLM je RAG i chat površina; vLLM i SGLang su inferencijski engine-i; open-webui je chat UI; Microsoft Presidio obrađuje PII detekciju i redakciju.