Suverena on-prem AI infrastruktura
za europska poduzeća

Privatni AI appliance s lokalnom inferencijom, OpenAI-kompatibilnim gateway-om, RAG-om, agentima, audit logovima, PII redakcijom i MCP konektorima. Implementacija unutar vašeg perimetra — bez izlaganja oblaku, bez naplate po tokenu, spremno za EU AI Act, GDPR, NIS2 i EU Data Act po dizajnu.

Razgovarajte s prodajom → Istražite tehnologiju

$0B+

Tržište enterprise AI-ja do 2028.

35%+ godišnji rast — IDC

Poduzeća koja prijavljuju da troškovi cloud AI-ja premašuju proračun.

Gartner, 2024

€0B

U GDPR kaznama — postupanje s AI podacima sljedeća je granica.

EU regulatorna izloženost

00 — Što dobivate

Kompletan privatni AI stack u jednom appliance-u.

LLM Machines pakira osnovne usluge koje europska poduzeća trebaju za lokalno pokretanje generativnog AI-ja, uz jasne granice podrške i bez ovisnosti o public-cloud LLM API-jima.

API gateway

OpenAI-kompatibilni endpointi.

Usmjerite postojeće alate na privatni gateway za lokalne modele, praćenje korištenja, rate limiting, audit logging i kontrole na razini tima.

Znanje

RAG nad internim podacima.

Povežite dokumente, wiki, tikete i repozitorije kako bi odgovori bili utemeljeni na vašoj vlastitoj bazi znanja — bez iznošenja podataka.

Automatizacija

Agenti i workflow-ovi.

Pokrenite kontrolirane agentske zadatke, upravljane workflow-ove i MCP alate unutar vaše mreže, s vjerodajnicama spremljenima na appliance-u.

Privatnost

PII redakcijski sloj.

Detektirajte i anonimizirajte osjetljive osobne podatke prije nego što promptovi dođu do modela, s politikama usklađenima za regulirana europska radna opterećenja.

Upravljanje

Audit logovi prema zadanim postavkama.

Zadržite zapise o promptu, odgovoru, korisniku, modelu i usmjeravanju unutar vašeg perimetra, kako bi sigurnosni timovi mogli pregledati što se dogodilo.

Konektori

Provjereni MCP katalog.

Povežite chat, source control, ticketing, dokumente, CRM, mail i pohranu kroz kurirane konektore umjesto ad hoc integracija.

01 — Problem

Enterprise AI je slomljen.

Tri sile čine enterprise AI bolnim, skupim i rizičnim.

Računi van kontrole.

Cloud AI troškovi su nepredvidivi i kažnjavajući u velikoj mjeri. Tvrtka koja obrađuje milijune tokena dnevno može potrošiti stotine tisuća eura godišnje — s računima koji rastu svaki mjesec.

Opasna ovisnost o dobavljaču.

Jednom kad gradite na OpenAI, Azure ili AWS, zarobljeni ste. Promjena dobavljača znači prepisivanje cijelog stacka. Te platforme inženjerski su dizajnirane da vas drže ovisnima.

Vaši podaci u njihovom oblaku.

Svaki prompt poslan cloud LLM-u obrađuje se na tuđim serverima. Poslovne tajne, korisnički PII i povjerljivi podaci — sve teče kroz infrastrukturu koju ne kontrolirate.

[ 01 ]

Podaci nikad ne napuštaju vaš perimetar.

Potpuna on-premise ili private cloud implementacija. Nula izloženosti oblaku. EU AI Act, GDPR, NIS2 i EU Data Act spremno — po dizajnu, ne naknadno.

[ 02 ]

Bez naplate po tokenu — nikad.

Jednokratna licenca. Pokrenite neograničenu inferenciju. Troškovi rastu s vašim hardverom, ne s volumenom upita.

[ 03 ]

Kompletan stack u jednoj kutiji.

Gateway, inferencija, RAG, agenti, PII anonimizacija — sve integrirano, testirano i spremno za implementaciju u danima.

[ 04 ]

Nula ovisnosti o dobavljaču.

Izgrađeno u potpunosti na auditabilnim open-source komponentama. Zamijenite modele, proširite stack ili samostalno održavajte u bilo kojem trenutku.

03 — Suverenost

Izgrađeno u EU.
Izgrađeno za EU.

Suverenost nije značajka — to je temelj. Svaki zadani parametar inženjerski je projektiran da zadovolji četiri stupa europske digitalne regulative.

Pročitajte više →

EU AI Act

Audit tragovi, transparentnost, ljudski nadzor — on-prem implementacija čini visokorizične sustave podložnima nadzoru unutar vašeg perimetra.

GDPR

Osobni podaci nikad ne napuštaju vašu mrežu. Microsoft Presidio detektira i redactira prije nego što modeli išta vide.

NIS2

Uklonite cloud-AI poveznicu iz vašeg supply chain-a. Izloženost cybersigurnosti na razini uprave uklonjena prema zadanim postavkama.

EU Data Act

Open-source temelj + jednokratna licenca poštuju mandate Acta o prenosivosti i prebacivanju po dizajnu.

04 — Tehnologija

Dvanaest slojeva certificirane jezgre.

Jedan appliance. Potpisani manifest provodi što se izvršava gdje — a Pure Mode sprječava bilo što prilagođeno da blokira vaš SLA.

Pogledajte arhitekturu →

Tier model

T1 / T2 / T3 uz manifest enforcement.

Svaka komponenta je potpisana i označena. T1 se izvršava s host privilegijama. T2 u ograničenim kontejnerima. T3 sandbox-iran bez pristupa hostu. Tier oznake vidljive su u admin UI-ju pored svake komponente.

Pure Mode

Ugasite sve prilagođeno. Zadržite certificiranu jezgru.

Jedan klik admin akcija koja onemogućuje svaku T2/T3 komponentu. Koristite je za sigurnosne incidente, dijagnostiku podrške ili da audit ostane čist.

MCP catalog

Provjereni konektori odmah po isporuci.

Chat, source control, ticketing, dokumenti, CRM, mail, pohrana — povezano kroz kurirane MCP servere. Svaka vjerodajnica živi u vašem on-box trezoru.

05 — Zašto ne oblak

Zašto ne jednostavno oblak?

Poduzeća se suočavaju s bolnim kompromisom — do sada.

	Azure AI / Bedrock	Razvoj u kući	LLM Machines
Suverenost podataka	Podaci izlaze iz organizacije	Moguće	Zajamčeno
Predvidljivi trošak	Naplata po tokenu	Fiksna infrastruktura	Jednokratna licenca
Neovisnost o dobavljaču	Zaključani ste	Ako je dobro izgrađeno	Open-source stack
Vrijeme implementacije	Dani	Mjeseci do godina	Dani do tjedana
Full-stack AI	Djelomično	Sve graditi	Sve u jednom
Spremno za compliance	Složeni dodaci	Moguće	PII sloj ugrađen

06 — Graditi vs. partnerirati

Matematika vlastite gradnje.

Što suverena on-prem AI stvarno košta interno isporučiti — naspram onoga što naplaćujemo da je isporučimo za vas.

Pogledajte cijelu raščlambu →

Vlastita gradnja: €600K–€1M+ u prvoj godini. Partnerstvo s nama: ~6.5% toga, hardver se prosljeđuje s nula komisije.

Vlastita gradnja

€600K – €1M+

Partnerstvo s nama

~€41K + HW

07 — Cijene

Prilagođena ponuda prema vašem profilu korištenja.

Svaka ponuda je dimenzionirana prema vašem stvarnom korištenju i kapacitetu. Bez javnog cjenika — ali evo donjih granica:

Pogledajte cijene →

Donja granica

Od €5,000

Jednokratno postavljanje i konfiguracija. Discovery, instalacija, identity federation, povezivanje konektora, validacija, obuka.

Od €3,000 / mjesečno

Periodični servisni retainer — raste s vašim hardverskim otiskom, brojem korisnika i SLA-jem.

0% na hardver

Nula komisije na Supermicro pass-through. Vaša infrastrukturna investicija ostaje kod vas, ne kod nas.

Gateway

Bez GPU-a · samo gateway

Timovi koji već koriste vanjske LLM API-je, a trebaju privatni gateway, praćenje korištenja i PII redakciju.

SME Appliance

Jedan GPU · potpuno lokalna AI

Srednje tvrtke koje žele potpuno lokalnu AI za inženjerske timove od 10–100 korisnika.

Enterprise

Multi-node · HA · prilagođen SLA

Velika poduzeća i regulirane industrije koje trebaju visoku dostupnost, horizontalno skaliranje i namjenske SLA-jeve.

08 — Onboarding

Od potpisanog ugovora do živog sustava: 4–6 tjedana.

Prilagođena implementacija, ne SaaS prijava. Osam faza, svaka prilagođena vašem okruženju.

Pogledajte onboarding →

T-14 → T-0

Pre-shipment

Discovery upitnik. Network pre-flight. Licencni ključ vezan za vaš hardver.

01–02

Day 0

Hardver i prvo pokretanje

Isporuka, montaža u rack, napajanje, licenca, self-test. ~2.5 sata ukupno.

03–05

Day 1 → Day 2

Federacija i integracija

Identity federation, app stack online, konektori povezani i smoke-testirani.

06–08

Day 2 → 30 dana

Validacija i partnerstvo

End-to-end testovi, obuka, primopredaja, fiksiran 30-dnevni check-in.

09 — Timing

Zašto sada.

Tržište dolazi do prekretnice.

→ 01 EU AI Act, GDPR, NIS2 i EU Data Act tjeraju regulirane industrije da AI radna opterećenja drže unutar vlastitog perimetra — a provedba se zaoštrava iz godine u godinu.
→ 02 Open-weight modeli — Llama, Mistral, Qwen — sada dosežu kvalitetu razine GPT-4, čineći on-prem inferenciju održivom.
→ 03 Enterprise sigurnosni timovi blokiraju cloud AI alate, stvarajući hitnu potražnju za internim alternativama.
→ 04 Strah od AI troškova: tvrtke prelaze s nepredvidivih OPEX cloud računa na kontrolirani CAPEX hardver.

10 — Tvrtka

Europska, po dizajnu.

Mali, tehnički tim koji gradi suverenu AI infrastrukturu za europska poduzeća. Bootstrapped na uvjerenju.

O tvrtki →

Misija

Učiniti suverenu AI zadanom za europska poduzeća — zamjenjujući cloud-AI porez applianceom koji posjedujete, auditirate i kontrolirate.

Sjedište

Hrvatska · Europska unija EU AI Act · GDPR · NIS2 · EU Data Act — spremno po dizajnu

Europski startup

11 — FAQ

Pitanja koja poduzeća prva postavljaju.

Kratki odgovori za timove koji uspoređuju on-prem AI, privatne AI platforme i cloud LLM API-je.

Što je on-prem AI appliance?

On-prem AI appliance je pre-integrirani hardverski i softverski stack koji izvršava modele, API gateway-e, RAG, agente i kontrole unutar vašeg vlastitog data centra ili privatnog okruženja.

Napuštaju li podaci tvrtke našu mrežu?

Ne. Zadana implementacija drži promptove, dokumente, model traffic, logove i vjerodajnice unutar vašeg perimetra. Ne trebamo vidljivost podatkovne ravnine za podršku appliance-a.

Je li kompatibilno s OpenAI alatima?

Da. Gateway izlaže OpenAI-kompatibilne endpointe, tako da timovi mogu usmjeriti postojeće aplikacije, developer alate i automation framework-e prema lokalnim ili odobrenim modelima.

Koliko dugo traje implementacija?

Tipična implementacija ide od potpisanog ugovora do živog sustava u 4–6 tjedana, uključujući discovery, sizing, instalaciju, SSO, konektore, validaciju i primopredaju.

Koji su modeli podržani?

Stack je izgrađen za open-weight modele kao što su Llama, Mistral, Qwen i slične familije, s usmjeravanjem i posluživanjem koje obavlja lokalni inferencijski sloj.

Kako funkcionira cijena?

Cijena počinje setup naknadom i servisnim retainerom dimenzioniranim prema vašem profilu korištenja, hardverskom otisku, broju korisnika i SLA-ju. Hardver se prosljeđuje s nula komisije.

12 — Donesite AI in-house

Suverena AI, implementirana u danima.

Pilotirajte appliance na vašim stvarnim radnim opterećenjima. Implementirat ćemo ga unutar vašeg perimetra — bez izlaganja oblaku, bez naplate po tokenu.