Discovery i sizing.
Mapirajte korisnike, radna opterećenja, potrebe modela, izvore podataka, compliance ograničenja i očekivani kapacitet prije nego što se hardver finalizira.
Prilagođena implementacija, ne SaaS prijava. Dimenzioniramo appliance, instaliramo stack, federiramo identitet, povezujemo konektore, validiramo radna opterećenja, obučavamo admine i predajemo živi suvereni AI sustav.
Ista kralježnica implementacije vrijedi bilo da appliance sleti on-premise, u vaš privatni oblak ili u naš hrvatski data centar.
Mapirajte korisnike, radna opterećenja, potrebe modela, izvore podataka, compliance ograničenja i očekivani kapacitet prije nego što se hardver finalizira.
Montaža u rack, napajanje, licenca, dodjela pohrane, validacija GPU-ova, testiranje mrežne propusnosti i smoke testovi lokalne inferencije.
Federirajte s vašim identity providerom, mapirajte uloge admin/korisnik/auditor i potvrdite granice pristupa prije šireg rolloutа.
Povežite odobrene izvore poput dokumenata, ticketinga, repozitorija, chata i pohrane kroz provjereni katalog konektora.
Pokrenite kanonske testove kroz chat, API, RAG, agente, observability, audit logove i Pure Mode sa stvarnim korisnicima.
Obučite admine i champione, dokumentirajte granice podrške, predajte runbookove i kalendarski fiksirajte 30-dnevni check-in.
Svaka komponenta na kutiji pripada jednoj od tri razine, kodirano u potpisanom manifestu pri instalaciji i vidljivo u admin UI-ju, telemetriji i support tiketima.
Firmware, OS, Kubernetes, inference gateway, inference serveri, identitet, ugrađene aplikacije, kurirani katalog konektora, odobreni modeli. Izvršava se s host privilegijama. Mi posjedujemo probleme.
Konektori, modeli i aplikacije iz našeg partnerskog registra koji su prošli reviziju. Izvršavaju se u ograničenim kontejnerima. Integracijska površina je naša; partnerska interna logika njihova.
Prilagođeni konektori, prilagođene aplikacije u K8s, prilagođeni modeli, prilagođeni workflow-ovi. Sandboxiran. Bez host pristupa. Bez ulaznog mrežnog prometa osim ako nije eksplicitno odobreno. Vi gradite, vi posjedujete.
Jedan klik admin akcija koja onemogućuje sve T2/T3 komponente. Ako se problem reproducira u Pure Mode-u, naš je tiket; ako ne, usmjerava se klijentu (ili partneru) s jasnim izvještajem o „uključenim komponentama". To je ugovor koji nam omogućuje skaliranje podrške.
Svaka faza ima eksplicitne vlasnike, kriterije izlaza i „Prilagođeno za: …" nit koja imenuje što se prilagođava vašem stacku. Ništa u instalaciji nije iznenađenje.
Discovery upitnik — vaš IdP, mrežna topologija, ciljane integracije, broj korisnika, preferencije modela, compliance ograničenja (HIPAA, SOC2, FedRAMP, air-gap). Network pre-flight. Specifikacija napajanja i racka. Licencni ključ vezan za vaš hardver. Pre-flight poziv prolazi kroz upitnik liniju po liniju. Pisana suglasnost.
Prilagođeno za: vaš tip IdP-a, compliance režim, ciljane integracijeInspekcija pri preuzimanju — serijski broj odgovara manifestu, bez fizičkih oštećenja, tamper pečati netaknuti. Montaža u rack, redundantno napajanje, mrežni uplink (mgmt + data VLAN-ovi). Konfiguracija BMC / out-of-band managementa. Terenski inženjer provjerava udaljeni konzolni pristup. Boot do firmware check ekrana, potvrda u odnosu na certificirani manifest.
Prilagođeno za: layout vašeg data centra, mrežne VLAN-oveČarobnjak za prvo pokretanje: hostname, vremenska zona, NTP, početne admin vjerodajnice (rotiraju se nakon IdP federacije). Aktivacija licence — online (vraćen potpisani token) ili offline (uploadan potpisani bundle; zadano za sigurnosno osjetljive klijente). Dodjela storage volume-a. Self-test: GPU enumeracija, NVMe zdravlje, mrežna propusnost, smoke test inferencije.
Prilagođeno za: vaš sigurnosni stav (online vs air-gapped)TLS certifikati instalirani (vaš CA ili Let's Encrypt s internim ACME-om). DNS zapisi usmjereni na kutiju za odabranu subdomenu. Reverse proxy konfiguriran s rutama za svaku app površinu. Keycloak federiran s vašim IdP-om putem OIDC ili SAML. SCIM provisioning verificiran sa stvarnom sinkronizacijom korisnika/grupe. Mapiranje uloga potvrđeno: Admin / Korisnik / Auditor / Read-Only sleti na pravo mjesto.
Najvrjedniji korak — adopcija staje ako je ovo pogrešnoModeli učitani prema upitniku — chat, kod, embeddinzi — povučeni iz on-box potpisanog registra (nije potreban internet za T1 modele). SGLang / vLLM inference serveri registrirani s gateway-om. LiteLLM konfiguriran: aliasi modela, rate limiti po timu, proračuni po timu, audit logiranje uključeno. Ugrađene aplikacije online: Open WebUI, AnythingLLM, n8n, openclaw / nemoclaw. Opcionalni dodaci (Continue, Tabby, Langfuse) prema opsegu.
Prilagođeno za: vaše preferencije modela, proračune po timuSlack / Teams, email, source control (GitHub / GitLab / Bitbucket), praćenje tiketa (Jira / Linear / Asana), dokumenti (Notion / Confluence / SharePoint), CRM, pohrana. Svaki autoriziran, opsegom omeđen (read-only zadano prvih 30 dana) i smoke testiran s pripremljenim promptom prije sign-offа. Sve što nije u kuriranom katalogu logira se kao T3 kandidat.
Prilagođeno za: vaš postojeći stack alataOsam end-to-end testova kroz svaku površinu — chat, IDE, ulazna integracija, izlazna integracija, workflow, agentic, observability, audit, Pure Mode toggle. Svaki vode stvarni korisnici iz vašeg tima, ne inženjeri. Skup testova je kanonski — identičan kroz svaku implementaciju da bude reproducibilan.
Stvarni korisnici, ne inženjeri — test mora biti reproducibilanAdmin obuka (60 min): upravljanje korisnicima/grupama, registar modela, životni ciklus konektora, Pure Mode, audit export, kanali ažuriranja, backup/restore, tier model. Kickoff za krajnje korisnike (30 min, snimljen). Klijentski runbook isporučen s ispunjenim vašim vrijednostima. Uspostavljen support kanal. Eskalacijski putevi za on-call potvrđeni s obje strane. Odabrana strategija ažuriranja.
Prilagođeno za: uloge vašeg tima, vaš support workflowKalendarski fiksirano pri primopredaji. Pregled korištenja — aktivni korisnici, promptovi/dan po površini, top use case-ovi, neaktivne površine. Pregled konektora — što ne radi, što je nedovoljno korišteno, što nedostaje. Pregled tier granica — je li itko izgradio T3 stvari? Ako da, jesu li implikacije podrške shvaćene? Razgovor o roadmapu. Brojevi adopcije su zdravi — ili postoji pisani plan ispravljanja.
Kontinuirano partnerstvo, ne transakcijska primopredajaEksplicitno vlasništvo za svaku onboarding aktivnost. R = Responsible (obavlja posao) · A = Accountable (potpisuje) · C = Consulted (konzultiran) · I = Informed (informiran).
| Aktivnost | Mi | Klijent IT | Vlasnik alata | Krajnji korisnik |
|---|---|---|---|---|
| Pre-flight i upitnik | A / R | R | C | I |
| Hardware rack i napajanje | C | R / A | I | I |
| Prvo pokretanje i licenciranje | R / A | C | I | I |
| Mreža, TLS, DNS | C | R / A | I | I |
| IdP federacija | R | A / R | I | I |
| Inference i app stack | R / A | C | I | I |
| Autentikacija i opseg konektora | R | C | A / R | I |
| Validacijski testovi | R | C | C | A |
| Admin obuka | R / A | A | I | I |
| Kickoff za krajnje korisnike | R | I | I | A |
| Day-2 operacije i T3 dodaci | C (T1/T2 samo) | A / R | A / R | I |
Što sigurnosni, IT i poslovni timovi obično trebaju znati prije zakazivanja on-prem AI rolloutа.
Trebate dogovoren mod implementacije, podatke o mreži, pristup identity provideru, odobrene izvore podataka, admin kontakte i pilot radna opterećenja za validaciju.
Da. Sigurnosno osjetljive implementacije mogu koristiti offline aktivaciju licence, lokalne bundle-ove modela i kontrolirano postavljanje konektora bez ovisnosti o javnom internetu.
Stack je dizajniran za standardnu enterprise identity federation putem OIDC ili SAML, s mapiranjem uloga za admine, korisnike, auditore i read-only pristup.
Konektori se biraju tijekom discovery-ja na temelju poslovne vrijednosti, osjetljivosti podataka, modela vjerodajnica i pripadaju li certificiranoj jezgri, partnerskoj razini ili klijentskom sandboxu.
Dobar pilot ima stvarne korisnike, jasne kriterije uspjeha, reprezentativne interne podatke i dovoljno rizika za testiranje upravljanja bez blokiranja produkcijskih operacija.
Discovery poziv, dimenzionirana specifikacija appliance-a i 4–6-tjedni put do produkcije. Isti tim end-to-end.