Onboarding

Implementirajte on-prem AI u 4–6 tjedana

Prilagođena implementacija, ne SaaS prijava. Dimenzioniramo appliance, instaliramo stack, federiramo identitet, povezujemo konektore, validiramo radna opterećenja, obučavamo admine i predajemo živi suvereni AI sustav.

00 — Put implementacije

Od discovery-ja do primopredaje.

Ista kralježnica implementacije vrijedi bilo da appliance sleti on-premise, u vaš privatni oblak ili u naš hrvatski data centar.

01

Discovery i sizing.

Mapirajte korisnike, radna opterećenja, potrebe modela, izvore podataka, compliance ograničenja i očekivani kapacitet prije nego što se hardver finalizira.

02

Hardver i prvo pokretanje.

Montaža u rack, napajanje, licenca, dodjela pohrane, validacija GPU-ova, testiranje mrežne propusnosti i smoke testovi lokalne inferencije.

03

SSO i uloge.

Federirajte s vašim identity providerom, mapirajte uloge admin/korisnik/auditor i potvrdite granice pristupa prije šireg rolloutа.

04

Konektori i podaci.

Povežite odobrene izvore poput dokumenata, ticketinga, repozitorija, chata i pohrane kroz provjereni katalog konektora.

05

Validacija.

Pokrenite kanonske testove kroz chat, API, RAG, agente, observability, audit logove i Pure Mode sa stvarnim korisnicima.

06

Obuka i primopredaja.

Obučite admine i champione, dokumentirajte granice podrške, predajte runbookove i kalendarski fiksirajte 30-dnevni check-in.

01 — Tier model podrške

Tri razine. Manifest-enforced. Bez dvosmislenosti.

Svaka komponenta na kutiji pripada jednoj od tri razine, kodirano u potpisanom manifestu pri instalaciji i vidljivo u admin UI-ju, telemetriji i support tiketima.

T1 · Certificirana jezgra

Puni SLA po ugovoru.

Firmware, OS, Kubernetes, inference gateway, inference serveri, identitet, ugrađene aplikacije, kurirani katalog konektora, odobreni modeli. Izvršava se s host privilegijama. Mi posjedujemo probleme.

T2 · Verificirani partneri

Best-effort, definirano po partneru.

Konektori, modeli i aplikacije iz našeg partnerskog registra koji su prošli reviziju. Izvršavaju se u ograničenim kontejnerima. Integracijska površina je naša; partnerska interna logika njihova.

T3 · Klijentski BYO

Nema podrške za dodatke; T1/T2 i dalje pokriveno.

Prilagođeni konektori, prilagođene aplikacije u K8s, prilagođeni modeli, prilagođeni workflow-ovi. Sandboxiran. Bez host pristupa. Bez ulaznog mrežnog prometa osim ako nije eksplicitno odobreno. Vi gradite, vi posjedujete.

Pure Mode

Jedan klik admin akcija koja onemogućuje sve T2/T3 komponente. Ako se problem reproducira u Pure Mode-u, naš je tiket; ako ne, usmjerava se klijentu (ili partneru) s jasnim izvještajem o „uključenim komponentama". To je ugovor koji nam omogućuje skaliranje podrške.

02 — Vremenska linija

Devet faza. Svaka prilagođena vašem okruženju.

Svaka faza ima eksplicitne vlasnike, kriterije izlaza i „Prilagođeno za: …" nit koja imenuje što se prilagođava vašem stacku. Ništa u instalaciji nije iznenađenje.

00 T-14 → T-0 dana

Pre-shipment.

Discovery upitnik — vaš IdP, mrežna topologija, ciljane integracije, broj korisnika, preferencije modela, compliance ograničenja (HIPAA, SOC2, FedRAMP, air-gap). Network pre-flight. Specifikacija napajanja i racka. Licencni ključ vezan za vaš hardver. Pre-flight poziv prolazi kroz upitnik liniju po liniju. Pisana suglasnost.

Prilagođeno za: vaš tip IdP-a, compliance režim, ciljane integracije
01 Day 0 · ~2 sata

Isporuka i montaža hardvera u rack.

Inspekcija pri preuzimanju — serijski broj odgovara manifestu, bez fizičkih oštećenja, tamper pečati netaknuti. Montaža u rack, redundantno napajanje, mrežni uplink (mgmt + data VLAN-ovi). Konfiguracija BMC / out-of-band managementa. Terenski inženjer provjerava udaljeni konzolni pristup. Boot do firmware check ekrana, potvrda u odnosu na certificirani manifest.

Prilagođeno za: layout vašeg data centra, mrežne VLAN-ove
02 Day 0 · ~30 min

Prvo pokretanje i licenciranje.

Čarobnjak za prvo pokretanje: hostname, vremenska zona, NTP, početne admin vjerodajnice (rotiraju se nakon IdP federacije). Aktivacija licence — online (vraćen potpisani token) ili offline (uploadan potpisani bundle; zadano za sigurnosno osjetljive klijente). Dodjela storage volume-a. Self-test: GPU enumeracija, NVMe zdravlje, mrežna propusnost, smoke test inferencije.

Prilagođeno za: vaš sigurnosni stav (online vs air-gapped)
03 Day 1 ujutro · 1–2 sata

Mreža i identity federation.

TLS certifikati instalirani (vaš CA ili Let's Encrypt s internim ACME-om). DNS zapisi usmjereni na kutiju za odabranu subdomenu. Reverse proxy konfiguriran s rutama za svaku app površinu. Keycloak federiran s vašim IdP-om putem OIDC ili SAML. SCIM provisioning verificiran sa stvarnom sinkronizacijom korisnika/grupe. Mapiranje uloga potvrđeno: Admin / Korisnik / Auditor / Read-Only sleti na pravo mjesto.

Najvrjedniji korak — adopcija staje ako je ovo pogrešno
04 Day 1 popodne · ~1 sat

Inference i app stack.

Modeli učitani prema upitniku — chat, kod, embeddinzi — povučeni iz on-box potpisanog registra (nije potreban internet za T1 modele). SGLang / vLLM inference serveri registrirani s gateway-om. LiteLLM konfiguriran: aliasi modela, rate limiti po timu, proračuni po timu, audit logiranje uključeno. Ugrađene aplikacije online: Open WebUI, AnythingLLM, n8n, openclaw / nemoclaw. Opcionalni dodaci (Continue, Tabby, Langfuse) prema opsegu.

Prilagođeno za: vaše preferencije modela, proračune po timu
05 Day 1 → Day 2 · 2–4 sata

Konfiguracija konektora.

Slack / Teams, email, source control (GitHub / GitLab / Bitbucket), praćenje tiketa (Jira / Linear / Asana), dokumenti (Notion / Confluence / SharePoint), CRM, pohrana. Svaki autoriziran, opsegom omeđen (read-only zadano prvih 30 dana) i smoke testiran s pripremljenim promptom prije sign-offа. Sve što nije u kuriranom katalogu logira se kao T3 kandidat.

Prilagođeno za: vaš postojeći stack alata
06 Day 2 · ~1 sat

Validacijski paket.

Osam end-to-end testova kroz svaku površinu — chat, IDE, ulazna integracija, izlazna integracija, workflow, agentic, observability, audit, Pure Mode toggle. Svaki vode stvarni korisnici iz vašeg tima, ne inženjeri. Skup testova je kanonski — identičan kroz svaku implementaciju da bude reproducibilan.

Stvarni korisnici, ne inženjeri — test mora biti reproducibilan
07 Day 2 popodne · ~2 sata

Obuka i primopredaja.

Admin obuka (60 min): upravljanje korisnicima/grupama, registar modela, životni ciklus konektora, Pure Mode, audit export, kanali ažuriranja, backup/restore, tier model. Kickoff za krajnje korisnike (30 min, snimljen). Klijentski runbook isporučen s ispunjenim vašim vrijednostima. Uspostavljen support kanal. Eskalacijski putevi za on-call potvrđeni s obje strane. Odabrana strategija ažuriranja.

Prilagođeno za: uloge vašeg tima, vaš support workflow
08 +30 dana

30-dnevni check-in.

Kalendarski fiksirano pri primopredaji. Pregled korištenja — aktivni korisnici, promptovi/dan po površini, top use case-ovi, neaktivne površine. Pregled konektora — što ne radi, što je nedovoljno korišteno, što nedostaje. Pregled tier granica — je li itko izgradio T3 stvari? Ako da, jesu li implikacije podrške shvaćene? Razgovor o roadmapu. Brojevi adopcije su zdravi — ili postoji pisani plan ispravljanja.

Kontinuirano partnerstvo, ne transakcijska primopredaja
03 — Tko što radi

RACI sažetak.

Eksplicitno vlasništvo za svaku onboarding aktivnost. R = Responsible (obavlja posao) · A = Accountable (potpisuje) · C = Consulted (konzultiran) · I = Informed (informiran).

Aktivnost Mi Klijent IT Vlasnik alata Krajnji korisnik
Pre-flight i upitnikA / RRCI
Hardware rack i napajanjeCR / AII
Prvo pokretanje i licenciranjeR / ACII
Mreža, TLS, DNSCR / AII
IdP federacijaRA / RII
Inference i app stackR / ACII
Autentikacija i opseg konektoraRCA / RI
Validacijski testoviRCCA
Admin obukaR / AAII
Kickoff za krajnje korisnikeRIIA
Day-2 operacije i T3 dodaciC (T1/T2 samo)A / RA / RI
04 — FAQ

Pitanja o implementaciji.

Što sigurnosni, IT i poslovni timovi obično trebaju znati prije zakazivanja on-prem AI rolloutа.

Što nam treba prije nego što implementacija počne?

Trebate dogovoren mod implementacije, podatke o mreži, pristup identity provideru, odobrene izvore podataka, admin kontakte i pilot radna opterećenja za validaciju.

Može li onboarding raditi za air-gapped okruženja?

Da. Sigurnosno osjetljive implementacije mogu koristiti offline aktivaciju licence, lokalne bundle-ove modela i kontrolirano postavljanje konektora bez ovisnosti o javnom internetu.

Koji su identity provideri podržani?

Stack je dizajniran za standardnu enterprise identity federation putem OIDC ili SAML, s mapiranjem uloga za admine, korisnike, auditore i read-only pristup.

Kako se odabiru konektori?

Konektori se biraju tijekom discovery-ja na temelju poslovne vrijednosti, osjetljivosti podataka, modela vjerodajnica i pripadaju li certificiranoj jezgri, partnerskoj razini ili klijentskom sandboxu.

Što čini dobar pilot workload?

Dobar pilot ima stvarne korisnike, jasne kriterije uspjeha, reprezentativne interne podatke i dovoljno rizika za testiranje upravljanja bez blokiranja produkcijskih operacija.

Što slijedi

Pilotirajte appliance na vašim stvarnim radnim opterećenjima.

Discovery poziv, dimenzionirana specifikacija appliance-a i 4–6-tjedni put do produkcije. Isti tim end-to-end.