Skip to main content
№ 00 · AI architektúra a implementácia · Bratislava

Zavolať model je jeden riadok.Staviame všetko okolo neho.

Jeden architekt navrhne, postaví a prevádzkuje produkčný systém okolo toho volania, a 30 dní po nasadení drží pohotovosť.

Sebrona je bratislavská AI konzultačná a softvérovo-inžinierska kancelária, ktorá stavia produkčné AI systémy pre európske firmy od stredného trhu po veľké podniky.

ARCHITEKT
Jeden architekt · od briefu po prevzatie
EVAL SET
50–600 promptov na route · červený build blokuje merge
PAGED ON-CALL
30 dní po nasadení · pager u nás
MODEL FLOOR
Claude Opus 4.8 · Mistral Small 3.2 (Apache 2.0) · routing pravidlá v prvom týždni
CAPABILITY
p95 < 600 ms TTFT · 5-minútový Anthropic prompt cache · backup-model route
NOT FOR
horizontálne SaaS predplatné · dvadsaťčlenné war roomy · šesťtýždňové jednorazové POC
№ 01 · Služby

Štyri oblasti.
Rovnaký architekt vo všetkých štyroch.

Staviame firmám AI systémy na mieru: softvér, ktorý sa nedá kúpiť hotový. Automatizujeme manuálnu, opakujúcu sa prácu. A keď žiadny existujúci produkt nesadne na to, ako firma funguje, postavíme softvér, ktorý sadne. Každú zákazku vedie jeden architekt od prvého hovoru po odovzdanie.

Mimo ponuky: horizontálne SaaS predplatné, dvadsaťčlenné war roomy a šesťtýždňové jednorazové POC.

  1. 01

    AI systémy na mieru

    Staviame AI systémy, ktoré pracujú s vašimi vlastnými dátami a bežia v produkcii.

    Je to softvér, ktorý pracuje s vašimi vlastnými údajmi: objednávky, ceny, produkty, história. Nečerpá z verejného internetu, takže odpovede sedia na vaše podnikanie. Napríklad obchodník sa spýta bežnou rečou: „Čo si tento zákazník kúpil minulý štvrťrok a akú má dohodnutú cenu?“ a hneď dostane odpoveď, namiesto hľadania v starom ERP. Nahrádza každodenné dohľadávanie toho, čo firma už dávno vie, a beží v bežnej prevádzke na vašich systémoch, nie ako ukážka.

    Hybridný retrieval (BM25 + husté embeddingy Voyage-3, Cohere rerank-3 na top-50) nad vaším vlastným korpusom. Cohere rerank je voliteľný a pri striktne suverénnych korpusoch nahrádza Voyage-3 lokálny BGE-M3. Agenty pracujúce cez servery Model Context Protocol (MCP) s typovanými kontraktmi. Privátna inferencia na open-weight modeloch (Mistral Small 3.2 / Qwen 3, Apache-2.0) tam, kde sú dáta príliš citlivé na to, aby opustili budovu. Gold set s 50–600 promptmi stráži každý prompt route cez Promptfoo CI. Červený eval blokuje merge. ADR pri zásadných rozhodnutiach. Každé volanie nesie plný OpenTelemetry trace. Cutover na ceste s otestovaným rollbackom: ak tieňová prevádzka označí regresiu, neprepneme.

    Stack
    • Hybrid retrieval · BM25 + Voyage-3
    • Tool-using agents · MCP
    • Eval harness · CI-gated
    • Local + hosted routing
  2. 02

    Automatizácia procesov

    Opakujúca sa, pravidlami daná práca: kontrola dokumentov, extrakcia dát, generovanie reportov. Prenesená na softvér, pričom ľudia zostávajú pri výnimkách.

    Prácu, ktorú váš tím opakuje každý deň rovnako, presunieme na softvér a ľudia zostanú pri prípadoch, ktoré si vyžadujú rozhodnutie. Napríklad namiesto toho, aby nákupca každé ráno kontroloval každú skladovú položku (čo sa predalo, čo doobjednať), systém sa učí z predošlých objednávok, predpovedá dopyt a pripraví objednávku. Nastavíte ho raz a potom vás upozorní len na výnimky, napríklad náhly výkyv alebo zmenu ceny od dodávateľa. Rutina sa tak vybaví sama a čas vášho tímu ide na rozhodovanie, nie na prepisovanie údajov.

    Kontrola dokumentov, extrakcia dát, generovanie reportov, kvalifikácia leadov: práca, ktorou váš analytik trávi 30 hodín týždenne. Agenty a n8n workflowy preberú rutinu; človek rieši okrajové prípady. Pri úlohách, ktoré na to sadnú, klesne čas na úlohu zo 40 minút na 4 minúty. Takých úloh je málo a pomenujeme ich: kontrola štruktúrovaných dokumentov, extrakcia polí zo zmlúv, triedenie leadov podľa pevnej schémy. Prínos si v každej zákazke najprv zmeriame, až potom sľúbime konkrétne číslo. Nie každý workflow na to sadne a na prvom hovore vám povieme, ktoré z vašich nie. Ak prínos nevieme zmerať, build neúčtujeme.

    Stack
    • n8n · queues
    • Pydantic AI agents
    • Webhooks · CRON
  3. 03

    Softvér a platformy na mieru

    Softvér na mieru pre procesy, na ktoré žiadny hotový produkt nesadne. Vlastníte to, čo postavíme.

    Keď žiadny produkt na trhu nesedí na to, ako naozaj pracujete, alebo ten, čo máte, sa používa ťažko, postavíme softvér podľa vášho procesu, namiesto toho, aby sme váš proces prispôsobovali všeobecnému nástroju. Napríklad starý ERP, ktorý nikto nechce otvárať, pokojne necháte tak a navrch postavíme prehľadné používateľské rozhranie: vaši ľudia pracujú v softvéri spravenom pre nich, kým on na pozadí číta a zapisuje do ERP. To, čo postavíme, je úplne vaše: žiadne predplatné za používateľa, žiadny dodávateľ, ktorý vám určuje smerovanie.

    Kompletný vývoj produktu pre klientov, ktorým hotový SaaS nesedí. Multi-tenant model, fakturácia, RBAC, audit log, admin konzola. Vrstvy, ktoré si tímy zvyčajne dorábajú až okolo Series A.

    Stack
    • Postgres RLS · per-tenant
    • Stripe · automatic_tax
    • RBAC + audit log
  4. 04

    Inžinierstvo a infraštruktúra

    Backend, frontend a infraštruktúra, na ktorých systémy vyššie bežia, na konci odovzdané vášmu tímu.

    Toto je základ, na ktorom bežia tri veci nad tým: servery, databázy a aplikácie. Staviame ho tak, aby vydržal skutočnú prevádzku, nielen ukážku. Napríklad údaje o objednávkach a nové rozhranie zostanú rýchle a dostupné aj počas najrušnejších dní v sezóne, vaše dáta sú v EÚ a váš vlastný tím vie kód čítať a udržiavať aj po tom, čo odídeme. Dostanete funkčný systém odovzdaný aj s kľúčmi, nie čiernu skrinku, pri ktorej ste odkázaní na nás.

    Full-stack dodávka: tRPC kontrakty so Zod validáciou, Postgres s row-level security, HMAC-overené webhooky, React web + React Native mobile. Cloudflare na edge. Budget na prvý bajt: pod 50 ms naprieč EÚ na statických a API routách s teplou cache; routy obsluhované modelom sú gateované samostatne na p95 < 600 ms TTFT (pozri stack). Dáta zostávajú v EÚ regiónoch (Supabase Frankfurt alebo vaše vlastné servery).

    Stack
    • TypeScript
    • Postgres
    • Cloudflare Workers
№ 02 · Prax

Ten riadok kódu je len začiatok. Produkčné AI je všetko ostatné okolo neho:

Retrieval ukotvený vo vašich vlastných dátach. Typované kontrakty, ktoré prežijú zmenu schémy. Evaly, ktoré o tri sprinty zachytia tichú regresiu vernosti alebo odmietnutia a zablokujú merge. Dashboard, ktorý si váš DPO prečíta bez našej pomoci. On-call, ktorý o tretej ráno zavolá správneho človeka. Model sám o sebe je tá ľahšia časť: držíme ho vymeniteľný, lebo kontrakt okolo neho sa nehýbe.

Princíp 01
Hlavný architekt vedie projekt od kick-offu po on-call a píše ADR za každým nosným rozhodnutím. Keď si rozsah pýta druhú hlavu, seniorný tím sa pripojí. Projekt nepreberá.
Artefakt
ADR · /docs/adr/NN.md
Princíp 02
Citlivé prompty bežia lokálne na open-weight modeloch. Zvyšok sa smeruje na Claude (Opus 4.8 pre uvažovanie, Sonnet 4.6 pre priepustnosť, Haiku 4.5 pre rutinné cesty) alebo rodinu GPT-5; politiku podpisujete vy. Každé volanie je zalogované s modelom, politikou, retrieval setom a nákladom: rozhodnutie o smerovaní je auditovateľné, netreba ho brať na slovo.
Artefakt
routing.policy.yaml · podpísané v 1. týždni
Princíp 03
Po našom odchode systém prevádzkuje váš tím. To znamená ADR priamo v repe, eval harness zapojený do vašej CI, registry s rollbackom, ktorý je zdokumentovaný aj otestovaný, runbook písaný proti reálnym incidentom (nie vymysleným) a tridsať dní on-callu, ktorý nesieme spolu s vami. Ak vám systém nevieme odovzdať bez zádrhelov, nedokončili sme prácu.
Artefakt
runbook.md · 30 dní on-callu
Naživo · revízna slučka

Každý systém, ktorý dodáme, prejde revíznou slučkou. Prešla ňou aj táto stránka.

Spustite ju a prejde stránkou, ktorú práve čítate. Každý prechod vyberie inú sadu kontrol a každá z nich je už v tom, čo vidíte, vyriešená.

Revízia hotová · 4 z 54 kontrol
  1. Výkonthree.js · ~1,18 MB odložené

    3D scéna v hero sekcii (three.js, ~1,18 MB) sa načítala skôr, než sa stihol vykresliť nadpis.

    VyriešenéRozdelili sme kód. Text sa vykreslí prvý, guľa sa doplní až potom.

  2. PrístupnosťWAI-ARIA · aria-hidden

    Diagram architektúry je dekoratívny, no čítačka obrazovky ohlasovala každý uzol ako obsah.

    VyriešenéOznačili sme ho ako aria-hidden. Názvy vrstiev žijú v texte, nie v geometrii.

  3. Pohybprefers-reduced-motion

    Animácie odhalenia aj rotujúca guľa ignorovali prefers-reduced-motion.

    VyriešenéTeraz ho rešpektujú obe. Stránka sa vykreslí ustálená a guľa stojí.

  4. Regresia layoutuposun 328px · zachytené pri 1920 · trieda strážená

    Oprava z predošlého kola pridala druhú position triedu na lištu, ktorá už bola fixed. Kaskáda rozhodla proti zámeru a hero sekciu odsunula o 328 pixelov nadol na širokých obrazovkách. Do produkcie sa to dostalo; zachytila to až ručná kontrola pri šírke 1920.

    VyriešenéDuplicitnú triedu sme odstránili. Audit odteraz zlyhá pri každom class stringu s dvoma position utilitami, takže celá trieda chýb je zamknutá.

Veci, ktoré väčšina stránok bežne nasadí a nevšimne si ich. Celá sada kontrol beží pri každom zostavení tejto stránky. Každá oprava nižšie je reálny kód v tomto repozitári.

№ 03 · Vybrané projekty

Päť projektov.
Tri môžeme ukázať.

Rovnaký architekt na každom projekte, od kick-offu po odovzdanie. Každý build stojí na rovnakom základe: typované kontrakty (tRPC + Zod), eval sada s 50–600 promptami zapojená do CI (Promptfoo / Inspect AI) a OpenTelemetry traces od edge po model.

01Live · Beží v produkcii

ElektrikPro

Field-service SaaS pre slovenských elektrikárov · prevádzkovaný spoločne s M.Z.CONNECT s.r.o., firmou elektrikára z praxe · platiaci zákazníci

Náš vlastný vertikálny SaaS pre slovenských elektrikárov: evidencia zákaziek, fakturácia, objednávanie materiálu. Spoluzaložený s elektrikárom z praxe, ktorý ten workflow denne robí, beží v produkcii s platiacimi zákazníkmi. Architektonické vzory sú tie isté, aké používame aj na klientskych projektoch: jeme z vlastnej kuchyne.

TypeScriptPostgresStripeMobileCloudflare
02Dodané · Beží v produkcii

B2B distribučný operátor · CEE

Softvér na cenové ponuky a nákup na mieru, so suverénnou lokálnou AI navrchu.

Deterministický engine rieši cenotvorbu a nákup — najlepšia cena naprieč dodávateľmi, upraviteľné marže, termíny naskladnenia, objednávanie podľa dopytu. Navrch lokálna AI postavená na vlastných dátach firmy a bežiaca na ich hardvéri: odhaľuje trendy, doladuje systém v bežnej reči, reportuje denne a odpovedá na otázky tímu. Cloud sa dotkne len necitlivej tvorby textu.

RAGLocal inferenceOn-premDeterministic coreClaude Sonnet
03Interný R&D · Sebrona testbed

JARVIS · interný R&D

Vlastná 24/7 privátna AI infraštruktúra zakladateľa

Privátna AI infraštruktúra, ktorú zakladateľ prevádzkuje na vlastnom hardvéri: hlas a chat cez Mac, iPhone a Telegram, napojené na kalendár, mail, správy, denník, zdravie a akúkoľvek aplikáciu, ktorú má práve na obrazovke. Zároveň miesto, kde si odladíme architektonické vzory skôr, než idú ku klientom.

VoiceLocal-firstMCP24/7Founder-run
04Dodané · NDA

AI pilot pre verejný sektor v EÚ

Privátna inferencia, default-deny prístup k dátam, plný audit trail

AI workflow na spracovanie dokumentov pre klienta, ktorý nesmie posielať dáta do modelov hostovaných v USA. Hybridný retrieval nad ~40 000 dokumentmi (BM25 + Voyage-3 dense, Cohere rerank-3 na top-50), sumarizácia na kvantizovanom open-weight modeli on-prem. Necitlivé prompty idú do modelu hostovaného v EÚ regióne cez vrstvu politiky, ktorú klient odsúhlasil. Eval harness: faithfulness, presnosť citácií, korektnosť odmietnutí, postavený na 600-položkovom gold sete s doménovými recenzentmi klienta. Default-deny na každej hranici, plný audit trail streamovaný do ich SIEM. Meno klienta pod NDA.

RETRIEVAL
Hybridný · 40k dokumentov
EVAL SET
600 položiek · expertný review
INFERENCIA
Mistral / Qwen · Q4_K_M–Q8 · on-prem GPU
AUDIT
Default-deny · SIEM stream
Local inferenceDefault-denyEU-regionAudit
05Vo vývoji · 2026

Európsky venue operátor · pred spustením

Rezervácie, majetok, reporty: podľa toho, ako prevádzka reálne funguje.

Operačná platforma šitá na mieru pre prevádzkovateľa s veľkým podielom hmotného majetku, ktorému horizontálne SaaS riešenie nesadne. Rezervácie, správa majetku, reporting. Stavané podľa toho, ako tím reálne pracuje dnes, nie podľa toho, ako si jeho prácu predstavuje Mews alebo Lightspeed. Šesťmesačná fáza pred spustením, tri interné kohorty používateľov pred verejným otvorením. Meno klienta pod NDA.

PRED-LAUNCH
6 mesiacov · 3 interné kohorty
DOMÉNA
Rezervácie · majetok · reporting
STAVANÉ PRE
Asset-heavy ops · nie horizontálny SaaS
OTVORENIE
Q4 2026 · postupné
BookingsAsset mgmtMulti-tenantCustom
№ 04 · Ako prebieha projekt

Päť fáz. Pevnú cenu poznáte do konca prvého týždňa.

Každý projekt prechádza tými istými piatimi fázami. Vopred si objednávate iba prvý týždeň. V piatok toho týždňa máte na stole ponuku s pevným rozsahom a cenou, alebo, ak projekt nedáva zmysel, čestnú odpoveď, ktorá vám to povie.

  1. 01

    Diagnostický týždeň

    5 dní

    Na mieste alebo na diaľku. Prečítame si kódovú bázu a dáta, spoznáme tím. Týždeň končí písomným architektonickým briefom a ponukou s pevným rozsahom.

  2. 02

    Architektonický spec

    1–2 týždne

    Odsúhlasený dizajn: dátový model, smerovanie inferencie, plán evalov, integračné kontrakty, on-call runbook. Váš tím má možnosť pripomienkovať skôr, než sa napíše prvý riadok kódu.

  3. 03

    Build sprint

    4–10 týždňov

    Samotný build. Pracujeme priamo vo vašom repozitári od prvého dňa. Týždenné demá voči špecifikácii. Hlavný architekt kóduje až do nasadenia; seniorní inžinieri sa pridajú, keď to rozsah vyžaduje. Nestane sa, že v šiestom týždni dostanete juniora.

  4. 04

    Eval & cutover

    1–2 týždne

    Eval harness beží na produkčných dátach. Tieňová prevádzka, potom čiastočný cutover, potom plný. Rollback je zdokumentovaný a otestovaný ešte pred prepnutím.

  5. 05

    On-call odovzdanie

    30 dní, v cene

    Prvý mesiac po prepnutí držíme on-call rotáciu my. Potom čisté odovzdanie vášmu tímu: runbook, dashboardy, eskalačná politika, šablóna post-mortemu.

Anti-vzory
  • Žiadne odovzdanie juniorom
  • Žiadny upsell na ‚optimalizáciu‘ v šiestej fáze
  • Žiadny drift do time-and-materials
Spolu
7–15týždňovod diagnostického týždňa po on-call odovzdanie
Zmluva v EURpevný rozsah alebo T&M

Cenové pásma nepublikujeme, lebo každý projekt začína diagnostickým týždňom s pevnou cenou: jediné číslo, na ktorom záleží, je to v ponuke, ktorú dostanete v piatok prvého týždňa.

Kedy Sebrona, kedy nie
01

Sebrona je správna voľba, keď

  • Potrebujete produkčné AI v rámci EÚ dátovej hranice.
  • Chcete jedného architekta až po cutover, nie šesťčlennú staff-aug rotáciu.
  • Systém nahradí proces, na ktorý ste predtým zamestnávali ľudí.
02

Sebrona je zlá voľba, keď

  • Chcete horizontálne SaaS predplatné? Kúpte si Copilot alebo ChatGPT Enterprise.
  • Chcete dvadsať inžinierov vo war roome? Zavolajte Big 4.
  • Projekt je POC, ktorý za šesť týždňov zahodíte? Nestrácajme spoločne čas.
№ 05 · Stanovisko

Suverénne v základe

Vaše dáta nesmú opustiť vašu jurisdikciu bez vášho výslovného súhlasu.

Európske firmy, verejný sektor a regulované odvetvia prestali akceptovať „pošli všetko na US server a ver nám“ ako architektúru. Staviame systémy, ktoré bežia tam, kde vaše dáta už sú: on-prem, v EÚ regióne, na privátnom inference endpointe. Štyri defaulty dostanete v každom builde, nie ako spoplatnený enterprise tier: default-deny dátové politiky, lokálna inferencia pre citlivé prompty, plný audit trail s verziou modelu a routing policy na každom volaní, a sídlo dát v EÚ od začiatku do konca.

Body uloženia
  • Dublin
  • CF EU
  • Frankfurt
  • Supabase
  • Bratislava
  • Kancelária
  • On-prem
  • Vaše racky
Dáta zostávajú tam, kde sú. Región vyberáte vy, my len staviame.
Súladové rámce
  • GDPR
  • ČL. 32 · BEZPEČNOSŤ
  • AI ACT
  • ČL. 9 · RIZIKÁ
  • NIS2
  • ČL. 21 · KYBER
Rámce, na ktoré sa odvolávame v architektonickom briefe: nie odznaky, citácie.
Prečítajte si podmienkyDPAOchrana údajov
Postoj 01

Local-first inferencia tam, kde to dáva zmysel.

Citlivé prompty bežia na open-weight modeloch na vašom hardvéri. Zvyšok môže ísť na Claude (Opus 4.8 / Sonnet 4.6 / Haiku 4.5) alebo rodinu GPT-5: vaše rozhodnutie, zapísané do politiky, ktorú vlastníte. Každý trace ukáže, ktorý prompt skončil na ktorom modeli a prečo.

Postoj 02

Audit pri každom volaní.

Prompty, retrievaly, volania nástrojov aj výstupy logujeme s verziou modelu, politikou smerovania, pôvodom dát, počtom tokenov a nákladom. Stream tečie priamo do vášho SIEM. Audit zvládne váš DPO bez našej asistencie.

Postoj 03

Naše regióny, alebo vaše regióny.

Cloudflare s EU Data Boundary, Supabase Frankfurt alebo váš vlastný hardvér vo vašich rackoch. Sebrona s.r.o. (Bratislava) drží každú zmluvu; žiadny americký dodávateľ nám neplatí províziu za odporúčanie.

Trade-off, ktorý pomenujeme nahlas
Open-weight modely stále zaostávajú za špičkou v ťažšom uvažovaní a dlhodobom plánovaní. Za suverenitu sa platí v investícii do GPU, prevádzkovej záťaži a slabšej odpovedi na tých pár percent najťažších promptov. Tam, kde to bolí, smerujeme konkrétne prompty na hostovaný model. S explicitným súhlasom. S redakčným krokom, ktorý maskuje citlivé polia. V špecifikácii presne píšeme, ktoré to sú. Volíme suverenitu ako default. Bez ideológie.
№ 06 · Referenčná architektúra

Šesť vrstiev. Jeden stack, ktorý sa nehýbe, keď sa hýbe model.

Zrozumiteľne povedané: všetkých šesť vrstiev stavia a vlastní jeden tím. Keď sa zmení model alebo dodávateľ, váš systém beží ďalej, bez prestavby a bez naháňania opráv u viacerých dodávateľov.

Defaulty, ktoré obhájime na každej vrstve: zvolené vedome, zdokumentované v ADR, s ktorým sa môžete hádať. Všetkých šesť vrstiev staviame pod jednou strechou. Žiadny externý frontend, žiadna dátová vrstva u zahraničného dodávateľa. Ktorúkoľvek bunku viete vymeniť za nástroj, ktorý už váš tím prevádzkuje: kontrakty nad ňou aj pod ňou sa nehýbu.

Stack je vyhranený. Ak už používate iný orchestračný framework alebo dátovú vrstvu mimo Postgresu, prevezmeme vašu voľbu a v špecifikácii to napíšeme. Disciplína v evaloch, registry a observabilite však neustúpi.

  1. L5
    Rozhranie

    Viditeľné rozhranie: chat, dashboardy, embedy, widget, ktorý spoznáva váš kupujúci.

    Web · React/TS
    Mobile · React Native
    Chat · copilot
    Dashboards · embeds

    React + TypeScript pre web, React Native pre mobilných klientov. Component primitives sú zdieľané naprieč oboma povrchmi: design systém nedubľujeme.

  2. L4
    API brána

    Autentizácia, rate limity, tvarovanie requestov. Šev medzi verejným webom a modelovou vrstvou.

    tRPC + Zod
    REST · OpenAPI
    Webhooks
    Auth · RLS

    tRPC + Zod je východisko: jeden kontrakt z DB riadku až do React propu. K REST-u prejdeme vtedy, keď externý spotrebiteľ potrebuje OpenAPI; disciplína validácie je v oboch prípadoch rovnaká.

  3. L3
    Orchestrácia

    Workflow grafy a agentné slučky. Retry, fallbacky, politiky, ktoré prežijú kontakt s používateľmi.

    LangGraph · MCP servers
    LiteLLM router · policy YAML
    Langfuse · Promptfoo
    n8n · queues

    LangGraph pre stavové agentné toky, ktoré vedieme od špecifikácie po cutover; LiteLLM ako router za routing.policy.yaml, odsúhlaseným v prvom týždni. Nástrojové povrchy štandardizujeme cez Model Context Protocol: rovnaký server kontrakt pre Claude, lokálne modely aj IDE. n8n za frontou pre automatizácie smerujúce k analytikom, ktoré si klient bude sám upravovať. Langfuse pre observabilitu na úrovni trace a diffov verzií promptov; Promptfoo ako brána v CI. Eval harness a registry promptov aj modelov žijú v tejto vrstve, nie ako dodatok.

  4. L2
    Modelová vrstva

    Router medzi providermi. Prompty pod version control, eval harness, ktorý beží na každom pushi.

    Claude Opus 4.8 · Sonnet 4.6 · Haiku 4.5
    Mistral Small 3.2 · Qwen 3 (Apache 2.0)
    Cohere rerank-3
    Voyage-3 · BGE-M3

    Routing policy rozhoduje, ktorý model vidí ktorý prompt. Hostovaná špička vtedy, keď je reasoning náročný a dáta nie sú citlivé; lokálny open-weight tam, kde má prednosť suverenita: za cenu investície do GPU a reálnej medzery pri tých najťažších promptoch.

  5. L1
    Dáta

    Postgres, pgvector, object storage. Ingestion pipelines, ktoré kŕmia každý prompt a retrieval.

    Postgres
    pgvector
    Object store
    Event stream

    Jedna databáza, kým nedokážeme, že potrebujeme dve. pgvector drží retrieval pri riadku, ktorý ho ukotvuje; k dedikovanému vector store sa pohneme až vtedy, keď nás k tomu donúti škála, a napíšeme ADR, ktoré vysvetlí prečo.

  6. L0
    Infraštruktúra

    EÚ dátová hranica v základe. On-prem, keď to vyžaduje regulátor. Secrets v KMS, SLO odsúhlasené v prvom týždni.

    Cloudflare · EU
    Supabase · Frankfurt
    OTel + SLOs
    Vault · KMS

    EÚ dátová hranica v základe, on-prem vtedy, keď to vyžaduje regulátor. Secrets v KMS, nikdy nie v env súboroch. SLO a error budgety odsúhlasené v prvom týždni: čo nemeriame, to neúčtujeme.

  7. CELÝ STACK
    Šesť vrstiev, jeden systém

    Všetkých šesť vrstiev beží v produkcii naraz. Typové kontrakty držia naprieč švami; eval harness drží kontrolu nad každou cestou.

    Type contracts
    Eval harness
    OTel + audit log
    EU sovereignty
    On-prem option
    Versioned · IaC

    Každý šev je kontrakt. Keď sa jeden zlomí, eval gate vystrelí na vrstve, čo to spôsobila, nie na používateľovi.

    Prejdite myšou · stack ožije naraz

↑ dáta tečú nahor · ↓ requesty tečú nadol · BUDGET hodnoty sú záväzky eval gate, nie historické SLO. Namerané čísla žijú v ADR každého projektu.

Disciplína

Čo platí naprieč všetkými vrstvami

KONTRAKTY
tRPC + Zod, generované
EVAL HARNESS
Bránený CI, každý route
DÁTOVÁ POLITIKA
Default-deny + egress allowlist
OBSERVABILITA
OTel traces + logy + metriky
№ 07 · Základ buildu

Na čom v každom builde nezľavíme.

  • Typová bezpečnosť od kraja po kraj: tRPC kontrakty, Zod validácia na každej hranici, generovaní klienti, žiadny netypovaný JSON cez sieťový hop.
  • Eval harness na každom prompt route, zapojený do CI cez Promptfoo / Inspect AI na per-route gold setoch dimenzovaných na blast radius routu (50–600 promptov) pre faithfulness, groundedness, korektnosť odmietnutí, odolnosť voči jailbreaku, nákladový strop a latency budget na p95: pass thresholdy žijú v ADR daného routu (faithfulness ≥ 90 · groundedness ≥ 90 · korektnosť odmietnutí ≥ 95 · detekcia regresie p95 < 5 %) a červený build blokuje merge.
  • Registry promptov aj modelov pripína každý prompt aj route na verziu, s rollbackom jedným príkazom a A/B aj tieňovou prevádzkou v základe.
  • OpenTelemetry traces od edge po model a späť: jeden trace na akciu používateľa, retrievaly a volania nástrojov ako spany, token a náklad ako atribúty spanu.
  • Default-deny dátové politiky: maskovanie PII na hranici, egress allowlist na sieťovom kraji, secrets v KMS, nikdy v env súboroch.
  • ADR priamo v repe za každým nosným rozhodnutím, takže si nový inžinier prečíta desať súborov a chápe, prečo má systém tento tvar.
  • Z preview do main na Cloudflare Pages za necelých šesť minút, rollback je `git revert` a databázové migrácie sú reverzibilné, inak nejdú.
agent.ts · referenčný vzorTypeScript
1// reference pattern (pseudocode, not a published SDK)
2import { agent, tool, eval } from '@sebrona/core'
3import { z } from 'zod'
4 
5export const triageAgent = agent({
6 model: 'claude-opus-4-8',
7 policy: 'default-deny',
8 retrieval: { store: 'pgvector', dense: 'voyage-3', lexical: 'bm25', rerank: 'rerank-3', topK: 8 },
9 tools: [searchDocs, openTicket, notifyOps],
10 guardrails: [pii.redact, eval.faithfulness(0.90)],
11 observability: { otel: true, traces: 'always' },
12})
13 
14// → typed end-to-end · eval'd on every prompt · observable by default
$

Staviame všetko okolo modelu.

№ 08 · Kancelária
Miroslav Striško — Bratislava · 2026
Miroslav Striško
Sebrona s.r.o.
IČO 57 639 272
Budatínska 3230/16A · 851 06 Petržalka
Bratislava · EST. 2026

Na zmluve jedno meno. V commit logu to isté.

Jeden architekt. Dva až tri projekty za kvartál. Prvá odpoveď do dvadsiatich štyroch hodín a váš tím má repozitár v rukách už v prvom týždni.

Sedemnásť rokov enterprise technológie kupoval, teraz ich stavia. Najprv desať rokov na finančných trhoch: exekúcia a riadenie rizík, tá nudnejšia časť. Potom sedem rokov v B2B tech distribúcii, kde viedol seniorný exportný tím s pokrytím EÚ. V roku 2024 začal stavať systémy, ktoré dovtedy sedemnásť rokov len kupoval. Prvé zákazky sú staršie ako samotná firma: dodal ich ešte pred založením s.r.o. v roku 2026 a do Sebrony prešli spolu s ním.

Sebrona dodáva dva vlastné produkty. ElektrikPro: spoluzaložený s elektrikárom z praxe, ktorý ten workflow denne robí, s platiacimi zákazníkmi v produkcii. JARVIS: privátny 24/7 AI stack zakladateľa a testovacie pole, kde sa architektonické vzory osvedčia, kým idú ku klientskemu projektu. Seniorný tím sa pridáva vtedy, keď si rozsah naozaj žiada druhú hlavu, ani o týždeň skôr. Celý log nasadení je na sebrona.sk/changelog. Aktuálne poznámky z terénu na sebrona.sk/blog.

Kapacita · 12 týždňov
TerazObsadenéVoľné
Najbližšie voľno · 5. týždeň · diagnostický týždeň
Na stole
  • Venue operator · build sprint · 5. týždeň z 8 · demo pre kohortu 2 v piatok.
  • Diagnostický týždeň · CEE priemyselná skupina · písomný brief a ponuka v piatok.
  • Architektonický spec · sovereign RAG pilot · routing policy v právnom review.
№ 09 · Kontakt

Prvý hovor je zadarmo.

Príďte s niečím, čo chcete postaviť, alebo s projektom, ktorý sa zasekol. Hovor zdvihne architekt. Prvých tridsať minút je zadarmo, a ak nie je čo stavať, povieme vám to ešte pred koncom toho polhodinového hovoru.

Pred prvým hovorom
  • Systém, ktorý chcete postaviť, alebo ktorý sa zasekol
  • Dáta, ktoré sa ho dotknú: regióny, objemy, citlivosť
  • Kto u vás nesie zodpovednosť za výsledok
  • Termín, ak nejaký existuje
Prvá odpoveď·Do 24 hodín · od architekta · nie BDR
Engagement·Diagnostický týždeň s pevnou cenou · potom pevný rozsah alebo T&M · zmluva v EUR