Agenți AI
Guardrails, prag de confidence, audit log, kill switch. By default.
Siguranța nu e un patch ulterior — e cum construim agentul de la prima linie de cod.

Pe scurt
Un agent autonom sigur are: drepturi minime pe credențiale, prag de confidence sub care escaladează la om, audit log imutabil pentru fiecare acțiune, mod „shadow" în care propune fără să execute, plus kill switch global. Trecerea la autonomie completă se face gradual, pe baza datelor — nu pe încredere oarbă.
- Least privilege pe credențialele agentului
- Prag de confidence configurabil pe acțiune
- Audit log imutabil, complet, queryable
- Mod shadow → human-in-the-loop → autonomie graduală
Cele 5 straturi de siguranță, by default
În fiecare implementare punem din start:
- Credențiale dedicate cu drepturi minime (nu „admin")
- Acțiuni permise definite explicit (allowlist, nu blocklist)
- Prag de confidence — sub el, escaladează la om
- Audit log imutabil pentru fiecare decizie și acțiune
- Kill switch global + posibilitatea de rollback pe acțiuni reversibile
Cum trecem treptat la autonomie
Săptămâna 1–2: shadow mode (agentul propune, omul decide pe tot). Săptămâna 3–4: human-in-the-loop pe acțiuni cu impact, autonom pe restul. Săptămâna 5+: extindere graduală a autonomiei, doar acolo unde acuratețea măsurată o justifică. Nimic „pe încredere" — totul pe date.
Ce facem când agentul greșește
Greșelile sunt așteptate, nu surprize. Audit log-ul permite analiza rapidă a cauzei, rollback acolo unde e posibil, ajustare a pragurilor și retraining pe cazul respectiv. Cultura noastră: greșeala devine input, nu blame.