15 maggio 2026 · 6 min lettura · Daniel Levis

Come misurare il ROI di un agente IA, framework + baseline che funzionano

Senza baseline, ogni claim 'l'AI ci ha fatto risparmiare X ore' è un'opinione. Il framework che usiamo con i clienti Soraia per misurare ROI con onestà.

La domanda più importante che fa un CEO prima di firmare un sprint AI non è “quanto costa”, è “come saprò che funziona”.

E qui la maggior parte degli AI integrator scappa, perché misurare ROI di un agente è difficile se non hai messo le fondamenta giuste prima.

Questo è il framework che usiamo in Soraia per ogni sprint. Quattro pezzi: baseline, perimetro, metric, finestra.

1. La baseline che NON funziona

“I miei recruiter passano metà del tempo a leggere CV.”, questa NON è una baseline.

È un’opinione raccontata in riunione. Non è misurata. Non è ripetibile. Non è confutabile.

Una baseline reale richiede:

Tempo cronometrato su un sample di 10-20 task reali
Distribuzione del tempo tra fasi (lettura, valutazione, data entry)
Outcome misurato (CV scartati / promossi / errori segnalati)

Questa l’abbiamo fatta su 8-12 clienti di Soraia. Costa una settimana. Sblocca tutto.

2. Il perimetro chiaro

L’agente fa una cosa, non tutte. Definisci:

Cosa è dentro lo scope: es. “screening CV inbound da Bullhorn”
Cosa è fuori: es. “no executive search (richiede senior touch)”, “no candidati referenziati”
Quali eccezioni gestisce l’agente vs quali escalation a umano

Sembra ovvio. Non lo è. Il 70% dei progetti AI falliscono perché lo scope diventa elastico.

3. Il metric primario (uno solo)

Un solo metric primario per sprint. Tutto il resto è secondario.

Esempi reali Soraia:

Recruitment: ore/recruiter/settimana recuperate su screening
Accounting: % fatture processate senza intervento umano
Customer Support: first-response-time in minuti

Multipli metric = nessun metric. Scegli uno, misura prima e dopo, decidi se ha funzionato.

4. La finestra di misurazione

Pre-sprint (1 settimana): baseline cronometrata
Settimana 1 dopo deploy: shadow mode, l’agente lavora ma umano controlla
Settimana 2-4: live, con escalation
30 giorni di hypercare: finestra reale per la misurazione finale

Misurare prima del 30° giorno = misurare il rumore. La curva di adoption ha bisogno di tempo per stabilizzarsi.

La garanzia che ne discende

Quando i 4 pezzi sopra sono chiari, puoi promettere ROI in modo concreto. Ed è esattamente quello che facciamo con la garanzia “ore recuperate o rimborso”: il target del metric primario è scritto nel contratto, misurato sulla baseline definita insieme, valutato a 30gg dal go-live.

Se non raggiungiamo il target, lavoriamo gratis o rimborsiamo lo sprint. Non perché siamo eroici, perché abbiamo costruito il sistema di misurazione che lo rende verificabile.

Vuoi vedere come funziona sul tuo caso? Fai il check-up (3 minuti, no email) o parlami direttamente.

ai agentsroimetricsmethodology

Continua a leggere

24 luglio 2026 · 8 min

Dati aziendali pronti per un agente IA? La checklist

Prima di spendere un euro in automazione: la checklist di data readiness (fonti, dedupe, permessi, ground truth) che decide se un agente IA funziona.

22 luglio 2026 · 7 min

Registro sistemi AI aziendale: template entro agosto 2026

Come costruire il registro dei sistemi IA che l'AI Act ti chiede entro agosto 2026: template, classificazione del rischio e primo passo operativo per COO e DPO.

Prossimo passo

Dove sei nel percorso AI?

Il check-up ti dà un punteggio di prontezza IA (0-100) + 3 next-step concreti. 3 minuti, no email.

Inizia il check-up Parliamone direttamente