Benchmark di qualità dei dati Salesforce per gli agenti AI
I benchmark di qualità dei dati Salesforce sono le soglie di punteggio che un’org dovrebbe raggiungere — per metrica, su ogni oggetto letto da un agente AI — prima del go-live di Agentforce: 85%+ di completezza, 90%+ di conformità e validità, meno dell’1% di esposizione PII. Ecco ogni numero, con il ragionamento che lo sostiene.
Dal team AgentforceSense · Ultimo aggiornamento: 12 giugno 2026
La tabella dei benchmark
I target di lancio consigliati per le sei dimensioni della qualità dei dati Agentforce, misurati sugli oggetti e sui campi che i tuoi agenti leggeranno davvero — non sulla media dell’org, che nasconde proprio i problemi che riaffiorano nelle risposte degli agenti.
| Metrica | Benchmark di lancio | Cosa misura |
|---|---|---|
| Tasso di completezza | 85%+ | Quota di campi chiave compilati sugli oggetti letti dagli agenti. |
| Tasso di conformità | 90%+ | Quota di valori di picklist e riferimenti conformi a un unico standard approvato. |
| Tasso di validità | 90%+ | Quota di campi strutturati (email, telefoni, ID) che superano le regole di formato. |
| Tasso di attualità | la tua finestra | Quota di record sensibili alle date aggiornati entro la finestra di freschezza che hai definito. |
| Tasso di duplicati | basso, in calo | Quota di record sugli oggetti letti dagli agenti con un probabile duplicato. |
| Tasso di esposizione PII | < 1% | Quota di record scansionati con una corrispondenza a un pattern PII nel testo libero. |
Perché il benchmark di completezza è 85% e non 100%?
Perché inseguire l’ultimo 15% ha rendimenti decrescenti molto ripidi. Una parte dei vuoti è legittima — campi facoltativi, record precedenti a un processo, oggetti in cui un valore semplicemente non si applica. Con 85%+ sui campi chiave, un agente ha quasi sempre contesto sufficiente per rispondere in modo specifico anziché generico. Sotto quella soglia, le risposte vaghe smettono di essere casi limite e diventano il marchio di fabbrica dell’agente. Investi lo sforzo rimanente su coerenza e PII: quando falliscono, fanno molto più rumore.
Perché conformità e validità richiedono il 90%?
I valori incoerenti e non validi non si limitano a indebolire le risposte — creano contraddizioni. Quando “US”, “USA” e “United States” convivono, un agente può dare tre risposte diverse alla stessa domanda, e il retrieval può perdere record filtrati per valore. Email e ID non validi vengono citati ai clienti alla lettera. Questi errori sono visibili agli utenti al primo record difettoso che incontrano: ecco perché l’asticella è più alta di quella della completezza.
Perché l’esposizione PII deve restare sotto l’1%?
Perché le PII sono l’unica metrica in cui un singolo record può diventare un incidente. Un SSN incollato nel commento di un Case può riaffiorare in una risposta dell’agente, e a quel punto il problema è normativo, non estetico. Sotto l’1% è un tetto operativo per l’approvazione al lancio, non un traguardo — l’obiettivo è zero segnalazioni sui pattern SSN e carte di credito, verificato da una scansione, con il resto in calo verso lo zero grazie al monitoraggio settimanale.
Perché attualità e duplicati non hanno un numero universale?
La freschezza dipende dal business: un’org di supporto può richiedere case aggiornati nel giro di giorni, mentre i dati account di un produttore possono avere un trimestre e restare corretti. Definisci la tua finestra per oggetto, poi mantienila. Per i duplicati vale lo stesso — il tasso accettabile dipende dal volume dell’oggetto e dalle regole di matching, quindi il benchmark è direzionale: basso, misurato e in calo, perché ogni duplicato frammenta la storia di un cliente in record che l’agente non può riconciliare.
Ogni quanto rimisurare?
I benchmark decadono — gli utenti continuano a inserire dati dopo il go-live. Ecco la cadenza che mantiene i punteggi al livello del lancio:
Esposizione PII
I campi di testo ad alto volume raccolgono ogni giorno messaggi dei clienti incollati; il rischio PII è quello che ricresce più in fretta.
Completezza e Coerenza
Nuovi record e nuovi utenti le erodono costantemente; la cadenza mensile intercetta la deriva prima degli agenti.
Tutte e sei le metriche
Un controllo completo su ogni oggetto letto dagli agenti azzera la baseline e intercetta il decadimento lento.
Per l’intera sequenza pre-lancio — cosa misurare e correggere nei 90 giorni prima del go-live — usa la checklist di lancio Agentforce.
Ottieni i tuoi numeri in 15 minuti
AgentforceSense confronta la tua org con ogni benchmark di questa pagina — nativamente in Salesforce, con il drill-down fino ai record sotto soglia.