Benchmark

Benchmark di qualità dei dati Salesforce per gli agenti AI

I benchmark di qualità dei dati Salesforce sono le soglie di punteggio che un’org dovrebbe raggiungere — per metrica, su ogni oggetto letto da un agente AI — prima del go-live di Agentforce: 85%+ di completezza, 90%+ di conformità e validità, meno dell’1% di esposizione PII. Ecco ogni numero, con il ragionamento che lo sostiene.

Dal team AgentforceSense · Ultimo aggiornamento: 12 giugno 2026

La tabella dei benchmark

I target di lancio consigliati per le sei dimensioni della qualità dei dati Agentforce, misurati sugli oggetti e sui campi che i tuoi agenti leggeranno davvero — non sulla media dell’org, che nasconde proprio i problemi che riaffiorano nelle risposte degli agenti.

Metrica	Benchmark di lancio	Cosa misura
Tasso di completezza	85%+	Quota di campi chiave compilati sugli oggetti letti dagli agenti.
Tasso di conformità	90%+	Quota di valori di picklist e riferimenti conformi a un unico standard approvato.
Tasso di validità	90%+	Quota di campi strutturati (email, telefoni, ID) che superano le regole di formato.
Tasso di attualità	la tua finestra	Quota di record sensibili alle date aggiornati entro la finestra di freschezza che hai definito.
Tasso di duplicati	basso, in calo	Quota di record sugli oggetti letti dagli agenti con un probabile duplicato.
Tasso di esposizione PII	< 1%	Quota di record scansionati con una corrispondenza a un pattern PII nel testo libero.

Perché il benchmark di completezza è 85% e non 100%?

Perché inseguire l’ultimo 15% ha rendimenti decrescenti molto ripidi. Una parte dei vuoti è legittima — campi facoltativi, record precedenti a un processo, oggetti in cui un valore semplicemente non si applica. Con 85%+ sui campi chiave, un agente ha quasi sempre contesto sufficiente per rispondere in modo specifico anziché generico. Sotto quella soglia, le risposte vaghe smettono di essere casi limite e diventano il marchio di fabbrica dell’agente. Investi lo sforzo rimanente su coerenza e PII: quando falliscono, fanno molto più rumore.

Perché conformità e validità richiedono il 90%?

I valori incoerenti e non validi non si limitano a indebolire le risposte — creano contraddizioni. Quando “US”, “USA” e “United States” convivono, un agente può dare tre risposte diverse alla stessa domanda, e il retrieval può perdere record filtrati per valore. Email e ID non validi vengono citati ai clienti alla lettera. Questi errori sono visibili agli utenti al primo record difettoso che incontrano: ecco perché l’asticella è più alta di quella della completezza.

Perché l’esposizione PII deve restare sotto l’1%?

Perché le PII sono l’unica metrica in cui un singolo record può diventare un incidente. Un SSN incollato nel commento di un Case può riaffiorare in una risposta dell’agente, e a quel punto il problema è normativo, non estetico. Sotto l’1% è un tetto operativo per l’approvazione al lancio, non un traguardo — l’obiettivo è zero segnalazioni sui pattern SSN e carte di credito, verificato da una scansione, con il resto in calo verso lo zero grazie al monitoraggio settimanale.

Perché attualità e duplicati non hanno un numero universale?

La freschezza dipende dal business: un’org di supporto può richiedere case aggiornati nel giro di giorni, mentre i dati account di un produttore possono avere un trimestre e restare corretti. Definisci la tua finestra per oggetto, poi mantienila. Per i duplicati vale lo stesso — il tasso accettabile dipende dal volume dell’oggetto e dalle regole di matching, quindi il benchmark è direzionale: basso, misurato e in calo, perché ogni duplicato frammenta la storia di un cliente in record che l’agente non può riconciliare.

Ogni quanto rimisurare?

I benchmark decadono — gli utenti continuano a inserire dati dopo il go-live. Ecco la cadenza che mantiene i punteggi al livello del lancio:

Settimanale

Esposizione PII

I campi di testo ad alto volume raccolgono ogni giorno messaggi dei clienti incollati; il rischio PII è quello che ricresce più in fretta.

Mensile

Completezza e Coerenza

Nuovi record e nuovi utenti le erodono costantemente; la cadenza mensile intercetta la deriva prima degli agenti.

Trimestrale

Tutte e sei le metriche

Un controllo completo su ogni oggetto letto dagli agenti azzera la baseline e intercetta il decadimento lento.

Per l’intera sequenza pre-lancio — cosa misurare e correggere nei 90 giorni prima del go-live — usa la checklist di lancio Agentforce.

Ottieni i tuoi numeri in 15 minuti

AgentforceSense confronta la tua org con ogni benchmark di questa pagina — nativamente in Salesforce, con il drill-down fino ai record sotto soglia.

Prenota una demo