Benchmarks

Salesforce-Datenqualitäts-Benchmarks für KI-Agenten

Salesforce-Datenqualitäts-Benchmarks sind die Schwellenwerte, die eine Org erreichen sollte – pro Metrik, auf jedem Objekt, das ein KI-Agent liest –, bevor Agentforce live geht: 85%+ Vollständigkeit, 90%+ Konformität und Validität, unter 1% PII-Exposition. Hier ist jede Zahl – und die Begründung dahinter.

Vom AgentforceSense-Team · Stand: 12. Juni 2026

Die Benchmark-Tabelle

Empfohlene Launch-Zielwerte für die sechs Dimensionen der Agentforce-Datenqualität, gemessen auf den Objekten und Feldern, die Ihre Agenten tatsächlich lesen werden – nicht als org-weiter Durchschnitt, der genau die Probleme verschleiert, die in Agenten-Antworten zutage treten.

Metrik	Launch-Benchmark	Was sie misst
Vollständigkeitsquote	85%+	Anteil der Schlüsselfelder auf agentengelesenen Objekten, die befüllt sind.
Konformitätsquote	90%+	Anteil der Auswahllisten- und Referenzwerte, die einem freigegebenen Standard entsprechen.
Validitätsquote	90%+	Anteil der strukturierten Felder (E-Mails, Telefonnummern, IDs), die ihre Formatregeln bestehen.
Aktualitätsquote	Ihr Zeitfenster	Anteil der datumskritischen Datensätze, die innerhalb Ihres definierten Aktualitätsfensters aktualisiert wurden.
Dublettenquote	niedrig, rückläufig	Anteil der Datensätze auf agentengelesenen Objekten mit wahrscheinlicher Dublette.
PII-Expositionsquote	< 1%	Anteil der gescannten Datensätze mit PII-Mustertreffer im Freitext.

Warum liegt der Vollständigkeits-Benchmark bei 85% und nicht bei 100%?

Weil die Jagd auf die letzten 15% rapide abnehmenden Ertrag bringt. Ein Teil der Leere ist legitim – optionale Felder, Datensätze aus der Zeit vor einem Prozess, Objekte, bei denen ein Wert schlicht nicht zutrifft. Ab 85%+ auf den Schlüsselfeldern hat ein Agent fast immer genug Kontext, um konkret statt generisch zu antworten. Darunter sind vage Antworten keine Ausnahmen mehr – sie werden zum Markenzeichen Ihres Agenten. Investieren Sie die verbleibende Energie lieber in Konsistenz und PII: Dort fallen Fehler deutlich lauter aus.

Warum brauchen Konformität und Validität 90%?

Inkonsistente und ungültige Werte schwächen Antworten nicht nur – sie erzeugen Widersprüche. Existieren „US“, „USA“ und „United States“ nebeneinander, kann ein Agent auf dieselbe Frage drei verschiedene Antworten geben, und das Retrieval übersieht Datensätze, die nach Wert gefiltert werden. Ungültige E-Mails und IDs werden Kunden wörtlich zitiert. Diese Fehler fallen Nutzern schon beim ersten schlechten Datensatz auf – deshalb liegt die Messlatte höher als bei der Vollständigkeit.

Warum muss die PII-Exposition unter 1% liegen?

Weil PII die einzige Metrik ist, bei der ein einzelner Datensatz ein Vorfall sein kann. Eine in einen Case-Kommentar kopierte SSN kann in einer Agenten-Antwort auftauchen – und ab da ist das Problem regulatorisch, nicht kosmetisch. Unter 1% ist eine Arbeitsobergrenze für die Launch-Freigabe, keine Ziellinie: Das operative Ziel sind null Treffer bei SSN- und Kreditkartenmustern, per Scan verifiziert, während der Rest durch wöchentliches Monitoring gegen null läuft.

Warum gibt es für Aktualität und Dubletten keine universelle Zahl?

Aktualität ist geschäftsspezifisch: Eine Support-Org braucht vielleicht Cases, die binnen Tagen angefasst wurden, während Account-Daten eines Herstellers ein Quartal alt und trotzdem korrekt sein können. Definieren Sie Ihr eigenes Zeitfenster pro Objekt – und halten Sie es ein. Bei Dubletten ist es ähnlich: Die akzeptable Quote hängt von Objektvolumen und Matching-Regeln ab. Der Benchmark gibt deshalb die Richtung vor: niedrig, gemessen und rückläufig – denn jede Dublette zerreißt die Historie eines Kunden in Datensätze, die der Agent nicht zusammenführen kann.

Wie oft sollten Sie nachmessen?

Benchmarks verfallen – nach dem Go-live geben Nutzer weiter Daten ein. Dieser Takt hält die Scores auf Launch-Niveau:

Wöchentlich

PII-Exposition

Textfelder mit hohem Volumen sammeln täglich hineinkopierte Kundennachrichten; das PII-Risiko wächst am schnellsten nach.

Monatlich

Vollständigkeit & Konsistenz

Neue Datensätze und neue Nutzer höhlen beide stetig aus; monatlich erwischen Sie das Abdriften, bevor Ihre Agenten es tun.

Quartalsweise

Alle sechs Metriken

Ein kompletter Durchlauf über jedes agentengelesene Objekt setzt die Baseline neu und fängt schleichenden Verfall ab.

Die komplette Pre-Launch-Sequenz – was Sie in den 90 Tagen vor dem Go-live messen und beheben – finden Sie in der Agentforce-Launch-Checkliste.

Ihre Zahlen in 15 Minuten

AgentforceSense misst Ihre Org an jedem Benchmark auf dieser Seite – nativ in Salesforce, mit Drill-down bis zu den Datensätzen, die die Marke verfehlen.

Demo buchen