Benchmarki

Benchmarki jakości danych Salesforce dla agentów AI

Benchmarki jakości danych Salesforce to progi, które org powinna osiągnąć — per metryka, na każdym obiekcie czytanym przez agenta AI — zanim Agentforce wejdzie na produkcję: 85%+ kompletności, 90%+ zgodności i poprawności oraz poniżej 1% ekspozycji PII. Oto każda z tych liczb i stojące za nią uzasadnienie.

Zespół AgentforceSense · Ostatnia aktualizacja: 12 czerwca 2026

Tabela benchmarków

Rekomendowane cele startowe dla sześciu wymiarów jakości danych Agentforce, mierzone na obiektach i polach, z których Twoi agenci naprawdę będą czytać — a nie jako średnia dla całej org, która maskuje dokładnie te problemy, które potem wychodzą w odpowiedziach agenta.

Metryka	Benchmark na start	Co mierzy
Wskaźnik kompletności	85%+	Odsetek kluczowych pól wypełnionych na obiektach czytanych przez agenta.
Wskaźnik zgodności	90%+	Odsetek wartości list wyboru i referencji zgodnych z jednym przyjętym standardem.
Wskaźnik poprawności	90%+	Odsetek pól strukturalnych (e-maile, telefony, identyfikatory) przechodzących reguły formatu.
Wskaźnik aktualności	Twoje okno	Odsetek rekordów wrażliwych na daty zaktualizowanych w zdefiniowanym oknie świeżości.
Wskaźnik duplikatów	niski, malejący	Odsetek rekordów na obiektach czytanych przez agenta, które mają prawdopodobny duplikat.
Wskaźnik ekspozycji PII	< 1%	Odsetek przeskanowanych rekordów z dopasowaniem wzorca PII w polach tekstowych.

Dlaczego benchmark kompletności to 85%, a nie 100%?

Bo pogoń za ostatnimi 15% ma gwałtownie malejący zwrot. Część pustych pól jest uzasadniona — pola opcjonalne, rekordy starsze niż obecny proces, obiekty, w których dana wartość po prostu nie ma zastosowania. Przy 85%+ na kluczowych polach agent prawie zawsze ma dość kontekstu, żeby odpowiedzieć konkretnie, a nie ogólnie. Poniżej tej granicy ogólnikowe odpowiedzi przestają być wyjątkiem, a stają się wizytówką agenta. Pozostały wysiłek zainwestuj w spójność i PII — tam awarie słychać znacznie głośniej.

Dlaczego zgodność i poprawność wymagają 90%?

Niespójne i nieprawidłowe wartości nie tylko osłabiają odpowiedzi — one tworzą sprzeczności. Gdy „US", „USA" i „United States" współistnieją, agent może udzielić trzech różnych odpowiedzi na to samo pytanie, a wyszukiwanie może pominąć rekordy filtrowane po wartości. Nieprawidłowe e-maile i identyfikatory są cytowane klientom dosłownie. Te błędy użytkownik widzi przy pierwszym złym rekordzie, na jaki trafi — dlatego poprzeczka wisi tu wyżej niż przy kompletności.

Dlaczego ekspozycja PII musi być poniżej 1%?

Bo PII to jedyna metryka, w której pojedynczy rekord może oznaczać incydent. SSN wklejony w komentarz do rekordu Case może pojawić się w odpowiedzi agenta — a wtedy problem jest już regulacyjny, nie kosmetyczny. Poniżej 1% to roboczy sufit dla akceptu startu, nie linia mety — celem operacyjnym jest zero trafień na wzorcach SSN i kart płatniczych, potwierdzone skanem, a reszta ma dążyć do zera dzięki cotygodniowemu monitoringowi.

Dlaczego aktualność i duplikaty nie mają jednej uniwersalnej liczby?

Świeżość zależy od biznesu: zespół wsparcia może potrzebować spraw aktualizowanych w ciągu dni, a dane kont u producenta mogą mieć kwartał i wciąż być poprawne. Ustal własne okno per obiekt i się go trzymaj. Z duplikatami podobnie — akceptowalny poziom zależy od wolumenu obiektu i reguł dopasowania, więc benchmark jest kierunkowy: niski, mierzony i malejący, bo każdy duplikat rozbija historię klienta na rekordy, których agent nie umie skleić w całość.

Jak często mierzyć ponownie?

Benchmarki się starzeją — po go-live użytkownicy dalej wprowadzają dane. Rytm, który utrzymuje wyniki na poziomie ze startu:

Co tydzień

Ekspozycja PII

Pola tekstowe o dużym wolumenie codziennie zbierają wklejone wiadomości od klientów; ryzyko PII odrasta najszybciej.

Co miesiąc

Kompletność i spójność

Nowe rekordy i nowi użytkownicy systematycznie podgryzają jedno i drugie; miesięczny rytm łapie dryf, zanim zrobią to agenci.

Co kwartał

Wszystkie sześć metryk

Pełny przegląd każdego obiektu czytanego przez agenta resetuje punkt odniesienia i wyłapuje powolną erozję.

Pełną sekwencję przedstartową — co mierzyć i naprawiać w ciągu 90 dni przed go-live — znajdziesz w checkliście startowej Agentforce.

Poznaj swoje liczby w 15 minut

AgentforceSense porówna Twoją org z każdym benchmarkiem z tej strony — natywnie w Salesforce, z zejściem do rekordów, które nie domykają progu.

Umów demo