Benchmarks de qualidade de dados Salesforce para agentes de IA
Benchmarks de qualidade de dados Salesforce são os limites de score que uma org deve atingir — por métrica, em cada objeto que um agente de IA lê — antes de entrar no ar com o Agentforce: 85%+ de completude, 90%+ de conformidade e validade, e menos de 1% de exposição de PII. Aqui está cada número, e o raciocínio por trás dele.
Pela equipe AgentforceSense · Atualizado em 12 de junho de 2026
A tabela de benchmarks
Metas de lançamento recomendadas para as seis dimensões de qualidade de dados Agentforce, medidas nos objetos e campos que seus agentes vão de fato ler — não na média da org inteira, que esconde justamente os problemas que aparecem nas respostas dos agentes.
| Métrica | Benchmark de lançamento | O que mede |
|---|---|---|
| Taxa de completude | 85%+ | Parcela dos campos-chave preenchidos nos objetos lidos por agentes. |
| Taxa de conformidade | 90%+ | Parcela dos valores de listas de seleção e referências que seguem um único padrão aprovado. |
| Taxa de validade | 90%+ | Parcela dos campos estruturados (e-mails, telefones, IDs) que passam nas regras de formato. |
| Taxa de atualidade | sua janela | Parcela dos registros sensíveis a datas atualizados dentro da janela de atualidade que você definiu. |
| Taxa de duplicatas | baixa, em queda | Parcela dos registros, nos objetos lidos por agentes, com provável duplicata. |
| Taxa de exposição de PII | < 1% | Parcela dos registros varridos com correspondência de padrão de PII em texto livre. |
Por que o benchmark de completude é 85%, e não 100%?
Porque perseguir os últimos 15% tem retorno cada vez menor. Parte do vazio é legítima — campos opcionais, registros anteriores a um processo, objetos em que o valor simplesmente não se aplica. Com 85%+ nos campos-chave, o agente quase sempre tem contexto suficiente para responder com especificidade, e não genericamente. Abaixo disso, as respostas vagas deixam de ser exceção e viram a marca registrada do agente. Invista o esforço restante em consistência e PII — são falhas que fazem muito mais barulho.
Por que conformidade e validade exigem 90%?
Valores inconsistentes e inválidos não apenas enfraquecem as respostas — eles criam contradições. Quando “US”, “USA” e “United States” coexistem, o agente pode dar três respostas diferentes para a mesma pergunta, e a recuperação pode deixar de encontrar registros filtrados por valor. E-mails e IDs inválidos são citados ao cliente ao pé da letra. Essas falhas ficam visíveis ao usuário no primeiro registro ruim que ele encontra — por isso a régua fica acima da de completude.
Por que a exposição de PII precisa ficar abaixo de 1%?
Porque PII é a única métrica em que um único registro pode ser um incidente. Um SSN colado no comentário de um caso pode aparecer na resposta de um agente — e, nesse ponto, o problema é regulatório, não cosmético. Menos de 1% é um teto de trabalho para o aval de lançamento, não a linha de chegada: a meta operacional é zero achados nos padrões de SSN e cartão de crédito, verificados por varredura, com o restante caminhando para zero por meio do monitoramento semanal.
Por que atualidade e duplicatas não têm um número universal?
Atualidade depende do negócio: uma operação de suporte pode exigir casos atualizados em dias, enquanto os dados de contas de uma indústria podem ter um trimestre e ainda estar corretos. Defina sua própria janela por objeto — e cumpra-a. Duplicatas são parecidas: a taxa aceitável depende do volume do objeto e das regras de correspondência, então o benchmark é direcional — baixa, medida e em queda, porque cada duplicata fragmenta o histórico do cliente em registros que o agente não consegue conciliar.
Com que frequência medir de novo?
Benchmarks decaem — os usuários continuam inserindo dados depois do go-live. A cadência que mantém os scores no nível do lançamento:
Exposição de PII
Campos de texto de alto volume acumulam mensagens de clientes coladas todos os dias; o risco de PII é o que volta a crescer mais rápido.
Completude e Consistência
Registros novos e usuários novos corroem as duas aos poucos; medir todo mês flagra o desvio antes dos agentes.
As seis métricas
Uma varredura completa em cada objeto lido por agentes redefine sua linha de base e flagra a decadência lenta.
Para a sequência completa de pré-lançamento — o que medir e corrigir nos 90 dias antes do go-live — use o checklist de lançamento do Agentforce.
Tenha seus números em 15 minutos
O AgentforceSense compara sua org com cada benchmark desta página — nativamente no Salesforce, com drill-down até os registros que ficam abaixo da régua.