Benchmarks

Benchmarks de qualidade de dados Salesforce para agentes de IA

Benchmarks de qualidade de dados Salesforce são os limites de score que uma org deve atingir — por métrica, em cada objeto que um agente de IA lê — antes de entrar no ar com o Agentforce: 85%+ de completude, 90%+ de conformidade e validade, e menos de 1% de exposição de PII. Aqui está cada número, e o raciocínio por trás dele.

Pela equipe AgentforceSense · Atualizado em 12 de junho de 2026

A tabela de benchmarks

Metas de lançamento recomendadas para as seis dimensões de qualidade de dados Agentforce, medidas nos objetos e campos que seus agentes vão de fato ler — não na média da org inteira, que esconde justamente os problemas que aparecem nas respostas dos agentes.

Métrica	Benchmark de lançamento	O que mede
Taxa de completude	85%+	Parcela dos campos-chave preenchidos nos objetos lidos por agentes.
Taxa de conformidade	90%+	Parcela dos valores de listas de seleção e referências que seguem um único padrão aprovado.
Taxa de validade	90%+	Parcela dos campos estruturados (e-mails, telefones, IDs) que passam nas regras de formato.
Taxa de atualidade	sua janela	Parcela dos registros sensíveis a datas atualizados dentro da janela de atualidade que você definiu.
Taxa de duplicatas	baixa, em queda	Parcela dos registros, nos objetos lidos por agentes, com provável duplicata.
Taxa de exposição de PII	< 1%	Parcela dos registros varridos com correspondência de padrão de PII em texto livre.

Por que o benchmark de completude é 85%, e não 100%?

Porque perseguir os últimos 15% tem retorno cada vez menor. Parte do vazio é legítima — campos opcionais, registros anteriores a um processo, objetos em que o valor simplesmente não se aplica. Com 85%+ nos campos-chave, o agente quase sempre tem contexto suficiente para responder com especificidade, e não genericamente. Abaixo disso, as respostas vagas deixam de ser exceção e viram a marca registrada do agente. Invista o esforço restante em consistência e PII — são falhas que fazem muito mais barulho.

Por que conformidade e validade exigem 90%?

Valores inconsistentes e inválidos não apenas enfraquecem as respostas — eles criam contradições. Quando “US”, “USA” e “United States” coexistem, o agente pode dar três respostas diferentes para a mesma pergunta, e a recuperação pode deixar de encontrar registros filtrados por valor. E-mails e IDs inválidos são citados ao cliente ao pé da letra. Essas falhas ficam visíveis ao usuário no primeiro registro ruim que ele encontra — por isso a régua fica acima da de completude.

Por que a exposição de PII precisa ficar abaixo de 1%?

Porque PII é a única métrica em que um único registro pode ser um incidente. Um SSN colado no comentário de um caso pode aparecer na resposta de um agente — e, nesse ponto, o problema é regulatório, não cosmético. Menos de 1% é um teto de trabalho para o aval de lançamento, não a linha de chegada: a meta operacional é zero achados nos padrões de SSN e cartão de crédito, verificados por varredura, com o restante caminhando para zero por meio do monitoramento semanal.

Por que atualidade e duplicatas não têm um número universal?

Atualidade depende do negócio: uma operação de suporte pode exigir casos atualizados em dias, enquanto os dados de contas de uma indústria podem ter um trimestre e ainda estar corretos. Defina sua própria janela por objeto — e cumpra-a. Duplicatas são parecidas: a taxa aceitável depende do volume do objeto e das regras de correspondência, então o benchmark é direcional — baixa, medida e em queda, porque cada duplicata fragmenta o histórico do cliente em registros que o agente não consegue conciliar.

Com que frequência medir de novo?

Benchmarks decaem — os usuários continuam inserindo dados depois do go-live. A cadência que mantém os scores no nível do lançamento:

Semanal

Exposição de PII

Campos de texto de alto volume acumulam mensagens de clientes coladas todos os dias; o risco de PII é o que volta a crescer mais rápido.

Mensal

Completude e Consistência

Registros novos e usuários novos corroem as duas aos poucos; medir todo mês flagra o desvio antes dos agentes.

Trimestral

As seis métricas

Uma varredura completa em cada objeto lido por agentes redefine sua linha de base e flagra a decadência lenta.

Para a sequência completa de pré-lançamento — o que medir e corrigir nos 90 dias antes do go-live — use o checklist de lançamento do Agentforce.

Tenha seus números em 15 minutos

O AgentforceSense compara sua org com cada benchmark desta página — nativamente no Salesforce, com drill-down até os registros que ficam abaixo da régua.

Agende uma demonstração