AI 에이전트를 위한 Salesforce 데이터 품질 벤치마크
Salesforce 데이터 품질 벤치마크는 Agentforce 가동 전에 — AI 에이전트가 읽는 모든 오브젝트에서 지표별로 — 조직이 충족해야 할 점수 기준입니다: 완전성 85% 이상, 정합성·유효성 90% 이상, PII 노출 1% 미만. 각 수치와 그 근거를 차례로 살펴봅니다.
AgentforceSense 팀 · 최종 업데이트: 2026년 6월 12일
벤치마크 표
Agentforce 데이터 품질의 6가지 차원에 대한 권장 출시 목표치로, 에이전트가 실제로 읽을 오브젝트와 필드를 기준으로 측정합니다 — 조직 전체 평균은 에이전트 답변에서 드러날 문제를 정확히 가려 버리기 때문입니다.
| 지표 | 출시 벤치마크 | 측정 내용 |
|---|---|---|
| 완전성 비율 | 85%+ | 에이전트가 읽는 오브젝트에서 핵심 필드가 채워져 있는 비율. |
| 정합성 비율 | 90%+ | 선택 목록 및 참조 값이 승인된 단일 표준을 따르는 비율. |
| 유효성 비율 | 90%+ | 구조화된 필드(이메일, 전화번호, ID)가 형식 규칙을 통과하는 비율. |
| 적시성 비율 | 자체 기준 | 날짜에 민감한 레코드가 자체 정의한 최신성 기준 안에서 갱신된 비율. |
| 중복률 | 낮은 수준, 하락 추세 | 에이전트가 읽는 오브젝트에서 중복 가능성이 있는 레코드의 비율. |
| PII 노출률 | < 1% | 스캔된 레코드 중 자유 텍스트에서 PII 패턴이 일치한 비율. |
완전성 벤치마크가 100%가 아니라 85%인 이유
마지막 15%를 좇는 것은 투입 대비 효과가 급격히 줄어들기 때문입니다. 일부 빈 값은 정당합니다 — 선택 입력 필드, 프로세스 도입 이전의 레코드, 값이 애초에 해당되지 않는 오브젝트 등. 핵심 필드에서 85% 이상이면 에이전트는 거의 항상 일반론 대신 구체적으로 답할 만큼의 컨텍스트를 갖습니다. 그 밑으로 내려가면 모호한 답변이 예외가 아니라 에이전트의 기본 모습이 됩니다. 남는 노력은 일관성과 PII에 쓰세요 — 실패했을 때 훨씬 크게 드러나는 영역이기 때문입니다.
정합성과 유효성에 90%가 필요한 이유
일관성 없고 유효하지 않은 값은 답변을 약화시키는 데 그치지 않고 모순을 만들어 냅니다. “US”, “USA”, “United States”가 공존하면 같은 질문에 에이전트가 세 가지 다른 답을 줄 수 있고, 값으로 필터링되는 검색은 레코드를 놓칠 수 있습니다. 잘못된 이메일과 ID는 고객에게 그대로 인용됩니다. 이런 실패는 사용자가 잘못된 레코드를 처음 만나는 순간 바로 눈에 띄기 때문에, 기준이 완전성보다 높게 설정되어 있습니다.
PII 노출이 1% 미만이어야 하는 이유
PII는 레코드 단 한 건이 곧 보안 사고가 될 수 있는 유일한 지표이기 때문입니다. Case 코멘트에 붙여 넣어진 SSN이 에이전트 답변에 노출되는 순간, 문제는 외관이 아니라 규제의 영역이 됩니다. 1% 미만은 출시 승인을 위한 실무적 상한이지 최종 목표가 아닙니다 — 운영 목표는 SSN·신용카드 패턴 탐지 건 0건을 스캔으로 검증하고, 나머지는 주간 모니터링을 통해 0으로 수렴시키는 것입니다.
적시성과 중복에는 왜 보편적인 수치가 없나요?
최신성은 비즈니스마다 다릅니다. 지원 조직은 케이스가 며칠 안에 갱신되어야 할 수 있지만, 제조사의 계정 데이터는 한 분기가 지나도 여전히 정확할 수 있습니다. 오브젝트별로 자체 기준을 정한 뒤 그것을 지키세요. 중복도 마찬가지입니다 — 허용 가능한 비율은 오브젝트 규모와 매칭 규칙에 따라 달라지므로 벤치마크는 방향성 기준입니다: 낮게, 측정하면서, 하락 추세로. 중복 하나하나가 에이전트가 통합할 수 없는 여러 레코드로 고객 이력을 쪼개 놓기 때문입니다.
얼마나 자주 다시 측정해야 하나요?
벤치마크 점수는 저하됩니다 — 가동 이후에도 사용자는 계속 데이터를 입력합니다. 점수를 출시 수준으로 유지하는 측정 주기는 다음과 같습니다:
PII 노출
대량 텍스트 필드에는 매일 고객 메시지가 붙여 넣어집니다. PII 리스크가 가장 빨리 다시 자라납니다.
완전성·일관성
새 레코드와 새 사용자가 두 지표를 꾸준히 깎아내립니다. 월간 점검이면 에이전트보다 먼저 변화를 잡아냅니다.
6개 지표 전체
에이전트가 읽는 모든 오브젝트의 전체 점검으로 기준선을 재설정하고 완만한 품질 저하를 잡아냅니다.
가동 전 90일 동안 무엇을 측정하고 고쳐야 하는지 전체 순서가 필요하다면 Agentforce 출시 체크리스트를 활용하세요.
15분 안에 귀사의 수치를 확인하세요
AgentforceSense는 이 페이지의 모든 벤치마크에 대해 귀사 조직을 점수화합니다 — Salesforce 안에서 네이티브로, 기준 미달 레코드까지 드릴다운하면서.