벤치마크

AI 에이전트를 위한 Salesforce 데이터 품질 벤치마크

Salesforce 데이터 품질 벤치마크는 Agentforce 가동 전에 — AI 에이전트가 읽는 모든 오브젝트에서 지표별로 — 조직이 충족해야 할 점수 기준입니다: 완전성 85% 이상, 정합성·유효성 90% 이상, PII 노출 1% 미만. 각 수치와 그 근거를 차례로 살펴봅니다.

AgentforceSense 팀 · 최종 업데이트: 2026년 6월 12일

벤치마크 표

Agentforce 데이터 품질의 6가지 차원에 대한 권장 출시 목표치로, 에이전트가 실제로 읽을 오브젝트와 필드를 기준으로 측정합니다 — 조직 전체 평균은 에이전트 답변에서 드러날 문제를 정확히 가려 버리기 때문입니다.

지표	출시 벤치마크	측정 내용
완전성 비율	85%+	에이전트가 읽는 오브젝트에서 핵심 필드가 채워져 있는 비율.
정합성 비율	90%+	선택 목록 및 참조 값이 승인된 단일 표준을 따르는 비율.
유효성 비율	90%+	구조화된 필드(이메일, 전화번호, ID)가 형식 규칙을 통과하는 비율.
적시성 비율	자체 기준	날짜에 민감한 레코드가 자체 정의한 최신성 기준 안에서 갱신된 비율.
중복률	낮은 수준, 하락 추세	에이전트가 읽는 오브젝트에서 중복 가능성이 있는 레코드의 비율.
PII 노출률	< 1%	스캔된 레코드 중 자유 텍스트에서 PII 패턴이 일치한 비율.

완전성 벤치마크가 100%가 아니라 85%인 이유

마지막 15%를 좇는 것은 투입 대비 효과가 급격히 줄어들기 때문입니다. 일부 빈 값은 정당합니다 — 선택 입력 필드, 프로세스 도입 이전의 레코드, 값이 애초에 해당되지 않는 오브젝트 등. 핵심 필드에서 85% 이상이면 에이전트는 거의 항상 일반론 대신 구체적으로 답할 만큼의 컨텍스트를 갖습니다. 그 밑으로 내려가면 모호한 답변이 예외가 아니라 에이전트의 기본 모습이 됩니다. 남는 노력은 일관성과 PII에 쓰세요 — 실패했을 때 훨씬 크게 드러나는 영역이기 때문입니다.

정합성과 유효성에 90%가 필요한 이유

일관성 없고 유효하지 않은 값은 답변을 약화시키는 데 그치지 않고 모순을 만들어 냅니다. “US”, “USA”, “United States”가 공존하면 같은 질문에 에이전트가 세 가지 다른 답을 줄 수 있고, 값으로 필터링되는 검색은 레코드를 놓칠 수 있습니다. 잘못된 이메일과 ID는 고객에게 그대로 인용됩니다. 이런 실패는 사용자가 잘못된 레코드를 처음 만나는 순간 바로 눈에 띄기 때문에, 기준이 완전성보다 높게 설정되어 있습니다.

PII 노출이 1% 미만이어야 하는 이유

PII는 레코드 단 한 건이 곧 보안 사고가 될 수 있는 유일한 지표이기 때문입니다. Case 코멘트에 붙여 넣어진 SSN이 에이전트 답변에 노출되는 순간, 문제는 외관이 아니라 규제의 영역이 됩니다. 1% 미만은 출시 승인을 위한 실무적 상한이지 최종 목표가 아닙니다 — 운영 목표는 SSN·신용카드 패턴 탐지 건 0건을 스캔으로 검증하고, 나머지는 주간 모니터링을 통해 0으로 수렴시키는 것입니다.

적시성과 중복에는 왜 보편적인 수치가 없나요?

최신성은 비즈니스마다 다릅니다. 지원 조직은 케이스가 며칠 안에 갱신되어야 할 수 있지만, 제조사의 계정 데이터는 한 분기가 지나도 여전히 정확할 수 있습니다. 오브젝트별로 자체 기준을 정한 뒤 그것을 지키세요. 중복도 마찬가지입니다 — 허용 가능한 비율은 오브젝트 규모와 매칭 규칙에 따라 달라지므로 벤치마크는 방향성 기준입니다: 낮게, 측정하면서, 하락 추세로. 중복 하나하나가 에이전트가 통합할 수 없는 여러 레코드로 고객 이력을 쪼개 놓기 때문입니다.

얼마나 자주 다시 측정해야 하나요?

벤치마크 점수는 저하됩니다 — 가동 이후에도 사용자는 계속 데이터를 입력합니다. 점수를 출시 수준으로 유지하는 측정 주기는 다음과 같습니다:

매주

PII 노출

대량 텍스트 필드에는 매일 고객 메시지가 붙여 넣어집니다. PII 리스크가 가장 빨리 다시 자라납니다.

매월

완전성·일관성

새 레코드와 새 사용자가 두 지표를 꾸준히 깎아내립니다. 월간 점검이면 에이전트보다 먼저 변화를 잡아냅니다.

분기

6개 지표 전체

에이전트가 읽는 모든 오브젝트의 전체 점검으로 기준선을 재설정하고 완만한 품질 저하를 잡아냅니다.

가동 전 90일 동안 무엇을 측정하고 고쳐야 하는지 전체 순서가 필요하다면 Agentforce 출시 체크리스트를 활용하세요.

15분 안에 귀사의 수치를 확인하세요

AgentforceSense는 이 페이지의 모든 벤치마크에 대해 귀사 조직을 점수화합니다 — Salesforce 안에서 네이티브로, 기준 미달 레코드까지 드릴다운하면서.

데모 신청