본문으로 건너뛰기
개선

한국어 브랜드 인식 정밀도 개선

AI 답변 속 브랜드 인식에서 한글 합성어에 우연히 포함된 이름을 언급으로 오인하지 않도록 개선하고, 가운뎃점(·)으로 묶인 분야명의 주제 관련성 인식을 강화했습니다

한국어 AI 답변에서 브랜드 언급을 인식하는 정밀도를 두 가지 측면에서 개선했습니다.

첫째, 다른 단어 안에 우연히 포함된 브랜드명을 언급으로 오인하지 않습니다. 한글은 단어 경계 구분이 어려워, 짧은 브랜드명이 무관한 합성어의 일부와 겹치면 실제로는 언급되지 않았는데 언급된 것으로 집계될 수 있었습니다. 이제 이런 오인을 차단하면서도, 조사가 붙은 표기("○○는", "○○를")와 브랜드 계열 서비스 표기는 기존대로 정상 인식합니다.

둘째, 가운뎃점(·)으로 여러 분야를 묶어 등록한 경우(예: "간편송금·핀테크")에도 각 구성 분야를 기준으로 주제 관련성을 판정합니다. 기존에는 이런 표기가 하나의 긴 단어로 처리되어 관련 답변인데도 주제 무관으로 집계되는 경우가 있었습니다.

두 개선 모두 사람이 직접 검수한 실측 AI 답변 정답지로 정확도를 검증했으며, 앞으로의 변경에서도 한국어 측정 품질이 기준선 아래로 내려가지 않도록 언어별 자동 검증을 함께 도입했습니다.