Bleu1 [데블챌 5일차] 번역 품질을 측정하는 BLEU 스코어: 기계번역의 신뢰성을 평가하다 요약BLEU 스코어는 기계 번역 결과와 사람이 번역한 참조 번역 사이의 유사도를 측정하는 평가 지표입니다.이는 n-gram을 활용하여 번역의 정확성을 평가합니다. N-gram은 연속된 n개의 단어 또는 문자를 의미합니다.기계 번역과 참조 번역이 일치하는 n-gram의 개수를 전체 n-gram 개수로 나누어 precision을 계산하며, 이를 기하 평균으로 구합니다.번역의 길이가 짧을 경우 품질이 떨어지는 문제를 보정하기 위해 brevity penalty (BP)가 도입되었습니다.BLEU 스코어는 BP와 precision에 가중치를 부여하여 최종적인 번역 품질을 나타냅니다.1. BLEU 스코어 계산 방법N-gram을 활용한 정확성 측정: 번역의 일치하는 n-gram 개수를 전체 n-gram 개수로 나누어 .. 2024. 6. 1. 이전 1 다음