Recall and Precision
Recall과 precision은 분류 문제에서 성능을 평가하는 지표입니다. Recall은 실제로 관련된 예제 중에서 검색된 예제의 비율이고, precision은 검색된 예제 중에서 관련된 예제의 비율입니다. Recall과 precision은 서로 trade-off 관계에 있습니다. 즉, 한 쪽을 높이면 다른 쪽이 낮아집니다.
Recall이 중요한 경우는 실제로 관련된 예제를 놓치지 않아야 하는 경우입니다. 예를 들어, 암 진단이나 스팸 필터링 같은 경우에는 실제로 암 환자나 스팸 메일을 정상으로 분류하는 것(FN)이 큰 위험이 될 수 있습니다. 따라서 recall을 높여서 FN을 줄여야 합니다.
Precision이 중요한 경우는 검색된 예제가 정확하게 관련되어야 하는 경우입니다. 예를 들어, 웹 검색이나 상품 추천 같은 경우에는 사용자에게 관련 없는 결과나 상품을 보여주는 것(FP)이 사용자 만족도를 떨어뜨릴 수 있습니다. 따라서 precision을 높여서 FP를 줄여야 합니다.