검색엔진 (1) 썸네일형 리스트형 갈아먹는 검색엔진 [2] Binary Independence Model 지난 포스팅 갈아먹는 검색엔진 [1] 검색의 확률론(probabilistics information retrieval) 들어가며 이전 포스팅에서 검색 엔진의 랭킹이란 무엇인지, 그리고 이를 확률의 관점에서는 어떻게 접근할 수 있는지 알아보았습니다. 살짝 복습해보면 문서와 질의어가 주어졌을 때, 해당 문서가 질의어와 관련이 있을 확률은 다음과 같이 표기할 수 있었습니다. 그리고 위 확률이 높은 순서대로 정렬해서 결과를 리턴하는 것이 최선이다! 라는걸 PRP(Probability Ranking Principle)라고 불렀습니다. 이번 포스팅에서는 좀 더 구체적으로 이 PRP로부터 파생한 Binary Independence Model에 대해서 알아보겠습니다. 수학적인 유도 과정이 꽤 많은데, 그 과정이 꽤나 .. 이전 1 다음