* 불리언쿼리
: 단어와 연산자로 이루어져 있음.
: 다음검색 -> { 다음검색 | ( 다음 & 검색 ) }
* 재현율
: [정보통신] recall factor (영어). 어떤 조건으로 검색되는 정보와 검색되어야 하는 모든 정보의 비율로, 정보검색 시스템의 성능을 평가하는 척도
: 검색결과가 얼마나 많이 나오는가의 척도.
* 재현율(recall factor) vs 정확도(precision)
trade-off 관계, NLP 성능척도.
---------------
고급기술인 NLP 전문가들이 옆에 있으니 많이 배워둬야겠다 :)
'일 > Data Mining' 카테고리의 다른 글
TFIDF ( Term Frequency Inverse Document Frequency) (0) | 2009.05.28 |
---|---|
산술평균, 기하평균, 조화평균 (Arithmetic , Geometric , Harmonic mean) (0) | 2008.12.19 |
Monte Carlo simulation (몬테 카를로 시뮬레이션) (0) | 2008.11.25 |
[SAS tip] ORACLE insert 속도 개선 : BULKLOAD, INSERTBUFF (0) | 2008.10.14 |
CRISP-DM ( CRoss Industry Standard Process for Data Mining ) (0) | 2008.10.07 |