====== 关键词TF-IDF计算方法 ====== ===== 1.计算词频TF ===== TF=词语在文章中出现的次数/文章总词数 ===== 2.计算IDF ===== IDF=log(语料库文档总数/(包含该词的文档数+1)) 词出现在越多的文档中,分母越大,IDF越接近0 ===== 3.计算TF-IDF ===== TF-IDF=TF*IDF