目录

关键词TF-IDF计算方法

1.计算词频TF

TF=词语在文章中出现的次数/文章总词数

2.计算IDF

IDF=log(语料库文档总数/(包含该词的文档数+1))

词出现在越多的文档中,分母越大,IDF越接近0

3.计算TF-IDF

TF-IDF=TF*IDF