用户工具

站点工具


tf-idf提取关键词

这是本文档旧的修订版!


1.计算词频TF

TF=词语在文章中出现的次数/文章总词数

2.计算IDF

IDF=log(语料库文档总数/(包含该词的文档数+1))

词出现在越多的文档中,分母越大,IDF越接近0

3.计算TF-IDF

TF-IDF=TF*IDF

tf-idf提取关键词.1576309061.txt.gz · 最后更改: 2020/02/01 21:40 (外部编辑)