用户工具

站点工具


tf-idf提取关键词

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

后一修订版
前一修订版
tf-idf提取关键词 [2019/12/14 15:37]
admin 创建
tf-idf提取关键词 [2021/06/03 09:13] (当前版本)
admin
行 1: 行 1:
-====== 1.计算词频TF ​======+====== 关键词TF-IDF计算方法 ====== 
 + 
 +===== 1.计算词频TF =====
 TF=词语在文章中出现的次数/​文章总词数 TF=词语在文章中出现的次数/​文章总词数
-====== 2.计算IDF ​======+===== 2.计算IDF =====
 IDF=log(语料库文档总数/​(包含该词的文档数+1)) IDF=log(语料库文档总数/​(包含该词的文档数+1))
  
 词出现在越多的文档中,分母越大,IDF越接近0 词出现在越多的文档中,分母越大,IDF越接近0
  
-====== 3.计算TF-IDF ​======+===== 3.计算TF-IDF =====
 TF-IDF=TF*IDF TF-IDF=TF*IDF
tf-idf提取关键词.1576309061.txt.gz · 最后更改: 2020/02/01 21:40 (外部编辑)