目录
目录README.md

LDA

写综述不知道该如何分类论文更好,于是编了一个LDA模型来帮我分类(^_^) python版本为3.7.9,使用了gensim中的LDA模型,分词工具以及词性还原工具都来自于nltk,可视化结果用了包pyLDAvis LDA主题模型可以用于推测文档的主题分布。根据文档集中的每一篇文档的字词,以概率分布的形式给出主题并进行主题聚类或文本分类。 具体数学原理太长了建议百度“LDA主题模型原理”。

其中nltk需要下载nltk_data包并放到对应目录下。具体目录不同机器显示不同。加载nltk报错时会显示

下载nltk_data的地址为https://gitcode.net/mirrors/nltk/nltk_data?utm_source=csdn_github_accelerator

关于

输入有待分类的主题文本,可以帮助你对文本内容按照关键词进行分类

64.0 KB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

©Copyright 2023 CCF 开源发展委员会
Powered by Trustie& IntelliDE 京ICP备13000930号