生成的词云图,如下:

20281688bd934da087bf0107dd95a6a1

安装wordcloud,jieba,其他包自行安装:

conda install -c conda-forge wordcloud

conda install -c conda-forge jieba

注:conda-forge是github的一个组织,提供了conda recipes库,就是一份相互关联的可打包在一起的东西。具体使用方法如上,首先加上conda-forge,然后安装所需要的工具包。这是最推荐的安装包的方式,因为是社团首选的一个可以使用的包,版本关联性等都是经过测试的。

代码示例如下:

1. 导入使用的库, 每个库的作用具体参见注释。

a74d72a99f0943c4a238eda19f6e9190

2. 读取要分析的文件,并对文本进行预处理。

dda0695d40564439b66dc68229a26150

4acaff0147594a37a01ca3e58bb5065c

注:在打开文件文件时遇到一个错误,如下,注意open的写法。

81fc2a21479d472386d8744f3fa3e29b

打开文件的时候就指定编码的类型,就可以避免出现类似的错误,如下。

fn=open('ana_test.txt',encoding='utf-8')

3. 文本分词,结果放到object_list

,使用了用户定义字典。

ec5157342fce47b1b178f3aafc703273

4. 词频统计,获取前20最高频词,并输出

a639a7c0ebe149dba5e1b9a8d906fe9f

5.

词频

显示,图像可以设置成自己喜欢的样式。

b6e27b35866042b7a6bd99def54f3375

6. 词云图像显示:参见注释步骤,从字典生成词云(词频统计), 从背景图建立颜色方案,并将词云颜色设置为背景图方案,显示出词云图像。

a51bdb8951374e1c83cd97042d901e41

7. 输出结果图,如下:

20281688bd934da087bf0107dd95a6a1

bb

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐