Python基于wordcloud及jieba实现中国地图词云图


Posted in Python onJune 09, 2020

热词图很酷炫,也非常适合热点事件,抓住重点,以图文结合的方式表现出来,很有冲击力。下面这段代码是制作热词图的,用到了以下技术:

jieba,把文本分词

wordcloud,制作热图

chardet,辨别文件的编码格式,其中中文统一为GB18030,更加的兼容

imageio,提取图片的形状

其他:自动识别文件编码,自动识别txt文件,图片文件名与txt文件一致,使用的是四大名著的文本(自行百度),部分中国地图

上代码:

import os
import jieba
import wordcloud
import chardet
import imageio
 
directory = "D:\\"
mask = imageio.imread(r"D:\map.jpg") # 用于最后图像图形
 
directory_lists = os.scandir(directory)
for directory_list in directory_lists:
 
  if directory_list.is_dir() or directory_list.path.split('.')[-1] != "txt":
    continue
 
  with open(directory_list.path, 'rb') as fd:
    coding = chardet.detect(fd.read()[:1000])['encoding']
    if coding.upper() == 'GB2312' or coding == 'GBK':
      coding = 'GB18030'
  file = open(directory_list.path, 'r', encoding=coding)
  text = file.read()
  file.close()
  jieba_text = ' '.join(jieba.lcut(text))
 
  w = wordcloud.WordCloud(height=800, width=1600, font_path='msyh.ttc', background_color='white', stopwords={'Page'}, mask=mask)
  w.generate(jieba_text)
  w.to_file('{}.png'.format(directory_list.path.split('.')[0]))

输出:

水浒传的如下

Python基于wordcloud及jieba实现中国地图词云图

西游记的如下

Python基于wordcloud及jieba实现中国地图词云图

仔细看输出的内容,还是挺有意思的,哈哈哈。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
利用python批量给云主机配置安全组的方法教程
Jun 21 Python
Python中用字符串调用函数或方法示例代码
Aug 04 Python
python3+PyQt5 创建多线程网络应用-TCP客户端和TCP服务器实例
Jun 17 Python
python函数装饰器之带参数的函数和带参数的装饰器用法示例
Nov 06 Python
Pytorch转tflite方式
May 25 Python
浅谈numpy中np.array()与np.asarray的区别以及.tolist
Jun 03 Python
Pycharm中配置远程Docker运行环境的教程图解
Jun 11 Python
详解Pandas 处理缺失值指令大全
Jul 30 Python
Python使用grequests并发发送请求的示例
Nov 05 Python
python 用opencv实现霍夫线变换
Nov 27 Python
解决python3输入的坑——input()
Dec 05 Python
Python用access判断文件是否被占用的实例方法
Dec 17 Python
Python中的__init__作用是什么
Jun 09 #Python
python小白学习包管理器pip安装
Jun 09 #Python
Python小白垃圾回收机制入门
Jun 09 #Python
Python中如何添加自定义模块
Jun 09 #Python
sklearn线性逻辑回归和非线性逻辑回归的实现
Jun 09 #Python
Python如何避免文件同名产生覆盖
Jun 09 #Python
对Keras中predict()方法和predict_classes()方法的区别说明
Jun 09 #Python
You might like
同一空间绑定多个域名而实现访问不同页面的PHP代码
2006/12/06 PHP
浅析PHP页面局部刷新功能的实现小结
2013/06/21 PHP
javascript fullscreen全屏实现代码
2009/04/09 Javascript
javascript 弹出的窗口返回值给父窗口具体实现
2013/11/23 Javascript
JS跨域问题详解
2014/11/25 Javascript
js实现下拉列表选中某个值的方法(3种方法)
2015/12/17 Javascript
Javascript实现鼠标框选操作  不是点击选取
2016/04/14 Javascript
BootStrap框架中的data-[ ]自定义属性理解(推荐)
2017/02/14 Javascript
从零学习node.js之模块规范(一)
2017/02/21 Javascript
jQuery加密密码到cookie的实现代码
2017/04/18 jQuery
js实现移动端编辑添加地址【模仿京东】
2017/04/28 Javascript
基于axios 解决跨域cookie丢失的问题
2018/09/26 Javascript
mpvue+vuex搭建小程序详细教程(完整步骤)
2018/09/30 Javascript
JavaScript ES6箭头函数使用指南
2018/12/30 Javascript
ElementUI 修改默认样式的几种办法(小结)
2020/07/29 Javascript
[02:27]2018DOTA2亚洲邀请赛赛前采访-OpTic
2018/04/03 DOTA
python3.5 + PyQt5 +Eric6 实现的一个计算器代码
2017/03/11 Python
python简单操作excle的方法
2018/09/12 Python
Laravel+Dingo/Api 自定义响应的实现
2019/02/17 Python
详解Python Matplotlib解决绘图X轴值不按数组排序问题
2019/08/05 Python
对Pytorch神经网络初始化kaiming分布详解
2019/08/18 Python
springboot配置文件抽离 git管理统 配置中心详解
2019/09/02 Python
pytorch 彩色图像转灰度图像实例
2020/01/13 Python
Python单例模式的四种创建方式实例解析
2020/03/04 Python
python中通过pip安装库文件时出现“EnvironmentError: [WinError 5] 拒绝访问”的问题及解决方案
2020/08/11 Python
HTML5单页面手势滑屏切换原理分析
2017/07/10 HTML / CSS
Links of London官方网站:英国标志性的珠宝品牌
2017/04/09 全球购物
办理退休介绍信
2014/01/09 职场文书
个人安全生产承诺书
2014/05/22 职场文书
本科毕业生应聘求职信
2014/07/06 职场文书
机关党建工作汇报材料
2014/08/20 职场文书
2014入党积极分子破除“四风”思想汇报
2014/09/14 职场文书
工会积极分子个人总结
2015/03/03 职场文书
二手房购房意向书
2015/05/09 职场文书
五年级作文之学校的四季
2019/12/05 职场文书