Python基于wordcloud及jieba实现中国地图词云图


Posted in Python onJune 09, 2020

热词图很酷炫,也非常适合热点事件,抓住重点,以图文结合的方式表现出来,很有冲击力。下面这段代码是制作热词图的,用到了以下技术:

jieba,把文本分词

wordcloud,制作热图

chardet,辨别文件的编码格式,其中中文统一为GB18030,更加的兼容

imageio,提取图片的形状

其他:自动识别文件编码,自动识别txt文件,图片文件名与txt文件一致,使用的是四大名著的文本(自行百度),部分中国地图

上代码:

import os
import jieba
import wordcloud
import chardet
import imageio
 
directory = "D:\\"
mask = imageio.imread(r"D:\map.jpg") # 用于最后图像图形
 
directory_lists = os.scandir(directory)
for directory_list in directory_lists:
 
  if directory_list.is_dir() or directory_list.path.split('.')[-1] != "txt":
    continue
 
  with open(directory_list.path, 'rb') as fd:
    coding = chardet.detect(fd.read()[:1000])['encoding']
    if coding.upper() == 'GB2312' or coding == 'GBK':
      coding = 'GB18030'
  file = open(directory_list.path, 'r', encoding=coding)
  text = file.read()
  file.close()
  jieba_text = ' '.join(jieba.lcut(text))
 
  w = wordcloud.WordCloud(height=800, width=1600, font_path='msyh.ttc', background_color='white', stopwords={'Page'}, mask=mask)
  w.generate(jieba_text)
  w.to_file('{}.png'.format(directory_list.path.split('.')[0]))

输出:

水浒传的如下

Python基于wordcloud及jieba实现中国地图词云图

西游记的如下

Python基于wordcloud及jieba实现中国地图词云图

仔细看输出的内容,还是挺有意思的,哈哈哈。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python学习手册中的python多态示例代码
Jan 21 Python
Python实现二分查找算法实例
May 26 Python
Python多进程同步简单实现代码
Apr 27 Python
简单实现python画圆功能
Jan 25 Python
PyQt5+requests实现车票查询工具
Jan 21 Python
Flask模板引擎之Jinja2语法介绍
Jun 26 Python
python使用Pandas库提升项目的运行速度过程详解
Jul 12 Python
python点击鼠标获取坐标(Graphics)
Aug 10 Python
Python键鼠操作自动化库PyAutoGUI简介(小结)
May 17 Python
Python生成并下载文件后端代码实例
Aug 31 Python
python使用re模块爬取豆瓣Top250电影
Oct 20 Python
Python 实现PS滤镜的旋涡特效
Dec 03 Python
Python中的__init__作用是什么
Jun 09 #Python
python小白学习包管理器pip安装
Jun 09 #Python
Python小白垃圾回收机制入门
Jun 09 #Python
Python中如何添加自定义模块
Jun 09 #Python
sklearn线性逻辑回归和非线性逻辑回归的实现
Jun 09 #Python
Python如何避免文件同名产生覆盖
Jun 09 #Python
对Keras中predict()方法和predict_classes()方法的区别说明
Jun 09 #Python
You might like
解析PHP中的内存管理,PHP动态分配和释放内存
2013/06/28 PHP
浅谈php中urlencode与rawurlencode的区别
2016/09/05 PHP
javascript CSS画图之基础篇
2009/07/29 Javascript
javascript instanceof 内部机制探析
2010/10/15 Javascript
用JavaScript实现类似于ListBox功能示例代码
2014/03/09 Javascript
jQuery实现批量判断表单中文本框非空的方法(2种方法)
2015/12/09 Javascript
JavaScript每天必学之数组和对象部分
2016/09/17 Javascript
AngularJS Phonecat实例讲解
2016/11/21 Javascript
用jQuery实现可输入多选下拉组合框实例代码
2017/01/18 Javascript
JavaScript获取用户所在城市及地理位置
2018/04/21 Javascript
微信小程序实现预览图片功能
2020/10/22 Javascript
elementUI中Table表格问题的解决方法
2018/12/04 Javascript
Vue安装浏览器开发工具的步骤详解
2019/05/12 Javascript
vue中配置scss全局变量的步骤
2020/12/28 Vue.js
[57:29]Alliance vs KG 2019国际邀请赛小组赛 BO2 第二场 8.16
2019/08/17 DOTA
Python 中的with关键字使用详解
2016/09/11 Python
python发送邮件实例分享
2017/07/28 Python
Python文件和流(实例讲解)
2017/09/12 Python
TensorFlow平台下Python实现神经网络
2018/03/10 Python
python计算两个矩形框重合百分比的实例
2018/11/07 Python
Python GUI库PyQt5样式QSS子控件介绍
2020/02/25 Python
python 元组的使用方法
2020/06/09 Python
聊聊python中的异常嵌套
2020/09/01 Python
关于Python 解决Python3.9 pandas.read_excel(‘xxx.xlsx‘)报错的问题
2020/11/28 Python
css3 边框、背景、文本效果的实现代码
2018/03/21 HTML / CSS
GoPro摄像机美国官网:美国运动相机厂商
2018/07/03 全球购物
希腊香水和化妆品购物网站:Parfimo.gr
2019/10/03 全球购物
Kipling澳洲官网:购买凯浦林包包
2020/12/17 全球购物
物理研修随笔感言
2014/02/14 职场文书
《故都的秋》教学反思
2014/04/15 职场文书
中国梦口号
2014/06/13 职场文书
计划生育证明书写要求
2014/09/17 职场文书
护士自荐信范文
2015/03/25 职场文书
活动总结书怎么写
2015/05/11 职场文书
如何自己动手写SQL执行引擎
2021/06/02 MySQL
无线电知识基础入门篇
2022/02/18 无线电