python词云库wordcloud的使用方法与实例详解


Posted in Python onFebruary 17, 2020

wordcloud是优秀的词云展示第三方库

python词云库wordcloud的使用方法与实例详解

一、基本使用

import jieba
import wordcloud
txt = open("1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
# print(txt1)
w = wordcloud.WordCloud(font_path="msyh.ttc",
      width=1000, height=700, background_color="white",
      )
w.generate(txt_1)
w.to_file("ciyun.png")

二、按图片形状生成

import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import numpy as np
from PIL import Image

txt = open("C:/Users/96356/Desktop/1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
photo = np.array(Image.open('C:/Users/96356/Desktop/2.png'))
# from scipy.misc import imread
# china=imread('C:/Users/96356/Desktop/2.png') #scipy.misc方式都可以读取图片

w = WordCloud(font_path="msyh.ttc",
    mask=photo,
    background_color="white",
    )
w.generate(txt_1)
w.to_file("ciyun.png")

三、WordCloud参数详解

from wordcloud import WordCloud

参数 作用
font_path 字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf'
width 输出的画布宽度,默认为400像素
height 输出的画布高度,默认为200像素
prefer_horizontal 词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
mask 如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread(‘读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open(‘xxx.jpg'))。其中from PIL import Image
scale 按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍
min_font_size 显示的最小的字体大小
font_step 字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差
max_words 要显示的词的最大个数
stopwords 设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS
background_color 背景颜色,如background_color=‘white',背景颜色为白色
max_font_size 显示的最大的字体大小
mode 当参数为“RGBA”并且background_color不为空时,背景为透明
relative_scaling 词频和字体大小的关联性
color_func 生成新颜色的函数,如果为空,则使用 self.color_func
regexp 使用正则表达式分隔输入的文本
collocations 是否包括两个词的搭配
colormap 给每个单词随机分配颜色,若指定color_func,则忽略该方法
random_state 为每个单词返回一个PIL颜色

其他部分函数

函数 作用
fit_words(frequencies) 根据词频生成词云
generate(text) 根据文本生成词云
generate_from_frequencies(frequencies[, …]) 根据词频生成词云
generate_from_text(text) 根据文本生成词云
process_text(text) 将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap]) 对现有输出重新着色。重新上色会比重新生成整个词云快很多
to_array() 转化为 numpy array
to_file(filename) 输出到文件

更多关于python词云库wordcloud的使用方法请查看下面的相关文章

Python 相关文章推荐
python33 urllib2使用方法细节讲解
Dec 03 Python
python持久性管理pickle模块详细介绍
Feb 18 Python
python使用chardet判断字符串编码的方法
Mar 13 Python
python文件与目录操作实例详解
Feb 22 Python
Python编程判断一个正整数是否为素数的方法
Apr 14 Python
Python实现合并同一个文件夹下所有PDF文件的方法示例
Apr 28 Python
python的中异常处理机制
Aug 30 Python
python isinstance函数用法详解
Feb 13 Python
Python错误的处理方法
Jun 23 Python
Python字符串三种格式化输出
Sep 17 Python
C++和python实现阿姆斯特朗数字查找实例代码
Dec 07 Python
python实现简单倒计时功能
Apr 21 Python
tensorflow保持每次训练结果一致的简单实现
Feb 17 #Python
Python基于Socket实现简单聊天室
Feb 17 #Python
TFRecord文件查看包含的所有Features代码
Feb 17 #Python
tensorflow之tf.record实现存浮点数数组
Feb 17 #Python
Python读取表格类型文件代码实例
Feb 17 #Python
基于Python获取docx/doc文件内容代码解析
Feb 17 #Python
Python多线程获取返回值代码实例
Feb 17 #Python
You might like
不用mod_rewrite直接用php实现伪静态化页面代码
2008/10/04 PHP
php中的三元运算符使用说明
2011/07/03 PHP
php实现文件编码批量转换
2014/03/10 PHP
为你总结一些php系统类函数
2015/10/21 PHP
php面向对象值单例模式
2016/05/03 PHP
JavaScript学习笔记(十七)js 优化
2010/02/04 Javascript
XMLHTTPRequest的属性和方法简介
2010/11/23 Javascript
jquery键盘事件使用介绍
2011/11/01 Javascript
html页面显示年月日时分秒和星期几的两种方式
2013/08/20 Javascript
jQuery使用ajaxSubmit()提交表单示例
2014/04/04 Javascript
JS函数的几种定义方式分析
2015/12/17 Javascript
js实现带农历和八字等信息的日历特效
2016/05/16 Javascript
原生js实现网页顶部自动下拉/收缩广告效果
2017/01/20 Javascript
使用 vue-i18n 切换中英文效果
2018/05/23 Javascript
node thread.sleep实现示例
2018/06/20 Javascript
微信小程序实现默认第一个选中变色效果
2018/07/17 Javascript
在Python的web框架中中编写日志列表的教程
2015/04/30 Python
Python实现数据库编程方法详解
2015/06/09 Python
详解在Python程序中自定义异常的方法
2015/10/16 Python
Python人脸识别初探
2017/12/21 Python
Django 过滤器汇总及自定义过滤器使用详解
2019/07/19 Python
python实现对图片进行旋转,放缩,裁剪的功能
2019/08/07 Python
python爬虫-模拟微博登录功能
2019/09/12 Python
Django Model中字段(field)的各种选项说明
2020/05/19 Python
Python装饰器结合递归原理解析
2020/07/02 Python
了解一下python内建模块collections
2020/09/07 Python
HTML5的标签的代码的简单介绍 HTML5标签的简介
2012/05/28 HTML / CSS
美国餐厅用品和厨房设备批发网站:KaTom Restaurant Supply
2018/01/27 全球购物
亚洲独特体验旅游专家:eOasia
2018/08/15 全球购物
JPA的特点
2014/10/25 面试题
教学评估实施方案
2014/03/16 职场文书
三年级上册科学教学计划
2015/01/21 职场文书
中学生自我评价2015
2015/03/03 职场文书
Sql Server之数据类型详解
2022/02/28 SQL Server
Spring Security使用单点登录的权限功能
2022/04/03 Java/Android
Python通用验证码识别OCR库ddddocr的安装使用教程
2022/07/07 Python