python词云库wordcloud的使用方法与实例详解


Posted in Python onFebruary 17, 2020

wordcloud是优秀的词云展示第三方库

python词云库wordcloud的使用方法与实例详解

一、基本使用

import jieba
import wordcloud
txt = open("1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
# print(txt1)
w = wordcloud.WordCloud(font_path="msyh.ttc",
      width=1000, height=700, background_color="white",
      )
w.generate(txt_1)
w.to_file("ciyun.png")

二、按图片形状生成

import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import numpy as np
from PIL import Image

txt = open("C:/Users/96356/Desktop/1.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)
txt_1 = " ".join(words)
photo = np.array(Image.open('C:/Users/96356/Desktop/2.png'))
# from scipy.misc import imread
# china=imread('C:/Users/96356/Desktop/2.png') #scipy.misc方式都可以读取图片

w = WordCloud(font_path="msyh.ttc",
    mask=photo,
    background_color="white",
    )
w.generate(txt_1)
w.to_file("ciyun.png")

三、WordCloud参数详解

from wordcloud import WordCloud

参数 作用
font_path 字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = ‘黑体.ttf'
width 输出的画布宽度,默认为400像素
height 输出的画布高度,默认为200像素
prefer_horizontal 词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
mask 如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread(‘读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open(‘xxx.jpg'))。其中from PIL import Image
scale 按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍
min_font_size 显示的最小的字体大小
font_step 字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差
max_words 要显示的词的最大个数
stopwords 设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS
background_color 背景颜色,如background_color=‘white',背景颜色为白色
max_font_size 显示的最大的字体大小
mode 当参数为“RGBA”并且background_color不为空时,背景为透明
relative_scaling 词频和字体大小的关联性
color_func 生成新颜色的函数,如果为空,则使用 self.color_func
regexp 使用正则表达式分隔输入的文本
collocations 是否包括两个词的搭配
colormap 给每个单词随机分配颜色,若指定color_func,则忽略该方法
random_state 为每个单词返回一个PIL颜色

其他部分函数

函数 作用
fit_words(frequencies) 根据词频生成词云
generate(text) 根据文本生成词云
generate_from_frequencies(frequencies[, …]) 根据词频生成词云
generate_from_text(text) 根据文本生成词云
process_text(text) 将长文本分词并去除屏蔽词(此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的 fit_words(frequencies) )
recolor([random_state, color_func, colormap]) 对现有输出重新着色。重新上色会比重新生成整个词云快很多
to_array() 转化为 numpy array
to_file(filename) 输出到文件

更多关于python词云库wordcloud的使用方法请查看下面的相关文章

Python 相关文章推荐
python求pi的方法
Oct 08 Python
python实现bucket排序算法实例分析
May 04 Python
python操作ie登陆土豆网的方法
May 09 Python
python生成excel的实例代码
Nov 08 Python
Python代码实现KNN算法
Dec 20 Python
python使用tensorflow保存、加载和使用模型的方法
Jan 31 Python
python删除服务器文件代码示例
Feb 09 Python
Python切片工具pillow用法示例
Mar 30 Python
如何基于Python pygame实现动画跑马灯
Nov 18 Python
python脚本定时发送邮件
Dec 22 Python
python实现ROA算子边缘检测算法
Apr 05 Python
Python还能这么玩之用Python修改了班花的开机密码
Jun 04 Python
tensorflow保持每次训练结果一致的简单实现
Feb 17 #Python
Python基于Socket实现简单聊天室
Feb 17 #Python
TFRecord文件查看包含的所有Features代码
Feb 17 #Python
tensorflow之tf.record实现存浮点数数组
Feb 17 #Python
Python读取表格类型文件代码实例
Feb 17 #Python
基于Python获取docx/doc文件内容代码解析
Feb 17 #Python
Python多线程获取返回值代码实例
Feb 17 #Python
You might like
php curl的深入解析
2013/06/02 PHP
Yii2增删改查之查询 where参数详细介绍
2016/08/08 PHP
PHP 二维关联数组根据其中一个字段排序(推荐)
2017/04/04 PHP
通过JS 获取Mouse Position(鼠标坐标)的代码
2009/09/21 Javascript
基于jquery的web页面日期格式化插件
2011/11/15 Javascript
js replace 与replaceall实例用法详解
2013/08/03 Javascript
jquery ajax 调用失败的原因示例介绍
2013/09/27 Javascript
JavaScript使用位运算符判断奇数和偶数的方法
2015/06/01 Javascript
JavaScript中使用自然对数ln的方法
2015/06/14 Javascript
bootstrap下拉列表与输入框组结合的样式调整
2016/10/08 Javascript
微信小程序 Windows2008 R2服务器配置TLS1.2方法
2016/12/05 Javascript
jQuery简单实现遍历单选框的方法
2017/03/06 Javascript
使用 Node.js 实现图片的动态裁切及算法实例代码详解
2018/09/29 Javascript
基于 jQuery 实现键盘事件监听控件
2019/04/04 jQuery
解决python打不开文件(文件不存在)的问题
2019/02/18 Python
pycharm重命名文件的方法步骤
2019/07/29 Python
python实现统计代码行数的小工具
2019/09/19 Python
python 3.7.4 安装 opencv的教程
2019/10/10 Python
Pycharm 安装 idea VIM插件的图文教程详解
2020/02/21 Python
Python使用GitPython操作Git版本库的方法
2020/02/29 Python
对python中return与yield的区别详解
2020/03/12 Python
keras导入weights方式
2020/06/12 Python
pycharm 配置svn的图文教程(手把手教你)
2021/01/15 Python
HTML4和HTML5之间除了相似以外的10个主要不同
2012/12/13 HTML / CSS
HTML5 3D旋转相册的实现示例
2019/12/03 HTML / CSS
大学毕业生通用自荐信范文
2013/10/31 职场文书
公司司机岗位职责
2014/02/07 职场文书
党员干部2014全国两会学习心得体会
2014/03/10 职场文书
毕业生自荐信如何写
2014/03/24 职场文书
文秘个人求职信范文
2014/04/22 职场文书
暑假社会实践心得体会
2014/09/02 职场文书
2015年幼儿园安全工作总结
2015/05/12 职场文书
湘江北去观后感
2015/06/15 职场文书
承诺书的内容有哪些,怎么写?
2019/06/21 职场文书
Python如何配置环境变量详解
2021/05/18 Python
MySQL 执行数据库更新update操作的时候数据库卡死了
2022/05/02 MySQL