>
Python 词云高级用法
2021年4月28日 21:30
Python
  • 1360
  • 527
  • 64
  • 51

如何使用Python来绘制好看的词云呢?

1.首先我们需要安装词云的包: pip install wordcloud

2.导入词云的包:from wordcloud import WordCloud

首先我们需要了解词云的参数:

font_path : string  #字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = '黑体.ttf'


width : int (default=400) #输出的画布宽度,默认为400像素


height : int (default=200) #输出的画布高度,默认为200像素


prefer_horizontal : float (default=0.90) #词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )


mask : nd-array or None (default=None) #如果参数为空,则使用二维遮罩绘制词云。如果 mask 非空,设置的宽高值将被忽略,遮罩形状被 mask 取代。除全白(#FFFFFF)的部分将不会绘制,其余部分会用于绘制词云。如:bg_pic = imread('读取一张图片.png'),背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。可以用ps工具将自己要显示的形状复制到一个纯白色的画布上再保存,就ok了。一般为mask=np.array(Image.open('xxx.jpg'))。其中from PIL import Image


scale : float (default=1) #按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍


min_font_size : int (default=4) #显示的最小的字体大小


font_step : int (default=1) #字体步长,如果步长大于1,会加快运算但是可能导致结果出现较大的误差


max_words : number (default=200) #要显示的词的最大个数


stopwords : set of strings or None #设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS


background_color : color value (default=”black”) #背景颜色,如background_color='white',背景颜色为白色


max_font_size : int or None (default=None) #显示的最大的字体大小


mode : string (default=”RGB”) #当参数为“RGBA”并且background_color不为空时,背景为透明


relative_scaling : float (default=.5) #词频和字体大小的关联性


color_func : callable, default=None #生成新颜色的函数,如果为空,则使用 self.color_func


regexp : string or None (optional) #使用正则表达式分隔输入的文本


collocations : bool, default=True #是否包括两个词的搭配


colormap : string or matplotlib colormap, default=”viridis” #给每个单词随机分配颜色,若指定color_func,则忽略该方法


random_state : int or None  #为每个单词返回一个PIL颜色


代码如下:

from wordcloud import WordCloud  #导入词云的包
wcd=WordCloud(
    background_color=White,#产生一个背影颜色 
    repeat=True,#是否重复产生词
    max_words=500,#重复产生词最大数量
    height=480,#图片大小
    width=780,#图片大小
    max_font_size=100,#最大的字号
    font_path = r'C:\Windows\Fonts\simfang.ttf',#字体路径
    colormap="Reds",#修改字体颜色 地址:https://matplotlib.org/2.0.2/users/colormaps.html
    mode="RGBA",#背景为透明
)
text="CYBLOG 欢迎你 感谢 您 对CYBLOG 的 支持 与 理解 "
wcd.generate(text)
wcd.to_image()

词云.png


这个词云是你们想要的图片吗?

反正不是我想要的 

接下来 我们一起写词云高级的用法:

第一步: 需要导入两个包   numpy ,PIL 

如果没有安装 的话 自行安装

第二步:需要找一张图片 我这里使用的如下图:


image.png

文本只填充 value!=255 的区域,对 Value ==255 区域忽略 ,所以如果作为mask的备选图像不满足这个条件的话,需对图像进行预处理如下,背景用纯白色像素填充

高级词云的代码:

from wordcloud import WordCloud
import numpy as np
from PIL import Image
mask=np.array(Image.open("ax.png")) #打开图片
wcd=WordCloud(
    background_color="White",#产生一个背影颜色
    repeat=True,#是否重复产生词
    max_words=500,#重复产生词最大数量
    height=200,#图片大小
    width=200,#图片大小
    max_font_size=100,#最大的字号 
    font_path = r'C:\Windows\Fonts\simfang.ttf',#字体路径
    colormap="Reds",#修改字体颜色
    mask=mask,#图片
#     contour_width=1,#轮廓宽度
#     contour_color="red",#轮廓颜色
    mode="RGBA",#背景为透明
)
text="CYBLOG 欢迎你 感谢 您 对CYBLOG 的 支持 与 理解 "
wcd.generate(text)
wcd.to_image()

这样写代码的结果是怎么样的呢?

我们来看看 如下图:

词云高级.png

这样的效果怎么样呢 ? 如果你有喜欢的图 更换图路径就可以制作出好看的词云图。

总结

感谢各位博友的阅读 ,欢迎您们提出意见 让我们一起交流。感谢你们对CYBLOG的支持理解,本次讲解到此结束!

全部评论 (0)
返回
顶部