• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

使用python实现个性化词云的方法

python 搞代码 4年前 (2022-01-07) 27次浏览 已收录 0个评论

最近看到可视化的词云,看到网上也很多这样的工具,但是都不怎么完美,有些不支持中文,有的中文词频统计得莫名其妙、有的不支持自定义形状、所有的都不能自定义颜色,于是网上找了一下,决定用python绘制词云

先上图片

词云图

需要模板

 pip install jieba pip install wordcloud

还需要安装另外两个东西这两个我也不太懂借鉴百度写上去的

 pip install scipy pip install matplotlib

因为用ubuntu系统所有没有windows那么麻烦,也没有那么多报错

看到好多人制作自己的词云有没有一丝丝的激动啊,有激动就要马上去做,冲动才是第一创造力。

jieba是一款很恨很好用的中文分词模板

jeiba中文文档

至于wordcloud没有中文文档不过咱会猜啊,英文不好咱们可以猜啊,查看源代码猜。

先把我全部代码贡献上来

 #-*-coding:utf-8―-*- import jieba.analyse from wordcloud import WordCloud,ImageColorGenerator from scipy.misc import imread import matplotlib.pyplot a<mark style="color:transparent">来源gaodaimacom搞#^代%!码&网</mark>s plt class wc: def __init__(self,txt_file,img_file,font_file): self.f = open(txt_file,'r') self.txt = self.f.read() self.f.close() self.tags = jieba.analyse.extract_tags(self.txt,topK=100) #topK说白了就是返回几个关键词 self.text = ' '.join(self.tags) #把分词链接起来,加空格因为英文靠空格分词 self.img = imread(img_file) self.wc = WordCloud(font_path=font_file,background_color='white',max_words=100,mask=self.img,max_font_size=80) ###直接在这里进行猜### #font_path指的是字体文件路径,因为wordcloud自带的字体不支持中文所以我们要指定一个字体文件,否者输出的图片全是框框 #background_color 默认是黑色 我设置成白色 #max_words最大显示的词数 #mask 背景图片 #max_font_size 最大字体字号 self.word_cloud = self.wc.generate(self.text) def show_wc(self): #img_color = ImageColorGenerator(self.img) plt.imshow(self.word_cloud) #可以通过 plt.imshow(self.wc.recolor(color_func=img_color))使图片颜色跟字体颜色一样 plt.axis("off") plt.show() if __name__=='__main__': mywc = wc('sanwen.txt','out.png-600','font.ttc') mywc.show_wc()

使用wc.recolor(color_func=img_color)

以上就是使用python实现个性化词云的方法的详细内容,更多请关注gaodaima搞代码网其它相关文章!


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:使用python实现个性化词云的方法

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址