重慶分公司,新征程啟航
為企業提供網站建設、域名注冊、服務器等服務
為企業提供網站建設、域名注冊、服務器等服務
詞云圖是將詞匯按照頻率的高低顯示不同大小而形成的圖,可以一目了然地看出關鍵詞。下面是詞云圖的python代碼~
成都創新互聯公司堅持“要么做到,要么別承諾”的工作理念,服務領域包括:成都做網站、成都網站設計、企業官網、英文網站、手機端網站、網站推廣等服務,滿足客戶于互聯網時代的高陵網站設計、移動媒體設計的需求,幫助企業找到有效的互聯網解決方案。努力成為您成熟可靠的網絡建設合作伙伴!
#導入需要模塊
import jieba
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
text_road=str(input('請輸入文章的路徑:'))
picture_road=str(input('請輸入圖片的路徑:'))
#加載需要分析的文章
text = open(text_road,'r',encoding='utf-8').read()
#對文章進行分詞
wordlist_after_jieba = jieba.cut(text, cut_all=False)
wl_space_split = " ".join(wordlist_after_jieba)
#讀取照片通過numpy.array函數將照片等結構數據轉化為np-array
mask=np.array(Image.open(picture_road))
#選擇屏蔽詞,不顯示在詞云里面
stopwords = set(STOPWORDS)
#可以加多個屏蔽詞
stopwords.add("
")
#創建詞云對象
wc = WordCloud(
background_color="white",
font_path='/Library/Fonts/Arial Unicode.ttf',
max_words=1000, # 最多顯示詞數
mask=mask,
stopwords=stopwords,
max_font_size=100 # 字體最大值
)
#生成詞云
wc.generate(text)
#從背景圖建立顏色方案
image_colors =ImageColorGenerator(mask)
#將詞云顏色設置為背景圖方案
wc.recolor(color_func=image_colors)
#顯示詞云
plt.imshow(wc,interpolation='bilinear')
#關閉坐標軸
plt.axis("off")
#顯示圖像
plt.show()
#保存詞云
wc.to_file('詞云圖.png')
下面這張圖是我爬了阿里巴巴招聘網站上所有數據分析職位需求,生成的詞云圖,大家可以看看阿里對數據分析師的要求~