最近想學(xué)習(xí)一些python數(shù)據(jù)分析的內(nèi)容,就弄了個(gè)爬蟲爬取了一些數(shù)據(jù),并打算用Anaconda一套的工具(pandas, numpy, scipy, matplotlib, jupyter)等進(jìn)行一些初步的數(shù)據(jù)挖掘和分析。
在使用matplotlib畫圖時(shí),橫坐標(biāo)為中文,但是畫出的條形圖橫坐標(biāo)總是顯示“框框”,就去查資料解決。感覺這應(yīng)該是個(gè)比較常見的問題,網(wǎng)上的中文資料也確實(shí)很多,但是沒有任何一個(gè)徹底解決了我遇到的問題。零零碎碎用了快3個(gè)小時(shí)的時(shí)間,才終于搞定。特此分享,希望能幫到有同樣問題的童鞋。
運(yùn)行環(huán)境:
python2.7
Linux Centos7
用conda安裝的matplotlib和pandas
問題:
matplotlib畫圖,無法顯示中文
問題原因:
linux操作系統(tǒng)以及matplotlib的字體庫(kù)中,沒有可用的中文字體
matplotlib包默認(rèn)只支持ASCII碼,不支持unicode碼
網(wǎng)上資料總結(jié):
修改matplotlib的資源配置文件,例如增加"Simhei"字體(這個(gè)字體并不是所有的linux系統(tǒng)都有的好嘛!修改了并沒有作用)
給linux安裝中文字體,并修改matplotlib的資源配置文件。(呵呵,并沒有作用)
解決方案:
其實(shí)也是綜合了網(wǎng)上的各種解決方案。總體說來有以下幾個(gè)步驟:
1. 獲取matplotlibrc文件所在路徑。在jupyter notebook中獲取:
import matplotlib matplotlib.matplotlib_fname()
例如,我的這個(gè)文件在:
u'~/miniconda2/lib/python2.7/site-packages/matplotlib/mpl-data/matplotlibrc'
后續(xù)步驟會(huì)修改此文件中的font參數(shù)。
2. 看看系統(tǒng)中的所有字體,以及可用的中文字體。也是在jupyter nb中:
from matplotlib.font_manager import FontManager import subprocess fm = FontManager() mat_fonts = set(f.name for f in fm.ttflist) print mat_fonts output = subprocess.check_output( 'fc-list :lang=zh -f "%{family} "', shell=True) print '*' * 10, '系統(tǒng)可用的中文字體', '*' * 10 print output zh_fonts = set(f.split(',', 1)[0] for f in output.split(' ')) available = mat_fonts & zh_fonts print '*' * 10, '可用的字體', '*' * 10 for f in available: print f
做完上述操作,會(huì)發(fā)現(xiàn)“可用的字體”這里為空。因?yàn)闆]有中文字體給matplotlib用(所以才會(huì)中文都顯示“框框”)
3. 假設(shè)操作系統(tǒng)中沒有中文字體。此時(shí)下載一個(gè)ttf中文字體,并在cenos中安裝。要安裝那種系統(tǒng)能檢測(cè)font-family的,否則無效。我在這個(gè)網(wǎng)站下載的:http://font.chinaz.com/130130474870.htm
解壓rar文件。在 /usr/share/fonts 路徑下創(chuàng)建存放此字體的文件夾yourfontdir,并下載的ttf文件復(fù)制到y(tǒng)ourfontdir中(可以給文件改個(gè)英文名,方便操作)
4. 給cenos安裝這個(gè)字體。
cd /usr/share/fonts/yourfontsdir #生成字體索引信息. 會(huì)顯示字體的font-family sudo mkfontscale sudo mkfontdir #更新字體緩存: fc-cache
5. 修改matplotlibrc文件
修改步驟1中獲取的matplotlibrc文件配置。
將font.family 部分注釋去掉,并且在font.serif 支持字體加上一個(gè)中文字體。這里就加上剛才下載的中文字體的font-family. 可以通過 fc-list 命令查找一下(所以前面最好記下來)。我這里增加的是"WenQuanYi Zen Hei Mono"字體。
下面這句注釋要去掉,不然中文減號(hào)也顯示方塊:
axes.unicode_minus : False
6. 這一步驟最重要!為matplotlib增加中文字體
完成步驟5后,再操作步驟2,會(huì)發(fā)現(xiàn)“可用的中文字體”已經(jīng)有了剛才安裝的字體,但是畫圖仍然不能顯示中文。這是因?yàn)槟氵@個(gè)字體給centos安裝了、也告訴matplotlib要用這個(gè)字體了,但是,matplotlib找不到這個(gè)字體的ttf文件啊。。所以需要給它弄一個(gè)。
將下載的ttf字體復(fù)制一份到以下路徑:
~/miniconda2/lib/python2.7/site-packages/matplotlib/mpl-data/fonts/ttf
并刪除相關(guān)cache。在以下路徑:
~/.cache/matplotlib
刪除其中與字體有關(guān)的cache
7. 現(xiàn)在重新畫個(gè)圖試試。搞定。
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com