問題描述
嘗試用Python寫一個Wordcloud的時候,出現了編碼問題。
Python打開并讀取TXT?照著網上某些博客的說法添添改改后,結果是變成了"UnicodeDecodeError: "utf-8' codec can't decode byte…”這個錯誤。
搗鼓了一天啊,TXT(此處為本人現下內心表情)。最后,干脆寫個最簡單的文件讀取,竟然還是報錯。于是就考慮是不是txt的編碼問題,因為讀取的txt文件是在Mac上面新建的純文本文件,一時沒找到在哪里查看編碼,最后拷貝到Windows系統上,查看了txt文件的編碼,竟然是ASCII,不是我最愛的utf-8,Mac你辜負了我對你的一番信任啊!ε(┬┬﹏┬┬)3
解決方法
將txt文件的編碼格式改為utf-8即可
Python讀取文件?此外,在打開文件的時候,要加上第三個參數encoding="utf8'(沒有橫杠)。
with open('./test3.txt','r',encoding='utf8') as fin:
for line in fin.readlines():
line = line.strip(' ')
python怎么讀取txt文件,下面附上第一次成功顯示的詞云的源碼(參考網上他人的,注釋很詳細)
import jieba
import jieba.analyse
from matplotlib import pyplot as plt
python讀取文件第n行?from scipy.misc import imread
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
# 1.讀取數據
with open("./test.txt","r",encoding="utf8") as f:
python輸出到txt文件,text = f.read()
# 2.基于 TextRank 算法的關鍵詞抽取,top50
keywords = jieba.analyse.textrank(text, topK=50, withWeight=False, allowPOS=('ns', 'n', 'vn', 'v'))
file = ",".join(keywords)
python讀取文件內容?# 指定中文字體,不然中文顯示框框
font = r'./HYQiHei-25J.ttf'
print(file)
# 指定背景圖,隨意
python讀取文本,image = imread('cake.jpg')
wc = WordCloud(
font_path=font,
background_color='white',#背景色
python讀取整個txt文件?mask=image,#背景圖
stopwords=STOPWORDS,#設置停用詞
max_words=100,#設置最大文字數
max_font_size=100,#設置最大字體
python讀取csv文件、width=800,
height=1000,
)
#生成詞云
python讀取txt數據。image_colors = ImageColorGenerator(image)
wc.generate(file)
# 使用matplotlib,顯示詞云圖
plt.imshow(wc) #顯示詞云圖
plt.axis('off') #關閉坐標軸
plt.show()
# 保存圖片
wc.to_file('news.png')
以上這篇Python3 解決讀取中文文件txt編碼的問題就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持我們。
本文標題: Python3 解決讀取中文文件txt編碼的問題
本文地址: http://www.cppcns.com/jiaoben/python/294349.html
版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。
工作时间:8:00-18:00
客服电话
电子邮件
admin@qq.com
扫码二维码
获取最新动态