国产伦精品一区二区三区千人斩,日韩一区二区av,欧美区日韩区

主頁 > 知識庫 > Python編解碼問題及文本文件處理方法詳解

Python編解碼問題及文本文件處理方法詳解

編解碼器

在字符與字節之間的轉換過程稱為編解碼，Python自帶了超過100種編解碼器，比如：

ascii（英文體系）
gb2312（中文體系）
utf-8（全球通用）
latin1
utf-16

編解碼器一般有多個別名，比如utf8、utf-8、U8。

這些編解碼器可以傳給open()、str.encode()、bytes.decode()等函數的encoding參數。

UnicodeEncodeError

多數非UTF編解碼器（比如cp437）只能處理Unicode字符的一小部分子集。把字符轉換成字節時，如果目標編碼中沒有定義這個字符，那么就會拋出UnicodeEncodeError異常。

處理方式一：使用utf8編碼。

處理方式二：添加errors參數：

# 忽略 如b'So Paulo'
city.encode("cp437", errors="ignore")
# 替換為? 如b'S?o Paulo'
city.encode("cp437", errors="replace")
# 替換為XML實體 如b'S#227;o Paulo'
city.encode("cp437", errors="xmlcharrefreplace")

UnicodeDecodeError

把字節轉換為字符時，遇到無法轉換的字節時會拋出UnicodeDecodeError異常。這是因為不是每個字節都包含有效的ASCII字符，也不是每個字符都是有效的UTF-8。

處理方式也有兩種，跟上面一樣。

SyntaxError

Python3默認使用UTF-8編碼源碼。如果加載的.py模塊中包含UTF-8之外的數據，而且沒有聲明編碼，就會拋出SyntaxError異常。

處理方式是在文件頂部添加coding注釋：

# coding: cp1252

但是這個辦法并不好，最好還是找到這些報錯字符，把它們轉換為UTF-8。

從網上直接復制代碼到IDE中執行經常會報這個錯。

處理文本文件

Unicode三明治：

在程序中盡量少接觸二進制，把字節解碼為字符，只處理字符串對象。比如在Django中，view應該輸出Unicode字符串，Django會負責把響應數據編碼成字節序列，而且默認使用UTF-8編碼。

Python內置的open函數就是采用了這個原則，在讀取文件時會做必要的解碼，以文本模式寫入文件時會做必要的編碼。

文件亂碼

Windows更容易遇到這個問題，因為Windows并不是統一的UTF-8編碼，比如在Windows10中：

>>> open("cafe.txt", "w", encoding="utf8").write("café")
4
>>> open("cafe.txt").read()
'caf茅'

寫入文件時指定了utf8，但是讀取文件沒有指定，Python就會使用系統默認編碼：

>>> import locale
# 打開文件用這個
# 如果沒有設置PYTHONENCODING環境變量，sys.stdout/stdin/stderr也用這個
>>> locale.getpreferredencoding()
'cp936'

cp936把最后一個字節解碼成了茅而不是é。

>>> import sys
# 二進制數據和字符串之間轉換用這個
>>> sys.getdefaultencoding()
'utf-8'

>>> import sys
# 文件名（不是文件內容）用這個
>>> sys.getfilesystemencoding()
'utf-8'

GNU/Linux或Mac OS X不會遇到這個問題，因為多年來它們的默認編碼都是UTF-8。

解決辦法是一定不能依賴系統默認編碼，打開文件時始終應該明確傳入encoding=參數，因為不同的設備使用的默認編碼可能不同，有時隔一天也會發生變化。

小結

本文介紹了Python的編解碼器，以及可能出現的UnicodeEncodeError、UnicodeDecodeError、SyntaxError問題，然后給出了Python的open函數處理文本文件的原則，最后對Windows容易出現的文件亂碼問題進行了說明。

到此這篇關于Python編解碼問題及文本文件處理方法的文章就介紹到這了,更多相關Python編解碼及文本處理內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家！

參考資料：

《流暢的Python》

您可能感興趣的文章:

Python使用email模塊對郵件進行編碼和解碼的實例教程
Python簡單實現Base64編碼和解碼的方法
Python中json格式數據的編碼與解碼方法詳解
Python base64編碼解碼實例
對python中url參數編碼與解碼的實例詳解
詳解Python中的文本處理
Python文本處理之按行處理大文件的方法
Python實現簡單文本字符串處理的方法
python處理文本文件并生成指定格式的文件
Python處理文本文件中控制字符的方法

標簽：清遠安慶長春洛陽泉州怒江吉林岳陽

巨人網絡通訊聲明：本文標題《Python編解碼問題及文本文件處理方法詳解》，本文關鍵詞 Python,編,解碼,問題,及,文本,；如發現本文內容存在版權問題，煩請提供相關信息告之我們，我們將及時溝通與處理。本站內容系統采集于網絡，涉及言論、版權與本站無關。

下面列出與本文章《Python編解碼問題及文本文件處理方法詳解》相關的同類信息！

Python編解碼問題及文本文件處理方法詳解

編解碼器在字符與字節之間的轉換過程稱為編解碼，Python自帶了超過100種編解碼器，比如： ascii（英文體系） gb2312（中文體系） utf-8（全球通用） latin1 utf-16 編解碼器一般有多個別名...

10-18

蘭州電銷卡外呼系統線路

蘭州電銷卡外呼系統線路現在工信部對高頻段呼出嚴打的環境下，電銷公司只能依靠外呼系統線路來避免因高頻外呼而封號...

11-15

宜春外呼系統價格（外呼系統哪家線路比較好）

本篇文章給大家談談宜春外呼系統價格，以及外呼系統哪家線路比較好對應的知識點，希望對各位有所幫助，不要忘了收藏本...

05-17

在全球外包100名中，RR Donnelley是領先的外包服務提供商

R. R. Donnelley & Sons 公司今天宣布：在全球外包 100 名中，其全球外包服務已連續第四年被公眾認可。全球外包 100 強名單，每年...

10-22

專利權限制的立法完善

專利權的內容立法始終關系專利權個人利益與國家、社會利益之間的平衡問題。在各國立法實踐中。它們大都規定了專利權的...

10-23

“叔同”商標被認無效申請人不服訴至法院

來源：中國法院網近日，北京知識產權法院受理了“叔同”商標無效宣告請求行政糾紛一案。訴爭商標由牧馬人公司于201...

10-23

未來農業報告：物聯網和新零售是主要力量

35斗對這份名為《食物革命：糧食的未來和我們面臨的挑戰》的報告進行了編譯，將陸續刊出。這是該系列的第四篇文章，主...

10-13

使用電銷卡是不是不會被封號？電銷卡會被封號嗎？

使用電銷卡是不是不會被封號？電銷卡會被封號嗎？由于電銷卡越來越容易出現封號的問題，所以不少的電銷人員把目光...

10-26

長治自動電銷卡大全（長治電信營業廳電話號碼）

本文目錄一覽：1、有什么適合做電銷的手機卡2、什么是電銷卡3、哪些電銷卡?4、智慧加油站系統公司找哪家比較好？5、防封...

07-10

麗水防封外呼機器人辦理價格,外呼機器人-原來是這樣

麗水防封外呼機器人辦理價格,外呼機器人不變則亡”的抉擇。據有關預測，在未來銷售行業，越早接觸人工智能的企業，就...

12-16

現代企業是否有必要開通400電話？

在發展競爭中，企業希望與潛在客戶溝通，改善客戶服務體驗，優化品牌形象，提高競爭力。很難使用網絡平臺或其他社交軟...

04-03

電銷客戶軟件使用介紹

導入編號【電銷客戶軟件使用介紹】外呼模板【電銷客戶軟件使用介紹】 4、設定編號說明規則【電銷客戶軟件使用介紹】...

10-30

海航通信卡正規嗎?（海航通信電話卡正規么）

近些年虛擬運營商慢慢走進大家的日常生活中，但是有很多人并不了解虛擬運營商，甚至對虛擬運營商存在誤解，虛擬運營商...

09-19

商標品牌俗稱、簡稱、昵稱法律保護的典型案例

來源：福建質量管理作者：紀翔 “索尼愛立信”是日本索尼公司和瑞典愛立信公司的合資企業，成立于2001年，在中國市場上...

10-23

阿朗或15億美元出售企業電信設備部門正尋買家

4月14日消息，據國外媒體報道，知情人士稱，阿爾卡特-朗訊正在探索出售其向企業銷售電話和其它電信設備的業務部門。這...

10-19

得到XML文檔大小的方法

XML文檔從格式到大小都是不是確定的。有的可能只有幾行，而有的卻有好幾兆字節。你也許會懷疑是不是需要了解XML文檔的大...

10-18

汕尾企業電銷卡（汕尾企業電銷卡怎么辦理）

本文目錄一覽：1、電銷卡如何避免封卡?2、電銷卡是什么卡?3、電銷卡為什么要留公司名4、電銷卡是否真的不封號?卡總被停...

07-10

移動撥打400電話怎么收費移動，靈活，可擴展和可靠的400電話系統解決方案

目前，通信工具越來越發展，固定電話逐漸淡出人們的視野。人們越來越喜歡日常交流的移動通信工具。我們可以隨時隨地...

01-13

移動400資費包括什么移動業務400是什么意思

移動400資費包括什么移動業務400是什么意思以下內容由巨人小編整理發布。座機撥打400電話是收費的按照市話費收取。手機...

02-07

菏澤市機器人電銷外包招聘（菏澤市機器人電銷

本文目錄一覽：1、有了電銷機器人是不是就不需求招電銷職工了？2、沒有用的比較好的電銷機器人啊？求介紹！現在的招...

11-29

400電話語音導航內容內蒙古400電話有哪些功能

內蒙古赤峰400電話語音導航功能：通過語音提示選擇按鈕，將電話直接轉到相關部門。 “歡迎致電***公司，咨詢請按1，售后...

01-12

400開頭的電話能接嗎400開頭電話可以接聽嗎

(400開頭的電話能接嗎)(400開頭電話可以接聽嗎)以下內容由巨人小編整理發布。 400電話只是一個轉接來電的服務，沒有線路，...

01-12

河北電話外呼系統有效果嗎（電話外呼人員是干什么的）

今天給各位分享河北電話外呼系統有效果嗎的知識，其中也會對電話外呼人員是干什么的進行解釋，如果能碰巧解決你現在面...

06-09

python 實現多線程的三種方法總結

1._thread.start_new_thread(了解) import threadingimport timeimport _threaddef job(): print("這是一個需要執行的任務。。。。。") print("當前線程...

10-18

徐州人工智能電話機器人（徐州人工智能電話機器人招聘）

本文目錄一覽： 1、人工智能電話機器人到底值不值得應用?2、人工智能電話營銷機器人到底能做什么？3、人工智能電話機器...

11-28

400號碼接聽要錢嗎400電話辦理費用會受哪些因素影響

作為企業的專屬客戶服務電話，400電話采用主被稱分享的方式。無論是用戶打電話還是企業接聽，都需要支付電話費，但雙...

01-12

天潤融通助力梵客家居優化呼叫中心體系

在當今社會，傾聽用戶的每一個聲音，確保服務渠道的方便和順暢，及時響應服務人員，是企業與用戶進行良性溝通、建立信...

07-12

400電話辦理的費用是多少呢400電話辦理如何選擇一家靠譜的服務商

說到客戶服務電話的使用，我相信很多企業不會感到奇怪。隨著科學技術的不斷發展，也有許多高質量的工具可以使用，這...

01-13

抖音短視頻代運營中有哪些流量池引薦規律？

抖音是一個關于夸姣的短視頻APP，不同于快手的略微低俗的流量和受眾，抖音是一個記載“夸姣”的產品，夸姣是什么？每個...

03-01

上海ai外呼電話機器人哪家強（ai機器人運營商外呼線路）

本文目錄一覽：1、ai智能電話銷售機器人哪家的靠譜?2、選擇智能電話機器人的話,哪家的比較好?3、人工電話機器人選哪家實...

07-15

呼叫中心職業生涯目標制訂的基本步驟方法與目標制定的具體方法

(一) 呼叫中心職業生涯目標制訂的基本步驟: 職業生涯目標的制訂一般需要經過6個步驟。 (1)自我分析，認識自我，找出自己...

10-20

打電銷不封號的手機卡

不封號的手機卡，電銷不封卡，電銷手機卡為什么要用電銷卡？對于電銷公司來說，電銷封卡是給不容忽視的問題！如果沒...

11-15

在線客服系統選擇要點，用戶滿意度調查顯示明確結果

企業發展需要挖掘和維護客戶關系，找到適合的在線客服系統至關重要。選擇在線客服系統關鍵點在于接入全渠道客戶資源，...

07-12

多功能客服帶動400電話辦理

400電話從通常意義上來講就是一種主被叫分攤業務，就是說主叫承擔市話接入費，而被叫承擔所有來電接聽費用。400電話具有...

05-15

電銷卡辦理難嗎（辦電銷卡有什么影響）

本文目錄一覽： 1、電銷卡在哪里處理多少錢2、平頂山電銷卡怎樣處理3、電信電銷改套餐好做嗎?4、本年電銷卡真的太難了，...

04-22

濟南三網電銷軟件批發,電話銷售系統辦理-點擊查看

濟南三網電銷軟件批發,電話銷售系統辦理實際上，言通智能營銷系統作為一站式智能營銷解決方案服務平臺，本質上就是為...

12-16

青島將認定技術先進型服務企業

人民網青島視窗1月11日消息: 青島將在今年開展技術先進型服務企業的認定工作,以促進企業技術創新和技術服務能力的提升。...

10-22

湖州crm外呼系統多少錢（crm外呼工作的弊端）

本文目錄一覽： 1、外呼體系一個多少錢，有哪些功用？2、外呼體系多少錢一個月？3、外呼體系多少錢一套？怎樣裝置？4、...

04-22

win8系統連網就藍屏提示unexpected kernel mode trap錯誤怎么辦?

win8一連上網，不久便藍屏，顯示unexpected kernel mode trap,怎么辦呢？ 1、同時按下 win鍵和x鍵，呼出快捷菜單。 2、按下M鍵，啟...

10-20

隨時隨地新浪網看病，東華互聯網醫院藥品處方

盡管現在優先選擇電話銷售服務中心BizTalk的民營企業有許多，但也并非所有民營企業的電話銷售服務中心都有必要BizTalk出去...

11-29

《世界版權公約》

《世界版權公約》由聯合國教科文組織發起簽訂，于1952年9月6日在瑞士日內瓦獲得通過，1955年生效。1971年7月在巴黎曾作補充...

10-23

巨人科技有很多400開頭的電話供企業選擇

05-15

Linux使用文本瀏覽器lynx并顯示中文的方法

使用Fedora，當然需要玩一些酷的東東，lynx是在文本環境下不錯的網頁瀏覽工具，在網速不好的時候使用lynx可以減少網頁下載...

10-20

物聯卡應用_遠特通信卡盟不僅為合作伙伴賦能還可增強變現能....

2022年，物聯網領域突破萬億市場，各種工業級和民用級智能設備層出不窮。物聯網卡在物聯網設備中起著重要作用，需求也...

11-07

服務外包行業上QQ開會

本報訊從區外經貿局了解到，蕭山區服務外包第一次網絡工作會議已于近日召開，全區有30多家服務外包企業在網上以QQ群聊...

10-22

最全Windows 10高清鎖屏壁紙下載附網盤下載地址

為了增加Windows 10的美觀性，微軟為自己的新一代操作系統新增了一個鎖屏壁紙更換功能Windows聚焦（Windows spotlight）。 Window...

10-20

內蒙古電銷機器人（電銷機器人外呼）

今天給各位共享內蒙古電銷機器人的常識，其間也會對電銷機器人外呼進行解說，假如能可巧處理你現在面臨的問題，別忘...

11-06

安裝ghost win7系統時藍屏提示錯誤代碼0x0000007E的故障原因及解決方法

電腦藍屏問題是Windows系統中常見的問題，安裝系統時也不常會遇到系統藍屏的問題。比如有一用戶安裝win7 純凈版系統出現藍...

10-19

寧波房產專用語音電銷機器人多少一臺-誠信優惠

寧波房產專用語音電銷機器人多少一臺機器人都要等到這通轉接人工通話結束后才會進行下一通的呼出，這就降低了機器人的...

05-18

南江免費的電銷外呼系統（電銷外呼系統南牛網絡）

本篇文章給咱們談談南江免費的電銷外呼體系，以及電銷外呼體系南牛網絡對應的知識點，期望對各位有所協助，不要忘了...

05-17

400電話是免費嗎400電話的免費與不免費

400電話是代理400電話主要的分攤支付業務，也就是說需要支付一定的電話費，但是這個費用很低，只是一個本地的城市電話費...

01-12

Python編解碼問題及文本文件處理方法詳解

10-18

本頁收集關于Python編解碼問題及文本文件處理方法詳解的相關信息資訊供網民參考！

推薦文章

上一篇：淺談Python協程asyncio

下一篇：利用python進行數據加載

一起分享吧

婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

Python編解碼問題及文本文件處理方法詳解

編解碼器

UnicodeEncodeError

UnicodeDecodeError

SyntaxError

處理文本文件

文件亂碼

小結