久久青草久久,亚洲精品tv久久久久久久久久,成人羞羞国产免费

為什么要對(duì)URL進(jìn)行encode

在寫(xiě)網(wǎng)絡(luò)爬蟲(chóng)時(shí)，發(fā)現(xiàn)提交表單中的中文字符都變成了TextBox1=%B8%C5%C2%CA%C2%DB這種樣子，觀察這是中文對(duì)應(yīng)的GB2312編碼，實(shí)際上是進(jìn)行了GB2312編碼和urlencode。

那么為什么要對(duì)URL進(jìn)行encode？

因?yàn)樵跇?biāo)準(zhǔn)的url規(guī)范中中文和很多的字符是不允許出現(xiàn)在url中的。為了字符編碼（gbk、utf-8）和特殊字符不出現(xiàn)在url中，url轉(zhuǎn)義是為了符合url的規(guī)范。

具體代碼

urlencode編碼：urllib中的quote方法

import urllib.parse
chinese_str = '中文'
# 先進(jìn)行g(shù)b2312編碼
chinese_str = chinese_str.encode('gb2312')
# 輸出 b'\xd6\xd0\xce\xc4'
# 再進(jìn)行urlencode編碼
chinese_str_url = urllib.parse.quote(chinese_str)
# 輸出 %D6%D0%CE%C4

urldecode解碼：urllib中的unquote方法

# 由于編碼問(wèn)題會(huì)報(bào)錯(cuò)，還未解決
urllib.parse.unquote('%D6%D0%CE%C4')
# ：的url編碼為%3A，可輸出 http://www.baidu.com
urllib.parse.unquote('http%3A//www.baidu.com')

其它應(yīng)用

URL中%u開(kāi)頭的字符

在網(wǎng)頁(yè)的表單參數(shù)中，還遇到過(guò)%u開(kāi)頭的字符，得知是中文對(duì)應(yīng)的Unicode編碼值

以下代碼可以實(shí)現(xiàn)字符與unicode編碼值的轉(zhuǎn)換

str = '姓名'
# 獲得urlencode編碼
str = str.encode('unicode_escape')
print(str)
# 輸出 b'\\u59d3\\u540d'
str=str.decode('utf-8')
print(str)
# 輸出 \u59d3\u540d
str=str.encode('utf-8')
print(str)
# 輸出 b'\\u59d3\\u540d'
str=str.decode('unicode_escape')
print(str)
# 輸出 姓名

hidden隱藏域?qū)ο笞鳛楸韱螀?shù)

在爬取ASP.NET平臺(tái)的網(wǎng)站信息時(shí)，有VIEWSTATE、EVENTVALIDATION這樣的hidden隱藏域?qū)ο螅鳛楸韱螀?shù)發(fā)送post請(qǐng)求，所以需要從網(wǎng)頁(yè)源代碼中獲取。

但post請(qǐng)求中的參數(shù)值是URL編碼值，而網(wǎng)頁(yè)源碼中獲取到的是URL解碼值，所以需要進(jìn)行urlencode編碼。

相關(guān)代碼

# 網(wǎng)頁(yè)源碼上得到之后，需要urlencode編碼
hid['VIEWSTATE'] = urllib.parse.quote(soup.find(id="__VIEWSTATE")['value'])

相關(guān)工具

谷歌瀏覽器的開(kāi)發(fā)者工具中可以查看參數(shù)的urlencode和decode值

在線URL編碼/解碼工具

可選擇編碼格式為UTF-8或GB2312

漢字字符集編碼查詢

可查漢字的GB2312等中文編碼和Unicode編碼

參考鏈接

python中的urlencode和urldecode(代碼)

到此這篇關(guān)于Python之進(jìn)行URL編碼案例講解的文章就介紹到這了,更多相關(guān)Python之進(jìn)行URL編碼內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

詳解python中文編碼問(wèn)題
python基礎(chǔ)之編碼規(guī)范總結(jié)
Python3 json模塊之編碼解碼方法講解
解決python3 中的np.load編碼問(wèn)題
python 編碼中為什么要寫(xiě)類型注解？
python源文件的字符編碼知識(shí)點(diǎn)詳解
Python新建項(xiàng)目自動(dòng)添加介紹和utf-8編碼的方法
python中字符串的編碼與解碼詳析

標(biāo)簽：濰坊許昌渭南七臺(tái)河辛集贛州西安雅安

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《Python之進(jìn)行URL編碼案例講解》，本文關(guān)鍵詞 Python,之,進(jìn)行,URL,編碼,案例,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題，煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無(wú)關(guān)。