今天,跟大家分享一下我做小項目時想出來的文本字符處理的方法,希望能對大家有所幫助。
strings = "我,是‘C|S;D|N!的:程【序】員#M,r.;P'a#n?_學(xué)?狂"#將字符串設(shè)置好 def String_Process(string):#定義一個字符處理函數(shù),設(shè)置參數(shù)string,是有待處理的字符串。 print("python使我快樂!!") print("未處理的字符串:",string) varchar = '‘'“”:#,!【】,#|?|,;;?:"'#人為設(shè)定字符集合 ls = []#定義一個列表用于存儲拆散的字符 for s in string: ls.append(s)#將字符串拆散存進(jìn)列表中 for element in ls: if element in varchar:#如果在字符集合內(nèi)發(fā)現(xiàn),則從列表中刪除 ls.remove(element) String = ''#定義字符串 for l in ls:#將列表中拆散的元素組合回去。 String = String+l print("處理后的字符串:",String)#得到處理結(jié)果 String_Process(string=strings)#調(diào)用函數(shù),傳入實參給形參。
運行結(jié)果,如下圖:
對于處理文本字符的思想在代碼中已經(jīng)說明,關(guān)于代碼的解釋在注釋中也寫出了。我們把它通過函數(shù)進(jìn)行封裝,當(dāng)我們需要處理文本字符的時候,通過調(diào)用函數(shù)就可以實現(xiàn)文本字符處理了。當(dāng)然,調(diào)用函數(shù)處理字符時需要得到string返回值以及注釋掉print,因為我們?nèi)绻窃谘h(huán)中調(diào)用,沒必要全部打印一遍,影響視覺對文本的分析。即修改代碼如下圖:
對于上面的文本處理代碼,我又做了一次更新,可以增加新的字符或者是字符串來更新字符集合,更加方便處理文本中的字符。
改進(jìn)后的代碼,如下圖:
strings = "我,是‘C|S;D|N!的:程【序】員#M,r.;②P'「(a#n」?_學(xué)?狂..."#將字符串設(shè)置好 def Process(string):#定義一個字符處理函數(shù),設(shè)置參數(shù)string,是有待處理的字符串。 print("python使我快樂!!") print("未處理的字符串:",string) varchar = '‘'“”:#,!【】,#|?|,;;?:"'#人為設(shè)定字符集合 var_ls = [] for var in varchar: var_ls.append(var) print("這是當(dāng)前的字符集合:",var_ls) while True: want = str(input("是否需要增加新的字符/字符集合?(yes or no)")) if want == 'yes': add_varchar = str(input("請輸入需要增加的新字符/字符集合:")) for var in add_varchar: var_ls.append(var) print("更新后的字符集合:",var_ls) elif want == 'no': break else: print("輸入有誤!!請重試!!") continue ls = []#定義一個列表用于存儲拆散的字符 for s in string: ls.append(s)#將字符串拆散存進(jìn)列表中 for element in ls[:]: if element in var_ls:#如果在字符集合內(nèi)發(fā)現(xiàn),則從列表中刪除 ls.remove(element) elif element not in var_ls: continue String = ''#定義字符串 for l in ls:#將列表中拆散的元素組合回去。 String = String+l print("處理后的字符串:",String)#得到處理結(jié)果 Process(string=strings)#調(diào)用函數(shù),傳入實參給形參。
代碼的解釋在注釋中寫了,大家如果對代碼不理解可以和我私信探討。
運行結(jié)果,如下圖:
到此這篇關(guān)于python中文本字符處理的文章就介紹到這了,更多相關(guān)python文本字符處理內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
標(biāo)簽:內(nèi)江 黔東 興安盟 渭南 廊坊 拉薩 綿陽 亳州
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python中文本字符處理的簡單方法記錄》,本文關(guān)鍵詞 python,中,文本,字符,處理,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。