利用pandas可以很方便的讀寫excel數據
data_in = pd.read_excel('M2FENZISHI.xlsx')
首先要創建數據框
# example df = pd.DataFrame({'A':[0,1,2]}) writer = pd.ExcelWriter('test.xlsx') #name of excel file df.to_excel(writer, sheet_name='Sheet1') # write writer.save() # save
這個例子稍微有點復雜,只看讀和寫的部分就可以了。
例子要實現的目標為:有一個excel文件,如下:
現在要將里面的化學符號中數字和字母分開,得到如下結果
由于化學符號里面有數字和字母,要提取數字或者字母首先想到的是正則表達式re模塊。
在讀取時由于我們已經將第一列命名data,因此pandas可以直接只讀這一列的提名。
讀取數字可以使用re.compile實現,如:
下面是完整實現的代碼
import numpy as np import re import pandas as pd data_in = pd.read_excel('M2FENZISHI.xlsx')['data'] #load data print(data_in.shape) length = len(data_in) # length pattern = re.compile(r'\d+') # find number num_out = [] for i in range(length): temp = pattern.findall(data_in[i]) # find number int_num = list(map(int,temp)) num_out.append(int_num) num_out = np.array(num_out) print(num_out.shape) # writer data to excel df = pd.DataFrame({'C': num_out[:, 0], 'H': num_out[:, 1], 'O': num_out[:, 2], 'N': num_out[:, 3], 'P': num_out[:, 4], 'S': num_out[:, 5]}) writer = pd.ExcelWriter('test.xlsx') # name of the file df.to_excel(writer, sheet_name='Sheet1') writer.save()
結果如下:
本篇文章就到這里了,希望能夠給你帶來幫助,也希望您能夠多多關注腳本之家的更多內容!