婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > pandas數據處理之 標簽列字符轉數字的實現

pandas數據處理之 標簽列字符轉數字的實現

熱門標簽:ai地圖標注 n400電話申請多少錢 如何在地圖標注文字 女王谷地圖標注 廈門crm外呼系統如何 地圖標注推廣單頁 長春人工智能電銷機器人官網 西藏快速地圖標注地點 百應ai電銷機器人鄭州

機器學習中,當我們在進行數據預處理的時候,對于標簽列非字符的數據,我們往往需要將其轉換成字符,因為有的算法可能不支持非數字類型來做特征。

那么怎么快捷地來著這個轉換呢,請看我的示例:

1.構建測試數據

import pandas as pd
array = ['good','bad','well','bad','good','good','well','good']

2.數據轉換下,并獲取標簽列的字典

df = pd.DataFrame(array,columns=['status'])
status_dict = df['status'].unique().tolist()

3.使用函數進行轉換

df['transfromed']=df['status'].apply(lambda x : status_dict.index(x))

這樣,就將標簽列處理好了哈

等用完之后,再轉回來

df['transfromed1']= df['transfromed'].apply(lambda x : status_dict[x])

補充:pandas factorize將字符串特征轉化為數字特征

將原始數據中的字符串特征轉化為模型可以識別的數字特征可是使用pandas自帶的factorzie方法。

原始數據的job特征值如下

都是字符串特征,無法用于訓練,當然可以單獨建立map硬編碼處理,但是pandas已經封裝好了相應的方法。

data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • pandas 對每一列數據進行標準化的方法
  • pandas數據處理進階詳解
  • Pandas 數據處理,數據清洗詳解
  • 使用pandas模塊實現數據的標準化操作

標簽:內江 拉薩 興安盟 廊坊 亳州 綿陽 黔東 渭南

巨人網絡通訊聲明:本文標題《pandas數據處理之 標簽列字符轉數字的實現》,本文關鍵詞  pandas,數據處理,之,標簽,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《pandas數據處理之 標簽列字符轉數字的實現》相關的同類信息!
  • 本頁收集關于pandas數據處理之 標簽列字符轉數字的實現的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 灵武市| 兰溪市| 嘉义县| 永川市| 合作市| 甘南县| 类乌齐县| 台北市| 景泰县| 南丰县| 东宁县| 子洲县| 青岛市| 福泉市| 永定县| 营山县| 丰都县| 焉耆| 小金县| 运城市| 洛川县| 曲阜市| 双柏县| 左云县| 菏泽市| 益阳市| 四会市| 新津县| 云和县| 苍溪县| 白玉县| 文成县| 盈江县| 庐江县| 重庆市| 光泽县| 岐山县| 泊头市| 朔州市| 漳平市| 南华县|