婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > pandas:get_dummies()與pd.factorize()的用法及區別說明

pandas:get_dummies()與pd.factorize()的用法及區別說明

熱門標簽:外呼系統哪些好辦 江西省地圖標注 富錦商家地圖標注 武漢外呼系統平臺 沈陽防封電銷卡品牌 沈陽外呼系統呼叫系統 沈陽人工外呼系統價格 如何申請400電話費用 池州外呼調研線路

1.get_dummies()

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None,sparse=False, drop_first=False):Convert categorical variable into dummy/indicator variables

>>> import pandas as pd
>>> s = pd.Series(list('abca'))
>>> pd.get_dummies(s)
   a  b  c
0  1  0  0
1  0  1  0
2  0  0  1
3  1  0  0

2.pd.factorize()

pandas.factorize(values, sort=False, order=None, na_sentinel=-1,size_hint=None):Encode input values as an enumerated type or categorical variable

Series.factorize(sort=False, na_sentinel=-1):Encode the object as an enumerated type or categorical variable

Pandas有一個方法叫做factorize(),它可以創建一些數字,來表示類別變量,對每一個類別映射一個ID,這種映射最后只生成一個特征,不像dummy那樣生成多個特征。

Parameters:

sort : boolean, default False

Sort by values

na_sentinel: int, default -1

Value to mark “not found”

Returns:

labels : the indexer to the original array

uniques : the unique Index

labels:對應的編碼array

uniques:需要編碼的類型

補充:pandas.get_dummies 的使用及含義

get_dummies 是利用pandas實現one hot encode的方式

get_dummies參數如下:

pandas.get_dummies(data,prefix = None,prefix_sep ='_',dummy_na = False,columns = None,sparse = False,drop_first = False,dtype = None )

data : array-like,Series或DataFrame

prefix :string,字符串列表或字符串dict,默認為None,

用于追加DataFrame列名的字符串。在DataFrame上調用get_dummies時,傳遞一個長度等于列數的列表。或者,前綴 可以是將列名稱映射到前綴的字典。

prefix_sep : string,默認為'_'

如果附加前綴,分隔符/分隔符要使用。或者傳遞與前綴一樣的列表或字典。

dummy_na : bool,默認為False

如果忽略False NaN,則添加一列以指示NaN。

columns : 類似列表,默認為無

要編碼的DataFrame中的列名稱。如果列是None,那么所有與列 對象或類別 D型細胞將被轉換。

sparse : bool,默認為False

偽編碼列是否應由SparseArray(True)或常規NumPy數組(False)支持。

drop_first : bool,默認為False

是否通過刪除第一級別從k分類級別獲得k-1個假人。

版本0.18.0中的新功能。

dtype: D型,默認np.uint8

新列的數據類型。只允許一個dtype。

版本0.23.0中的新功能。

實例

prefix自定義前綴

以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。

您可能感興趣的文章:
  • pandas使用get_dummies進行one-hot編碼的方法
  • Python使用Pandas庫常見操作詳解
  • Python pandas用法最全整理

標簽:通遼 潛江 呂梁 黑龍江 銅川 常德 阿里 株洲

巨人網絡通訊聲明:本文標題《pandas:get_dummies()與pd.factorize()的用法及區別說明》,本文關鍵詞  pandas,get,dummies,與,pd.factorize,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《pandas:get_dummies()與pd.factorize()的用法及區別說明》相關的同類信息!
  • 本頁收集關于pandas:get_dummies()與pd.factorize()的用法及區別說明的相關信息資訊供網民參考!
  • 企业400电话

    智能AI客服机器人
    15000

    在线订购

    合计11份范本:公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议

    推薦文章
    主站蜘蛛池模板: 尖扎县| 永州市| 大兴区| 兴宁市| 淅川县| 辉南县| 雅安市| 灵石县| 肇州县| 房产| 客服| 醴陵市| 阿尔山市| 台中县| 茶陵县| 镇安县| 阿合奇县| 云安县| 岫岩| 苗栗市| 榆中县| 金沙县| 中宁县| 黑龙江省| 鄂托克前旗| 安西县| 和平区| 西昌市| 南宁市| 黄山市| 彰化县| 天柱县| 新蔡县| 广西| 永州市| 三门峡市| 当雄县| 房产| 县级市| 乌鲁木齐县| 利川市|