婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁(yè) > 知識(shí)庫(kù) > pandas中DataFrame檢測(cè)重復(fù)值的實(shí)現(xiàn)

pandas中DataFrame檢測(cè)重復(fù)值的實(shí)現(xiàn)

熱門標(biāo)簽:河北防封卡電銷卡 天津電話機(jī)器人公司 應(yīng)電話機(jī)器人打電話違法嗎 電銷機(jī)器人的風(fēng)險(xiǎn) 開封語(yǔ)音外呼系統(tǒng)代理商 開封自動(dòng)外呼系統(tǒng)怎么收費(fèi) 手機(jī)網(wǎng)頁(yè)嵌入地圖標(biāo)注位置 地圖標(biāo)注線上如何操作 400電話辦理哪種

本文詳解如何使用pandas查看dataframe的重復(fù)數(shù)據(jù),判斷是否重復(fù),以及如何去重

DataFrame.duplicated(subset=None, keep='first')

subset:如果你認(rèn)為幾個(gè)字段重復(fù),則數(shù)據(jù)重復(fù),就把那幾個(gè)字段以列表形式放到subset后面。默認(rèn)是所有字段重復(fù)為重復(fù)數(shù)據(jù)。

keep:

  • 默認(rèn)為'first' ,也就是如果有重復(fù)數(shù)據(jù),則第一條出現(xiàn)的定義為False,后面的重復(fù)數(shù)據(jù)為True。
  • 如果為'last',也就是如果有重復(fù)數(shù)據(jù),則最后一條出現(xiàn)的定義為False,后面的重復(fù)數(shù)據(jù)為True。
  • 如果為False,則所有重復(fù)的為True

下面舉例

df = pd.DataFrame({
    'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'],
    'style': ['cup', 'cup', 'cup', 'pack', 'pack'],
    'rating': [4, 4, 3.5, 15, 5]
})
df 

# 默認(rèn)為keep="first",第一條重復(fù)的為False,后面重復(fù)的為True
# 一般不會(huì)設(shè)置keep,保持keep為默認(rèn)值。
df.duplicated()

結(jié)果
0    False
1     True
2    False
3    False
4    False
dtype: bool

# keep="last",,最后一條重復(fù)的為False,后面重復(fù)的為True
df.duplicated(keep="last")

結(jié)果
0     True
1    False
2    False
3    False
4    False
dtype: bool

# keep=False,,所有重復(fù)的為True
df.duplicated(keep=False)

結(jié)果
0     True
1     True
2    False
3    False
4    False
dtype: bool

# sub是子,subset是子集
# 標(biāo)記只要brand重復(fù)為重復(fù)值。
df.duplicated(subset='brand')

結(jié)果

0    False
1     True
2    False
3     True
4     True
dtype: bool


# 只要brand重復(fù)brand和style重復(fù)的為重復(fù)值。
df.duplicated(subset=['brand','style'])

結(jié)果

0    False
1     True
2    False
3    False
4     True
dtype: bool


# 顯示重復(fù)記錄,通過布爾索引
df[df.duplicated()]

# 查詢重復(fù)值的個(gè)數(shù)。
df.duplicated().sum()

結(jié)果
1

到此這篇關(guān)于pandas中DataFrame檢測(cè)重復(fù)值的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)pandas DataFrame檢測(cè)重復(fù)值內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Pandas實(shí)現(xiàn)Dataframe的重排和旋轉(zhuǎn)
  • Pandas實(shí)現(xiàn)Dataframe的合并
  • pandas中DataFrame數(shù)據(jù)合并連接(merge、join、concat)
  • 教你漂亮打印Pandas DataFrames和Series
  • 使用pandas忽略行列索引,縱向拼接多個(gè)dataframe
  • Pandas.DataFrame轉(zhuǎn)置的實(shí)現(xiàn)
  • Pandas中DataFrame交換列順序的方法實(shí)現(xiàn)
  • 詳解pandas中利用DataFrame對(duì)象的.loc[]、.iloc[]方法抽取數(shù)據(jù)
  • Pandas中兩個(gè)dataframe的交集和差集的示例代碼
  • Pandas DataFrame求差集的示例代碼
  • 淺談pandas dataframe對(duì)除數(shù)是零的處理
  • Pandas中DataFrame數(shù)據(jù)刪除詳情

標(biāo)簽:蘭州 成都 六盤水 江蘇 山東 駐馬店 常州 宿遷

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《pandas中DataFrame檢測(cè)重復(fù)值的實(shí)現(xiàn)》,本文關(guān)鍵詞  pandas,中,DataFrame,檢測(cè),重復(fù),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《pandas中DataFrame檢測(cè)重復(fù)值的實(shí)現(xiàn)》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于pandas中DataFrame檢測(cè)重復(fù)值的實(shí)現(xiàn)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    主站蜘蛛池模板: 宜城市| 炎陵县| 潜江市| 东兰县| 枣强县| 承德县| 彰化县| 贡山| 汨罗市| 慈溪市| 关岭| 汤阴县| 中方县| 忻城县| 晴隆县| 北海市| 苏尼特右旗| 图木舒克市| 松江区| 泾源县| 新闻| 左云县| 盈江县| 宁德市| 崇州市| 赤壁市| 始兴县| 监利县| 永仁县| 扎兰屯市| 嵊州市| 南宁市| 阿拉善右旗| 揭阳市| 芦山县| 枝江市| 田阳县| 皮山县| 娱乐| 平乐县| 富顺县|