最新文章專題視頻專題問答1問答10問答100問答1000問答2000關(guān)鍵字專題1關(guān)鍵字專題50關(guān)鍵字專題500關(guān)鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關(guān)鍵字專題關(guān)鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
當前位置: 首頁 - 科技 - 知識百科 - 正文

Python對多屬性的重復數(shù)據(jù)去重

來源:懂視網(wǎng) 責編:小OO 時間:2020-11-27 14:22:04
文檔

Python對多屬性的重復數(shù)據(jù)去重

python中的pandas模塊中對重復數(shù)據(jù)去重步驟。1)利用DataFrame中的duplicated方法返回一個布爾型的Series,顯示各行是否有重復行,沒有重復行顯示為FALSE,有重復行顯示為TRUE。2)再利用DataFrame中的drop_duplicates方法用于返回一個移除了重復行的DataFrame。注釋。如果duplicated方法和drop_duplicates方法中沒有設(shè)置參數(shù),則這兩個方法默認會判斷全部咧,如果在這兩個方法中加入了指定的屬性名(或者稱為列名),例如:frame.drop_duplicates([';state';]),則指定部分列(state列)進行重復項的判斷。具體實例如下:
推薦度:
導讀python中的pandas模塊中對重復數(shù)據(jù)去重步驟。1)利用DataFrame中的duplicated方法返回一個布爾型的Series,顯示各行是否有重復行,沒有重復行顯示為FALSE,有重復行顯示為TRUE。2)再利用DataFrame中的drop_duplicates方法用于返回一個移除了重復行的DataFrame。注釋。如果duplicated方法和drop_duplicates方法中沒有設(shè)置參數(shù),則這兩個方法默認會判斷全部咧,如果在這兩個方法中加入了指定的屬性名(或者稱為列名),例如:frame.drop_duplicates([';state';]),則指定部分列(state列)進行重復項的判斷。具體實例如下:

下面為大家分享一篇Python對多屬性的重復數(shù)據(jù)去重實例,具有很好的參考價值,希望對大家有所幫助。一起過來看看吧

python中的pandas模塊中對重復數(shù)據(jù)去重步驟:

1)利用DataFrame中的duplicated方法返回一個布爾型的Series,顯示各行是否有重復行,沒有重復行顯示為FALSE,有重復行顯示為TRUE;

2)再利用DataFrame中的drop_duplicates方法用于返回一個移除了重復行的DataFrame。

注釋:

如果duplicated方法和drop_duplicates方法中沒有設(shè)置參數(shù),則這兩個方法默認會判斷全部咧,如果在這兩個方法中加入了指定的屬性名(或者稱為列名),例如:frame.drop_duplicates(['state']),則指定部分列(state列)進行重復項的判斷。

具體實例如下:

>>> import pandas as pd 
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} 
>>> frame=pd.DataFrame(data) 
>>> frame 
 pop state 
0 a 1 
1 b 1 
2 c 2 
3 d 2 
>>> IsDuplicated=frame.duplicated() 
>>> print IsDuplicated 
0 False 
1 False 
2 False 
3 False 
dtype: bool 
>>> frame=frame.drop_duplicates(['state']) 
>>> frame 
 pop state 
0 a 1 
2 c 2 
>>> IsDuplicated=frame.duplicated(['state']) 
>>> print IsDuplicated 
0 False 
2 False 
dtype: bool 
>>>

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

文檔

Python對多屬性的重復數(shù)據(jù)去重

python中的pandas模塊中對重復數(shù)據(jù)去重步驟。1)利用DataFrame中的duplicated方法返回一個布爾型的Series,顯示各行是否有重復行,沒有重復行顯示為FALSE,有重復行顯示為TRUE。2)再利用DataFrame中的drop_duplicates方法用于返回一個移除了重復行的DataFrame。注釋。如果duplicated方法和drop_duplicates方法中沒有設(shè)置參數(shù),則這兩個方法默認會判斷全部咧,如果在這兩個方法中加入了指定的屬性名(或者稱為列名),例如:frame.drop_duplicates([';state';]),則指定部分列(state列)進行重復項的判斷。具體實例如下:
推薦度:
  • 熱門焦點

最新推薦

猜你喜歡

熱門推薦

專題
Top