專(zhuān)題文章
時(shí)長(zhǎng):00:00更新時(shí)間:2020-11-27 14:22:04
python中的pandas模塊中對(duì)重復(fù)數(shù)據(jù)去重步驟。1)利用DataFrame中的duplicated方法返回一個(gè)布爾型的Series,顯示各行是否有重復(fù)行,沒(méi)有重復(fù)行顯示為FALSE,有重復(fù)行顯示為T(mén)RUE。2)再利用DataFrame中的drop_duplicates方法用于返回一個(gè)移除了重復(fù)行的DataFrame。注釋。如果duplicated方法和drop_duplicates方法中沒(méi)有設(shè)置參數(shù),則這兩個(gè)方法默認(rèn)會(huì)判斷全部咧,如果在這兩個(gè)方法中加入了指定的屬性名(或者稱(chēng)為列名),例如:frame.drop_duplicates([';state';]),則指定部分列(state列)進(jìn)行重復(fù)項(xiàng)的判斷。具體實(shí)例如下:
查看詳情