重慶分公司,新征程啟航
為企業提供網站建設、域名注冊、服務器等服務
為企業提供網站建設、域名注冊、服務器等服務
本篇內容主要講解“Pandas實現數據清洗的方法有哪些”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Pandas實現數據清洗的方法有哪些”吧!
彌渡網站制作公司哪家好,找創新互聯!從網頁設計、網站建設、微信開發、APP開發、響應式網站等網站項目制作,到程序開發,運營維護。創新互聯從2013年成立到現在10年的時間,我們擁有了豐富的建站經驗和運維經驗,來保證我們的工作的順利進行。專注于網站建設就選創新互聯。
我們在處理真實的數據時,往往會有很多缺少的的特征數據,就是所謂的空值,必須要進行處理才能進行下一步分析
空值的處理方式有很多種,一般是刪除或者填充
Excel通過“查找和替換”功能實現空值的統一替換:
通過“定位”刪除空值:
pandas處理空值的方式比較靈活,可以使用dropna函數刪除空值
import pandas as pd data=pd.read_csv('成績表.csv',encoding='gbk') data.dropna(how='any')
用fillna函數實現空值的填充
①使用數字0填充數據表中的空值
data.fillna(value=0)
②使用平均值填充數據表中的空值
data['語文'].fillna(data['語文'].mean())
excel中清理空格很簡單,直接替換即可
pandas刪除空格也很方便,主要使用map函數
data['姓名']=data['姓名'].map(str.strip) data
excel中大小寫轉換函數分別為upper()和lower()
pandas中轉換函數也為upper()和lower()
data['拼音']=data['拼音'].str.upper() data
data['拼音']=data['拼音'].str.lower() data
excel中更改數據格式通過快捷鍵“ctrl+1”打開“設置單元格格式”:
pandas使用astype來修改數據格式,以將“語文”列改成整數為例
data['語文'].dropna(how='any').astype('int')
excel中更改列名稱就不說了,大家都會
pandas使用rename函數更改列名稱,代碼如下:
data.rename(columns={'語文':'語文成績'})
excel的功能區“數據”下有“刪除重復項”,可以用來刪除表中的重復值,默認保留最第一個重復值,把后面的刪除:
pandas使用drop_duplicates函數刪除重復值:
data['數學'].drop_duplicates() #默認刪除后面的重復值 data['數學'].drop_duplicates(keep='last') #刪除第一項重復值
excel中使用“查找和替換”功能實現數值的替換
pandas中使用replace函數實現數據替換
data['姓名'].replace('成 功','失 敗')
到此,相信大家對“Pandas實現數據清洗的方法有哪些”有了更深的了解,不妨來實際操作一番吧!這里是創新互聯網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!