《Python数据分析实践Python数据分析实践 (26).pdf》由会员分享,可在线阅读,更多相关《Python数据分析实践Python数据分析实践 (26).pdf(2页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2021/11/21 下午4:365-1-2file:/C:/Users/sgl/Downloads/5-1-2.html1/2In:import pandas as pd pd.set_option(display.unicode.east_asian_width,True)#解决数据输出时列名不对齐的问题 df=pd.read_excel(tdata/cj.xlsx)#读取数据 5.1.2数据清洗-缺失值处理In:import pandas as pd pd.set_option(display.unicode.east_asian_width,True)#解决数据输出时列名不对齐的问题
2、df=pd.read_excel(tdata/cj.xlsx)#读取数据 In:#存在任一缺失值即删除 df1=df.dropna()print(删除前:,df.shape)print(删除后:,df1.shape)In:#所有列均为缺失值即删除 df1=df.dropna(how=all)print(删除前:,df.shape)print(删除后:,df1.shape)In:#指定列均为缺失值即删除 df1=df.dropna(how=all,subset=专业,选修)print(删除前:,df.shape)print(删除后:,df1.shape)In:#保留某些属性中不存在缺失值的情况
3、df1=dfdf性别.notnull()print(删除前:,df.shape)print(删除后:,df1.shape)In:#将缺失值NaN填充为0 df选修.fillna(0)In:#将缺失值NaN填充与后面的值相同 df选修.fillna(method=bfill)2021/11/21 下午4:365-1-2file:/C:/Users/sgl/Downloads/5-1-2.html2/2In:import numpy as np#将缺失值NaN填充选修课的平均分 df选修.fillna(np.mean(df选修)-重复值处理In:#去除全部重复数据 df1=df.drop_dupl
4、icates()print(去重前:,df.shape)print(去重后:,df1.shape)In:#去除指定列中重复数据 df1=df.drop_duplicates(专业)print(去重前:,df.shape)print(去重后:,df1.shape)In:#去除指定列中重复数据,设置keep参数 df1=df.drop_duplicates(专业,keep=last)print(去重前:,df.shape)print(去重后:,df1.shape)In:#去除指定若干列中重复数据 df1=df.drop_duplicates(学号,姓名)print(去重前:,df.shape)print(去重后:,df1.shape)