Python数据分析实践Python数据分析实践 (26).pdf

上传人:刘静 文档编号:57973830 上传时间:2022-11-06 格式:PDF 页数:2 大小:253.78KB
返回 下载 相关 举报
Python数据分析实践Python数据分析实践 (26).pdf_第1页
第1页 / 共2页
Python数据分析实践Python数据分析实践 (26).pdf_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《Python数据分析实践Python数据分析实践 (26).pdf》由会员分享,可在线阅读,更多相关《Python数据分析实践Python数据分析实践 (26).pdf(2页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、2021/11/21 下午4:365-1-2file:/C:/Users/sgl/Downloads/5-1-2.html1/2In:import pandas as pd pd.set_option(display.unicode.east_asian_width,True)#解决数据输出时列名不对齐的问题 df=pd.read_excel(tdata/cj.xlsx)#读取数据 5.1.2数据清洗-缺失值处理In:import pandas as pd pd.set_option(display.unicode.east_asian_width,True)#解决数据输出时列名不对齐的问题

2、df=pd.read_excel(tdata/cj.xlsx)#读取数据 In:#存在任一缺失值即删除 df1=df.dropna()print(删除前:,df.shape)print(删除后:,df1.shape)In:#所有列均为缺失值即删除 df1=df.dropna(how=all)print(删除前:,df.shape)print(删除后:,df1.shape)In:#指定列均为缺失值即删除 df1=df.dropna(how=all,subset=专业,选修)print(删除前:,df.shape)print(删除后:,df1.shape)In:#保留某些属性中不存在缺失值的情况

3、df1=dfdf性别.notnull()print(删除前:,df.shape)print(删除后:,df1.shape)In:#将缺失值NaN填充为0 df选修.fillna(0)In:#将缺失值NaN填充与后面的值相同 df选修.fillna(method=bfill)2021/11/21 下午4:365-1-2file:/C:/Users/sgl/Downloads/5-1-2.html2/2In:import numpy as np#将缺失值NaN填充选修课的平均分 df选修.fillna(np.mean(df选修)-重复值处理In:#去除全部重复数据 df1=df.drop_dupl

4、icates()print(去重前:,df.shape)print(去重后:,df1.shape)In:#去除指定列中重复数据 df1=df.drop_duplicates(专业)print(去重前:,df.shape)print(去重后:,df1.shape)In:#去除指定列中重复数据,设置keep参数 df1=df.drop_duplicates(专业,keep=last)print(去重前:,df.shape)print(去重后:,df1.shape)In:#去除指定若干列中重复数据 df1=df.drop_duplicates(学号,姓名)print(去重前:,df.shape)print(去重后:,df1.shape)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁