《Python数据处理单元四 使用pandas进行数据分组与聚合.docx》由会员分享,可在线阅读,更多相关《Python数据处理单元四 使用pandas进行数据分组与聚合.docx(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、填空题.分组聚合的流程分为、01 .分组键的形式可以有、o. transform。方法会对产生的标量值进行 操作。2 .当对一个DataFrame对象进行分组后会返回一个 对象。二、判断题.分组聚合的原理一般分为拆分-应用-合并。()1 .只要使用groupby()方法分组就会产生一个DataFrameGroupby对象。().使用agg()方法进行聚合运算会对产生的标量值进行广播。()2 .使用transform。方法进行聚合运算,其结果可以保持与原数据形状相同。(). apply。方法可以使用广播功能。()三、 选择题1.以下选项中,关于groupbyO方法说法不正确的选项是。()A,分组
2、键可以是列表或数组,但长度不需要与待分组轴的长度相同B.可以通过DataFrame中的列名的值进行分组C,可以使用函数进行分组D,可使用series或字典分组2.以下选项中,关于agg()方法使用不正确是。()agg。方法中func参数只能传入一个函数A. agg()方法中func参数可以传入多个函数c. agg()方法中func参数可以传入自定义函数D. agg()方法不能对产生的标量值进行广播3.以下选项中,关于transform。方法说法正确的选项是。()A.不会与原数据保持相同形状B.会对产生的标量值进行广播操作C. func参数只能传入内置函数D. func参数可以传入多个内置函数4
3、.以下选项中,关于apply。说法不正确的选项是。()A.可以使用自定义函数B.可以接收多个函数C.可以使用广播功能D.返回的结果一定与原数据的形状相同5.请阅读下面一段程序:import pandas as pd(pd.DataFrame(2, 3,) * 3, columns=(A*, *B).apply(lambda x: x + 1) 执行上述程序后,最终输出的结果为()。A.A B()3 21 3 22 3 2B.A B0 2 3c.A B0 3 41 3 42 3 4D.A B0 4 31 4 32 4 3四、 简答题1 .请简述分组聚合的流程。2 .请简述常用的分组方式。五、程序题1 .现有如以下图所示的学生信息,请根据图中的信息完成以下操作:年级姓名年龄性别身iS)(cm)体重(kg)0大一李宏卓18男175651大二李思真19女165602大三张振海20男178703大四赵鸿飞21男175754大二白蓉19女160555大三马腾飞20男180706大一张睦凡18女167527大三金紫萱20女170538大四金炜21男18573(1) 根据年级信息为分组键,对学生信息进行分组,并输出大一学生信息。(2) 分别计算出四个年级中身高最高的同学。(3) 计算大一学生与大三学生的平均体重。