湖人队官网宣布,将在2017年12月19日同时退役科比的8号与24号球衣,科比这位96届最传奇的巨星也将彻底地告别这个舞台。值得一提的是,这是NBA联盟历史上一支球队首次为一位球员退役两个号码的球衣,之前最具传奇色彩的是乔丹的退役,除了母队公牛队之外,效力过的奇才队也为他退役了球衣。那么在你的心目中,身披8号球衣与24号球衣的科比,哪一位更加出色呢?请通过数据分析,给出你的理由。
此次项目没有标准的解法,仅给出大致思路与参考代码。如果有其他想法,只要有合理的逻辑和数据支撑即可。
可以尝试回答以下问题,来对比8号与24号两个时期的科比的表现
哪一位的进攻能力更强?
哪一位在防守端的作用更大?
哪一位更愿意与队友分享球权?
两位在打法选择上有什么不同吗?
两位都是“不好相处”的类型吗?哪一位更愿意与主教练合作?
两位的进阶数据上有什么差别?
项目所需的数据文件可以在这个仓库中找到
此次项目不指定所需要的数据文件,根据需求自行选择即可
数据文件简介
文件名 | 简介 |
player_season.csv | 球员常规赛单场比赛数据 |
player_playoff.csv | 球员季后赛单场比赛数据 |
player_salary.csv | 球员薪金数据 |
coach_season.csv | 教练常规赛平均数据 |
coach_playoff.csv | 教练季后赛平均数据 |
team_season.csv | 球队常规赛单场比赛数据 |
team_playoff.csv | 球队季后赛单场比赛数据 |
avg.csv | 球员场均数据 |
tot.csv | 球员总计数据 |
single.csv | 球员单场最佳数据 |
advanced_basic.csv | 球员进阶数据 |
advanced_shooting.csv | 球员投篮进阶数据 |
pivot_table()
透视表。熟悉Excel的人应该对这个名词不会陌生。这个方法,根据一个或者多个键对数据进行聚合,并根据行和列上的分组键将数据分配到各个矩形区域中。除了DataFrame本身具有这个方法外,也具有顶级的函数pandas.pivot_table(),除了调用方式不一样,作用基本上是相同的。
如同上面所介绍的,我们提取了key1和key2列作为所生成的透视表的index,这样就很可以很清楚地看到每一层关系下的数据。
而上例中,我们只选用了原DataFrame的部分数据,就再次生成了一张新的透视表,这运用在开发中是非常便利的功能,我们只需要选取我们关心的columns就可以进行分析,而不需要对一张可能非常巨大的原始数据表进行操作。
利用margins参数可以设定是否需要在获得的透视表的最后一行生成一行统计项。
上例中,展示了aggfuc这个在pivot_table中的重要参数的使用。可以传入普通的函数,得到的是每一个分组的结果集合,也可以传入带有“聚集”性质的函数,所得到的结果就是一个聚集值。
以上是关于透视表方法的简单介绍,如果想要进一步了解该方法的使用方式,具体参数的用法,请查阅官方文档。
欢迎小伙伴们自由发挥,给出自己的解答。而我们也给出了一份自己的分析,详情请见下方的链接。
欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/) | Powered by Discuz! X2.5 |