数据分析---人口分析案例

1. 首先导入所需数据，了解每个csv文件存储了哪些数据。2.将人口数据pop和各州简称数据abb 进行合并：如果想保证数据的完整性，需要使用外连接。3. 将合并之后重复的一列abbreviation删除：4. 查看讯在缺失数据的列：（说明abb_pop数据中有缺失值）5. 找到哪些state/region 使得state的值为NaN，进行去重操作：将state中空值对应的简称找到，然后对sta

S1406793

1722人浏览 · 2022-03-15 10:57:28

S1406793 · 2022-03-15 10:57:28 发布

1. 首先导入所需数据，了解每个csv文件存储了哪些数据。
2. 将人口数据pop 和各州简称数据abb 进行合并：

如果想保证数据的完整性，需要使用外连接。

3. 将合并之后重复的一列abbreviation删除：

4. 查看讯在缺失数据的列：（说明abb_pop数据中有缺失值）

5. 找到哪些state/region 使得state的值为NaN，进行去重操作：

将state中空值对应的简称找到，然后对state/region进行去重操作。

思路：将state这一列中的空值所对应的行数据找到，然后在这些行数据中找到对应的简称的值

6. 为找到的这些state/region 的state项补上正确的值，从而去除掉state中这一列的所有空值：

fillna 是给全体空值进行填充，但是这里需要给固定的两个'PR'和'USA'所对应的state进行填充，可以使用元素赋值的方法。

检查是否赋值成功：得到剩下'PR'对应的state为空。，说明‘USA’赋值完成。

同理，对‘PR’对应的state进行赋值：

7. 合并各州面积数据，并找出area中哪些行有缺失数据：

8. 去除一些含有缺失数据的行：

9. 找出2010年全名人口数据：

10. 计算各洲的人口密度= 总人口/面积，并将密度这一列汇总到原表中。

11. 排序，并找出人口密度最高的州：

先排序（sort_value），然后再找出最大的行数据（ iloc[0] ）对应的state。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

大模型推理适配实战：手把手带你完成vLLM Ascend迁移实操

魔乐社区

2025西电A测气压测控仿真系统（自行编写上位机软件）

到此为止2025的A测已顺利解决，希望能为同学们的考公考研节省一点时间。这篇也是我写的第一篇文章，有写的烂的地方请尽管告诉我。文中如有侵权，联系立删。还有问题的地方也请在评论区反馈，我会尽量回复。最后，所有源码放在下方，有需要自取。A测_气压测控仿真系统.zip。

魔乐社区

数据结构（2） —— 双向链表、循环链表与内核链表

定义节点结构体，包含数据域data、指向前驱节点的指针*ppre和指向后继节点的指针*pnext。用typedef定义数据类型datatype（这里为int）和节点类型linknode。// 存放数据空间// 指向前驱节点的指针// 指向后继节点的指针} linknode;// 定义数据类型// 存储数据// 指向前一个节点// 指向后一个节点} linknode;

魔乐社区

所有评论(0)

查看更多评论

S1406793

@S1406793

已为社区贡献3条内容