Python数据处理之描述性统计

描述性统计量：平均值,标准误差,中位数’,众数,标准差,方差,峰度,偏度,最小值,最大值,求和,观测数,第一四分位数,中位数,第三四分位数。（还会持续更新一些计量经济学的基础知识点，可以点个关注哦~ 如果有关于计量经济学的问题欢迎交流~~~）

佛系研go

859人浏览 · 2023-12-03 18:31:41

佛系研go · 2023-12-03 18:31:41 发布

Python数据处理之描述性统计（详尽）

描述性统计量：平均值,标准误差,中位数’,众数,标准差,方差,峰度,偏度,最小值,最大值,求和,观测数,第一四分位数,中位数,第三四分位数

import pandas as pd
import numpy as np
from scipy import stats

# # 导入数据
data = pd.read_excel("需要进行描述性统计的数据表格.xlsx")

des_index = ['平均值','标准误差','中位数','众数','标准差','方差','峰度','偏度','最小值','最大值','求和','观测数','第一四分位数','中位数','第三四分位数']

#需要进行描述性统计的变量名称
need_list = ['A', 'B', 'C']
df = pd.DataFrame(index=des_index, columns=need_list)

for col in need_list:
    df[col] = [
        np.mean(data[col]),# 平均值
        stats.sem(data[col]),# 标准误差
        np.median(data[col]),# 中位数
        stats.mode(data[col]).mode[0],# 众数
        np.std(data[col]), # 标准差
        np.var(data[col]),# 方差
        stats.kurtosis(data[col]), # 峰度
        stats.skew(data[col]),  # 偏度
        np.min(data[col]),# 最小值
        np.max(data[col]), # 最大值
        np.sum(data[col]),# 求和
        len(data[col]),# 观测数
        np.percentile(data[col], 25),#上四分位数
        np.percentile(data[col], 50),#中位数
        np.percentile(data[col], 75)#下四分位数
    ]

#将描述性统计结果保存到excel中，并导出
df.to_excel('data_des.xlsx')

示例结果：
Alt

（还会持续更新一些计量经济学的基础知识点，可以点个关注哦~ 如果有关于计量经济学的问题欢迎交流~~~）

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。