Python数据处理之描述性统计(详尽)

描述性统计量:平均值,标准误差,中位数’,众数,标准差,方差,峰度,偏度,最小值,最大值,求和,观测数,第一四分位数,中位数,第三四分位数

import pandas as pd
import numpy as np
from scipy import stats

# # 导入数据
data = pd.read_excel("需要进行描述性统计的数据表格.xlsx")

des_index = ['平均值','标准误差','中位数','众数','标准差','方差','峰度','偏度','最小值','最大值','求和','观测数','第一四分位数','中位数','第三四分位数']

#需要进行描述性统计的变量名称
need_list = ['A', 'B', 'C']
df = pd.DataFrame(index=des_index, columns=need_list)

for col in need_list:
    df[col] = [
        np.mean(data[col]),# 平均值
        stats.sem(data[col]),# 标准误差
        np.median(data[col]),# 中位数
        stats.mode(data[col]).mode[0],# 众数
        np.std(data[col]), # 标准差
        np.var(data[col]),# 方差
        stats.kurtosis(data[col]), # 峰度
        stats.skew(data[col]),  # 偏度
        np.min(data[col]),# 最小值
        np.max(data[col]), # 最大值
        np.sum(data[col]),# 求和
        len(data[col]),# 观测数
        np.percentile(data[col], 25),#上四分位数
        np.percentile(data[col], 50),#中位数
        np.percentile(data[col], 75)#下四分位数
    ]

#将描述性统计结果保存到excel中,并导出
df.to_excel('data_des.xlsx')

示例结果:
Alt

(还会持续更新一些计量经济学的基础知识点,可以点个关注哦~ 如果有关于计量经济学的问题欢迎交流~~~)

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐