针对数据集age_fat.txt求均值,中位数,标准差,四分位数,画盒图,散点图,qq图。
针对数据集age_fat.txt求均值,中位数,标准差,四分位数,画盒图,散点图,qq图。
·
要求:针对数据集age_fat.txt
-
计算age和fat的均值、中位数和标准差。
-
绘制age和fat的盒图,并分别给出第一个四分位数和第三个四分位数。
-
绘制基于这两个变量的散点图和q-q图。
age_fat.txt文件数据如下:
前期准备:安装numpy,matplotlib,scipy库。
分别使用:pip install 库名 即可在terminal下安装。
程序实现:
1.针对数据集age_fat.txt
(1)计算age和fat的均值、中位数和标准差。
import numpy as np
f2 = "./age_fat.txt"
age=[]
fat=[]
with open(f2) as txtData:
lines = txtData.readlines()
for line in lines:
lineData = line.strip().split('\t')
age.append(lineData[0])
fat.append(lineData[1])
age=list(map(int, age[1:]))
fat=list(map(float, fat[1:]))
print("age平均数:{} 中位数:{} 标准差:{}".format(np.mean(age),np.median(age),np.std(age)))
print("fat平均数:{} 中位数:{} 标准差:{}".format(np.mean(fat),np.median(fat),np.std(fat)))
运行结果:
(2)绘制age和fat的盒图,并分别给出第一个四分位数和第三个四分位数。
代码:
import matplotlib.pyplot as plt
f2 = "./age_fat.txt"
age=[]
fat=[]
with open(f2) as txtData:
lines = txtData.readlines()
for line in lines:
lineData = line.strip().split('\t')
age.append(lineData[0])
fat.append(lineData[1])
age=list(map(int, age[1:]))
fat=list(map(float, fat[1:]))
plt.boxplot([age,fat])
plt.show()
运行结果:
(3)绘制基于这两个变量的散点图和q-q图。
散点图代码:
import matplotlib.pyplot as plt
from scipy import stats
f2 = "./age_fat.txt"
age=[]
fat=[]
with open(f2) as txtData:
lines = txtData.readlines()
for line in lines:
lineData = line.strip().split('\t')
age.append(lineData[0])
fat.append(lineData[1])
age=list(map(int,age[1:]))
fat=list(map(float, fat[1:]))
plt.scatter(age, fat)
plt.show()
运行结果:
qq图代码:
import matplotlib.pyplot as plt
from scipy import stats
f2 = "./age_fat.txt"
age=[]
fat=[]
with open(f2) as txtData:
lines = txtData.readlines()
for line in lines:
lineData = line.strip().split('\t')
age.append(lineData[0])
fat.append(lineData[1])
age=list(map(int,age[1:]))
fat=list(map(float, fat[1:]))
stats.probplot(age,dist="norm", plot=plt)
plt.show()
运行结果:

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)