本篇文章给大家带来的内容是关于Python中简单统计量的计算,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。
1、这些操作都要确保已经在电脑中安装好了Anaconda集成库,如果安装好后运行出错误,可以将原来电脑中的python卸载重新安装Anaconda,建议安装时直接将添加环境变量打勾,否则以后得自己添加环境变量,在Pycharm中的编译器选择Anaconda安装文件夹中的python。在Pycharm中新建一个data文件夹用来存放数据文件。
2.打开Python Console。
3.首先在用python读取数据,需要先输入import pandas as pd引入pandas包,再输入df=pd.read_csv("./data/CityData.csv")读取数据,最后输入df显示数据。
4.分别输入type(df)和type(df["cid"])可以发现两种数据类型不同。
5.计算平均值:df.mean()或df["xid"].mean()
6.计算中位数:输入df.median()或df["yid"].median
7.求四分位数:输入df.quantile(q=0.25)
8.求众数:输入df.mode()或df["xid"].mode()
9.求标准差:输入df.std()或df["yid"].std()
10.计算方差:df.var()或df["xid"].var()
11.求和:df.sum()或df["xid"].sum()
12.计算偏态系数:df.s本文来源gao@!dai!ma.com搞$$代^@码网*kew()或df["yid"].skew()
13.计算峰态系数:df.kurt()或df["yid"].kurt()
14.生成正态分布函数,pandas无法直接生成,需要先引入scipyimport scipy.stats as ss,再输入ss.norm,这时生成的是一个正态分布的对象,我们输入ss.norm.stats(moments="mvsk")查看一下,mvsk分别代表的是均值、方差、偏态系数、峰态系数。