python求均值中位数众数标准差极值
发布时间
阅读量:
阅读量
首先需要数据源,这里随便写了一个:
nums = [1,2,3,4]
求均值和中位数均可以使用numpy库的方法:
import numpy as np
#均值
np.mean(nums)
#中位数
np.median(nums)
众数:
求众数 方法一:
在numpy中没有直接的方法,但是也可以这样实现:
import numpy as np
counts = np.bincount(nums)
#返回众数
np.argmax(counts)
其中np.bincount方法返回了一个长度为 nums最大值的列表,列表中的每个值代表其索引位数值出现在nums中的次数,例如
返回[2,1,0],代表0在nums中出现2次,而1在nums中出现1次,3在nums中没有出现。
然后再使用np.argmax就能得到众数啦。但是,由于索引值是从0开始的,所以这种求众数的方法只能用在非负数据集。
求众数方法二——直接利用scipy下stats模块【推荐】:
from scipy import stats
stats.mode(nums)[0][0]
标准差:
numpy.std() 求标准差的时候默认是除以 n 的,即是有偏的,np.std无偏样本标准差方式为加入参数 ddof = 1;
pandas.std() 默认是除以n-1 的,即是无偏的,如果想和numpy.std() 一样有偏,需要加上参数ddof=0 ,即pandas.std(ddof=0) ;DataFrame的describe()中就包含有std();
>>> a
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> np.std(a, ddof = 1)
3.0276503540974917
>>> np.sqrt(((a - np.mean(a)) ** 2).sum() / (a.size - 1))
3.0276503540974917
>>> np.sqrt(( a.var() * a.size) / (a.size - 1))
3.0276503540974917
极值:
np.max()
np.min()
全部评论 (0)
还没有任何评论哟~
