介绍
浏览数据世界通常意味着在并非所有数据点都具有相同重要性的情况下进行操作
这是加权平均值是一种为每个值分配重要性的统计工具,可帮助我们将情况的上下文纳入我们的平均计算中!
import numpy as np
使用Python的多功能生态系统我们能够利用numpy
等工具快速有效地计算我们的分析和数据项目中的加权平均值
目录
- Prerequisites and installation
- What is the weighted average?
- Examining a simple example
- Using np.average to calculate weighted mean
- Conclusion
- Additional resources
先决条件和安装
以下软件包是先决条件安装与此博客文章一起使用!
要安装它,您的首选终端/控制台并运行:
pip3 install numpy
加权平均水平是多少?
weighted average是典型算术平均值的扩展,在计算平均值
时,每个数据点都包括每个数据点的重要性(或权重)在所有数据点具有相同重要性的情况下,加权平均简化了标准算术平均值。但是,当每个数据点的重要性变化时,加权平均成为重要的工具
检查一个简单的例子
让我们考虑一个例子,我们是大学使用的数据科学家来计算学校所有班级的平均学生等级
为了保留个别学生的隐私,我们只提供了班级的数据
- 平均等级
- 学生人数
我们最初的本能可能只是在所有班级中平均平均水平,但是在将小课与非常大的课程进行比较时会发生什么?
如果一堂课的平均考试成绩为20/100,但只有4个学生可以将其与平均考试成绩为93和500名学生的课程进行比较吗?否!
如果我们这样做的话,小班级将被给予 的重要性水平,因为只有4个学生的考试成绩不应影响总体平均多500名学生
那么,我们如何将学生人数纳入大学的平均水平?
使用加权平均!
使用NP平均计算加权平均
继续上一个示例,例如,这些是grades
及其各自的number_of_students
:
grades = [20, 93, 56, 79, 100, 86]
number_of_students = [4, 500, 93, 274, 12, 30]
要使用numpy
在整个大学中获得加权平均值,我们要做的就是将权重纳入koude4:
import numpy as np
university_average = np.average(grades, weights=number_of_students)
print(university_average)
>>> 84.57174151150055
结论
,我们可以通过利用np.average
的weights
参数
非常感谢您的阅读,如果您喜欢我的内容,请务必在社交媒体或我的personal websiteð上查看我的其他一些工作或 Connect
欢呼!