用numpy和python计算加权平均值!
#初学者 #教程 #python #datascience

介绍

浏览数据世界通常意味着在并非所有数据点都具有相同重要性的情况下进行操作

这是加权平均值是一种为每个值分配重要性的统计工具,可帮助我们将情况的上下文纳入我们的平均计算中!

import numpy as np

使用Python的多功能生态系统我们能够利用numpy等工具快速有效地计算我们的分析和数据项目中的加权平均值

目录

Chris Greening - Software Developer

嘿!我叫克里斯·格林(Chris Greening),我是来自纽约都会区的软件开发人员,具有各种工程经验 - 请给我留言,让我们构建一些很棒的东西!

favicon Christophergreening.com

先决条件和安装

以下软件包是先决条件安装与此博客文章一起使用!

要安装它,您的首选终端/控制台并运行:

pip3 install numpy

加权平均水平是多少?

weighted average是典型算术平均值的扩展,在计算平均值

时,每个数据点都包括每个数据点的重要性(或权重

在所有数据点具有相同重要性的情况下,加权平均简化了标准算术平均值。但是,当每个数据点的重要性变化时,加权平均成为重要的工具

检查一个简单的例子

让我们考虑一个例子,我们是大学使用的数据科学家来计算学校所有班级的平均学生等级

为了保留个别学生的隐私,我们只提供了班级的数据

  • 平均等级
  • 学生人数

我们最初的本能可能只是在所有班级中平均平均水平,但是在将小课与非常大的课程进行比较时会发生什么?

如果一堂课的平均考试成绩为20/100,但只有4个学生可以将其与平均考试成绩为93和500名学生的课程进行比较吗?否!

如果我们这样做的话,小班级将被给予 的重要性水平,因为只有4个学生的考试成绩不应影响总体平均多500名学生

那么,我们如何将学生人数纳入大学的平均水平?

使用加权平均

使用NP平均计算加权平均

继续上一个示例,例如,这些是grades及其各自的number_of_students

grades = [20, 93, 56, 79, 100, 86]
number_of_students = [4, 500, 93, 274, 12, 30]

要使用numpy在整个大学中获得加权平均值,我们要做的就是将权重纳入koude4

import numpy as np
university_average = np.average(grades, weights=number_of_students)
print(university_average)

>>> 84.57174151150055

结论

,我们可以通过利用np.averageweights参数

将加权平均值迅速纳入我们的项目

非常感谢您的阅读,如果您喜欢我的内容,请务必在社交媒体或我的personal websiteð上查看我的其他一些工作或 Connect

Chris Greening - Software Developer

嘿!我叫克里斯·格林(Chris Greening),我是来自纽约都会区的软件开发人员,具有各种工程经验 - 请给我留言,让我们构建一些很棒的东西!

favicon Christophergreening.com

欢呼!