机器学习:基本术语
#初学者 #python #machinelearning #math

在这些系列文章中,我们将讨论ML算法并在Python中实现它们,这些文章的主要重点是了解这些算法背后的数学和逻辑。我们将首先了解ML的基本术语。

1.分类算法

顾名思义,这些是将数据分为不同类别的分类算法。这是一种监督的学习技术。

2.监督学习

监督学习与通过监督或培训有关。在监督学习中,算法经过标记或分类的数据培训。

3.无监督的学习

无监督的学习与学习无监督或培训有关。在无监督的学习中,对算法进行了培训,这些数据既不标记也没有分类。在无监督的学习中,代理需要从模式中学习而无需相应的输出值。

4.横向损失

IS 是一种用于测量机器学习中的分类模型表现的度量。损失(或误差)的数量是在0到1之间的数字,其中0是一个完美的模型。

5.条件正(P)

数据中实际阳性案例的数量

6.条件负(n)

数据中实际负面案例的数量

7.真正的正(TP)

正确指示存在条件或特征的测试结果

8.真正的负(TN)

正确指示没有条件或特征的测试结果

9.假阳性(FP)

错误表明存在特定条件或属性的测试结果

10.假负(FN)

错误表明缺乏特定条件或属性的测试结果

11.混淆矩阵

它以矩阵形式为我们提供了模型的结果(如下所示)。我们使用它来测量模式的准确性。

实际积极 实际负面
预测正 true积极 假阴性
预测负面 假阴性 true负面

12.曲线下的区域(AUC)

是曲线和X轴之间封装的区域。

Area Under the Curve

13.接收器操作特征(ROC)

接收器操作特性(ROC)曲线,该曲线被定义为测试灵敏度的图,为y坐标与其1特异性或假阳性率(FPR)为X坐标

r o c H t s h i s m i s s <或>和 s ROC = \frac{hits}{hits + misses}

Receiver Operating Characteristic

Wikipedia的此图像显示了Roc的精确定义。

如果您希望我在本文中包括其他任何术语,我将尽力包括它们。

参考