在这些系列文章中,我们将讨论ML算法并在Python中实现它们,这些文章的主要重点是了解这些算法背后的数学和逻辑。我们将首先了解ML的基本术语。
1.分类算法
顾名思义,这些是将数据分为不同类别的分类算法。这是一种监督的学习技术。
2.监督学习
监督学习与通过监督或培训有关。在监督学习中,算法经过标记或分类的数据培训。
3.无监督的学习
无监督的学习与学习无监督或培训有关。在无监督的学习中,对算法进行了培训,这些数据既不标记也没有分类。在无监督的学习中,代理需要从模式中学习而无需相应的输出值。
4.横向损失
IS 是一种用于测量机器学习中的分类模型表现的度量。损失(或误差)的数量是在0到1之间的数字,其中0是一个完美的模型。
5.条件正(P)
数据中实际阳性案例的数量
6.条件负(n)
数据中实际负面案例的数量
7.真正的正(TP)
正确指示存在条件或特征的测试结果
8.真正的负(TN)
正确指示没有条件或特征的测试结果
9.假阳性(FP)
错误表明存在特定条件或属性的测试结果
10.假负(FN)
错误表明缺乏特定条件或属性的测试结果
11.混淆矩阵
它以矩阵形式为我们提供了模型的结果(如下所示)。我们使用它来测量模式的准确性。
实际积极 | 实际负面 | |
---|---|---|
预测正 | true积极 | 假阴性 |
预测负面 | 假阴性 | true负面 |
12.曲线下的区域(AUC)
是曲线和X轴之间封装的区域。
13.接收器操作特征(ROC)
接收器操作特性(ROC)曲线,该曲线被定义为测试灵敏度的图,为y坐标与其1特异性或假阳性率(FPR)为X坐标
Wikipedia的此图像显示了Roc的精确定义。
如果您希望我在本文中包括其他任何术语,我将尽力包括它们。
参考
- https://www.javatpoint.com/classification-algorithm-in-machine-learning
- Park SH,Goo JM,Jo Ch。接收器操作特征(ROC)曲线:放射科医生的实践审查。韩国J Radiol。 2004 Jan-Mar; 5(1):11-8。 doi:10.3348/kjr.2004.5.1.11。 PMID:15064554; PMCID:PMC2698108。
- https://en.wikipedia.org/wiki/Receiver_operating_characteristic
- https://developers.google.com/machine-learning/crash-course/classification/roc-and-auc