我坚信,理解ML的关键是了解其术语以及您在做什么。
1)时代
对整个数据集进行全面培训,以便每个示例都可以看到一次。因此,一个时期代表N /批大小训练迭代,其中N是示例总数。
2)例子
数据集的一行。一个示例包含一个或多个功能,可能还包含一个标签。另请参见带有标签的示例和未带标签的示例。
3)标签
这是示例的结果部分。数据集中的每个示例均包含一个或多个要素和一个标签。
在垃圾邮件检测数据集中,功能可能包括主题,发件人和邮件,而标签可能是“垃圾邮件”或“非垃圾邮件”。
4)学习率
用于通过梯度下降训练模型的标量。在每次迭代期间,梯度下降算法将学习率乘以梯度。所得乘积称为梯度步骤。
5)型号
机器学习系统从训练数据中学到的东西的表示。
6)训练
确定理想参数的过程包括一个模型。
7)随机梯度下降(SGD)
一种批处理大小为1的梯度下降算法。换句话说,SGD依赖于从数据集中随机选择的单个示例来计算每个步骤的梯度估计。
8)平方损失(L2损失)
此函数计算带标签的示例的模型预测值与标签的实际值之差的平方。
由于平方,此损失函数会放大不良预测的影响。
9)损失
衡量模型的预测距离其标签的距离。或者,更悲观地说,是对模型有多糟糕的一种度量。为了确定该值,模型必须定义损失函数。
10)机器学习
一些新手不知道这个术语的含义。但是,他们不应该责怪大多数人只是直接去编码而不学习基础知识。
机器学习是根据输入数据构建(训练)预测模型的程序或系统。
该系统使用学习的模型从与训练模型所用的分布相同的分布中得出的新数据(从未见过)做出有用的预测。
机器学习还指与这些程序或系统有关的研究领域。
结论
感谢您阅读,希望对您所帮助。
注意:本文归作者所有,未经作者允许,不得转载