stochasticLinearRegression
有4个可自定义的参数。它们按顺序传递给函数,但不需要传递所有四个参数——将使用默认值,然而好的模型需要一些参数调整。
语法
l2 regularization coefficient
这可能有助于防止过度拟合。 默认值为0.1
。mini-batch size
设置元素的数量,这些元素将被计算和求和以执行梯度下降的一个步骤。纯随机下降使用一个元素,但是具有小批量(约10个元素)使梯度步骤更稳定。 默认值为15
。method for updating weights
他们是:Adam
(默认情况下), ,Momentum
,Nesterov
。Momentum
和Nesterov
需要更多的计算和内存,但是它们恰好在收敛速度和随机梯度方法的稳定性方面是有用的。
stochasticLinearRegression
用于两个步骤:拟合模型和预测新数据。 为了拟合模型并保存其状态以供以后使用,我们使用 -State
组合器,它基本上保存了状态(模型权重等)。
为了预测我们使用函数 evalMLMethod, 这需要一个状态作为参数以及特征来预测。
可以使用这种查询。
在这里,我们还需要将数据插入到 train_data
表。参数的数量不是固定的,它只取决于传入 的参数数量。它们都必须是数值。
注意,目标值(我们想学习预测的)列作为第一个参数插入。
2. 预测
查询将返回一列预测值。注意,evalMLMethod
的第一个参数是 AggregateFunctionState
对象, 接下来是特征列。
test_data
是一个类似 train_data
的表 但可能不包含目标值。
参见