dropout
dropout操作
丢弃或者保持x的每个元素独立。Dropout是一种正则化手段,通过在训练过程中阻止神经元节点间的相关性来减少过拟合。根据给定的丢弃概率,dropout操作符按丢弃概率随机将一些神经元输出设置为0,其他的仍保持不变。
dropout op可以从Program中删除,提高执行效率。
参数:
x (Variable) - 输入,多维Tensor。数据类型:float32和float64。
dropout_prob (float32) - 输入单元的丢弃概率,即输入单元设置为0的概率。
name (str|None) – 具体用法请参见 cn_api_guide_Name ,一般无需设置,默认值为None。
dropout_implementation (str) - 丢弃单元的方式,有两种’downgrade_in_infer’和’upscale_in_train’两种选择,默认:’downgrade_in_infer’。具体作用可以参考一下描述。
downgrade_in_infer(default), 在预测时减小输出结果
inference: out = input * (1.0 - dropout_prob)
upscale_in_train, 增加训练时的结果
train: out = input * mask / ( 1.0 - dropout_prob )
(mask是一个张量,维度和输入维度相同,值为0或1,值为0的比例即为
dropout_prob
)
dropout操作符可以从程序中移除,使程序变得高效。
返回:Tensor。经过丢弃部分数据之后的结果,与输入X形状相同的张量。
代码示例: