dropout

    dropout操作

    丢弃或者保持x的每个元素独立。Dropout是一种正则化手段,通过在训练过程中阻止神经元节点间的相关性来减少过拟合。根据给定的丢弃概率,dropout操作符按丢弃概率随机将一些神经元输出设置为0,其他的仍保持不变。

    dropout op可以从Program中删除,提高执行效率。

    参数:

    • x (Variable) - 输入,多维Tensor。数据类型:float32和float64。

    • dropout_prob (float32) - 输入单元的丢弃概率,即输入单元设置为0的概率。

    • name (str|None) – 具体用法请参见 cn_api_guide_Name ,一般无需设置,默认值为None。

    • dropout_implementation (str) - 丢弃单元的方式,有两种’downgrade_in_infer’和’upscale_in_train’两种选择,默认:’downgrade_in_infer’。具体作用可以参考一下描述。

      1. downgrade_in_infer(default), 在预测时减小输出结果

        • inference: out = input * (1.0 - dropout_prob)

      2. upscale_in_train, 增加训练时的结果

        • train: out = input * mask / ( 1.0 - dropout_prob )

        (mask是一个张量,维度和输入维度相同,值为0或1,值为0的比例即为 dropout_prob

    dropout操作符可以从程序中移除,使程序变得高效。

    返回:Tensor。经过丢弃部分数据之后的结果,与输入X形状相同的张量。

    代码示例