sigmoid_focal_loss
Focal Loss 被提出用于解决计算机视觉任务中前景-背景不平衡的问题。该OP先计算输入x中每个元素的sigmoid值,然后计算sigmoid值与类别目标值label之间的Focal Loss。
Focal Loss的计算过程如下:
其中,已知:
x (Variable) – 维度为
的2-D Tensor,表示全部样本的分类预测值。其中,第一维N是批量内参与训练的样本数量,例如在目标检测中,样本为框级别,N为批量内所有图像的正负样本的数量总和;在图像分类中,样本为图像级别,N为批量内的图像数量总和。第二维:math:C 是类别数量( 不包括背景类 )。数据类型为float32或float64。
fg_num (Variable) – 维度为 [1][1] 的1-D Tensor,表示批量内正样本的数量,需在进入此OP前获取正样本的数量。数据类型为int32。
alpha (int|float) – 用于平衡正样本和负样本的超参数,默认值设置为0.25。
返回: 输入x中每个元素的Focal loss,即维度为 [N,C][N,C] 的2-D Tensor。
返回类型: 变量(Variable),数据类型为float32或float64。