Я пытаюсь использовать кофе для реализации триплетных потерь, описанных в Schroff, Kalenichenko and Philbin "FaceNet: A Unified Embedding for Face Recognition and Clustering", 2015.Какова формула градиента распространения обратной связи по триплету?
Я новичок в этом, так как рассчитать градиент в обратном распространении?
Я вижу, что существует открытый PR, реализующий эту потерю: https://github.com/BVLC/caffe/pull/3663 – Shai