Nouveau à la NN de l'. CNN peuvent être formés pour détecter un unique objet dans une image. Cependant, si n'importe quelle image en un ensemble de données peut contenir tout le n ° d'objets. N'est-ce pas poser un problème à CNNs que la sortie dense couche doit être d'une taille fixe? Comment voulez-vous résoudre ce problème?
Par exemple: Disons que j'ai un échantillon aléatoire de 2 images de cet ensemble. Image 1 a 2 objets et de l'image 2 a 5 objets. L'axe de l'étiquette de l'img1 contient la boîte englobante coordonnées de 2 objets; l'axe de l'étiquette de l'img2 contiendra les coordonnées pour les 5 objets, beaucoup plus grand vecteur y de img1.
Une solution possible? :
J'aurais besoin de trouver l'image avec le plus grand nombre de des objets (désigner cette valeur de M). Disons aussi qu'un objet a 4 coordonnées. Si M = 5, j'aurais besoin d'un vecteur y de 20. Si une image a 1 objet, y vecteur contenant 4 les valeurs non nulles ET les 16 valeurs différentes de zéro. Les 4 non-zéro les valeurs représentent les coordonnées et le 16 à zéro les valeurs représentent les coordonnées des autres inexistante objets.