Plusieurs Instances d'un Même Objet dans des Images Détection d'Objets à l'Aide de CNN

0

La question

Nouveau à la NN de l'. CNN peuvent être formés pour détecter un unique objet dans une image. Cependant, si n'importe quelle image en un ensemble de données peut contenir tout le n ° d'objets. N'est-ce pas poser un problème à CNNs que la sortie dense couche doit être d'une taille fixe? Comment voulez-vous résoudre ce problème?

Par exemple: Disons que j'ai un échantillon aléatoire de 2 images de cet ensemble. Image 1 a 2 objets et de l'image 2 a 5 objets. L'axe de l'étiquette de l'img1 contient la boîte englobante coordonnées de 2 objets; l'axe de l'étiquette de l'img2 contiendra les coordonnées pour les 5 objets, beaucoup plus grand vecteur y de img1.

Une solution possible? :

J'aurais besoin de trouver l'image avec le plus grand nombre de des objets (désigner cette valeur de M). Disons aussi qu'un objet a 4 coordonnées. Si M = 5, j'aurais besoin d'un vecteur y de 20. Si une image a 1 objet, y vecteur contenant 4 les valeurs non nulles ET les 16 valeurs différentes de zéro. Les 4 non-zéro les valeurs représentent les coordonnées et le 16 à zéro les valeurs représentent les coordonnées des autres inexistante objets.

1

La meilleure réponse

1

La façon la plus simple de faire plusieurs objet de la classification est de l'aide de la segmentation. Ceci est fait par la segmentation de l'image d'entrée à plusieurs sous-domaines et de les nourrir, chaque zone du réseau de neurones.

Cependant, c'est une méthode de base et il y a maintenant de nombreux algorithmes avancés qui ne segmentation automatique.

Généralement, plusieurs objets de classification est abordée en deux étapes: la Première est une région de la proposition de l'algorithme de deviner les parties de l'image qui contient l'objet.

Le deuxième est un algorithme qui permet de classer les régions proposées.

enter image description here

img source

2021-11-21 05:58:06

Quelque chose comme la plus Rapide R-CNN effectue la segmentation en utilisant RPN pour extraire des caractéristiques qu'il juge pertinents? Est ma compréhension de ce correct? En outre, ce serait le vecteur y regarder étant donné qu'il y a des variables de prédiction des étiquettes pour les images.
Ayma

Dans d'autres langues

Cette page est dans d'autres langues

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................