Partager via


ROIPooling

    ROIPooling (input,
                ROIs,
                {ROI output shape}, 
                spatialScale = {spatial scale wrt image (float)})

L’opération de regroupement du roi calcule une nouvelle matrice en sélectionnant la valeur maximale (regroupement maximal) dans l’entrée de regroupement pour chaque région d’intérêt (ROI). Les régions d’intérêt sont fournies en tant que deuxième entrée à l’opérateur en tant que coin supérieur gauche et inférieur droit des régions en pixels absolus de l’image d’origine. L’entrée de regroupement est calculée par roi en projetant les coordonnées sur la carte des fonctionnalités d’entrée (première entrée à l’opérateur) et en tenant compte de toutes les positions qui se chevauchent. La projection utilise l’échelle spatiale, qui est le rapport de taille de la carte des fonctionnalités d’entrée sur la taille de l’image d’entrée. L’échelle spatiale peut être calculée en multipliant toutes les progressions qui se produisent avant le regroupement de rois et en prenant l’inverse, par exemple, un réseau qui a quatre couches de regroupement avec la progression 2 aurait une échelle spatiale de 1/16. La largeur et la hauteur de la forme de sortie sont déterminées par le troisième argument, la profondeur de sortie (nombre de filtres) est identique à la profondeur d’entrée.

  • input - mise en pool d’entrées pour l’image entière
  • ROIs - Coordonnées roi en tant que coordonnées de pixels absolus (x_min, y_min, x_max, y_max)
  • {roi output shape} - dimensions (largeur, hauteur) de la sortie ROI, en tant que vecteur BrainScript, par exemple (4:4).
  • spatialScale - l’échelle de l’opérande à partir de la taille d’image d’origine. La valeur par défaut est 1/16, qui correspond par exemple aux réseaux AlexNet et VGG16.

Notes

Modifié dans CNTK version 2.1.

Dans CNTK 2.1, le paramètre d’échelle spatiale a été ajouté et les coordonnées des ROIs sont désormais passées sous forme de valeurs de pixel absolu plutôt que de valeurs relatives comme dans les versions précédentes.