Vision par ordinateur
-
Upload
radhouani-mejdi -
Category
Engineering
-
view
53 -
download
0
Transcript of Vision par ordinateur
![Page 1: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/1.jpg)
Vision par ordinateur
Mejdi RADHOUANI &
Majdi SAIBI
![Page 2: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/2.jpg)
C’est quoi la vision ?
![Page 3: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/3.jpg)
La vision (⅓ )★ L’espace qui nous entoure a une structure tri-dimensionnelle
(3D)★ L'être humain sait parfaitement décrire et interpréter ce
monde.
★ Il ne trouve aucune difficulté de nommer les objets et leurs état
★ Pourtant, l'information disponible sur la rétine de ses yeux n'est qu'un ensemble de points (environ un million de picture elements ou pixels).
★ Chaque pixel contient des informations sur la lumière reçue en ce point de la rétine
![Page 4: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/4.jpg)
La vision (⅔ ) ★ Guide à la fois par l'information codée dans l'image ou la
rétine et par ses propres connaissances le processus visuel construit des percepts.
★ Les objets et leurs état sont le résultat final d’un processus d’interprétation qui intègre le système de vision.
★ Le système de vision doit fournir les connaissances nécessaires an de permettre une interprétation non ambiguë.
![Page 5: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/5.jpg)
La vision (3)Image (ensemble de pixels)
System de visionInterprétation
Description de la scène (objets, position, mouvement)
Connaissances a priori (forme, couleur,
comportement physique)
![Page 6: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/6.jpg)
La vision par ordinateur
![Page 7: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/7.jpg)
La vision par ordinateur★La vision humaine est extrêmement complexe (neurosciences)
★La vision par ordinateur ne cherche pas à comprendre ou à reproduire la vision humaine
★Il cherche à construire un modèle algorithmique qui, vu de l'extérieur, possède des propriétés semblables.
★La vision par ordinateur (aussi appelée vision artificielle ou vision numérique) est une branche de l'intelligence artificielle dont le principal but est de permettre à une machine d'analyser, traiter et comprendre une ou plusieurs images prises par un système d'acquisition (par exemple : caméras, etc.)
![Page 8: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/8.jpg)
La vision par ordinateur: quelques applications
★Traditionnellement, le flux vidéo était traité par un opérateur humain, remplacé progressivement par un traitement automatique sur les données enregistrées contenant des événements anormaux. Actuellement, l'objectif est de détecter ces événements en temps réel et de façon automatique.
★Navigation: ex. dans un véhicule autonome ou un robot mobile ★Détection d’événements:ex. pour la surveillance ou le comptage
automatique de personnes.★Reconnaissance d'écriture (OCR)
![Page 9: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/9.jpg)
Une théorie de la visionLes algorithmes de vision sont des expressions des stratégies mises en œuvre :
➢ Extraction de primitives à partir des images
➢ Représentation des connaissances
➢ Mise en correspondance images/connaissances : reconnaissance
![Page 10: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/10.jpg)
Une théorie de la vision : Connaissances à prioriPhysiques (optique, forces/interactions)
Géométriques (forme des objets, formation de l'image)
Sémantiques (fonction des objets, comportement)
Exemple : Exemple : que sait-on de mesurable sur une voiture qui permette de l'identifier dans une image ?
![Page 11: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/11.jpg)
Le paradigme de David MarrVers la n des années 70 David Marr a proposé un modèle calculatoire pour le traitement et la représentation de l'information visuelle :
1.a partir d'une ou de plusieurs images un processus d'extraction de caractéristiques produit un description en termes d'attributs en 2D.Ce niveau de représentation est appelé première ébauche (primal sketch).
2. la première ébauche constitue l'entrée d'un certain nombre de processus: il s'agit de processus d'inférence qui utilisent des connaissances géométriques (analyse des contours) géométriques et statistiques (analyse des textures), photométriques (analyse des ombrages) ou colorimétriques (analyse des reflets).ébauche 2.5D
![Page 12: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/12.jpg)
Le paradigme de David Marr3 . l'ébauche 2.5D est mise en correspondance avec des connaissances 3D afin de construire une description de la scène en termes d'objets et de relations entre les objets il s'agit maintenant d'une représentation centrée sur la scène.
❖Il s'agit maintenant d'une représentation centrée sur la scène ( la description ne dépend plus de la position de l'observateur (le cas de 2éme étape))
![Page 13: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/13.jpg)
Segmentation, reconstruction, reconnaissanceEn pratique le paradigme de David Marr se traduit par trois étapes de traitement segmentation reconstruction et reconnaissance :
On peut appliquer ces 3 étape sur différents types des image :
● optiques (2D) : photo, satellite, document
● médicales (Rayons X, IRM, 2D/3D…)● images fixes ou séquences temporelles● autres (radar, laser, sonar…)
![Page 14: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/14.jpg)
Segmentation
![Page 15: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/15.jpg)
SegmentationLa pierre de base de tout système de vision
Le but de toute méthode de segmentation est l'extraction d'attributs caractérisant ces entités.
Détection de contours: la recherche des discontinuités locales de la fonction des niveaux de gris de l'image.
La segmentation des contours :consiste a approximer les contours par des représentations analytiques exemple droite ou polygone..
L'extraction de régions (zones homogènes)
Frontières de régions ⇔ contours
![Page 16: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/16.jpg)
Reconstruction
![Page 17: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/17.jpg)
ReconstructionOn commence par le calibrage de le détecteur : avoir une idée globale sur la scène en se basant sur un ensemble de caractéristique tel que l’intensité des images
Il ya plusieur approche pour reconstruire la scène pour l’adapter au capteur selon ses capacités :
exemple : Stéréoscopie
![Page 18: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/18.jpg)
Reconnaissance
![Page 19: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/19.jpg)
ReconnaissanceComparer des indices visuels bi ou tridimensionnels avec les indices des objets à reconnaître
Les méthodes de reconnaissance sont souvent couplées avec des méthodes de localisation
On se basant sur un base de connaissance , on obtient donc une description d’objet et les relations entre eux (mouvement..)
![Page 20: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/20.jpg)
Exemple pratiqueMicrosoft cognitive services : Computer vision
https://www.microsoft.com/cognitive-services/en-us/computer-vision-api
![Page 21: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/21.jpg)
ConclusionLa vision par ordinateur est un processus de traitement de
l’information Elle utilise des stratégies bien définies an d’atteindre ses buts
L’entrée d’un système de vision est constituée par une séquence d’images Le système lui-même apporte un certain nombre de
connaissances qui interviennent à tous les niveaux
La sortie est une description de l’entrée en termes d’objets et de relations entre ces objets
![Page 22: Vision par ordinateur](https://reader036.fdocuments.net/reader036/viewer/2022070603/587012141a28ab7f428b4751/html5/thumbnails/22.jpg)
Albert Einstein
Les machines un jour pourront résoudre tous les problèmes,
mais jamais aucune d'entre elles ne pourra en poser un