La vision par ordinateur : une intelligence artificielle qui voit et comprend
La vision par ordinateur (computer vision) est une technique d’intelligence artificielle qui permet d’analyser des images et des vidéos captées par des caméras. Grâce à cette technologie, l’IA peut comprendre et traiter les informations visuelles en temps réel.
Avec la qualité croissante des capteurs vidéo, les algorithmes d’IA sont désormais capables de « voir » le monde : ils catégorisent les objets, analysent leurs déplacements et interprètent les contextes visuels. Ces analyses génèrent ensuite des alertes ou des informations accessibles à l’humain, facilitant ainsi la prise de décision.
Un exemple concret : Notre algorithme, par exemple, est entraîné à détecter des départs de feu. Il alerte immédiatement les autorités compétentes pour une intervention rapide et efficace.
Des usages multiples pour les collectivités et infrastructures
Les caméras sont déjà déployées dans de nombreux espaces publics et privés, pour des fonctions variées telles que :
-
Comptage des mobilités,
-
Étude des flux,
-
Protection des bâtiments,
-
Surveillance des abords exposés à des risques (vol, agressions),
-
Constatation des infractions routières.
Sans IA, c’est l’œil humain qui doit analyser toutes ces images. Mais avec la croissance exponentielle des données, qui doublent chaque année, et la capacité limitée de notre cerveau (seulement 70 % des données visuelles sont réellement perçues), la vision par ordinateur vient soutenir et soulager l’œil humain.
Un défi technique majeur
Le monde visuel est complexe : un objet peut apparaître sous différents angles, être partiellement caché, ou soumis à des conditions d’éclairage changeantes.
Pour être performant, un système de vision par ordinateur doit pouvoir reconnaître un objet dans toutes ces situations, ce qui constitue un véritable challenge technique.
Enjeux juridiques et éthiques
Avec le déploiement massif de caméras dans des espaces publics et privés, des questions légitimes se posent sur la protection des libertés individuelles.
Chez XXII, nous respectons strictement le RGPD :
-
Nous n’analysons jamais de données à caractère personnel.
-
Nous distinguons uniquement des silhouettes classées par catégories (humain, chien, voiture, vélo…) sans utiliser de données biométriques.
-
Les données personnelles éventuelles restent « en sommeil » et ne sont pas intégrées dans les analyses d’IA.
Données d’entraînement et deep learning
L’IA nécessite un grand volume de données images et vidéos pour apprendre, tester et s’améliorer.
Cette étape, appelée deep learning, s’appuie sur des réseaux de neurones artificiels composés de nombreuses couches, qui interprètent et transmettent les informations.
Lors de la constitution des datasets, nous veillons au strict respect du RGPD, souvent accompagnés d’une analyse d’impact relative à la protection des données.
Constitution de bases de données responsables
Nous créons des bases de données dédiées à la recherche scientifique interne chez XXII, toujours dans le respect de la législation et des personnes concernées.
Pour limiter les risques liés aux données personnelles, nous travaillons aussi sur des données synthétiques générées artificiellement.
Nos datasets sont :
-
ciblés par cas d’usage (ex. apprendre à détecter un nouvel objet),
-
diversifiés (pour tester la robustesse face à différentes situations),
-
anonymisés ou pseudonymisés,
-
issus de solutions open source, ou collectés avec consentement.
Annotation et apprentissage
Le développement d’un algorithme commence par l’annotation des données : chaque image est étiquetée selon des critères précis (types d’objets, angles de vue, conditions météo, etc.).
Ces données annotées permettent ensuite d’entraîner les modèles d’IA, souvent des réseaux de neurones profonds, afin qu’ils apprennent à analyser et comprendre les images reçues.
Évaluation des performances
Nous évaluons nos modèles en mesurant :
-
le taux de vrais positifs,
-
le taux de faux positifs,
-
le taux de vrais négatifs,
-
le taux de faux négatifs.
Ces mesures, calculées par catégorie d’objets, nous aident à construire des indicateurs synthétiques (sensibilité, spécificité), essentiels pour comprendre les forces et limites de nos algorithmes.
Ces tests sont réalisés sur des données pseudonymisées, à l’aide de logiciels propriétaires ou développés en interne.
Lutte contre les biais
Un enjeu majeur est la création d’algorithmes exempts de biais : par exemple, l’IA doit détecter une voiture rouge aussi bien qu’une voiture bleue.
Pour cela, nous enrichissons constamment nos modèles avec de nombreux datasets variés et diversifiés.
Importance de la diversité des données
La diversité des angles de vue est également cruciale. Elle permet de vérifier que les algorithmes détectent correctement les objets, quelle que soit la position de la caméra.
Cette approche rigoureuse permet à XXII de proposer des solutions fiables, performantes et éthiques, capables d’accompagner l’humain dans l’analyse et la compréhension du monde visuel.
RGPD & éthique chez XXII
CORE, un outil d’aide à la décision
La vision par ordinateur traite souvent des flux vidéo contenant des données personnelles. C’est pourquoi le respect du RGPD et des réglementations associées est une priorité pour nous.
Nous réaffirmons clairement que CORE est un outil d’aide à la prise de décision. En aucun cas il ne remplace l’œil humain, mais vient le compléter.
Notre plateforme ne déclenche aucune procédure automatisée suite à une infraction présumée. Elle facilite simplement l’accès à des informations déjà disponibles dans un centre de sécurité. Ainsi, l’usage de CORE reste toujours encadré par l’intervention humaine.
Notre engagement en accord avec la CNIL
-
Nécessité : Le dispositif doit servir un objectif clair et légitime.
-
Proportionnalité : CORE agit uniquement sur des images déjà couvertes par la vidéoprotection, sans impact supplémentaire sur les personnes.
-
Minimisation des données : XXII ne stocke aucun flux vidéo. Notre logiciel fonctionne exclusivement en temps réel.
-
Non-identification : Les algorithmes analysent des silhouettes, sans collecte de données personnelles. Seule la position dans l’espace est étudiée, jamais une personne en particulier. L’analyse porte toujours sur des groupes, jamais sur des individus ciblés.
CORE combine ainsi performance, respect de la vie privée et complémentarité humaine pour offrir une solution éthique et efficace.