Un photographe professionnel passe de nombreuses heures à traiter ses images afin d’y apporter des modifications esthétiques uniques.
Meero conçoit des algorithmes qui apprennent ces procédés de création afin d’offrir une solution rapide, globale, et applicable à grande échelle.
Pour livrer les dizaines de milliers de photographies par jour, Meero a rapidement eu besoin de développer un procédé de retouche et d'amélioration d'images sans intervention externe. En se fondant sur les dernières avancées en recherche en apprentissage automatique, il est devenu possible de programmer les retouches en mettant à profit des techniques de pointe.
Le problème le plus délicat consiste à développer un algorithme qui produit les mêmes transformations globales et locales qu’un retoucheur. L’expertise de Meero dans le domaine, couplée à une base de données de 25 millions d’images unique au monde, a constitué une base solide pour travailler sur de tels modèles d’apprentissage automatique.
Meero met à profit les techniques d’apprentissage profond en utilisant un double réseau de neurones convolutif. Cela implique l’extraction de caractéristiques images globales et locales sur une base d’analyse multi-échelle. L'objectif est de minutieusement faire apprendre les différentes étapes d’amélioration exercées par des professionnels de l’image à notre algorithme, et de le rendre robuste à des variations d’éclairage (comme la balance des blancs ou des tonalités), de sémantique, et de défauts de capture (par exemple, le bruit ou le flou de bougé).
Au-delà de l’aspect esthétique d’une photo, l’intelligence artificielle de Meero est aussi capable de transformer les caractéristiques visuelles d’une image en information quantitative et valorisable, toujours en utilisant des techniques d’apprentissage profond. La base de données de Meero comporte des annotations sémantiques, qui sont utilisées en plus des améliorations esthétiques. En couplant des images avec des métadonnées décrivant des régions d’intérêts et des classes d’objets, il devient alors possible de prédire la présence d’un objet dans une image, et ce en une fraction de seconde.
Comment un algorithme peut-il afficher des performances similaires à celles d’un photographe professionnel sur une tâche aussi complexe et subjective ? La réponse réside dans le principe de l’apprentissage par descente de gradient. En utilisant un réseau de neurones profond qui imite le fonctionnement du cerveau, Meero est capable d’utiliser l’erreur renvoyée par ce dernier. Le calcul de son gradient est réalisé via des méthodes d’optimisation convexe. Ensuite, Meero utilise le théorème de dérivation des fonctions composées afin de corriger cette erreur. En partant de la fin vers le début du réseau de neurones convolutif, et en répétant cette opération des millions de fois grâce à la base de données de Meero, l’algorithme propriétaire d’apprentissage profond affiche des performances aussi bonnes que celles d’un photographe professionnel en matière de retouche d’images.