Reverse Image Search Feature


Votre image moyenne vaut probablement beaucoup moins que mille mots, vous pouvez apprendre beaucoup de choses à partir des selfies. Mais parfois, vous avez juste besoin de savoir d’où vient une image, quel que soit le nombre de mots qu’elle vaut.

Pour cela, il existe des moteurs de recherche d’images inversées fournis par Google, TinEye, Bing, Yandex, Pixsy et bien d’autres. Cependant, puisque vous ne fournissez aucun mot dans votre requête, comment savent-ils quoi rechercher ? Et surtout, comment le trouvent-ils ? La façon dont la recherche d’image inversée fonctionne à partir de chaque moteur de recherche varie, et ils gardent secrets leurs algorithmes exacts, mais les idées de base sont facilement disponibles et pas si difficiles à comprendre.

Empreintes digitales

Les images peuvent en fait être plus uniques que les empreintes digitales humaines, car les chances que deux images contiennent exactement le même agencement de pixels sont incroyablement infinitésimales, tandis que le risque d’une collision d’empreintes digitales est d’environ 64 milliards de chances relativement bonnes. Mais comment prendre une empreinte digitale sur une image ? Les étapes varient en fonction de l’algorithme, mais la plupart d’entre elles suivent la même formule de base.

Tout d’abord, vous devez mesurer les caractéristiques des images, qui peuvent inclure la couleur, les textures, les dégradés, les formes, les relations entre les différentes parties de l’image et même des choses comme les transformées de Fourier (une méthode de division des images en sinus et cosinus).

Disons que nous recherchons l’image suivante et que nous en avons besoin d’une empreinte digitale.

Pour ce faire, nous pourrions, entre autres, utiliser l’histogramme de couleurs, la transformée de Fourier et la carte de texture des images, que vous pouvez voir ci-dessous.

Si une image devait être redimensionnée, floue, tournée ou autrement manipulée, il y aurait un certain nombre d’algorithmes qui utiliseraient les fonctionnalités ci-dessus et d’autres pour essayer de trouver des résultats.

Codage, stockage et recherche.

Chaque élément d’image de l’empreinte digitale peut être encodé sous forme de chaînes de lettres et de chiffres, faciles à stocker et à indexer dans une base de données. Toute combinaison de caractéristiques extraites et stockées deviendra l’entrée des moteurs de recherche d’images inversées pour cette image. La base de données TinEyes, par exemple, contient environ 39,6 milliards d’images indexées en février 2020, ce qui signifie qu’ils ont exécuté leur algorithme sur ce nombre d’images et stockent toutes ces empreintes digitales pour comparer les images recherchées.

La deuxième partie importante de l’algorithme consiste à déterminer quelles images sont similaires. Lorsque vous téléchargez une image, elle passe par l’algorithme d’empreinte digitale des moteurs de recherche d’images inversés. Le moteur de recherche essaiera de trouver les entrées avec les empreintes digitales les plus proches, ce que l’on appelle la distance de l’image. Décider quels facteurs comparer et comment les pondérer appartient également à chaque moteur de recherche, mais son objectif principal est de trouver une distance totale d’image aussi proche que possible de zéro.

Qu’en est-il de l’apprentissage automatique/de l’IA ?

Grâce aux techniques d’indexation/d’empreintes digitales décrites ci-dessus, la recherche d’image inversée était assez bonne avant même qu’il ne soit pratique d’y appliquer l’IA. Cependant, comme l’IA est excellente pour le traitement des images, il est très probable que de nombreux moteurs de recherche majeurs utiliseront des éléments tels que les réseaux de neurones convolutifs (CNN) pour aider à extraire et à baliser les fonctionnalités. Google, par exemple, pourrait utiliser un CNN dans sa recherche d’image inversée, lui permettant de trouver des mots-clés probables pour l’image et de produire des images et des résultats Web pertinents, comme ils le font dans Google Photos depuis un certain temps.

Cela place la recherche d’image inversée au-dessus de la simple extraction de caractéristiques et de la distance de l’image. Les réseaux de neurones convolutifs exécutent essentiellement des images à travers plusieurs filtres qui cartographient plusieurs types de caractéristiques différents, puis tentent de les classer en fonction de la formation précédente. C’est une simplification excessive, bien sûr, mais il suffit de dire que les CNN rendent la recherche d’images beaucoup plus précise et utile et sont probablement mises en œuvre parallèlement aux anciennes méthodes d’empreintes digitales par vision par ordinateur.

Quel est le meilleur moteur de recherche d’images inversées ?

Différents algorithmes signifient que différents moteurs de recherche d’images sont bons pour différentes choses, bien qu’en fin de compte ils visent tous le même objectif : trouver une correspondance pour l’image que vous avez téléchargée. Google images il a un assez bon taux de réussite, par exemple, mais il fait beaucoup de conjectures, vous donnant beaucoup de photos similaires mais pas identiques. C’est très bien si vous recherchez une ambiance générale ou une catégorie, mais un moteur comme oeil d’étain il est beaucoup plus axé sur la recherche d’images identiques, même si elles sont fortement modifiées, et peut même identifier les images dans les photos, ce qui le rend un peu meilleur si vous avez besoin d’une correspondance exacte.

Le moteur de recherche russe Yandex est également réputé pour avoir un excellent outil de recherche d’images, même si, comme on pouvait s’y attendre, il a tendance à mieux fonctionner sur les sujets russes. Des outils comme Pixsy et ImageRaider se concentrent sur l’identification des cas d’utilisation non autorisée, ils ont donc tendance à inclure plus de fonctionnalités comme les alertes et se concentrent sur la surveillance des bibliothèques de photos des utilisateurs.

Parce que les algorithmes changent tout le temps et restent souvent bloqués, il vaut la peine de vérifier quelques moteurs différents si l’un ne renvoie pas les résultats que vous recherchez.

Crédits image : Vapeur d’une rue de New Yorkicône de la base de données db

Cet article est-il utile ?

Abonnez-vous à notre newsletter!

Nos derniers tutos envoyés directement dans votre boite mail

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici