Nos données montrent que lorsque les personnes recherchent un produit, la plupart d’entre elles utilisent environ un mot et demi. Malheureusement, ces requêtes courtes permettent difficilement aux recherches en texte intégral d’offrir des résultats pertinents. L’utilisation de filtres permet de les améliorer, mais ils sont souvent si nombreux que cela peut en devenir déroutant.
L’une des méthodes permettant d’augmenter l’efficacité de la recherche est d’utiliser l’approche ‘learning to rank’ ou ‘apprendre à classer’, qui crée un classement optimal des résultats. Toutefois, même cette méthode d’apprentissage automatique n’est pas toute puissante ; c’est pourquoi nous avons créé la Compréhension des requêtes, le compagnon idéal de ‘learning to rank.’
La recherche en texte intégral est excellente si vous utilisez des requêtes plus longues, de quatre mots ou plus par exemple, ou des termes spéciaux, tels que le code du produit. Dans ces cas-là, elle retourne généralement votre recherche exacte en première position ou vous affiche une page “Aucun résultat”. L’une ou l’autre de ces solutions vaut mieux que de recevoir des résultats totalement hors sujet, ce qui est souvent le cas si vous utilisez des requêtes courtes en minimisant ou en oubliant certains mots spécifiques.
Comment la recherche fonctionne dans le monde réel
Voilà comment la plupart des gens effectuent une recherche. Nos données montrent qu’en moyenne, les gens utilisent 1,43 mots par requête (avec une déviation standard de +/- 0,58, calculée pour nos 150 clients les plus actifs). Nous avons des clients qui ont de nombreuses requêtes par code produit uniquement (cela dépend du domaine), mais la médiane pour les requêtes par code produit uniquement n’est que de 2,9 %.
Les personnes qui utilisent des requêtes courtes et peu précises sont la pierre angulaire des problèmes liés à la technologie de recherche en texte intégral. Les inconvénients de la recherche en texte intégral sont les mêmes que ses principaux avantages – elle peut trouver tout ce qui correspond à la requête, littéralement n’importe où. Du coup, elle trouve généralement une tonne de résultats et laisse à la personne qui recherche la tâche de les trier. Le score du texte intégral, calculé à partir de requêtes courtes et peu précises, n’est pas suffisamment bon pour produire un classement des résultats les plus pertinents.
Comment les entreprises e-commerce doivent-elles réagir ?
C’est pour cette raison que la méthode ‘apprendre à classer’ existe. Cette méthode basée sur l’apprentissage automatique, qui met les résultats en ordre à l’aide d’une valeur numérique représentant leur pertinence, combine le comportement humain avec des indicateurs plein texte et crée un classement optimal des résultats. Chez Luigi’s Box, nous avons déjà incorporé ce mécanisme dans nos produits associés à la recherche. Nous avons néanmoins constaté, que malgré sa grande utilité, la méthode ‘apprendre à classer’ n’est pas la panacée pour trouver la solution de recherche optimale. Il est difficile d’apprendre la bonne méthode de classement pour une requête qui ne se produit qu’une fois par mois, et dans de nombreux domaines, il existe des requêtes à longue traîne qu’il faut prendre en compte.
La solution serait d’inciter les utilisateurs à se fier davantage aux filtres pour affiner les résultats de la recherche en fonction des paramètres qui les intéressent particulièrement. Toutefois, lorsqu’il s’agit de filtres, le nombre d’options peut être énorme. Par exemple, un de nos clients a plus de 2 000 paramètres différents (selon la catégorie de produits) et près de 19 000 valeurs différentes pour ces paramètres. Il est impossible de construire une interface simple et intuitive pour l’ensemble de ces paramètres.
La compréhension des requêtes est maintenant disponible
La façon dont nous abordons ce problème consiste à reconnaître l’intention de recherche des utilisateurs et à transformer le maximum de termes de recherches en filtres clé-valeur. Par exemple, si un utilisateur saisit “écouteurs ouverts”, nous reconnaissons automatiquement le filtre “Système acoustique : ouvert”, qui n’est généralement pas disponible via une interface à facettes standard, et informons l’utilisateur qu’il peut le désactiver s’il change d’avis. Nous sommes capables de traiter n’importe quel paramètre parmi les milliers disponibles et d’activer les filtres qui, autrement, ne sont pas accessibles aux utilisateurs, lorsque le système en reconnaît le besoin.
Un cas unique mais assez fréquent, c’est lorsque les personnes recherchent une catégorie. Dans ce cas, nous les redirigeons vers la page des catégories, et, ce faisant, vers la page (souvent) organisée manuellement avec le contenu lié au contexte du site e-commerce, tel que les bannières, les promotions, etc. Ils peuvent désormais voir un résultat pertinent ainsi que vos offres en cours !
Notre fonctionnalité, Compréhension des requêtes, est capable de reconnaître les catégories, les marques et les paramètres des produits, ce qui permet aux clients d’obtenir des résultats plus pertinents pour les requêtes courtes. Elle est disponible pour tous nos clients.
Tomáš est le Directeur de la technologie et un des co-fondateurs de Luigi’s Box. Il est titulaire d'un doctorat en ingénierie informatique et logicielle de FIIT STU. Tomáš étudie les technologies de recherche de pointe depuis plus de dix ans et travaille continuellement dans le but de révolutionner le concept de recherche et de navigation afin d'offrir la meilleure expérience client possible pour les utilisateurs de recherche interne.
Plus d'articles de blog de cet auteur