TF.IDF (term frequency – inverse document frequency) est une mesure statistique permettant d’indiquer l’importance d’un mot ou d’une phrase relativement à un document au sein d’une collection de documents.
Le score est proportionnel au nombre d’occurrences du mot dans le document, compensé par la fréquence du mot dans la collection de documents.
Il se calcule en multipliant la “fréquence du terme” (term frequency) du mot apparaissant dans le document et la “fréquence inverse du document” (inverse document frequency) du mot dans l’ensemble des documents.
Il est conçu pour mesurer la pertinence d’un terme pour un document particulier par rapport aux autres documents dans l’ensemble.
Dans les recherches centrées sur les personnes, comme les offres d’emploi, TF.IDF permet d’identifier les mots associés à certains postes ou rôles, afin que les employeurs puissent comparer correctement les CV avec les compétences requises pour le poste.
(Voir également BM25)
Pages et articles associés
Si vous cherchez du contenu similaire, essayez ces suggestions pour en découvrir plus sur le monde du commerce électronique et sur Luigi’s Box.
Fréquence des termes
La fréquence des termes mesure la fréquence d'apparition d'un terme dans un document et joue un rôle dans la pertinence de la recherche et les algorithmes.
Résultats de recherche
Les résultats de recherche sont les pages, documents ou données qui aident les utilisateurs à trouver des informations pertinentes suite à une requête.
Longue traîne
La longue traîne fait référence à des requêtes de recherche de niche moins populaires ou à des éléments ayant une pertinence et un impact importants.
Taxonomie
La taxonomie organise les objets dans une structure de type arborescence, ce qui simplifie la récupération et le tri pour un accès sans effort.
Glossaire de recherche
Explorez notre guide complet sur la découverte de produits, avec définitions, explications et exemples. Boostez vos connaissances et performances.
Indexation linguistique
L'indexation linguistique est la classification d'ensembles de mots dans des classes grammaticales, telles que les noms, les adjectifs ou les verbes.
Thésaurus
Le thésaurus référence les mots de fçon croisée, relie les taxonomies et facilite la recherche de documents grâce à la méta-classification.
Métadonnée
Les métadonnées complètent et clarifient le contenu des documents, en améliorant la recherche et l'extraction pour une meilleure expérience utilisateur.