IdFr integre la lemmatisation dans son moteur de recherche IdSearch

    18 mai 2016

    IdFr intègre maintenant la notion de lemmatisation dans son produit moteur de recherche pour vous proposer une richesse et une justesse des résultats toujours plus complète !

    Qu’est-ce que la lemmatisation ? :

    La lemmatisation regroupe les différentes formes que peut revêtir un mot (le nom, le pluriel, le verbe à l’infinitif, …). Chacun des mots d’un contenu se trouve ainsi réduit en une entité appelée lemme (forme canonique). L’objectif de ce procédé est d’analyser les thématiques et de proposer un moteur de recherche non pas de mot, mais de thème (lemme).

    Dans la pratique :

    Lorsqu’un moteur de recherche analyse votre page web, il recherche les mots ayant la même racine et les regroupe afin d’identifier le sujet principal de votre page. Le moteur de recherche fait donc un travail d’identification et d’extraction des mots ayant le même lemme dans un texte donné. Il sera ainsi capable de regrouper toutes ces variantes autour d’un lemme principal. Exemple : voici ce que la lemmatisation pourrait donner pour la lemme « cherche »

    Lemme principal retenuVariantes de mot détecté
    cherchrecherche
    cherchons
    chercheurs
    chercheuses

    Grâce à la lemmatisation, les robots retiendront ici « cherche » comme mot clé principal mais prendront également en compte les autres variantes dans l’évaluation de la densité des mots clés de la page crawlée.La lemmatisation permet donc de saisir de manière plus précise le contenu globale d’une page.    

    loupe

     

    Pour rappel IdSearch, est notre moteur de recherche qui s’adapte à toutes vos demandes. Notre solution intègre les fonctionnalités suivantes :

    • Moteur de recherche Faceting : Pour faciliter les recherches des internautes et aider à affiner leur recherche, nous notre moteur de recherche à facettes, classées par thème et croisables à volonté. Chaque facette (mot clés) affiche systématiquement le nombre de résultats associés. Plus de « Pas de résultats ».
    • Communication digitale : notre moteur n’indexera pas uniquement votre site mais aussi vos pages media facebook, vos vidéos Youtube ou Dailymotion….
    • Sémantique : recherche sémantique par tag cloud (plusieurs tag cloud en fonction de notre métier seront utilisés : commune, thématique du site, arborescence, …). Ainsi, une recherche faisant apparaître 2 mots issus de 2 thésaurus différents sera traitée de manière intelligente. Par exemple, pour un site de tourisme, la recherche « Hôtel lyon » ne va pas afficher toutes les pages contenant ces deux mots clés, mais elle va afficher tous les hôtels à Lyon.
    •  Autocomplétion : après saisi de 2 lettres, l’internaute verra instantanément apparaître les meilleures propositions de pages. L’ordre d’affichage est travaillé pour faire apparaitre avant tous les mots clés des thésaurus en premier.
    • Tri intelligent : Finir l’ordre aléatoire d’affichage, place à l’intelligence. Les résultats sont triés par importance, en fonction d’un algorithme de pertinence de la réponse.
    • Moteur à apprentissage : une phrase d’apprentissage permet au moteur de recherche d’évoluer, en complétant par exemple les thésaurus utilisés. Le contenu de votre site sera également un des piliers de l’évolution du moteur de recherche, qui viendra compléter en permanence son tag cloud.
    • Tag cloud ou nuage de mots clés : un tag cloud des mots clés les plus utilisés sur votre site peut-être affiché, avec l’occurrence de chaque mot. Ces nuages de mots clés peuvent être thématisé en fonction de la page sur laquelle il est affiché.
    • Mots clés les plus utilisés : cette fonctionnalité vous proposera les mots clés les plus utilisés, mais c’est l’administrateur qui pourra les publier et en ajouter. Ainsi, le moteur peut afficher une liste de mots clés les plus utilisés les 30 derniers jours, tout en administrant cette information.
    • Multi CMS : notre moteur de recherche peut se greffer à tous les CMS (Joomla, Drupal, Explid, WordPress…) sur votre site ou sur votre intranet.
    • Indexation de document : Document PDF, Word et même image, notre moteur indexe tous les documents de votre site.

     

    Nous contacter

    form
    First

    logo IDfrEspace Client


    Nous contacter

    First

    Facebook

    logo IDfr