logo BDSP

Centre d'aide


Utilisation du nuage de mots-clés

drogue-tags

A l'issue d'une recherche sur la base documentaire, le système vous propose un nuage de mots-clés.

Ce nuage, établi à partir de statistiques portant sur les résultats  obtenus pour la requête en cours, vous permet d'un simple clic,  d'affiner ou d'élargir votre recherche en l'enrichissant avec des mots-clés issus du thésaurus  BDSP.

Utilisation de base

Chaque mot-clé présent dans le nuage de tags est un lien qui, par défaut, relance une nouvelle recherche de la forme MotsCles=tag.

Si votre navigateur supporte javascript, le fait de cliquer sur ces liens ouvre un "popup" qui vous permet de choisir ce qu'il faut faire de ce mot-clé. Via ce menu, vous pouvez :

  • Lancer une nouvelle recherche sur le mot-clé choisi,
  • Restreindre les réponses à ce mot-clé (cela conserve la requête en cours et la croise en ET avec le mot-clé choisi),
  • Exclure ce mot-clé de la recherche en cours (la requête en cours est relancée avec en plus une clause "SAUF ce mot-clé").

A chaque fois que la requête est relancée, un nouveau nuage de tags est généré. Comme la requête contient de nouveaux critères, les mots-clés suggérés vont être de plus en plus précis. Ce processus itératif "d'affinage" vous permet d'enrichir votre recherche en choisissant à chaque étape les mots-clés les plus pertinents.

En vous proposant des termes et des mots-clés auxquels vous n'auriez pas forcément pensé, le nuage de mots-clés vous permet également de prendre en compte toutes les facettes de votre domaine de recherche, ce qui est bien sûr important dans le cadre d'une stratégie de recherche exhaustive.

Utilisation comme outil de profiling

Une autre utilisation possible du système consiste à s'en servir pour dresser le profil d'une recherche donnée.

Exemples :

Paramétrage

Par défaut, le nuage de mots-clés affiche des mots-clés issus du thésaurus BDSP.

Dans la page de gestion de vos préférences, vous pouvez changer le thésaurus utilisé et choisir de générer des mots-clés issus du thésaurus Pascal de l'Inist-CNRS. Deux choix vous sont proposés : soit les mots-clés Pascal en français, soit les mots-clés Pascal en anglais.

Vous pouvez également choisir de ne jamais afficher le nuage de mots-clés si vous le souhaitez.

Fonctionnement

Une fois que les réponses obtenues ont été affichées, le système exécute une nouvelle recherche pour déterminer les 50 notices les plus pertinentes par rapport à la question posée par l'utilisateur.

Un comptage est alors effectué pour inventorier le nombre d'occurrences de chaque mot-clé BDSP au sein de ces 50 notices.

Certains mots-clés sont cependant ignorés :

  • Les mots-clés présents dans plus de 10% des notices de la base sont ignorés. Ces mots-clés, très souvent utilisés, ne constituent pas de bons "discriminants" permettant d'affiner la recherche. C'est le cas pour des descripteurs comme "France", "Etats-unis", "Homme", "Epidémiologie", etc.
  • Les dates et périodes éventuelles sont également ignorées.
  • Enfin, les mots-clés déjà présents dans la requête de l'utilisateur ne sont bien sûr pas proposés comme suggestions.

La liste obtenue est ensuite affichée sous la forme d'un nuage de tags, en se limitant aux 25 mots-clés les plus fréquents.

Remarque : le nuage de tags n'est pas affiché dans le cas d'une recherche purement booléenne. Pour certaines requêtes (par exemple : "Date:2008", "TypDoc:article", "CodLang:FRE"...) suggérer des mots-clés n'a pas de sens. Le critère que nous avons pris en compte pour savoir s'il faut ou non suggérer des mots-clés repose sur l'examen de votre requête : si celle-ci contient des termes probabilistes (i.e. c'est vraiment une recherche), le système affiche le nuage de tags. Si par contre elle ne contient que des critères booléens (i.e. des filtres) comme dans les exemples donnés ci-dessus, rien n'est affiché.

Limites du système

En général, les mots-clés suggérés sont pertinents et permettent de mettre en avant des descripteurs utiles pour la recherche en cours.

Néanmoins, il y a des cas où cela fonctionne moins bien et il faut garder à l'esprit que le système se contente de "compter" les mots-clés.

En fait, tout dépend de la pertinence des 50 premières notices étudiées. Si par exemple, l'utilisateur lance une recherche sur un sujet qui n'est pas (ou mal) couvert dans la Bdsp, les réponses obtenues ne seront pas pertinentes et les mots-clés suggérés ne le seront pas non plus.

Il y a aussi quelques "faux-amis". Par exemple sur des requêtes de la forme "conduite à risque", le système a tendance à focaliser autour du mot-clé "Conduite automobile" qui n'est qu'un aspect de la question... Cela dit, il propose aussi "Facteur risque", "Prise de risque", "Conduite égard toxique"... mais en moins gros et dans ce cas précis, il peut être utile d'exclure justement le terme "Conduite automobile" de la recherche.