Format de la base de données
Liste des champs de la base
Le service base documentaire est géré sous la forme d'une base de données (Bdsp) structurée en 37 champs contenant chacun une information élémentaire.
La plupart des champs sont simples (ils contiennent une valeur unique telle qu'un texte, un nombre ou une date) mais d'autres peuvent être multivalués : on parle alors de champs de type article.
| Nom | Description |
|---|---|
REF | Numéro de référence Il s'agit d'un entier identifiant de façon unique chaque notice bibliographique au sein de la base de données documentaire de la BDSP. Ce numéro est attribué automatiquement par le système lorsqu'une nouvelle notice est créée. |
TypDoc | Type de document principal Le type principal du document est défini par le genre du document (Article, Ouvrage...) et par son support (Papier, Internet...). Exemple :
|
TypdocB | Type de document secondaire Ce champ qualifie le genre initial d'où le document actuel a été dérivé, ou bien constitue une précision par rapport au genre principal indiqué dans TypDoc. |
AutPhys | Auteurs physiques Ce champ contient à la fois les auteurs physiques principaux et secondaires. Sont dits "auteurs secondaires" tous les contributeurs autres que l'auteur principal du document. Cette notion comprend les directeurs de thèse, les illustrateurs, les traducteurs, les préfaciers, etc. La nature de leur contribution à l'élaboration du document doit obligatoirement être précisée à l'aide d'une étiquette de rôle sélectionnée dans une liste d'autorité. L'identification d'un auteur physique comporte les éléments suivants :
Exemples :
|
AutColl | Auteurs collectifs et commanditaires Ce champ contient les collectivités auteurs principales et secondaires ainsi que les organismes commanditaires. Pour les auteurs secondaires, la nature de leur contribution à l'élaboration du document est précisée à l'aide d'une étiquette de rôle sélectionnée dans une liste d'autorité. La dénomination d'un organisme est constituée des éléments suivants :
Exemple :
Le pays de l'organisme est indiqué sous la forme de son code ISO à 3 lettres (norme ISO 3166-1 alpha 3). |
TitOrigA | Titre original du document au niveau analytique Un document est dit de niveau analytique lorsqu'il est extrait d'un ensemble documentaire plus large (article de périodique, communication lors d'un congrès, chapitre d'un ouvrage). |
TitOrigM | Titre original du document au niveau monographique Un document est dit de niveau monographique lorsqu'il constitue une unité en soi et que son support lui est entièrement dédié (un ouvrage, une thèse, un rapport, un numéro spécial de périodique consacré à un seul sujet). |
TitFran | Traduction en français du titre Ce champ contient la traduction en français du titre original du document, soit :
|
TitEng | Traduction en anglais du titre Ce champ contient la traduction en anglais du titre original du document, soit :
|
TitCol | Titre de la collection Ce champ contient le nom de la collection à laquelle appartient le document. Les éléments composant un nom de collection sont les suivants :
Exemple :
|
Diplom | Intitulé du diplôme Ce champ contient la dénomination complète du diplôme et de la discipline tels qu'ils figurent sur le document. Sont concernés : les travaux individuels de recherche sanctionnés par l'obtention d'un diplôme ou donnant lieu à l'attribution d'un titre universitaire ou professionnel : thèses, mémoires académiques ou professionnels. Exemple :
|
TitCong | Titre original du congrès Ce champ contient l'appellation officielle d'une manifestation : congrès, colloque, journée, rencontre, séminaire, etc., lorsque celle-ci est différente du titre des actes indiqué dans le champ TitOrigM. |
TitCongF | Traduction en français du titre du congrès Ce champ contient la traduction en français de l'appellation officielle de la manifestation, c'est-à-dire la traduction en français du contenu du champ TitCong. |
VilCong | Ville du congrès Ce champ contient le nom de la ville où s'est tenu le congrès avec précision de son code pays sur 3 lettres (norme ISO 3166-1 alpha 3). Exemple :
|
DatEdit | Date d'édition Ce champ contient la date d'édition ou la date de diffusion du document. Il peut également contenir la date de tenue d'une manifestation lorsque les actes lui correspondant ne mentionnent pas de date d'édition en propre. Format :
|
DatCong | Date du congrès Ce champ contient la date de tenue de la manifestation, uniquement lorsqu'elle est différente de la date d'édition des actes. Le format utilisé est identique à celui du champ DatEdit. |
TitPerio | Titre du périodique Ce champ contient le titre générique du périodique suivi éventuellement de l'adresse du site Internet de la revue. Exemples :
|
NoVol | Numéro de volume ou tomaison Ce champ contient, sous la forme de chiffres arabes :
|
NoFasc | Numéro de fascicule Ce champ est utilisé pour les publications périodiques et contient le numéro du fascicule sans aucune autre mention. Le numéro de fascicule peut être représenté par un nombre en chiffres arabes, par deux bornes exprimées en chiffres arabes, ou par un identifiant composite alphanumérique. Exemples :
|
NumDiv | Mention d'édition, numéro spéciaux, législation, etc. Pour les périodiques, ce champ sert à préciser si le numéro de la revue est un numéro spécial, un hors-série, un supplément. Pour les monographies, il est est utilisé pour indiquer :
|
PageColl | Pagination et collation Ce champ contient à la fois la pagination et des informations de collation, séparées par des virgules. Les étiquettes de collation sont issues d'une table d'autorité. Elles permettent de faire état de certaines caractéristiques physiques ou conditions d'utilisation : présence de tableaux, graphiques, format, durée, support, technique de restitution associée au support, etc. Pagination des monographies : indiquer le nombre total de pages. Exemples :
Pagination des documents traités au niveau analytique (extraits d'un document plus large) : indiquer les numéros de la première et de la dernière page. Exemples :
Documents non-livre : dénombrer. Exemple :
Exemples d'étiquettes de collation :
|
RefBib | Références bibliographiques Il existe trois formes standards pour renseigner ce champ. Elles permettent de signaler que le document renvoie sur des sources extérieures en donnant une idée quantitative de l'importance de celles-ci. Exemples :
|
Issn | Numéro ISSN L'ISSN (International Standard Serial Number) est un code international normalisé (norme ISO 3297) qui permet d'identifier de façon unique chaque publication périodique, quels que soient le pays d'édition, la langue de publication, l'alphabet utilisé, la périodicité, le support, etc. Syntaxe :
Exemples :
|
Isbn | Numéro ISBN L'ISBN (International Standard Book Number) est un code international normalisé (norme ISO 2108) qui identifie de façon unique chaque édition d'une monographie ou chaque volume de cette monographie (ouvrages en plusieurs tomes), quel qu'en soit le support de publication : imprimé ou multimédia. Depuis le 1er janvier 2007, le numéro ISBN est composé de 13 chiffres, répartis en 5 segments. Exemple :
|
VilEd | Ville d'édition et nom de l'éditeur La dénomination d'un éditeur comporte trois éléments :
Exemples :
Remarque : la mention s.l. (sans lieu) signifie que la ville d'implantation de l'éditeur n'est pas connue. |
CodPays | Pays d'édition du document Ce champ sert à indiquer le pays où est implanté le siège social de l'éditeur. Les pays sont identifiés à l'aide de codes ISO à trois lettres (norme ISO 3166-1 alpha 3 + ajouts). Exemples :
Remarque : les codes INT, EUR et INC ne font pas partie de la norme ISO 3166-1 alpha 3. |
CodLang | Langue(s) du document Ce champ sert à indiquer la (les) langue(s) dans laquelle (lesquelles) l'exemplaire du document est écrit. Les langues sont identifiées par un code ISO à trois lettres (norme ISO 639-2). Exemple :
|
LangResu | Langue du résumé de la notice Ce champ contient le code ISO à trois lettres (norme ISO 639-2) correspondant à la langue du résumé présent dans le champ Resum, quand celui-ci n'est pas en français. |
Resum | Résumé du document La réutilisation d'un résumé fourni par l'auteur, par l'éditeur ou par un tiers doit être impérativement signalée. Exemples :
|
MotsCles | Mots-clés BDSP Ce champ contient tous les mots-clés (mots-matières, mots-outils et noms géographiques) ainsi que les dates et périodes (ex : 2010, 1990-2005) permettant l'indexation du document. Seuls les descripteurs du thésaurus de la BDSP y sont autorisés. |
NouvDesc | Candidats descripteurs Ce champ contient tous les descripteurs ne figurant pas dans le thésaurus BDSP, mais considérés comme nécessaires pour rendre compte correctement du contenu du document. Dans la mesure du possible, leur syntaxe doit se rapprocher le plus possible de la syntaxe du thésaurus (pas de points dans les sigles, pas de mots-vides, préférence donnée à la forme au singulier, etc.). |
CodInist | Code dans le plan de classement INIST-CNRS Il s'agit d'un code appartenant au plan de classement utilisé par l'INIST-CNRS dans la base Pascal (http://refcode.inist.fr/). Exemple :
|
Ident | Sigle du producteur et cote d'accès au document Ce champ contient :
Exemple :
|
Pascal | Mots-clés Pascal français Ce champ contient les équivalences en mots-clés Pascal en français des descripteurs BDSP indiqués dans le champ MotsCles. Le vocabulaire terminologique Pascal a été élaboré par l'INIST-CNRS et peut être consulté sur le portail TermSciences (http://www.termsciences.fr/). Ce champ ne fait pas partie du format de catalogage standard de la BDSP, il est spécifique au site BDSP. |
PasEng | Mots-clés Pascal anglais Ce champ contient les équivalences en mots-clés Pascal en anglais des descripteurs BDSP indiqués dans le champ MotsCles. Le vocabulaire terminologique Pascal a été élaboré par l'INIST-CNRS et peut être consulté sur le portail TermSciences (http://www.termsciences.fr/). Ce champ ne fait pas partie du format de catalogage standard de la BDSP, il est spécifique au site BDSP. |
Creation | Date de création de la notice Ce champ ne fait pas partie du format de catalogage standard de la BDSP, il est spécifique au site BDSP. |
LastUpdate | Date de dernière modification de la notice Ce champ ne fait pas partie du format de catalogage standard de la BDSP, il est spécifique au site BDSP. |
Liste des index
La base Bdsp définit 31 index que vous pouvez utiliser dans vos requêtes en indiquant le nom de l'index suivi du signe deux-points (index:xxxx) ou en utilisant le formulaire de recherche.
Chaque index porte sur un ou plusieurs champs qui peuvent être indexés de différentes manières :
- au mot : vous pouvez lancer des recherches de la forme
index:mot; - à la phrase : vous pouvez rechercher des expressions entre guillemets doubles avec des requêtes de la forme
index:"plusieurs mots"; - à l'article (uniquement pour les champs de type article) : vous pouvez lancer une recherche sur la valeur exacte qui figure dans l'index avec une requête de la forme
index:[valeur recherchée].
Le poids affecté à chacun des champs composant un index permet de définir "l'importance" d'un champ par rapport aux autres. C'est l'un des critères pris en compte par l'algorithme de calcul de pertinence utilisé par le moteur de recherche pour afficher en premier les documents qui répondent le mieux à la requête. Par défaut, tous les champs d'index ont un poids de 1. Le fait de donner un poids plus important à un champ permet d'augmenter son importance.
| Nom | Description | Champs : type (x poids) |
|---|---|---|
REF | Numéro de référence |
REF : mots. |
TypDoc | Type de document principal |
TypDoc : mots, phrases, articles (x 5). |
TypDocB | Type de document secondaire |
TypDocB : mots, phrases. |
AutPhys | Auteurs physiques Cet index ignore l'étiquette de rôle et l'affiliation éventuellement associées à l'auteur physique. |
AutPhys : mots, phrases, articles (x 5). |
AutColl | Auteurs collectifs et commanditaires Cet index ignore l'étiquette de rôle éventuellement associée à l'organisme. |
AutColl : mots, phrases, articles (x 5). |
TitOrig | Titre original du document | TitOrigA : mots, phrases (x 5). TitOrigM : mots, phrases (x 5). |
TitFran | Traduction en français du titre |
TitFran : mots, phrases (x 3). |
TitEng | Traduction en anglais du titre |
TitEng : mots, phrases (x 3). |
TitCol | Titre de la collection |
TitCol : mots, phrases. |
Diplom | Intitulé du diplôme |
Diplom : mots, phrases. |
TitCong | Titre original du congrès |
TitCong : mots, phrases. |
TitCongF | Traduction en français du titre du congrès |
TitCongF : mots, phrases. |
DatEdit | Date d'édition |
DatEdit : mots, phrases (x 5). |
DatCong | Date du congrès |
DatCong : mots, phrases (x 5). |
TitPerio | Titre du périodique |
TitPerio : mots, phrases, articles. |
NoVol | Numéro de volume ou tomaison |
NoVol : mots. |
NoFasc | Numéro de fascicule |
NoFasc : mots. |
Issn | Numéro ISSN |
Issn : mots, phrases, articles. |
Isbn | Numéro ISBN |
Isbn : mots, phrases. |
VilEd | Ville d'édition et nom de l'éditeur |
VilEd : mots, phrases. |
CodPays | Pays d'édition du document |
CodPays : mots. |
CodLang | Langue(s) du document |
CodLang : mots. |
Resum | Résumé du document |
Resum : mots, phrases, dénombrement. |
MotsCles | Mots-clés BDSP |
MotsCles : mots, phrases, articles, dénombrement (x 5). |
NouvDesc | Candidats descripteurs |
NouvDesc : mots, phrases, articles (x 5). |
Pascal | Mots-clés Pascal français |
Pascal : mots, phrases, articles. |
PasEng | Mots-clés Pascal anglais |
PasEng : mots, phrases, articles. |
Ident | Sigle du producteur Cet index permet de rechercher toutes les notices fournies par un producteur donné. |
Ident : mots, phrases, articles. |
Cote | Cote du document au sein de la collection du producteur Permet de rechercher un document dont vous connaissez la cote. Exemple : Ident=Ehesp ET Cote="OA10/1234" |
Ident : mots, phrases. |
Creation | Date de création de la notice |
Creation : mots. |
LastUpdate | Date de dernière modification de la notice |
LastUpdate : mots. |
Liste des alias et des index de regroupements
Les alias permettent de définir un nouveau nom (un synonyme) pour un index existant et de regrouper sous un nom unique des index différents.
Ils permettent d'exécuter facilement une requête portant sur plusieurs index à la fois.
L'exécution d'une requête portant sur un alias est interprétée comme la combinaison en OU des requêtes portant sur les index composant l'alias. Par exemple : si l'alias a=b+c+d est défini, la requête a=test est exécutée de la même manière que la requête b=test OR c=test OR d=test.
Parmi tous les alias, il existe un alias particulier nommé (default) qui spécifie les index qui seront utilisés lorsqu'un terme est recherché et qu'aucun nom d'index n'a été indiqué.
| Nom | Description |
|---|---|
| (default) | Index global utilisé lorsqu'aucun nom d'index n'est indiqué dans la requête Synonyme de : AutPhys + AutColl + TitOrig + TitFran + TitEng + TitCong + TitCongF + DatEdit + DatCong + Resum + MotsCles + NouvDesc |
| Aut | Auteur physique Compatibilité ascendante : cet alias existait dans l'ancienne version du site (Bdsp2001). Utiliser de préférence l'index AutPhys. Synonyme de : AutPhys |
| AutPhysColl | Auteurs physiques et collectifs Cet alias regroupe sous un nom unique les champs auteurs présents dans la notice bibliographique. |
| Auteur | Auteur (personne ou organisme) et éditeur |
| Date | Date du document ou du congrès |
| Lang | Langue du document Compatibilité ascendante : cet alias existait dans l'ancienne version du site (Bdsp2001). Utiliser de préférence l'alias Langue. Synonyme de : CodLang |
| Langue | Langue du document Synonyme de : CodLang |
| Mcl | Motsclés ou candidats descripteurs Cet alias regroupe sous un nom unique tous les champs mots-clés présents dans la notice bibliographique. |
| Mot | Mots des titres et du résumé Synonyme de : TitOrig + TitFran + TitEng + TitCong + TitCongF + TitCol + Resum |
| Pays | Pays d'édition du document Synonyme de : CodPays |
| TitDoc | Titres du document Compatibilité ascendante : cet alias existait dans l'ancienne version du site (Bdsp2001). Utiliser de préférence l'alias Titre. Synonyme de : TitOrig + TitFran + TitEng + TitCong + TitCongF + TitCol |
| Titre | Titre du document Cet alias regroupe sous un nom unique tous les champs titres présents dans la notice bibliographique. Synonyme de : TitOrig + TitFran + TitEng + TitCong + TitCongF |
| Type | Type de document principal et secondaire Compatibilité ascendante : cet alias existait dans l'ancienne version du site (Bdsp2001). Utiliser de préférence les index TypDoc ou TypDocB. |
Mots-vides
Certains mots sont tellement communs qu'ils sont considérés comme "vides de sens" et sont automatiquement supprimés des requêtes : on parle alors de mots-vides (ou stopwords en anglais).
Dans le service base documentaire, les mots-vides sont par défaut supprimés des requêtes exécutées : si vous lancez la requête un test, le système exécute en fait la requête test et vous signale que le mot-vide un a été ignoré.
Il existe néanmoins des exceptions. Les mots-vides ne sont pas supprimés des requêtes si :
- votre recherche contient uniquement des mots-vides
- les mots-vides sont présents dans une expression entre guillemets doubles (par exemple
"un test") - les mots-vides sont précédés du signe
+(par exemple+un test)
Voici la liste des termes que la base Bdsp traite comme des mots-vides :
a able abord about above according accordingly across actually afin after afterwards again against ah ai aie ainsi all allaient allo allons allow allows almost alone along already also although always am among amongst an and another any anybody anyhow anyone anything anyway anyways anywhere apart appear appreciate appropriate apres are aren around as aside ask asking assez at attendu au aucun aucune aujourd auquel aura auront aussi autre autres aux auxquelles auxquels avaient available avais avait avant avec avoir away awfully ayant b bah be beaucoup became because become becomes becoming been before beforehand behind being believe below beside besides best better between beyond bien bigre both boum bravo brief brrr by c ca came cannot cant car ce ceci cela celle celles celui cent cependant certain certaine certaines certainly certains certes ces cet cette ceux chacun changes chaque cher chere cheres chers chez chiche chut ci cinq cinquantaine cinquante cinquantieme clac clearly clic co com combien come comes comme comment compris concernant concerning consequently consider considering contain containing contains contre corresponding couic could couldn crac currently d dans de debout dedans definitely dehors dela depuis derriere des described desormais despite desquelles desquels dessous dessus deux deuxiemement devant devers devra did didn different differente differentes differents dire divers diverse diverses dix do does doesn doing doit doivent don donc done dont douze down downwards dring du duquel durant during e each effet eg eh eight either elle elles else elsewhere en encore enough entirely entre envers environ es especially est et etaient etais etait etant etc etre eu euh eux even ever every everybody everyone everything everywhere exactly example except excepte f facon fais faisaient faisant fait far feront few fi five flac floc followed following follows font for former formerly forth four from further furthermore g gens get gets getting given gives go goes going gone got gotten greetings h ha had hadn happens hardly has hasn have haven having he hein helas hello help hem hence hep her here hereafter hereby herein hereupon hers herself hi him himself his hither ho hola hop hopefully hormis hors hou houp how howbeit however hue hui huit hum hurrah i ie if ignored il ils immediate importe inasmuch inc indeed indicate indicated indicates insofar instead into inward is isn it its itself j je jusqu jusque just k keep keeps kept know known knows l la laquelle las lately later latter latterly le least lequel les lesquelles lesquels less lest let leur leurs like liked likely little ll longtemps look looking looks lorsque ltd lui m ma mainly maint mais malgre many may maybe me mean meanwhile meme memes merci merely mes mien mienne miennes miens might mille mince moi moins mon more moreover most mostly moyennant much must my myself n na name namely nd ne neanmoins near nearly necessary need needs neither neuf never nevertheless new next ni nine no nobody nombreuses nombreux non none noone nor normally nos not nothing notre notres nous novel now nowhere nul o obviously of off often oh ohe ok okay old ole olle on once one ones only ont onto onze or ore other others otherwise ou ouf ought ouias our ours ourselves oust ouste out outre outside over overall own p paf pan par parmi partant particular particularly particulier particuliere particulierement pas passe pendant per perhaps peu peut peuvent peux pff pfft pfut pif placed please plein plouf plus plusieurs plutot possible pouah pour pourquoi premierement pres presumably probably proche provides psitt puisque q qu quand quant quanta quarante quatorze quatre quatriemement que quel quelconque quelle quelles quelqu quelque quelques quels qui quiconque quinze quite quoi quoique qv r rather rd re really reasonably regarding regardless regards relatively respectively revoici revoila rien right s sa sacrebleu said same sans sapristi sauf saw say saying says se secondly see seeing seem seemed seeming seems seen seize selon selves sensible sent sept sera serious seriously seront ses seven several shall she should shouldn si sien sienne siennes siens since sinon six so soit soixante some somebody somehow someone something sometime sometimes somewhat somewhere son sont soon sorry sous specified specify specifying still stop sub such suis suivant sup sur sure surtout t ta tac take taken tant te tel tell telle tellement telles tels tenant tends tes th than thank thanks thanx that thats the their theirs them themselves then thence there thereafter thereby therefore therein theres thereupon these they this thorough thoroughly those though three through throughout thru thus tic tien tienne tiennes tiens to toc together toi ton too took touchant toujours tous tout toute toutes toward towards treize trente tres tried tries trois troisiemement trop truly try trying tsoin tsouin tu twice two u un under une unes unfortunately unless unlikely uns until unto up upon us used useful uses using usually v va vais value various vas ve vers very via vif vifs vingt vivat vive vives viz vlan voici voila vont vos votre votres vous vs vu w want wants was wasn way we welcome well went were weren what whatever when whence whenever where whereafter whereas whereby wherein whereupon wherever whether which while whither whoever whole whom whose why will willing wish with within without won wonder would wouldn x y yes yet you your yours yourself yourselves z zero zut.
Tables de lookup
Les tables de lookup (tables de consultation des index) permettent de disposer d'une assistance à la recherche et/ou à la saisie en listant les valeurs qui existent déjà dans la base de données et en indiquant pour chacune de ces entrées le nombre total d'occurences.
Tous les index de base et tous les alias peuvent être utilisés comme tables de lookup. Dans ce cas, la consultation porte sur les termes élémentaires stockés dans les index (i.e. les mots élémentaires en minuscules et sans accents).
Des tables de lookup supplémentaires peuvent être créées pour permettre la consultation des entrées dans leur forme originale (minuscules et majuscules, accents, ponctuation).
Il existe alors deux types de tables de lookup :
- simple : il s'agit de tables optimisées qui permettent de consulter toutes les entrées qui commencent par une chaine donnée ;
- inversée : il s'agit de tables plus conséquentes, organisées sous la forme d'un index inversé et qui permettent de consulter toutes les entrées qui contiennent une chaine donnée.
Dans base Bdsp, les tables de lookup supplémentaires suivantes sont disponibles :
| Nom | Description |
|---|---|
| AutColl | Liste des noms d'organismes référencés dans la base Type : simple Champ(s) : AutColl |
| TitPerio | Liste des titres de périodiques référencés dans la base Type : simple Champ(s) : TitPerio |
| TitCol | Liste des collections référencées Type : simple Champ(s) : TitCol |
| Diplom | Liste des intitulés de diplômes Type : simple Champ(s) : Diplom |
| Cote | Cote du document au sein de la collection du producteur Type : simple Champ(s) : Ident |