Terminologie documentaire

Report
Daniel CERDA - 2006
1
SCIENCES DE L’INFORMATION
TERMINOLOGIE DE BASE
Avant -propos
Cette animation s’appuie sur une fiche établie par le Ministère de la
Culture - Direction des musées de France - Bureau de l’informatique et
de la recherche Base JOCONDE - Septembre 2004. Il m’a semblé
judicieux d’y ajouter quelques précisions et termes pertinents.
Les définitions sont reprisent sous leur forme simple, parfois
retouchée, puis éventuellement développées de manière à pouvoir,
sommairement mais sans impasse, rappeler l’essentiel : les
fondamentaux ! En effet, il n’est pas ou plus possible de se contenter
de définitions pas toujours très claires ni explicites, imprécises voire
inexactes alors que les sciences de l’information relèvent, de fait,
d’une science universelle.
Si on clique sur chaque terme de ce lexique apparaissant dans
chaque diapositive, un lien hypertexte renvoie à la fiche qui le définit.
Daniel CERDA - 2006
2
LISTE EXHAUSTIVE
Pour accéder directement à une définition
- Base de données
- Bibliothèque
- Bruit
- Centre de documentation
- Champ
- Descripteur
Descripteur associé
Descripteur générique
Descripteur spécifique
- Fonds
- Hiérarchie
- Langage naturel
dessus
- Mot-clé
- Non descripteur
- Occurence
- Opérateur(s) booléen(s)
- Silence
- Synonymie
- Terme
- Thésaurus
- Troncature
- Vocabulaire contrôlé
- Vocabulaire libre
3
- BASE DE DONNEES Une base de données est un ensemble de données (informations sous
forme électronique) relatif à un domaine défini de connaissances et
organisé pour être disponibles aux consultations d’utilisateurs.
4
- BASE DE DONNEES Une base de données, généralement appelée BD (en anglais DB pour
database) est un ensemble structuré et organisé permettant le
stockage de grandes quantités d’informations afin d’en faciliter
l’exploitation (ajout, mise à jour, recherche de données).
Une base de données se traduit physiquement par un ensemble de fichiers sur une
unité de stockage en évitant les redondances.
Les données doivent pouvoir être utilisées, à l’aide de programmes,
par des utilisateurs différents.
La notion de base de données est généralement couplée à celle de réseau, afin de
pouvoir mettre en commun des informations, d’où le nom de base.
On parle tout aussi généralement de système d’information pour
désigner toute la structure regroupant les moyens mis en place pour
pouvoir partager les données.
5
- BIBLIOTHEQUE Organisme chargé de constituer des collections organisées de
documents, de les accroître, de les traiter, d’en faciliter l’utilisation
par les usagers.
Source AFNOR
Nota : le bibliothécaire a une mission de conservation et d’enrichissement
d’un fonds à vocation soit encyclopédique, soit spécialisée.
6
- BRUIT (BRUIT DOCUMENTAIRE) Réponse à une recherche documentaire mais non pertinente,
inappropriée, insatisfaisante ou creuse (sans contenu valable).
7
- CENTRE DE DOCUMENTATION Organisme ou service chargé de rassembler, organiser, conserver,
mettre à la disposition d’utilisateurs les outils de recherche et les
documents apportant une réponse à leur demande d’information.
Source AFNOR
Nota : le documentaliste a une mission de service aux utilisateurs et de
diffusion rapide de l’information.
8
- CHAMP Ensemble de données de l’item d’une base ; rubrique contenant des
informations de même nature (titre, auteur, date, etc.)
9
- DESCRIPTEUR Mot ou groupe de mots choisi pour caractériser les informations
contenues dans un document et pour faciliter les recherches
documentaires.
Les descripteurs font, en général, partie d’une liste de vocabulaire
contrôlé, organisé et limité appelé thésaurus.
10
- DESCRIPTEUR ASSOCIE Pour ouvrir d’autres pistes de recherche, certains descripteurs d’un
thésaurus sont associés au descripteur considéré en raison de leur sens
proche (ex : nautisme, associé à eau).
Il est également justifié d’associer des descripteurs qui désignent des
concepts similaires mais non équivalents, des concepts complémentaires
ou encore des concepts contraires (ex : sécheresse, associé à eau).
11
- DESCRIPTEUR GENERIQUE Descripteur désignant une notion englobant d’autres notions plus fines
représentées par des termes spécifiques (ex : bois, générique de bois
fruitier, bois exotique, etc.).
12
- DESCRIPTEUR SPECIFIQUE Descripteur désignant une notion plus large représentée par un terme
générique (ex : chêne, spécifique de bois).
13
- FONDS ( Fonds d’archives) Ensemble des documents de toute nature qu’une personne physique
ou morale a automatiquement et organiquement réunis dans
l’exercice de ses activités et conservés en vue d’une utilisation
éventuelle.
Source AFNOR
Nota : l’archiviste a une mission de conservation exhaustive, sans
sélection ni élimination des documents. La communication des des
documents est soumise à condition
14
- HIERARCHIE Dans un thésaurus, une hiérarchie est un système
montrant les relations entre les termes, de
concepts généraux et vastes aux catégories plus
précises. Une relation hiérarchique existe entre un
descripteur spécifique et un descripteur générique.
15
- LANGAGE NATUREL Il est plus riche que le vocabulaire contrôlé mais peut être implicite,
redondant et ambigu. Dans une base de données, une interrogation en
langage naturel peut offrir la possibilité au chercheur de ne pas avoir
à construire une requête en manipulant les opérateurs booléens ni à
choisir les bons descripteurs.
Une recherche en langage naturel est fréquemment génératrice de
bruit documentaire.
16
- MOT-CLE Désigne un mot ou groupe de mots choisi librement
dans le titre ou dans le corps d’un texte (ou d’un
document), permettant d’en caractériser le contenu
et d’en faciliter la classification et la recherche. Le
mot-clé peut aussi éventuellement faire partie d’une
liste fermée de mots (dits descripteurs) utilisée à des
fins de description et de recherche de documents (on
parle de vocabulaire contrôlé).
Les mots-clé ne sont pas hiérarchisés (par contre, les
descripteurs le sont).
17
- NON-DESCRIPTEUR Terme rejeté au sein d’un thésaurus. Il peut
s’agir de synonymes, d’abréviations ou de
variantes orthographiques du concept retenu
comme descripteur (ex : descripteur : cachot,
utiliser : prison).
18
- OCCURRENCE Nombre de fois où un mot ou une expression apparaît
dans un texte. Le nombre d’occurrences permet d’évaluer
la fréquence d’apparition des descripteurs recherchés,
dans une base de données par exemple.
19
- OPERATEUR(S) BOOLEEN(S) L’adjectif « booléen » vient du nom du mathématicien George Boole.
Ces opérateurs sont basés sur la théorie des ensembles.
Dans une base de données, les opérateurs booléens :
- ET = intersection
- OU = union
- SAUF = exclusion
permettent de faire une recherche avec un ou plusieurs mots en
limitant ou en croisant un ou plusieurs champs.
20
- OPERATEUR(S) BOOLEEN(S) - ET L’opérateur ET implique que chaque terme de la recherche est
contenu dans chaque document répondant à la requête .
ET = UNION
21
- OPERATEUR(S) BOOLEEN(S) - OU L’opérateur OU implique que l’un ou l’autre des termes de la
recherche sont contenus dans chaque document répondant à la
requête.
OU = UNION
22
- OPERATEUR(S) BOOLEEN(S) - SAUF L’opérateur SAUF implique que le terme suivant « SAUF » ne figure
pas dans chaque document répondant à la requête.
SAUF = EXCLUSION
23
- SILENCE Dans une recherche documentaire, il y a silence lorsque les
documents pertinents et existants dans la base de données ne sont pas
sélectionnés à la suite de l’interrogation.
24
- SYNONYMIE Deux termes dont le sens est proche sont des synonymes même si
chacun exprime une variante de sens. Par exemple, les mots
complexe, compliqué et difficile sont des synonymes même s’ils n’ont
pas tout à fait le même sens.
Dans un vocabulaire contrôlé, une relation de synonymie permet
d’obtenir le même nombre de réponses que l’on interroge avec le
descripteur ou avec l’un de ses synonymes (ex : Roma, synonyme de
Rome; 28 et Eure et Loir, synonymes d’Eure-et-Loir, etc.)
25
- TERME Désigne un mot ou groupe de mots qui ne s’applique qu’à un seul
objet ou concept, et ce, dans un domaine donné. Autrement dit, il
s’agit d’un mot qui désigne de façon univoque un objet ou un concept
dans un domaine qui, généralement, est un domaine de spécialité.
De fait, dans l’idéal terminologique, un terme n’a pas d’équivalent
(ou synonyme) dans le domaine désigné. Un terme formé d’un seul
mot (par exemple : avion) est dit terme simple ou uniterme, alors que
celui constitué de plusieurs mots est appelé terme complexe ou multiterme (par exemple : avion à réaction), bien que le mot terme soit
couramment employé dans les deux cas. On parle également d’unité
terminologique.
26
- THESAURUS Le thésaurus est un outil de contrôle du vocabulaire dont l’utilisation
doit rendre la recherche documentaire plus efficace. Un thésaurus est
une liste de termes organisée se rapportant à un ou plusieurs
domaines de la connaissance. Les termes inscrits dans un thésaurus
sont des descripteurs. La plupart des bases de données ont leur
thésaurus dans lequel on choisit les descripteurs décrivant les
documents cités dans la base.
Un thésaurus indique les termes utilisés pour décrire sans ambiguïté
le contenu des documents au détriment d’autres termes, non retenus.
Le vocabulaire sur un thème précis est donc regroupé, limité, classé
et régi par des relations hiérarchiques, d’équivalence ou de parenté
entre les termes (descripteurs générique, descripteur spécifique,
descripteur associé). Les modalités d’emploi des descripteurs peuvent
être brièvement expliqués dans des notes d’application (ou note
27
d’usage).
- TRONCATURE La troncature est un signe « joker » qui remplace une ou plusieurs
lettres d’un mot. Elle permet de rechercher des termes qui ont une
racine identique en substituant un ou plusieurs caractères par un
symbole. Ce symbole est généralement un astérisque.
Nota : astérique
*
28
- VOCABULAIRE CONTRÔLE Un vocabulaire contrôlé est une liste de vocabulaire qui n’a pas
l’ambiguïté du langage naturel.
Dans une base de données, le vocabulaire contrôlé garantit qu’un
sujet sera décrit avec les mêmes termes préférentiels. Durant une
recherche, on peut ainsi trouver plus facilement tous les
renseignements relatifs à un sujet précis. Lorsque cette liste de
vocabulaire est organisée et régie par des relations sémantiques, on
parle de thésaurus.
29
- VOCABULAIRE LIBRE Désigne un ensemble de mots (dits mots-clé) choisis librement pour
rechercher un document (ou partie de document) dans une banque
de données, ou choisis librement dans le titre ou dans le corps de
texte (ou d’un document) pour en caractériser le contenu à des fins
de classification et de recherche en cas de besoin.
On parle aussi de langage naturel.
30
31

similar documents