Catalogage, indexation, recherche Flashcards
Grands types de banques de données
- bibliographiques
- textuelles
- numériques
- d’images
Métamoteur
logiciel qui interroge simultanément plusieurs moteurs de recherche
Condensation
opération consistant à extraire l’info utile d’un document puis à la mettre en forme pour produire un résumé
Types d’images
- scientifique (macro ou micro, devient lisible par sa légende)
- événementielle (la légende donne une partie de la signification)
- anecdotique (sa lecture se suffit à elle-même)
Niveaux de description des images
- catalographique (infos qui servent au classement)
- morphologique (description technique)
- sémantique (description du contenu)
Relations sémantiques dans un thésaurus
- équivalence (EP indique synonyme non retenu)
- hiérarchie (TG et TS)
- association (TA indique termes qui devraient être compris ensemble)
Folksonomie / indexation personnelle
système de classification collaborative décentralisée spontanée basé sur une indexation effectuée par des non-spécialistes
Les 4 phénomènes documentaires majeurs en France pendant les Trente Glorieuses (1946-1975)
- explosion de la production documentaire
- début utilisation des outils informatiques
- prise de conscience de l’importance cruciale de l’info dans la société
- structuration des systèmes d’org documentaire dans les entreprises
Hypercard
- logiciel développé par Bill Atkinson pour Apple en 1987
- fonctionne par piles de cartes composées d’un fond et de calques utilisant des outils graphiques (formes géométriques…)
- créé de l’hypertexte entre des cartes d’une même pile
PageRank
- algorithme à la base du moteur de recherche de Google
- classe pages web en fonction du nb de liens entrants: plus il y a de pages qui pointent vers un doc, plus ce doc sera considéré comme important
Google Scholar
moteur de recherche d’articles et publications scientifiques
Opérateurs booléens
ET, OU, SAUF
Document
contenu intellectuel + le support sur lequel il est sauvegardé
Supports de documents utilisés aujourd’hui
- papier
- optique
- électronique
Dictionnaire thématique
fournit concepts et intros générales sur un thème donné
Encylopédie de référence sur Internet
Encyclopaedia Universalis
Portail de référence pour les textes législatifs et réglementaires
Légifrance
Opérateurs de proximité
- terme 1 NEAR terme 2 -> les 2 termes sont dans la même zone de texte
- terme 1 ADJ terme 2 -> les 2 termes se suivent immédiatement
Langage contrôlé / documentaire
utilisation de termes extraits d’une liste d’autorité ou d’un thésaurus
Les 3 grands types de langage contrôlé
- classification
- liste d’autorité/de vedettes-matières
- thésaurus
Partie de vedette matière qui exprime l’essentiel du sujet
Tête de vedette
Partie de vedette matière qui apporte des précisions à la tête de vedette
Sous-vedette
Thésaurus
liste hiérarchisée de termes normalisés (les descripteurs)
2 types de caractéristiques essentiels d’un doc
- physiques (nature, support)
- intellectuelles (mode de publication, source)
Les types de flux documentaires
- entrants
- circulants
- sortants
RAMEAU
- Répertoire d’Autorité-Matière Encyclopédique et Alphabétique Unifié
- vocabulaire de termes faisant autorité + ensemble de règles qui régissent l’utilisation de ces autorités
- géré par la BnF
- d’usage obligatoire pour les biblis participant au Sudoc
Les 5 zones de l’ISBN
préfixe (978 pour les livres) - groupe national/linguistique - éditeur - titre - clé de contrôle
Flux documentaires internes
- verticaux (validation hiérarchique)
- horizontaux (partage d’infos)
Web invisible
partie du web non identifiée ni indexée par les robots des moteurs de recherche
Moteur de recherche sémantique
est capable d’analyser le sens d’une requête formulée en langage naturel
Critères de pertinence des mots-clés pour les moteurs de recherche
- nombre d’occurrences dans une page
- présence aux endroits clés (titres…)
- mise en exergue (gras…)
Clustering
méthode d’analyse statistique qui permet entre autres aux moteurs de recherche de proposer des termes associés aux mots-clés tapés
SAE (système d’archivage électronique)
a pour vocation d’assurer la conservation d’un doc numérique sur le long terme tout en empêchant les modifications ultérieures
Check-in
entrée d’un doc dans un système d’information
Check-out
sortie temporaire d’un doc d’un système d’information, permet à une seule personne à la fois de travailler dessus pour éviter les conflits de version
Workflow (flux de travaux)
représentation d’une suite de tâches ou opérations effectuées par une personne, un groupe…