Les bases bibliographiques ou plus précisément les bases de références bibliographiques se créent à partir des années 1960[1].
Dans les années 1960-1970, le terme banque de données est privilégié. Il désigne alors des bases, à l'époque fréquemment de références bibliographiques, relatives « à un domaine défini de connaissances et organisé[ées] pour être offert aux consultations d'utilisateurs »[2],[3]. Ce terme permettait de distinguer ces systèmes documentaires des logiciels eux-mêmes ou systèmes de gestion de base de données (SGBD).
Les bases de données bibliographiques évoluent, en particulier depuis les années 2000, selon deux axes qui peuvent se combiner :
soit en convergeant vers des bases de données non-bibliographiques en particulier des bases contenant des données (scientifiques, économiques…) pour créer des plateformes élaborées[5], comme celle proposée par les Chemical Abstracts Service intégrant des bases de données chimiques ou « Entrez » dans le monde médical.
Caractéristiques
Structure des données
Le terme base de données utilisé ici doit être compris avec précaution. En effet, il s'agit plutôt d'une collection de données ou de notices bibliographiques. Cette structure apparemment simple peut cacher des facteurs de complexité.
La structure des enregistrements peut être relativement élémentaire (simple collection de champs), plus complexe avec des formats MARC (ou conformes à la norme ISO 2709), et maintenant d'une structure quelconque avec XML.
Par rapport aux bases de données relationnelles, un facteur de complexité vient de l'impossibilité de figer la taille des données. Pratiquement tous les champs sont de longueur variable avec des facteurs de répétition pouvant devenir très importants. Par exemple, un nom d'auteur fait en moyenne moins de 10 caractères, mais on trouve des auteurs de plus de 100 caractères. Un article scientifique possède en moyenne 2 ou 3 auteurs mais on peut trouver des articles de physique avec 500 auteurs.
Indexation et référentiels
De nombreuses bases de données bibliographiques contiennent des informations décrivant le contenu à l'aide d'une liste de termes d'indexation ou mots-clés. Ces mots-clés appartiennent souvent à des référentiels terminologiques dont la nature est variable : simple liste de mots contrôlés, plan de classement, thésaurus documentaire ou ontologie.
Outre l'indexation, de nombreuses données peuvent se référer à des référentiels spécialisés, comme les titres de périodique ou les affiliations.
Enfin certaines bases codifient également les références de la bibliographie des articles traités, comme le Science Citation Index, et la base bibliographique devient alors son propre référentiel.
Thématique et couverture
Les bases bibliographiques sont également définies en fonction des thématiques choisies. Elles peuvent influencer considérablement la structure de la base (par exemple, en sciences de la vie la codification des gènes).
Une base se définit également par sa couverture, ou plus précisément la façon dont la base est constituée. Dans bien des cas (Medline, Pascal) la couverture est définie par un ensemble de revues qui sont systématiquement dépouillées.
Exemples
Chemical Abstracts — Articles scientifiques en chimie — Origine américaine, Chemical Abstracts Service (CAS).
Francis — Articles scientifiques en sciences humaines et sociales — Origine française (CNRS, INIST) — résumés en français — indexation bilingue (français, anglais) (la base Francis n'est plus mise à jour).
Medline — Science de la vie et médecine — Origine administration américaine (National Library of Medecine).
Pascal — Science Technique et Médecine — Origine française (CNRS, INIST) — indexation bilingue (français, anglais) (la base Pascal n'est plus mise à jour).
WorldCat — catalogue collectif OPAC (monographies et périodiques) — Origine OCLC (États-Unis) — parfois citée comme la plus grande base bibliographique mondiale.
Urbamet — base de données bibliographiques — origine association Urbamet, France — la principale base de données française sur l'urbanisme, l'aménagement du territoire, les villes, l'habitat et le logement, l'architecture, les équipements collectifs, les transports, les collectivités locales, etc. qui rassemble et diffuse la mémoire de l’aménagement, de l’urbanisme et de l’habitat.
↑Définition donnée dans l'arrêté du , Journal Officiel, , p. 624. Consultable sur France Terme, la base des termes recommandés au Journal officiel de la République française - http://www.culture.fr/franceterme (consulté le ).