Base de Données

Categories: Termes et expressions

Dans le langage commun, une base de données est une collection de Données de natures différentes (textes, graphiques, photographies, archives sonores, etc.) dont l’organisation est structurée de telle façon que l’accès et la mise à jour des données sont facilités. Le plus souvent, la gestion d’une base de données requiert une Infrastructure Informatique.

En Informatique, l’expression base de données désigne un Système d’Information qui recouvre à la fois l’ensemble des données enregistrées selon un modèle préétabli (le contenu structuré) et son Système de Gestion de la Base de Données.
Le SGBD est l’ensemble des composants logiciels nécessaires à l’administration du stockage physique des données — leur contenant — et la manipulation du contenu pour en tirer des Informations.

Un SGBD est un Logiciel dédié à la gestion des bases de données qui contient deux composants logiciels principaux :

Le DDL (abréviation de l’anglais « Data Description Language», le Langage de description des données) ;
Le DML (abréviation de l’anglais « Data Manipulation Language», le langage de manipulation des données aussi appelé langage de requête)

Il propose aussi des d’outils de service dont certains permettront entre autres de :

Sécuriser les données (sauvegarde ; restauration ; protection des autorisations d’accès au contenu limité par des vues logiques restreintes) ;
Optimiser les performances du système (par la gestion d’index ; par la partition des fichiers ; par le stockage de vues intermédiaires ; etc.) ;
Organiser la permanence du service (gestion des conflits d’accès ; gestion de la journalisation pour rétroactions sur les modifications ; gestion de stockages redondants ; etc.) ;
Analyser l’intégrité et la performance du Modèle de données ; rétablir les incohérences ; gérer les évolutions de ce modèle.

De la préhistoire mécanographique au concept de base de données :

Les toutes premières applications de l’informatique en entreprise analysaient des données stockées sur cartes perforées. Leur lecture séquentielle permettait une recherche et un traitement 100 fois plus rapide que les techniques manuelles.
Le stockage sur bandes magnétiques améliora le procédé à la fois en limitant les manipulations humaines fastidieuses et leurs inévitables erreurs (notamment dans les étapes de tri) et en accélérant la lecture séquentielle des enregistrements. La survie de la mécanographie ne dépendait plus que de son utilisation pour la saisie initiale des données.
Outre une accélération de la lecture séquentielle et de la capacité de stockage, les disques magnétiques ont permis l’accès indexé : en maitrisant le positionnement du bras de lecture directement sur le secteur du n^ièmeenregistrement, il n’était plus nécessaire de lire les n-1 enregistrements précédents pour y accéder. Une table d’index associait une clé logique à une adresse physique. Exemple : le détail du produit CHA0123-BZ commence à l’enregistrement no. 6133.
L’accès indexé s’enrichissait très vite du mode d’accès séquentiel indexé. Exemple : après lecture de l’enregistrement no. 6133, entête du produit CHA0123-BZ, lire en séquence les enregistrements suivants qui en donnent le détail.
Les bandes magnétiques ne servaient plus désormais qu’au stockage à meilleur coût des données traitées sur disque.
Au début des années 1970, l’arrivée des postes de saisies programmables conjointement au développement des premières applications transactionnelles à partir de postes passifs signa la fin des pools de saisie et de la mécanographie. Rappelons-nous les écrans noirs aux caractères d’un vert électrique qui fonctionnaient de façon asynchrone ou encore le Minitel français qui les suivait de près.
En moins de 15ans, l’avènement de la micro-informatique confirma la distribution de la plus grande partie des tâches de saisie dactylographique sur l’ensemble des employés administratifs.
Vers la fin des années1970, le Britannique Edgar Frank T’Codd proposait un modèle mathématique pour une structuration rigoureuse et efficace des données s’appuyant sur les Formes Normales. Ses travaux ont ouvert la voie aux bases de données relationnelles, modèle que met en oeuvre la très grande majorité des SGBD (devenus SGBDR) commercialisés en 2018.

L’histoire des bases de données :

Le schéma logique d’une base de données modélise les liens fonctionnels qui permettent la navigation entre les données physiques et la reconstitution d’entités logiques. L’histoire des bases de données a suivi l’évolution de la Modélisation de leur structure organisationnelle : du modèle hiérarchique, en passant par le modèle en réseaux, vers les modèles relationnel et NoSQL .

Les modèles hiérarchiques répandus à la fin des années 1970 sont les héritiers des techniques de structuration des données optimisant le stockage séquentiel enrichi par le mode indexé et le mode séquentiel indexé. Les données élémentaires sont rattachées à un des nœuds de l’arbre qui structure le modèle.
Leur inconvénient est la redondance d’information qu’il entraine :
Imaginons un constructeur automobile qui structure son catalogue par type de véhicule (citadine, berline, utilitaire, SUV, cabriolet, camping-car, etc.), pour chaque type, par offre (particulier ; véhicule de société ; etc.). Une voiture Berline de son offre est proposée à quelques détails près, aux particuliers et aux clients sociétés. Une mise à jour de ce détail commun devra être exécutée à deux endroits différents de la base.
Les modèles en réseaux ont résolu ce problème : en référence à l’exemple précédent, l’entité « description générale du véhicule » peut être rattachée à deux entités maitresses : « Offre commerciale type » et « Type de véhicule ».
– Le concepteur du Modèle de données anticipe les chemins à parcourir pour constituer des requêtes fonctionnelles courantes. Il consolide et configure les liens utiles entre entités.
– Pour extraire les données dont son algorithme a besoin, il revient alors au développeur du logiciel de décrire dans son Code Source, les étapes du chemin qui parcourt les entités au travers des liens prédéfinis.
Le modèle relationnel est conçu pour intégrer l’approche par les formes normales. Le concepteur définit des entités fonctionnelles et les liens qui les associent. Outre la simplicité de la mise en œuvre du schéma, le développeur n’a plus à se soucier de l’optimisation physique des requêtes. SQL (pour « Structured Query Language », ou langage structuré de requête) est le langage de requête le plus répandu, normé par l’ISO et par l’ANSI. Le SGBD traduira la requête SQL en Code Exécutable juste avant son traitement.
Les bases de données NoSQL sont les toutes dernières arrivées. Leur nom est souvent traduit par « Not only SQL » (pas seulement/au-delà de SQL), mais il porte aussi en lui le blocage qu’ont les startups et les nouveaux arrivés de l’Économie Numérique face à la domination des grands leaders du marché SQL et, plus encore, il indique leur refus face au coût élevé de la licence logicielle qui est appliqué par les leaders SQL du marché, essentiellement Oracle, Microsoft et IBM (qui, avec DB2, est encore leader sur les gros équipements centraux).
NoSQL est une offre encore marginale qui s’adresse aux gestionnaires de larges ensembles de données distribuées. Dans le cadre du Big Data, NoSQL apporte des réponses partielles au mode d’implémentation physique et aux optimisations des traitements, mais ne réalise toujours pas le changement de paradigme annoncé.
En 2018, Teradata est encore la première des références de SGBD pour le big data.

Synonymes:

Banque de Données

Articles associés:

Last posts