Les données structurées
Définition : Les données
Les données sont des ensembles de symboles (mots, nombres, images, sons etc...) pour représenter le monde réel ( objets événements etc...).
Elles peuvent être quantitatives ( âge, poids taille, température etc..) ou qualitatives ( noms, prénom, adresse etc...)
L'information
Une information est une donnée interprétée.
Prenons la donnée suivante : 2 81 12 92 01208680.
C'est juste une série de chiffres...
Si maintenant on précise que c'est un numéro de sécurité sociale, on en déduit qu'il s'agit de celui d'une femme née en 1981 au mois de décembre dans le département 92 (haut de seine).
Une information = données + modèle d'interprétation.
Le schéma suivant montre que l'information dépend du modèle d'interprétation :
Fondamental : Les données structurées.
Reprenons le cas de la série de chiffres : 2 81 12 92 ...., si on ne précise pas que c'est un numéro de sécurité sociale, ce n'est qu'une série de chiffres.
Les données doivent être décrites, par un descripteur compréhensible pour celui qui veut les interpréter.
Prenons le cas d'une bibliothèque, et considérons un abonné. Lors de son inscription celui-ci fournit des données ( son nom, son prénom, son adresse et son numéro de téléphone), ces données seront associées aux descripteurs (Nom, Prénom, Adresse, n-tel).
On regroupe les données des abonnés dans une table, avec les mêmes descripteurs, on crée ainsi une collection.
On regroupe ensuite toutes les collections ( livres, abonnés, emprunts, etc...) dans une base de donnée.
Stockage des données
Les bases de données de grande taille sont stockées dans des ordinateurs distants (Data center).
La concentration d'un grand nombre de machines dans un même espace engendre une production de chaleur qu'il faut maîtriser. Cela entraîne une forte consommation d'électricité.
La consommation des data center à la base du réseau internet ne cesse de croître, au point de représenter 4 % de la consommation énergétique mondiale en 2015. La climatisation et les systèmes de refroidissement représentent de 40 à 50 % de la consommation énergétique des data Center. Les data center américains ont consommé 91 milliards de kWh en 2013 et 56 milliards en Europe (prévision : 104 milliards en 2020).
Cela a engendré de nombreux progrès technologiques en climatisation notamment.
Le cloud :
Accès aux données
Certaines données sont accessibles à tous ( Open Data - le site data.gouv.fr propose des jeux de données libre d'accès) et d'autres sont non accessibles( privées ou sensibles..).
Certaines bases de données sont souvent comparées à l'or noir d'internet. Les données qu'elles contiennent sont utilisées pour analyser le comportement des internautes afin de leur proposer tel ou tel produit lors de leur navigation.
De puissants algorithmes sont utilisés pour faire ces interprétations.
Beaucoup de ces données sont "récoltées" sans qu'on s'en aperçoive....
Installer l'extension (dans Firefox) lightbeam, allez sur vos sites préférés, puis allez regarder dans lightbeam toutes les connexions qui observent votre navigation.