Les différents types de données

Définition

Les données personnelles (Nom, téléphone…), les coordonnées GPS des véhicules, les mesures prises par les instruments scientifiques, etc… ne sont pas consignées dans des fichiers word ou pdf mais des fichiers spéciaux qui permettent d’organiser les données en tableaux pour mieux les classer, catégoriser, trier.

A voir dans cet article

  • Comment organiser les données ?
  • Les fichiers *.csv

Articles à consulter

Comment organiser les données ?

Vocabulaires

Avant de présenter l’organisation des données, il est nécessaire que l’on s’entende sur le vocabulaire que l’on utilisera dans ce thème.

Une donnée

C’est une valeur décrivant un objet (=une personne, un événement) digne d’intérêt pour celui qui choisit de la conserver.

Exemple : 06 75 34 : le numéro de téléphone d’une personne est une donnée.

Un descripteur

Plusieurs descripteurs peuvent être utiles pour décrire un objet.

Exemple : Pour décrire une personne, on utilise les descripteurs : nom, prénom, adresse et numéro de téléphone.

Les tableaux = Table = Collection

La structure de table permet de présenter une collection : les objets en ligne, les descripteurs en colonne et les données à l’intersection : les données sont alors dites structurées.

Tableau appelé "Collection" dans le langage de l'organisation des données.

Travail :

  • Ouvrir le fichier “Avengers.xls” qui se trouve dans le dossier : Echanges / Maclasse / SNT / Données.
  • A l’aide du site Allociné.fr, compléter les descripteurs manquants.
  • Certains objets ont des données manquantes. Complétez-les aussi.
  • Enregistrez votre travail dans vos “Documents”.

Les fichiers

Pour assurer la sauvegarde et l’exploitation des données, ces dernières sont très souvent stockées dans des fichiers spécifiques à l’organisation des données : leurs extensions sont *.csv ou *.xml ou *.json.

Format CSV

Le format CSV (Comma Separated Values = données avec des séparateurs) est un format de fichier simple permettant d’enregistrer une table.

Format XML

Format JSON

Travail :

Tous les sites web dispose d’une page dans laquelle les webmasters du site se présentent et développent leurs objectifs. Cette page se trouve très souvent en pied de page. Pour data.gouv.fr, il faut cliquer sur le lien hypertext “Documentation” dans la rubrique “L’open Data”.

  • Pour qui s’adresse ce site ? Quel est son but ?

Dans le site web, trouver et télécharger :

  • 1 fichier *.xml pas trop lourd (moins de 2Mo)
  • 1 fichier *.csv pas trop lourd (moins de 2Mo)
  • 1 fichier *.json pas trop lourd (moins de 2Mo)

Ouvrir chacun des fichiers avec le programme “textedit” ou “notepad”.

  • Constater les différences de rédaction du programme.

Traitement des fichiers

L’évolution des capacités de stockage, de traitement et de diffusion des données fait que l’on assiste aujourd’hui à un phénomène de surabondance des données.

Pour les exploiter efficacement, de nouveaux algorithmes se développent pour effectuer des opérations sur une table de données comme :

  • rechercher une information précise dans la collection
  • trier la collection sur une ou plusieurs propriétés
  • filtrer la collection selon un ou plusieurs tests sur les valeurs des descripteurs
  • effectuer des calculs
  • mettre en forme les informations produites pour une visualisation par les utilisateurs.

Travail : Ouvrir le fichier “1G Données brut.csv” qui se trouve dans “Echanges / MaClasse / SNT / …” avec le programme “Excel”.

En vous aidant du tutoriel proposé par le site ac-poitiers.fr, vous devrez :

  • Trier les élèves par ordre alphabétique.
  • Trier les élèves du plus jeune au moins jeune.
  • Filtrer tous les élèves qui ont pris la spécialité “Physique chimie”. Combien sont-ils ? 
  • Filtrer tous les élèves qui ont pris la spécialité “SVT” ET “Maths”. Combien sont-ils ? 

Laisser un commentaire

Fermer le menu