Aller au contenu

Algorithmes et programmes⚓

Sources et crédits pour ce cours

Pour préparer ce cours, j'ai utilisé :

Recherche dans une collection de donnĂ©es⚓

Point de cours 4

Une table de données structurées peut faire l'objet de différentes opérations :

  • rechercher une information prĂ©cise dans la collection
  • trier la collection selon un ou plusieurs descripteurs
  • filtrer la collection selon un ou plusieurs tests sur les valeurs des descripteurs
  • effectuer des calculs
  • mettre en forme les informations produites pour une visualisation par les utilisateurs.

Une base de données est une collection de plusieurs tables de données structurées qu'on peut rapprocher sur les valeurs de descripteurs communs pour générer de nouvelles informations.

Les SystÚmes de Gestion de Bases de Données (SGBD) sont trÚs utilisés pour gérer les données structurées : abonnés d'une plateforme, stocks et commandes, systÚmes de réservation ...

Les recherches dans une base de donnĂ©es sont effectuĂ©es Ă  l'aide de requĂȘtes.

alt

ModĂšle relationnel

Dans le modÚle relationnel les tables sont appelées relations et les descripteurs attributs :

  • une clef primaire est un attribut ou un ensemble d'attributs identifiant de façon unique un enregistrement (\(=\) une ligne) de la relation (\(=\) table)
  • une clef Ă©trangĂšre est un attribut ou un ensemble d'attributs qui fait rĂ©fĂ©rence Ă  une clef primaire d'une autre relation et permet de faire la jointure entre deux relations pour gĂ©nĂ©rer de nouvelles informations.

Le langage SQL permet d'effectuer des requĂȘtes sur une base de donnĂ©es relationnelles.

alt

Exemple de la gestion d'une base de données musicale

Pour gérer une base de données de morceaux de musique, il est préférable d'utiliser plusieurs tables plutÎt qu'une seule. Séparer les données des morceaux de celles des interprÚtes permet de ne pas ressaisir le nom de l'interprÚte pour chaque morceau. En éliminant les redondances, on réduit les risques d'erreurs de saisie ou de modification.

alt

Certains fichiers contiennent des donnĂ©es non structurĂ©es, par exemple des images, des documents de traitement de texte ou PDF. L'indexation permet de leur associer des mĂ©tadonnĂ©es (titre, date) ou des mots clefs qui sont ensuite utilisĂ©s pour la recherche dans une collection de documents. Cette indexation peut ĂȘtre manuelle ou automatisĂ©e Ă  l'aide de programmes de reconnaissance automatique de caractĂšre (OCR) ou qui vont lire les mĂ©tadonnĂ©es dĂ©jĂ  prĂ©sentes (dans les images par exemple ...)

Les logiciels de Gestion Electronique de Données (GED), comme Microsoft Sharepoint permettent de gérer des collections de données non structurées (factures dans une entreprise, archives ...)

Exercice 1

Objectif : Connaßtre les principales méthodes de recherche dans une collection de données

Pour chaque question de ce QCM, plusieurs bonnes réponses sont possibles.

Questions

  1. Que gÚre un SystÚme de Gestion de Bases de Données ?

    • Une collection de plusieurs tables de donnĂ©es structurĂ©es

    • Une collection de documents non structurĂ©s

    • Un fichier CSV

    • Un dossier avec des sous-dossiers par catĂ©gories de fichiers

  2. Comment les recherches dans une base de données sont-elles effectuées ?

    • Par tri manuel des tables

    • À l'aide de requĂȘtes

    • Par classement alphabĂ©tique

    • Par reconnaissance automatique de caractĂšres (OCR)

  3. Quelle est la fonction principale des logiciels de Gestion Électronique de DonnĂ©es (GED) ?

    • GĂ©rer des tables de donnĂ©es structurĂ©es

    • GĂ©rer des collections de donnĂ©es non structurĂ©es

    • Trier les commandes et les stocks

    • Effectuer des calculs sur des donnĂ©es structurĂ©es

  4. Quel est le nom du langage de requĂȘte des SystĂšmes de Gestion de Bases de DonnĂ©es ?

    • CSV

    • OCR

    • XLS

    • SQL

Utiliser un logiciel de tableur pour rechercher dans une table⚓

Exercice 2

Objectif : Réaliser des opérations de recherche, filtre, tri ou calcul sur une ou plusieurs tables, à l'aide d'un tableur

Question 1

Regardez la vidéo précédente pour découvrir la façon dont un logiciel de tableur permet de gérer une table de données structurées.

Question 2

  1. Lire attentivement la page À consulter absolument avant de commencer ! : tĂ©lĂ©charger le fichier musiques.csv et ouvir le fichier avec le tableur LibreOffice en suivant les instructions.
  2. Traiter les six exercices Musique 1 à Musique 6 dont les liens d'accÚs se trouvent sur la page Utiliser un tableur. Chaque exercice est une série de petits défis portant sur des recherches et tris à effectuer sur le fichier musiques.csv avec le tableur LibreOffice.

Utiliser un langage de programmation pour interroger une base de donnĂ©es⚓

Exercice 3

Question 1

Objectif : Réaliser des opérations de recherche, filtre, tri ou calcul sur une ou plusieurs tables, à l'aide d'un langage de programmation

  1. Se connecter Ă  son compte sur parcours-algorea.org.
  2. Traiter l'exercice Les rĂ©gions et leurs capitales dans le module Programmer des requĂȘtes - Python
  3. Traiter l'exercice Les grandes villes dans le module Programmer des requĂȘtes - Python
  4. Traiter l'exercice Les fleuves dans le module Programmer des requĂȘtes - Python
  5. Traiter l'exercice La RĂ©gion Grand-Est dans le module Programmer des requĂȘtes - Python
  6. Traiter l'exercice Les villes du Pas-de-Calais dans le module Programmer des requĂȘtes - Python
  7. Traiter l'exercice Les habitants des Hauts-de-Seine dans le module Programmer des requĂȘtes - Python
  8. Traiter l'exercice Les dĂ©partements de Nouvelle-Aquitaine dans le module Programmer des requĂȘtes - Python

Question 2 (en route vers la spécialité NSI)

Objectif : À partir de deux tables de donnĂ©es ayant en commun un descripteur, rĂ©aliser un croisement des donnĂ©es permettant d'obtenir une nouvelle information.

Traiter les deux exercices Les villes de Bretagne et Les capitales de rĂ©gion de la page Programmer des requĂȘtes avancĂ©es - Python

Exercice 4

Source : TP de la bibliothÚque Capytale, réalisé par une équipe de formation de l'académie de Rennes

Pour traiter des données, ce TP utilise la bibliothÚque Python Pandas. Une bibliothÚque Python permet de rajouter des fonctionnalités par rapport au langage de base. La bibliothÚque Pandas est trÚs utilisée pour tout ce qui touche au traitement des données.