Algorithmes et programmesâïž
Sources et crédits pour ce cours
Pour préparer ce cours, j'ai utilisé :
- le programme de SNT
- le parcours thématique Données strucuturées proposé par l'association France IOI sur le site https://parcours.algorea.org
- le cours de Cédric Gouygou
- un TP Capytale d'une formation SNT pour l'académie de Rennes
Recherche dans une collection de donnĂ©esâïž
Point de cours 4
Une table de données structurées peut faire l'objet de différentes opérations :
- rechercher une information précise dans la collection
- trier la collection selon un ou plusieurs descripteurs
- filtrer la collection selon un ou plusieurs tests sur les valeurs des descripteurs
- effectuer des calculs
- mettre en forme les informations produites pour une visualisation par les utilisateurs.
Une base de données est une collection de plusieurs tables de données structurées qu'on peut rapprocher sur les valeurs de descripteurs communs pour générer de nouvelles informations.
Les SystÚmes de Gestion de Bases de Données (SGBD) sont trÚs utilisés pour gérer les données structurées : abonnés d'une plateforme, stocks et commandes, systÚmes de réservation ...
Les recherches dans une base de donnĂ©es sont effectuĂ©es Ă l'aide de requĂȘtes.

ModĂšle relationnel
Dans le modÚle relationnel les tables sont appelées relations et les descripteurs attributs :
- une clef primaire est un attribut ou un ensemble d'attributs identifiant de façon unique un enregistrement (\(=\) une ligne) de la relation (\(=\) table)
- une clef étrangÚre est un attribut ou un ensemble d'attributs qui fait référence à une clef primaire d'une autre relation et permet de faire la jointure entre deux relations pour générer de nouvelles informations.
Le langage SQL permet d'effectuer des requĂȘtes sur une base de donnĂ©es relationnelles.

Exemple de la gestion d'une base de données musicale
Pour gérer une base de données de morceaux de musique, il est préférable d'utiliser plusieurs tables plutÎt qu'une seule. Séparer les données des morceaux de celles des interprÚtes permet de ne pas ressaisir le nom de l'interprÚte pour chaque morceau. En éliminant les redondances, on réduit les risques d'erreurs de saisie ou de modification.

Certains fichiers contiennent des donnĂ©es non structurĂ©es, par exemple des images, des documents de traitement de texte ou PDF. L'indexation permet de leur associer des mĂ©tadonnĂ©es (titre, date) ou des mots clefs qui sont ensuite utilisĂ©s pour la recherche dans une collection de documents. Cette indexation peut ĂȘtre manuelle ou automatisĂ©e Ă l'aide de programmes de reconnaissance automatique de caractĂšre (OCR) ou qui vont lire les mĂ©tadonnĂ©es dĂ©jĂ prĂ©sentes (dans les images par exemple ...)
Les logiciels de Gestion Electronique de Données (GED), comme Microsoft Sharepoint permettent de gérer des collections de données non structurées (factures dans une entreprise, archives ...)
Exercice 1
Objectif : Connaßtre les principales méthodes de recherche dans une collection de données
Pour chaque question de ce QCM, plusieurs bonnes réponses sont possibles.
Questions
-
Que gÚre un SystÚme de Gestion de Bases de Données ?
- Une collection de plusieurs tables de données structurées
- Une collection de documents non structurés
- Un fichier CSV
- Un dossier avec des sous-dossiers par catégories de fichiers
-
Comment les recherches dans une base de données sont-elles effectuées ?
- Par tri manuel des tables
- Ă l'aide de requĂȘtes
- Par classement alphabétique
- Par reconnaissance automatique de caractĂšres (OCR)
-
Quelle est la fonction principale des logiciels de Gestion Ălectronique de DonnĂ©es (GED) ?
- Gérer des tables de données structurées
- Gérer des collections de données non structurées
- Trier les commandes et les stocks
- Effectuer des calculs sur des données structurées
-
Quel est le nom du langage de requĂȘte des SystĂšmes de Gestion de Bases de DonnĂ©es ?
- CSV
- OCR
- XLS
- SQL
Utiliser un logiciel de tableur pour rechercher dans une tableâïž
Exercice 2
Objectif : Réaliser des opérations de recherche, filtre, tri ou calcul sur une ou plusieurs tables, à l'aide d'un tableur
Question 1
Regardez la vidéo précédente pour découvrir la façon dont un logiciel de tableur permet de gérer une table de données structurées.
Question 2
- Lire attentivement la page à consulter absolument avant de commencer ! : télécharger le fichier musiques.csv et ouvir le fichier avec le tableur LibreOffice en suivant les instructions.
- Traiter les six exercices Musique 1 à Musique 6 dont les liens d'accÚs se trouvent sur la page Utiliser un tableur. Chaque exercice est une série de petits défis portant sur des recherches et tris à effectuer sur le fichier musiques.csv avec le tableur LibreOffice.
Utiliser un langage de programmation pour interroger une base de donnĂ©esâïž
Exercice 3
Question 1
Objectif : Réaliser des opérations de recherche, filtre, tri ou calcul sur une ou plusieurs tables, à l'aide d'un langage de programmation
- Se connecter Ă son compte sur parcours-algorea.org.
- Traiter l'exercice Les rĂ©gions et leurs capitales dans le module Programmer des requĂȘtes - Python
- Traiter l'exercice Les grandes villes dans le module Programmer des requĂȘtes - Python
- Traiter l'exercice Les fleuves dans le module Programmer des requĂȘtes - Python
- Traiter l'exercice La RĂ©gion Grand-Est dans le module Programmer des requĂȘtes - Python
- Traiter l'exercice Les villes du Pas-de-Calais dans le module Programmer des requĂȘtes - Python
- Traiter l'exercice Les habitants des Hauts-de-Seine dans le module Programmer des requĂȘtes - Python
- Traiter l'exercice Les dĂ©partements de Nouvelle-Aquitaine dans le module Programmer des requĂȘtes - Python
Question 2 (en route vers la spécialité NSI)
Objectif : à partir de deux tables de données ayant en commun un descripteur, réaliser un croisement des données permettant d'obtenir une nouvelle information.
Traiter les deux exercices Les villes de Bretagne et Les capitales de rĂ©gion de la page Programmer des requĂȘtes avancĂ©es - Python
Exercice 4
Source : TP de la bibliothÚque Capytale, réalisé par une équipe de formation de l'académie de Rennes
Pour traiter des données, ce TP utilise la bibliothÚque Python Pandas. Une bibliothÚque Python permet de rajouter des fonctionnalités par rapport au langage de base. La bibliothÚque Pandas est trÚs utilisée pour tout ce qui touche au traitement des données.
- Traiter le đ» TP sur Capytale.
- Vérifier ses résultats ou se débloquer avec la correction.