M162 Daten analysieren und modellieren

Kompetenzmatrix - Modul 162

Handlungsziele und typische Handlungssituationen

1. Sichtet Daten aus verschiedenen strukturierten und unstrukturierten Informationsbeständen und ordnet sie ein.

Bsp. für Handlungssituation: Eine Mediathek hat Informationen zu ihren Medien (Bücher, Filme und Musik, je digital oder analog) sowie den Ausleihen über die Jahre hinweg in verschiedenen Formaten elektronisch abgelegt (Textdateien, CSV, Excel, XML). Paul Muster, Lernender im 1. Lehrjahr, erhält den Auftrag, die vorliegenden Informationen zusammenzutragen und nach ihrer Struktur einzuordnen.

2. Charakterisiert einen Informationsbestand für die Verarbeitung hinsichtlich Qualität, z.B. Vollständigkeit, Eindeutigkeit, Widersprüchlichkeit, Redundanz und bereinigt die Daten falls nötig.

Bsp. für Handlungssituation: Die Informationen zu den Medien sind teils nicht vollständig, redundant oder haben widersprüchliche Angaben. So haben z.B. MP3-Dateien den Titel als Dateinamen, dieser weicht teilweise aber von den in der Datei hinterlegten MP3-Tags (Metainformation) ab. Oder die Adressdaten von Schülern sind teils nicht mehr aktuell. Im nächsten Schritt soll Paul Muster die Informationen validieren und bereinigen.

3. Wählt Informationen aus, welche sich für eine Auswertung eignen und berücksichtigt Aspekte bezüglich allfälliger Schutzbedürfnisse (z.B. Personendaten, Geheimhaltung).

Bsp. für Handlungssituation: Die Leitung der Mediathek möchte wissen, was für Auswertungen mit den vorhandenen (bereinigten) Informationen so alles möglich sind. Sie möchte nicht nur Auswertungen zu Medien (z.B. wie viele Bücher zu einem bestimmten Autor vorhanden sind), sondern auch in Kombination mit Daten der Lernenden. So hegt sie zum Beispiel die Idee auszuwerten, ob es einen Bezug zwischen Anzahl Ausleihen und Schulnoten gibt. Paul Muster erhält den Auftrag von der Leitung, mehrere mögliche Auswertungen vorzuschlagen.

4. Erstellt ein konzeptionelles Datenmodell für die bereinigten Daten und definiert Entitätstypen, Attribute und Beziehungen.

Bsp für Handlungssituation: Da die Informationen zu Medien, Schülern und Ausleihen nach wie vor in verschiedenen Formaten vorhanden sind, sollen diese für ein neue Verwaltungssoftware strukturiert in einer Datenbank abgelegt werden. Paul Muster soll dazu ein erstes Konzept für die Datenstruktur entwickeln. Dieses soll die grundlegend benötigten Entitätstypen, Attribute und Beziehungen aufzeigen.

5. Überführt das konzeptionelle Datenmodell in ein logisches, relationales Datenmodell durch Ergänzen von Identifikations- und Fremdschlüsseln, Datentypen und allfälliger Zwischentabellen.

Bsp für Handlungssituation: Das erste Konzept ist vorhanden und wurde vom Vorgesetzten abgenommen. Im nächsten Schritt soll Paul Muster dieses in ein logisches-relationales Datenmodell überführen. Paul soll sich dabei z.B. Gedanken dazu machen, ob in den vorhandenen Daten geeignete Kandidaten für eine eindeutige Identifikation vorhanden sind oder diese künstlich ergänzt werden müssen. Ebenso soll Paul zu allen Daten einen geeigneten Datentyp festlegen.

6. Normalisiert das logische, relationale Datenmodell.

Bsp für Handlungssituation: Paul Muster soll nun das nicht normalisierte Modell Schritt für Schritt bis in die 3. Normalform zu überführen. Dabei soll er insbesondere beachten, dass wiederkehrende Daten (z.B. Autor) widerspruchsfrei im Modell implementiert sind (Domänentabellen) und eine eindeutige Zuordnung gewährleistet ist (n:m auflösen)

7. Bildet das konzeptionelle und logische, relationale Datenmodell in einer geeigneten Darstellung ab.

Bsp für Handlungssituation: Der Vorgesetzte von Paul Muster möchte die beiden Modelle elektronisch ablegen können. Dazu soll Paul sich betreffend passenden Notationen und Tools informieren, ein Tool (z.B. MS-Visio, diagrams.net) installieren und die Modelle zeichnen. Das ERD könnte auch mit UML-Notation umgesetzt werden.

Matrix

Kompetenzband: HZ Grundlagen Fortgeschritten Erweitert
Formen und Struktur von Daten erkennen 1 A1G: Ich kann Formen von Daten aufzählen und diese beschreiben (Numerisch, Text, Medien). Hanok 1.1 A1F: Ich kann die Form der Speicherung verschiedener Daten unterscheiden (Dateitypen / Datentypen). Hanok 1.1 A1E: Ich kann die Auswertbarkeit von Daten, deren Möglichkeiten und Grenzen vergleichen. Hanok 1.2
Merkmale eines Datenbestandes 2 B1G: Ich kann die Konsequenz der Struktur auf die Möglichkeit der Auswertbarkeit (Text tiefe Auswertbarkeit, Tabelle mittel, DB hoch) erläutern. Hanok 2.1 B1F: Ich kann abhängig von der Struktur eine Auswertung durchführen. (Text, Tabelle …) Hanok 2.1 B1E: Ich kann aufzeigen, wie mit Hilfe einer Strukturtransformation Daten in eine besser auswertbare Form gebracht werden können. Hanok 2.1
Daten- und Skalentypen 2 C1G: Ich kann verschiedene Datentypen (ganze Zahl, rationale Zahlen, Zeit, Datum, Text, Boolean, usw.) erläutern. Hanok 2.2 C1F: Ich kann für vorliegende Daten den richtigen Datentyp bestimmen. Hanok 2.2 C1E: Ich kann Daten eines bestimmten Types zu einem anderen Datentyp transformieren. Hanok 2.2
2 C2G: Ich kann die Unterschiede der Skalentypen (nominal, ordinal und metrisch) erläutern. Hanok 2.3 C2F: Ich kann die Skalentypen auf Daten anwenden. Hanok 2.3 C2E: Ich kann einen bestimmten Skalentyp begründet auswählen. Hanok 2.3
Daten auswerten und visualisieren 3 D1G: Ich kann Diagrammtypen (Balken, Säule, Kreis, Netz, Linie) begründet für die Darstellung von Daten auswählen. Hanok 3.1 D1F: Ich kann aus vorliegende Daten Diagramme erstellen. Hanok 3.1 D1E: Ich kann Tendenzen in Auswertungsergebnissen ableiten und beschreiben. Hanok 3.2
3 D2G: Ich kann die wichtigsten statistischen Kenngrössen (Minimum, Maximum, Mittelwert, Anzahl, Median) und die Voraussetzungen (Skalentypen, Anzahl Beobachtungen, Datenqualität, …) erläutern. Hanok 3.3 D2F: Ich kann Daten mit gegebenen Anforderungen mittels passenden Kenngrössen auswerten und eine Statistik mit geeigneten Skalentypen erstellen. Hanok 3.3 D2E: Ich kann eine Statistik mit passende Kenngrössen und Skalentypen kritisch hinterfragen und Verbesserungen vorschlagen. Hanok 3.3
Geheimhaltung / Datenschutz 3 E1G: Ich kann erläutern, wieso personenbezogene Daten nicht ohne weiteres in Auswertungen und Statistiken eingesetzt, weitergeleitet oder publiziert werden dürfen. Hanok 3.4 Keine höhere Detailierung, da eine Vertiefung im Modul 231 erfolgt Keine höhere Detailierung, da eine Vertiefung im Modul 231 erfolgt
Konzeptionelles Datenmodell anwenden 4 F1G: Ich kann Elemente eines konzeptionellen Datenmodelles (Entitätstyp, Attribut, Assoziation, unterschiedliche Kardinalität …) erläutern. Hanok 4.2, Hanok 4.3, Hanok 5.3 F1F: Ich kann aus gegebenen Anforderungen ein konzeptionelles Datenmodell erstellen. Hanok 4.1 F1E: Ich kann ein konzeptionelles Datenmodell anhand der Anforderungen auf Vollständigkeit überprüfen. Hanok 4.2
Logisches relationales Datenmodell anwenden 5 G1G: Ich kann Unterschiede von einem konzeptionellen und einem logischen relationalen Datenmodell aufzählen und beschreiben. Hanok 5.1 G1F: Ich kann ein konzeptionelles Datenmodell in ein logisches relationales Datenmodell überführen. (Schlüssel, Fremdschlüssel, Kardinalitäten, Zwischentabelle …) Hanok 5.1, Hanok 5.3 G1E: Ich kann ein logisches relationales Datenbankmodell analysieren (Entitäten, Attribute, Schlüssel, Fremdschlüssel, Kardinalitäten, Zwischentabelle …) und daraus das konzeptionelle Modell ableiten (Reverse Engineering). Hanok 5.1
Identifikationsschlüssel 5 H1G: Ich kann Eigenschaften von Identifikationsmerkmalen (Eindeutigkeit, Definiertheit, Minimalität, Lebenslänglich…) und an einem Beispiel erklären. Hanok 5.2 H1F: Ich kann für Entitäten einen geeigneten Schlüssel begründet auswählen. (einfache, zusammengesetzte und künstlichen Schlüsseln) Hanok 5.2 H1E: Ich kann Schlüsselkandidaten auf Eignung analysieren und mögliche Probleme benennen. (zBsp. 8-stellige Artikelnummer, alte AHV-Nr, IPV4…) Hanok 5.2
Normalisierung auf bestehendes Datenmodell anwenden 6 I1G: Ich kann das Ziel der Normalisierung beschreiben. Hanok 6.1 I1F: Ich kann die Normalisierung (1. bis 3. Normalform) anwenden. Hanok 6.1 I1E: Ich kann die Normalisierung kritisch hinterfragen, z. B. in Bezug wie sich auf die Performance auswirkt, und Verbesserungen vorschlagen. Hanok 6.2
Datenmodell als ERD zeichnen. 7 J1G: Ich kann ein einfaches ERD mit einem Tool zeichnen (bis 3 Entitäten). Hanok 7.2 J1F: Ich kann ein Datenmodell mit Zwischentabellen, Attributen und Datentypen mit Hilfe eines Tools zeichnen (< 10 Tabellen). Hanok 7.2 J1E: Ich kann mich selbständig in ein mir fremdes Tool einarbeiten und innert nützlicher Frist ein Datenmodell zeichnen. Hanok 7.2

Kompetenzstufen

Grundlagen | Stufe 1

Diese Stufe ist als Einstieg ins Thema gedacht. Der Fokus liegt hier auf dem Verstehen von Begriffen und Zusammenhängen.

Als Richtungshinweis: Wer alle Kompetenzen in dieser Stufe erfüllt, hat die Noten 3.0.

Fortgeschritten | Stufe 2

Diese Stufe definiert den Pflichtstoff, den alle Lernenden am Ende des Moduls möglichst beherrschen sollen.

Als Richtungshinweis: Wer alle Kompetenzen in dieser Stufe erfüllt, hat die Noten 4.5

Erweitert | Stufe 3

Diese Lerninhalte für Lernende gedacht, die schneller vorankommen und einen zusätzlichen Lernanreiz erhalten sollen.

Als Richtungshinweis: Wer alle Kompetenzen in dieser Stufe erfüllt, hat die Noten 6

Fragekatalog

Link zum Fragekatalog