courseoutline_metadesc.tpl
From Data to Insights with Google Cloud Platform (DIGCP) – Details
Detaillierter Kursinhalt
Modul 1: Einführung in Daten auf der Google Cloud Platform
- Hervorhebung von Analytics-Herausforderungen für Datenanalysten
- Vergleich von Big Data vor Ort mit Big Data in der Cloud
- Erläuterung realer Anwendungsfälle von Unternehmen, die durch Analytics in der Cloud eine Transformation durchlaufen haben
- Projektgrundlagen von Google Cloud Platform
- Lab: Erste Schritte mit Google Cloud Platform
Modul 2: Überblick über Big-Data-Tools
- Anleitung für die Aufgaben und Herausforderungen von Datenanalysten und Einführung in die Datentools der Google Cloud Platform
- Demo: 10 Milliarden Datensätze mit Google BigQuery analysieren
- 9 grundlegende Funktionen in Google BigQuery untersuchen
- GCP-Tools für Analysten, Data Scientists und Data Engineers vergleichen
- Lab: Datasets mit Google BigQuery untersuchen
Modul 3: Daten mit SQL erkunden
- Gängige Techniken der Datenexploration vergleichen
- Qualitativ hochwertiges Standard-SQL codieren
- Öffentliche Datasets von Google BigQuery untersuchen
- Vorschau der Visualisierung: Google Data Studio
- Lab: Gängige SQL-Fehler beheben
Modul 4: Preisgestaltung von Google BigQuery
- Anleitung für einen Job in BigQuery
- Preise von BigQuery berechnen: Kosten für Speicherung, Abfrage und Streaming
- Abfragen nach Kosten optimieren
- Lab: Preise von Google BigQuery berechnen
Modul 5: Daten bereinigen und transformieren
- Die fünf Prinzipien der Integrität von Datasets
- Dataset-Form und -Verzerrung charakterisieren
- Daten mit SQL bereinigen und transformieren
- Daten mit neuer UI bereinigen und transformieren: Einführung in Cloud Dataprep
- Lab: Daten mit Cloud Dataprep untersuchen und gestalten
Modul 6: Daten speichern und exportieren
- Permanente und temporäre Tabellen vergleichen
- Abfrageergebnisse speichern und exportieren
- Leistungsvorschau: Abfragecache
- Lab: Neue permanente Tabellen erstellen
Modul 7: Neue Datasets in Google BigQuery aufnehmen
- Externe Datenquellen abfragen
- Probleme bei der Datenaufnahme vermeiden
- Neue Daten in permanente Tabellen aufnehmen
- Streaming-Insert-Anweisungen diskutieren
- Lab: Neue Datasets aufnehmen und abfragen
Modul 8: Datenvisualisierung
- Übersicht zu den Prinzipien der Datenvisualisierung
- Exploratorischer und erklärender Analyseansatz im Vergleich
- Demo: UI von Google Data Studio
- Google Data Studio und Google BigQuery verbinden
- Lab: Dataset in Google Data Studio untersuchen
Modul 9: Datasets verbinden und zusammenführen
- Verlaufsdatentabellen mit UNION zusammenführen
- Einführung in Tabellenplatzhalter für einfache Zusammenführungen
- Datenschemata überprüfen: Daten über mehrere Tabellen hinweg verknüpfen
- Anleitung zu JOIN-Beispielen und Problemen
- Lab: Daten aus mehreren Tabellen verbinden und zusammenführen
Modul 10: Fortgeschrittene Funktionen und Klauseln
- SQL-Fallanweisungen überprüfen
- Einführung in analytische Fensterfunktionen
- Datensicherung mit unidirektionaler Feldverschlüsselung
- Effektives Design für Unterabfragen und CTE
- SQL- und JavaScript-UDFs im Vergleich
- Lab: Mit erweiterten SQL-Funktionen Erkenntnisse ableiten
Modul 11: Schemadesign und verschachtelte Datenstrukturen
- Google BigQuery und herkömmliche RDBMS-Datenarchitekturen im Vergleich
- Normalisierung und Denormalisierung im Vergleich: Leistungskompromisse
- Schemaüberprüfung: Gute und schlechte Schemata
- Arrays und verschachtelte Daten in Google BigQuery
- Lab: Verschachtelte und wiederkehrende Daten abrufen
Modul 12: Mehr Visualisierung mit Google Data Studio
- Fallanweisungen und berechnete Felder erstellen
- Überlegungen zum Cache und der Vermeidung von Leistungsproblemen
- Dashboards teilen und Überlegungen zum Datenzugriff diskutieren
Modul 13: Leistungsoptimierung
- Leistungsprobleme von Google BigQuery vermeiden
- Hotspots in Ihren Daten verhindern
- Mit der Query Explanation Map Leistungsprobleme diagnostizieren
- Lab: Abfrageleistung optimieren und Fehler beheben
Modul 14: Datenzugriff
- Dataset-Rollen in IAM und BigQuery im Vergleich
- Zugriffsprobleme vermeiden
- Mitglieder, Rollen, Organisationen, Kontoverwaltung und Dienstkonten überprüfen
Modul 15: Notebooks in der Cloud
- Cloud Datalab
- Compute Engine und Cloud Storage
- Lab: VM zum Verarbeiten von Erdbebendaten mieten
- Datenanalyse mit BigQuery
Modul 16: Maschinelles Lernen bei Google
- Einführung in maschinelles Lernen für Analysten
- Mit vortrainierten ML APIs für Bild- und Textverständnis üben
- Lab: Vortrainierte ML APIs
Modul 17: Maschinelles Lernen auf Ihre Datasets anwenden (BQML)
- ML-Datasets erstellen und Merkmale analysieren
- Modelle für die Klassifizierung und Prognose mit BQML erstellen
- Lab: Kaufverhalten von Websitebesuchern mit einem Klassifizierungsmodell in BQML vorhersagen
- Lab: Taxikosten mit einem ML-Prognosemodell in BigQuery vorhersagen