Data Science Kurs Python - Online
Dieser Data Science Kurs bietet eine umfassende und praxisorientierte Einführung in die Datenanalyse und Machine Learning mit Python.
Zu Beginn der Schulung werden die Grundlagen der Programmiersprache Python vermittelt, wobei der Fokus auf den wichtigsten Werkzeugen für die Datenanalyse liegt.
Im Zentrum des Kurses steht das Python-Modul pandas, das für die Arbeit mit DataFrames und zur Datenvorbereitung unerlässlich ist. Pandas gilt als eines der führenden Pakete in der Data Science-Welt. Ergänzend dazu lernen die Teilnehmer die Erstellung von Grafiken und Visualisierungen mit den Paketen seaborn und matplotlib kennen. Während matplotlib eine Vielzahl von Anpassungsmöglichkeiten für Plots bietet, überzeugt seaborn durch einfache Handhabung, um komplexe Diagramme mit minimalem Code zu erstellen.
Darüber hinaus erhalten die Teilnehmer einen Einblick in die Anwendung erster Machine Learning Algorithmen, darunter Entscheidungsbäume, K-Means Clustering, DBSCAN und Neuronale Netze, mithilfe des scikit-learn Pakets. Dabei liegt der Schwerpunkt auf der praktischen Implementierung dieser Algorithmen, sodass nur das notwendige theoretische Wissen vermittelt wird.
Nach Abschluss des Kurses sind Sie in der Lage, eigenständig Datenanalysen durchzuführen und erste, grundlegende Machine Learning Modelle in Python umzusetzen. Besonderes Augenmerk liegt auf der praxisnahen Anwendung. Die Teilnehmer lösen eigenständig Übungsaufgaben, um das Gelernte direkt umzusetzen. Dabei steht der Trainer unterstützend zur Seite, um den praktischen Umgang mit Python, pandas und Machine Learning Algorithmen zu vertiefen.
Zu Beginn der Schulung werden die Grundlagen der Programmiersprache Python vermittelt, wobei der Fokus auf den wichtigsten Werkzeugen für die Datenanalyse liegt.
Im Zentrum des Kurses steht das Python-Modul pandas, das für die Arbeit mit DataFrames und zur Datenvorbereitung unerlässlich ist. Pandas gilt als eines der führenden Pakete in der Data Science-Welt. Ergänzend dazu lernen die Teilnehmer die Erstellung von Grafiken und Visualisierungen mit den Paketen seaborn und matplotlib kennen. Während matplotlib eine Vielzahl von Anpassungsmöglichkeiten für Plots bietet, überzeugt seaborn durch einfache Handhabung, um komplexe Diagramme mit minimalem Code zu erstellen.
Darüber hinaus erhalten die Teilnehmer einen Einblick in die Anwendung erster Machine Learning Algorithmen, darunter Entscheidungsbäume, K-Means Clustering, DBSCAN und Neuronale Netze, mithilfe des scikit-learn Pakets. Dabei liegt der Schwerpunkt auf der praktischen Implementierung dieser Algorithmen, sodass nur das notwendige theoretische Wissen vermittelt wird.
Nach Abschluss des Kurses sind Sie in der Lage, eigenständig Datenanalysen durchzuführen und erste, grundlegende Machine Learning Modelle in Python umzusetzen. Besonderes Augenmerk liegt auf der praxisnahen Anwendung. Die Teilnehmer lösen eigenständig Übungsaufgaben, um das Gelernte direkt umzusetzen. Dabei steht der Trainer unterstützend zur Seite, um den praktischen Umgang mit Python, pandas und Machine Learning Algorithmen zu vertiefen.
Dieses Seminar richtet sich an:
Dieser Python Data Science Kurs richtet sich an Einsteiger, die die Grundlagen von Data Science erlernen möchten. Der Kurs ist ideal für Personen, die mit Python arbeiten wollen, um Daten zu analysieren und Machine Learning Modelle zu erstellen.
Ihr Abschluss:
Teilnahmebescheinigung
Jetzt anmelden
-
online
noch Plätze frei- Seminar-Nr.:
- 1846_251_01AI
- Dauer:
- ca. 24 UStd.
- Zeiten:
- 3 Termine
€ 2.200,–
Anmelden -
online
noch Plätze frei- Seminar-Nr.:
- 1846_251_02AI
- Dauer:
- ca. 24 UStd.
- Zeiten:
- 3 Termine
€ 2.200,–
Anmelden -
online
noch Plätze frei- Seminar-Nr.:
- 1846_252_01AI
- Dauer:
- ca. 24 UStd.
- Zeiten:
- 3 Termine
€ 2.200,–
Anmelden -
online
noch Plätze frei- Seminar-Nr.:
- 1846_252_02AI
- Dauer:
- ca. 24 UStd.
- Zeiten:
- 3 Termine
€ 2.200,–
Anmelden
Inhalt:
Dieser Kurs vermittelt Ihnen eine umfassende Einführung in Python für Data Science, einer der beliebtesten Programmiersprachen im Bereich Machine Learning und Deep Learning. Wir nutzen die Anaconda Distribution, die sich selbst als "die weltweit populärste Data Science Plattform" bezeichnet, und arbeiten in der Entwicklungsumgebung Jupyter Lab.
Nach dem Seminar sind Sie in der Lage:
Bekannte Machine Learning Algorithmen, die im Seminar behandelt werden, umfassen:
Nach Abschluss des Kurses verfügen Sie über fundierte Grundlagen in Data Science und haben die Einstiegshürde für den Einsatz von Python im Machine Learning erfolgreich überwunden. Sie werden in der Lage sein, Ihr Wissen selbstständig weiter auszubauen und praktische Anwendungen zu entwickeln. Der Schwerpunkt liegt auf der eigenständigen Umsetzung der Inhalte auf Ihrem Laptop, unterstützt durch den Dozenten.
Bitte überprüfen Sie, ob Ihr Firmenlaptop Internetzugriff ohne Einschränkungen hat, da die Seminarunterlagen (Skripte, Code, Dateien) online zum Download bereitgestellt werden.
Nach dem Seminar sind Sie in der Lage:
- Daten aus verschiedenen Formaten in Python einzulesen
- Daten mit seaborn und matplotlib zu visualisieren
- Datenbereinigung mit pandas durchzuführen, einschließlich des Ersetzens fehlender Werte, Anpassen von Zeilen und Spalten sowie Erstellen neuer Spalten
- Wie Sie eigene Funktionen in Python schreiben
- Die Umsetzung von Control Flows wie For-Schleifen und If-Else-Bedingungen
- Das Grundkonzept von pandas DataFrames und wie Sie Data Wrangling und Data Cleaning erfolgreich durchführen
Bekannte Machine Learning Algorithmen, die im Seminar behandelt werden, umfassen:
- Entscheidungsbäume
- K-Means Clustering
- DBSCAN Clustering
- K-Nearest Neighbors (KNN)
Nach Abschluss des Kurses verfügen Sie über fundierte Grundlagen in Data Science und haben die Einstiegshürde für den Einsatz von Python im Machine Learning erfolgreich überwunden. Sie werden in der Lage sein, Ihr Wissen selbstständig weiter auszubauen und praktische Anwendungen zu entwickeln. Der Schwerpunkt liegt auf der eigenständigen Umsetzung der Inhalte auf Ihrem Laptop, unterstützt durch den Dozenten.
Grundlagen von Python
- Neue Pakete installieren
- Jupyter Notebook als Entwicklungsumgebung/IDE
- Funktionen und Methoden
Das Paket pandas - DataFrame
- Struktur (Zeilen, Spalten) eines DataFrames
- Auswahl einer Zeile/Spalte
- Zeilen/Spalten erstellen, löschen, ändern
- Boolean indexing: eine logische Abfrage zur Selektion von Zeilen
- Daten zusammenfassen, um einen Überblick zu erhalten.
Berechnen von Statistiken direkt im pandas DataFrame
- Einfache Statistiken direkt auf einem DataFrame (Mittelwert, Min, Max, Summe, Median, Varianz,…)
- Zusammenfassen und Filtern von Daten
- Fehlende Werte ersetzen
- Kreuztabelle (Kontingenztafel)
Daten einlesen und schreiben
- Das Arbeitsverzeichnis in Python setzen
- Ein CSV bzw. Excel einlesen und schreiben
- Von einer URL einlesen
- Überblick über nützliche Parameter
- Lesen und Schreiben vom Python Format pickle
Control Flows
- Eine eigene Funktion schreiben
- Default Parameter in einer Funktion setzen: position arguments und keyword arguments
- For-Schleifen
- If-Else Bedingungen
Datenvisualisierung mit seaborn / matplotlib
- Die wichtigsten Grundlagen von matplotlib
- Achsen-Beschriftung, Legende, Titel ändern
- Einen Plot speichern
- In seaborn Linienplot, Boxplot, Histogram, Scatterplot, Barplot erstellen
- Darstellungen (Größe der Datenpunkte, Farbe, Gruppierung) mit einer Variable variieren oder festsetzen
String Manipulation im DataFrame; Grundlagen von numpy
- Text zeilenweise in einem DataFrame bearbeiten
- Informationen aus Text extrahieren
- Numpy arrays erstellen und nach Zeilen, Spalten slicen
- Funktionen in numpy auf ein array anwenden
Überblick über Machine Learning
- Einführung in Machine Learning
- Anwendungsbeispiele von Machine Learning
- Künstliche Intelligenz - Machine Learning - Deep Learning
- Unterschied Supervised - Unsupervised Learning (überwachtes - unüberwachtes Lernen)
- Overfitting und Train-Test-Split
Entscheidungsbaum mit scikit-learn
- Aufteilung der Daten in Test-Train, ein Model erstellen und validieren
- Grundlagen des Algorithmus
- Umsetzung in Python
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Anpassen von Hyperparametern im Training
Neuronales Netz; K-Nearest Neighbor
- Grundlagen des Algorithmus
- Ein Multi-Layer-Perceptron (MLP) trainieren
- Umsetzung in Python mit scikit-learn
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Anpassen von Hyperparametern
K-Means Clustering
- Ein Cluster-Model erstellen und validieren
- Grundlagen des Algorithmus
- Umsetzung in Python mit scikit-learn
- Validieren der Ergebnisse (Sillhouette Score, Calinski-Harabasz)
DBSCAN
- Wie funktioniert DBSCAN Clustering?
- Grundlagen des Algorithmus und Unterschiede zu K-Means
- Umsetzung in Python mit scikit-learn
- Validieren der Ergebnisse (Sillhouette Score, Calinski-Harabasz)
Voraussetzungen für die Python Data Scientist Weiterbildung
Für die Übungsaufgaben im Kurs benötigen die Teilnehmer einen Laptop. Es wird empfohlen, Ihren eigenen Laptop zu verwenden, auf dem die erforderliche Software vorab installiert ist. Eine detaillierte Installationsanleitung wird Ihnen vor dem Seminar per E-Mail zugeschickt.Bitte überprüfen Sie, ob Ihr Firmenlaptop Internetzugriff ohne Einschränkungen hat, da die Seminarunterlagen (Skripte, Code, Dateien) online zum Download bereitgestellt werden.
Technik im Data Science mit Python Kurs
- Die Teilnehmer benötigen für die Übungsaufgaben Laptops. Wir empfehlen, Ihren eigenen Laptop mit der vorab installierten Software mitzubringen. Eine genaue Installationsanleitung für die Software wird Ihnen vor dem Seminar per E-mail zugesandt. Auf Anfrage stellen wir auch Schulungslaptops zur Verfügung.
- Bitte prüfen Sie, ob Ihr Firmenlaptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript, Code, Dateien) werden im Kurs online zum Download zur Verfügung gestellt. Sie erhalten vor der Schulung per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können.
- Sie sollten sich in firmenfremde WLAN-Netze registrieren können.
- Als Backup Lösung ist es möglich, dass der USB Port bei Ihrem Laptop freigeschalten ist, um damit im Seminar verwendete Dateien oder sonstige Unterlagen übertragen zu können.
- In der Schulung wird das Betriebssystem Windows verwendet. Der Umgang mit Ihrem verwendeten Betriebssystem und Laptop sollte bekannt sein. Insbesondere sollten Sie ohne Schwierigkeiten Sonderzeichen auf der Tastatur finden (insbesondere bei Apple Geräten werden auf manchen Tastaturen nicht immer runde, eckige bzw. geschweifte Klammern dargestellt).