Zurück

Versionskontrolle in Machine-Learning-Projekten

In diesem Vortrag erfahrt ihr anhand eines Beispiels, wie sich die Modellentwicklung für maschinelles Lernen (ML) systematisch mit DVC und scikit-learn organisieren lässt. So kann unter anderem die Leistung eines Modells verbessert werden, wenn ihr die Parameter feiner abstimmt, oder wenn mehr Trainingsdaten verfügbar werden.
Um die Verbesserung messen zu können, sollte sich nachverfolgen lassen, welche Daten für das Training in welcher Modelldefinition und -konfiguration verwendet und welche Modellleistung damit erzielt wurde. Dabei werden sowohl die Daten wie auch der zugehörige Python-Code in einer Version erfasst.

Vorkenntnisse

Erfahrung mit der Versionsverwaltung Git

Lernziele

Reproduzierbare Modellentwicklung für maschinelles Lernen

Speaker

Frank Hofmann arbeitet zumeist von unterwegs als Entwickler, Autor und Linux- und Python-Trainer. Bevorzugte Arbeitsorte sind Berlin, Genf und Kapstadt. Er ist Co-Autor des Debian-Paketmanagement-Buches.