In diesem Vortrag erfahrt ihr anhand eines Beispiels, wie sich die Modellentwicklung für maschinelles Lernen (ML) systematisch mit DVC und scikit-learn organisieren lässt. So kann unter anderem die Leistung eines Modells verbessert werden, wenn ihr die Parameter feiner abstimmt, oder wenn mehr Trainingsdaten verfügbar werden.
Um die Verbesserung messen zu können, sollte sich nachverfolgen lassen, welche Daten für das Training in welcher Modelldefinition und -konfiguration verwendet und welche Modellleistung damit erzielt wurde. Dabei werden sowohl die Daten wie auch der zugehörige Python-Code in einer Version erfasst.
Vorkenntnisse
Erfahrung mit der Versionsverwaltung Git
Lernziele
Reproduzierbare Modellentwicklung für maschinelles Lernen
Speaker
Frank Hofmann arbeitet zumeist von unterwegs als Entwickler, Autor und Linux- und Python-Trainer. Bevorzugte Arbeitsorte sind Berlin, Genf und Kapstadt. Er ist Co-Autor des Debian-Paketmanagement-Buches.
Du möchtest über die auf dem Laufenden gehalten werden? Dann trage einfach Deine E-Mail-Adresse in das Feld ein, das aufklappt, wenn Du die Einwilligung unten gibst:
Ich willige ein, dass mich die Rheinwerk Verlag GmbH und die Heise Medien GmbH & Co. KG über die informiert.
Meine Daten werden ausschließlich zu diesem Zweck genutzt. Eine Weitergabe an Dritte erfolgt nicht. (Deine E-Mail-Adresse wird an unseren Newsletter-Dienstleister Inxmail weitergegeben (https://www.inxmail.de/datenschutz).
Inxmail verwendet Deine Daten ausschließlich zu dem hier angegebenen Zweck. Eine Weitergabe der Daten erfolgt auch hier nicht.)
Ich kann die Einwilligung jederzeit an events@dpunkt.de,
per Brief an Rheinwerk Verlag GmbH, Wieblinger Weg 17, 69123 Heidelberg oder durch Nutzung des in den E-Mails enthaltenen Abmeldelinks widerrufen.
Es gilt die Datenschutzerklärung der Rheinwerk Verlag GmbH.