* Grundkenntnisse in Python
* Grundkenntnisse in HTML
* erste Erfahrung in der objektorientierten Programmierung
* Grundverständnis im Bereich der HTTP Requests
* Idealerweise Grundkenntnisse in Regular Expressions
Die Teilnehmer
* bekommen den Überblick über gängige Python Crawling Frameworks und sind in der Lage das zu ihrer Situation passende Framework auszuwählen
* erfahren über die verschiedenen Vorgehensweisen beim Web Crawling (Listen-basiert, Sitemap-basiert etc.)
* sind in der Lage ein auf Scrapy (Python) basierendes Crawling-Projekt zu erstellen, zu starten und zu überwachen
* lernen HTML-Elemente mithilfe von XPath zu selektieren
* können den Inhalt einer robots.txt einer Webseite verstehen
* lernen die gängigen Fehler kennen und wissen diese zu vermeiden
Yevgen Papernyk ist studierter Informatiker (M.Sc.) und verfügt über langjährige Berufserfahrung mit Python im Bereich Web Crawling – vorrangig mit dem Scrapy-Framework, aber auch mit Selenium und einfachen Python-Requests. Tiefergehende Kenntnisse mit dem Scrapy-Framework sammelte Yevgen im Zuge der Erweiterung des Frameworks für firmeninterne Zwecke.
Als Co-Organisator und aktives Mitglied der Python User Group Nürnberg engagiert sich Yevgen in der Ausbildung von Python-Einsteigern und hält firmeninterne Vorträge – sowie zuletzt zum Thema Web Crawling auf dem PyDay Nürnberg 2019.