Netzwerk- und Trendanalyse von User Generated Content mit Python

Reddit ist ein soziales Netzwerk, das bereits seit 15 Jahre existiert. Im Gegensatz zu Facebook, Instagram und Twitter ist Reddit in Communitys organisiert, den sog. Subreddits. In letzter Zeit hat es beträchtlich an Popularität gewonnen.
Reddit erlaubt den Download der Daten mit einer liberalen Lizenz und bietet dafür ein API an, dessen Daten sich mit Python einfach interpretieren lassen. Damit unterscheidet es sich deutlich von anderen sozialen Netzwerken.

Für unseren Vortrag zeigen wir anhand des "WallStreetBets"-Subreddits, wie man die Text- und Metadaten nach der Akquisition mit Python analysieren und statistisch validieren kann. Anschließend nutzen wir diese Daten, um zukünftige Trends zu identifizieren.

Vorkenntnisse

  • Grundsätzliches Verständnis sozialer Netzwerke ist hilfreich
  • Grundkenntnisse in Python, Natural Language Processing und Graph-Analyse sind hilfreich, die verwendeten Methoden werden aber erklärt.
  • Für die Validierung nutzen wir statistische Methoden, die wir dann auch zur Trendvorhersage verwenden.

Lernziele

  • Teilnehmer lernen das soziale Netzwerk Reddit kennen und verstehen das Konzept der Subreddits
  • Sie verstehen, wie man Daten von Reddit nutzen kann, welche Analysen zur Erschließung der Inhalte sinnvoll sein können und wie man diese Ergebnisse für eine möglichst intuitive Interpretation darstellen kann.
  • Nach dem Vortrag wissen sie, wie man in Python Text- und Metadaten analysieren, User mit großem Einfluss bestimmen und daraus Trends ableiten kann.

Speaker

 

Stefanie Scholz
Stefanie Scholz ist Professorin für Sozialwirtschaft an der SRH Wilhelm Löhe Hochschule in Fürth. Nach ihrer Tätigkeit als Bereichsleiterin für Marketing und Vertrieb befasst sie sich mit KI-gestützten Marketinganalysen. Data-driven Marketing und Advanced Analytics stehen im Fokus ihrer Forschungsaktivitäten.

enterPy-Newsletter

Ihr möchtet über die enterPy
auf dem Laufenden gehalten werden?

 

Anmelden