Kategorien
Seiten
-

IT Center Blog

MATSE-Azubi belegt 2. Platz beim GermEval-Wettbewerb

12. Mai 2023 | von
Icons zur Computerlinguistik

Quelle: Eigene Darstellung

Auszubildende bringen frischen Wind in Unternehmen und überraschen oft mit beachtlichen Leistungen. Ein bemerkenswertes Beispiel dafür ist Patrick Gustav Blaneck, ein ehemaliger MATSE-Auszubildender des IT Centers, der beim GermEval-Wettbewerb 2022 den zweiten Platz belegt hat.

Als Arbeitsgeber ist es uns wichtig, die Leistungen unserer Mitarbeitenden zu würdigen und hervorzuheben. Deshalb sprechen wir in diesem Interview mit Patrick über seine Arbeit, die Erfahrungen, die er dabei sammeln konnte, sowie seine Pläne für die Zukunft.

 

Hallo Patrick, kannst du dich unserer Leserschaft kurz vorstellen und uns ein wenig über deine Ausbildung berichten?

Patrick: Mein Name ist Patrick Gustav Blaneck und bis Februar 2023 war ich MATSE-Azubi am IT Center. Ich habe meine Ausbildung im Jahr 2020 begonnen und durch Verkürzung vorzeitig beendet. Während meiner Ausbildung habe ich mich besonders auf die Bereiche Data Science, Machine Learning und Deep Learning konzentriert. Daher konnte ich auch die DataScienceMATSE-Spezialisierung erlangen. Zudem war ich Semestersprecher in meinem MATSE-Jahrgang.

 

Herzlichen Glückwunsch zum zweiten Platz beim GermEval-Wettbewerb 2022! Kannst du uns etwas über den Rahmen dieses Wettbewerbs erzählen und worum es dabei genau ging?

Patrick: Herzlichen Dank! Beim GermEval-Wettbewerb 2022 ging es um die Bewertung der Textkomplexität von deutschen Texten. Die Lesbarkeit eines Textes ist ein essenzieller Faktor, der das Verständnis von Lesenden beeinflusst. Im Rahmen des Wettbewerbs sollte diese Lesbarkeit entsprechend quantifiziert werden. Teilnehmende Teams sollten Modelle entwickeln, die die Komplexität von Textstücken auf einer Skala von eins bis sieben automatisiert vorhersagen können.

GermEval ist eine Reihe von Shared Tasks, die im Rahmen der KONVENS stattfinden. Dabei handelt es sich um eine jährlich stattfindende wissenschaftliche Konferenz zu Themen im Bereich der Computerlinguistik und Sprachtechnologie.

 

Bei deiner Arbeit hast du Unterstützung erhalten. Wer hat dich dabei unterstützt und wie wurde die Arbeit aufgeteilt?

Patrick: Die Arbeit wurde im Team entwickelt. Jeder hat seine eigenen Fähigkeiten und Erfahrungen eingebracht. Das Team bestand neben mir aus Prof. Stephan Bialonski (Professor für Data Science an der FH Aachen), Niklas Grieger (M. Sc. Doktorand bei Prof. Bialonski) und Tobias Bornheim (B. Sc. Masterstudent an der FH Aachen). Prof. Bialonski war unser Experte für wissenschaftliche Methoden und Publikationen und stand stets beratend zur Seite. Prof. Bialonski, Niklas und Tobias hatten bereits Erfahrungen mit dem GermEval-Wettbewerb im Vorjahr und konnten wertvolle Einblicke und Ratschläge geben.

Wir haben im Rahmen des Wettbewerbs verschiedene Ansätze ausprobiert und deren Implementierung auf das Team aufgeteilt. Ich war für die Evaluation und Implementierung von Ensembling-Methoden verschiedener Modelle verantwortlich. Tobias Bornheim hat weitere Ansätze ausprobiert, wie zum Beispiel das Einbeziehen klassischer Lesbarkeitsmetriken. Niklas Grieger hatte stets ein kritisches Auge, um mögliche Verbesserungen aufzuzeigen. Insgesamt war es eine großartige Teamleistung, bei der jeder sein Bestes gegeben hat. Ich bin dankbar für die Unterstützung meiner Kollegen und die Gelegenheit, an diesem spannenden Projekt teilzunehmen.

 

Kannst du uns einen kurzen Einblick in deine Arbeit geben? Worum ging es dabei?

Patrick: Gerne. Wie bereits beschrieben, ging es um die Textkomplexitätsbewertung von deutschen Texten. Dabei habe ich verschiedene Modellarchitekturen zur Vorhersage der Textkomplexität untersucht und miteinander verglichen. Dazu gehörten unter anderem BERT (Google), GPT-2 (OpenAI) und RoBERTa (Facebook beziehungsweise Meta). Mein Ziel war es, herauszufinden, welches Modell am besten geeignet ist, um die Komplexität von Texten in deutscher Sprache zu bewerten.

Zusätzlich habe ich die Evaluierung von Ensembling untersucht. Hierbei wurden die Vorhersagen mehrerer Modelle und Modellfamilien kombiniert, um bessere Ergebnisse zu erzielen. Ich habe verschiedene Ansätze getestet und evaluiert, um zu sehen, ob sie tatsächlich zu besseren Vorhersageergebnissen führen können. Das Paper zu meiner Arbeit findet ihr auf der Website der ACL Anthology.

 

Wurde die Arbeit auf der Konferenz vorgestellt? Wie hast du dich darauf vorbereitet? Gab es besondere Herausforderungen, denen du dich stellen musstest?

Patrick: Ja, die Arbeit wurde auf der KONVENS vorgestellt. Der Vortrag wurde von Niklas Grieger und mir an der Universität Potsdam im September 2022 vor Fachpublikum gehalten. Die Vorbereitung auf den Vortrag erfolgte zusammen mit dem Team und es wurde ein gemeinsames Konzept erarbeitet. Hierbei wurde besonderes Augenmerk darauf gelegt, die Methodik der Arbeit möglichst anschaulich und verständlich darzustellen.

Die Vorbereitung auf die Konferenz und den Vortrag stellte mich vor einige Herausforderungen. Es war meine erste Teilnahme an einer wissenschaftlichen Konferenz und auch mein erster Fachvortrag. Die Nervosität war daher groß. Zudem musste der Vortrag auf Englisch gehalten werden, was eine zusätzliche Herausforderung darstellte. Trotzdem konnten wir den Vortrag erfolgreich halten und das Feedback war sehr positiv.

 

Inzwischen hast du deine Ausbildung erfolgreich abgeschlossen. Was machst du jetzt und was sind deine Pläne für die Zukunft?

Patrick: Seit meinem erfolgreichen Abschluss setze ich meine Tätigkeit als Softwareentwickler am IT Center in Teilzeit mit Freude fort. Aktuell mache ich ebenfalls meinen Master im Studiengang „Angewandte Mathematik und Informatik“ an der FH Aachen. Gemeinsam mit Prof. Bialonski beschäftige ich mich weiterhin mit Deep Learning und Natural Language Processing (NLP). Darüber hinaus engagiere ich mich in der Jugend- und Auszubildendenvertretung (JAV) der RWTH Aachen.

Zu meinen Plänen für die Zukunft zählen, meine Arbeit am IT Center weiterhin erfolgreich fortzusetzen und mich in meinem Fachgebiet, insbesondere im Bereich Deep Learning und NLP, weiterzuentwickeln. Auch werde ich mich bemühen, die MATSE-Ausbildung weiterhin positiv zu gestalten, indem ich mich zum Beispiel in der JAV engagiere, den Kontakt zu anderen Azubis und Lehrjahren aufrechterhalte, die Kommunikation mit der MATSE-Gruppe pflege und bei Bedarf meine Erfahrungen und Kenntnisse weitergebe.

____________________________________________________________________________________________________

 

Wir bedanken uns bei Patrick für die Einblicke in seine spannende Arbeit und wünschen ihm für die berufliche Zukunft weiterhin alles Gute.

 

Verantwortlich für die Inhalte dieses Beitrags sind Stéphanie Bauens, Patrick Blaneck und Jelena Ćulum.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert