Manuel Lankes erhält teampool Preis für seine Bachelorarbeit
Manuel Lankes, geboren 2003, absolvierte sein Abitur am Rottmayr Gymnasium Laufen in Deutschland. Er arbeitet derzeit parallel zum Masterstudium Informatik als Projektmitarbeiter an der Universität Salzburg.
In seiner Forschung entwickelt er das Thema aus seiner Bachelorarbeit zur Beschleunigung von Jaro-Winkler Similarity Joins weiter und plant, die Ergebnisse in naher Zukunft auf einer Konferenz zu publizieren. Nun hat er den renommierten teampool Preis für seine Bachelorarbeit erhalten.
Ihre Bachelorarbeit untersucht Jaro-Winkler Similarity Joins. Können Sie uns erklären, was genau das bedeutet und warum das wichtig ist?
Heutzutage werden täglich Unmengen an Daten generiert. Will man diese Daten zusammenführen, um beispielsweise doppelte Einträge zu erkennen oder Informationen aus verschiedenen Quellen zu verknüpfen, muss man herausfinden, welche Einträge sich auf dieselbe Person, denselben Ort oder dasselbe Objekt beziehen. Das Problem dabei ist, dass die Daten selten in der gleichen Form vorliegen. Ein Name kann etwa als Müller oder Mueller auftauchen. Während für uns Menschen sofort klar ist, dass es sich um denselben Namen handelt, sind es für den Computer zwei völlig unterschiedliche Wörter. Hier kommt der Jaro-Winkler Similarity Join ins Spiel. Dabei gilt es, innerhalb einer gegebenen Menge an Wörtern alle Paare zu finden, die sich ähnlich sind. Bei Millionen von Wörtern in einem Datensatz ist es jedoch viel zu aufwändig, jedes mögliche Paar einzeln zu vergleichen. Das Ziel der Arbeit war es daher, eine Methode zu entwickeln, die weniger Vergleiche benötigt, aber trotzdem dieselben Ergebnisse liefert.
Was hat Sie dazu bewegt, sich auf das Thema Similarity Joins zu spezialisieren?
Ich wollte ein Thema wählen, das sowohl theoretisch interessant als auch praktisch relevant ist. Datenqualität spielt heute in fast jedem Unternehmen eine große Rolle, und ich wollte verstehen, wie Computer Ähnlichkeit zwischen Daten erkennen. Etwas, was für uns Menschen intuitiv ist, für Maschinen aber schwierig.
Welche Herausforderungen haben Sie bei der Umsetzung Ihrer Arbeit gemeistert, und wie sind Sie damit umgegangen?
Eine der größten Herausforderungen war das eigenständige Erarbeiten von Lösungen. Während man im Studium meist klar formulierte Aufgaben mit bekannten Lösungswegen bekommt, war bei der Bachelorarbeit die Lösung unbekannt. Durch schrittweises Ausprobieren und kontinuierliches Testen habe ich mich immer näher an eine bessere Lösung herangetastet. Dieser iterative Prozess war anspruchsvoll, aber auch sehr lehrreich, weil man mitbekommt, wie systematisches, wissenschaftliches Arbeiten funktioniert.
Welche neuen Erkenntnisse haben Sie durch Ihre Forschung gewonnen, die Sie vorher nicht erwartet hatten?
Während meiner Forschung habe ich gelernt, dass es nicht nur auf die Idee eines Algorithmus ankommt, sondern auch darauf, wie der Computer ihn tatsächlich ausführt. Schon kleine Anpassungen, beispielsweise beim Umgang mit Speicher, können die Rechendauer enorm verkürzen. Um ein Problem wirklich gut zu lösen, braucht man also sowohl die theoretische Idee als auch das nötige technische Wissen, wie man die Lösung effizient auf Hardware umsetzt.
Gibt es einen bestimmten Bereich der Informatik, den Sie in Zukunft weiter erforschen möchten?
In Zukunft würde ich dem Bereich der Ähnlichkeitssuche weiterhin treu bleiben. Dabei geht es nicht nur darum, ähnliche Wörter zu erkennen, sondern auch komplexere Objekte wie Graphen oder Vektoren zu vergleichen. Effiziente Methoden dafür könnten unter anderem in sozialen Netzwerken, Bioinformatik oder Machine Learning Anwendung finden.
Wo sehen Sie sich in fünf Jahren und welche Projekte möchten Sie bis dahin realisieren?
In fünf Jahren möchte ich in einem Umfeld arbeiten, in dem ich meine Fähigkeit, komplexe Probleme zu lösen, weiter ausbauen kann. Besonders spannend finde ich Projekte, bei denen es darum geht, Daten effizient zu analysieren, Muster zu erkennen und daraus fundierte Entscheidungen abzuleiten. Wichtig ist mir dabei allerdings, dass meine Lösungen nicht nur theoretisch elegant, sondern auch in der Praxis schnell und nützlich sind.
Zu teampool
teampool personal service gmbh gehört zu den führenden Personaldienstleistern in Österreich und ist auf Zeitarbeit, Personalberatung und Engineering spezialisiert. An zwölf Standorten betreuen die Teamplayer die Anliegen ihrer Kund:innen, Zeitarbeiter*innen, Techniker*innen und Bewerber*innen. Das Unternehmen steht für Begeisterung und setzt sich aktiv für die Förderung junger Talente im Bereich Informatik ein, um den Fachkräftebedarf zu decken und innovative Entwicklungen voranzutreiben. Durch Stipendien an Studierende der Universität Salzburg will teampool nicht nur Karrieren fördern, sondern auch zur Stärkung des Innovationsstandorts Österreich beitragen.
Kommende Woche zeichnet die Firma teampool personal service gmbh vier Informatik-Studierende der Universität Salzburg mit Stipendien und Prämien aus. Diese Reihe zeigt unsere Preisträger*innen.
Tamara Stangl, MA MA
Universität Salzburg | Kommunikation und Fundraising
Kaigasse 6 | 5020 Salzburg | Austria
Tel: +43 662 8044-2026
E-Mail an Tamara Stangl, MA MA
Foto: Manuel Lankes | © privat