Themenvorschlag für eine Abschlussarbeit

Prof. Dr. Jörg Roth


Data Mining zur Merkmalsextraktion aus Positionsdaten

Durch den Einsatz kostengünstiger und präziser Aufzeichnungsgeräte für geographische Positionen durch Satellitennavigation (so genannter GPS-Logger) steht eine Flut von Positionssensordaten zur Verfügung. Diese haben folgende Eigenschaften:
  • sie haben einen linienförmigem Charakter, d.h. beschreiben abgefahrene oder abgegangene Wege;
  • sie haben trotz genauer Messungen einen Sensorfehler;
  • durch die Berücksichtigung der Messzeiten erlauben sie, weitere Eigenschaften des Weges zu ermitteln, beispielsweise Fahrtrichtungen und Durchschnittsgeschwindigkeiten.
Ziel der Arbeit ist die Konzeption und Realisierung einer Werkzeugumgebung, die es ermöglicht auf der Basis der GPS-Log-Daten einfache Merkmale zu extrahieren; insbesondere sollen die linienförmigen Laufwege ermittelt werden. Darüber hinaus können weitere Eigenschaften aus den Sensordaten berechnet werden, z.B.
  • ob Wege für Fußgänger, Fahrrad oder Auto bzw. ob sie gemischt genutzt werden;
  • der Ort von Kreuzungen mit eingeschränkten Abbiegerichtungen;
  • ob Wege Einbahnstraßen sind;
  • ob für bestimmte Punkte Wartezeiten existieren (die z.B. auf Ampeln hindeuten);
  • wo Plätze liegen, z.B. Fußgängerzonen oder Parkplätze.
In dieser Arbeit soll zunächst recherchiert werden, welche Ansätze für die Merkmalsextraktion aus linienförmigen Sensordaten schon existieren. Darauf aufbauend ist ein eigener Ansatz zu entwickeln, der die folgenden Funktionen leistet:
  • Segmentierung von Sensordaten anhand der Fehlermuster und Geschwindigkeitsprofile;
  • Ermitteln der Laufwege von Kreuzung zu Kreuzung;
  • Korrektur der Sensorfehler, wenn mehrere Messungen für einen Laufweg vorliegen.
Ein entsprechender Algorithmus soll die Resultate möglichst autonom berechnen. Er soll jedoch in weitem Rahmen über Regeln konfigurierbar sein. Die Implementierung erfolgt in der Programmiersprache Java, da schon eine Reihe von Import- und Filterfunktionen in Java vorliegen. Es stehen umfangreiche GPS-Logs zur Verfügung.