TrAIn_Connection_Prediction: TCP


Ihre Verbindungsvorhersage

Verbindung finden:


About TCP

Die Bahn bietet auf ihrer Webseite eine statische Reiseplanung an, die auf den Zeiten im Fahrplan basiert. Gerade die Fernzüge der Bahn sind aber oft verspätet, so dass man einen Anschlusszug nicht erreicht. Für Bahnfahrer ist es wichtig zu wissen, ob eine gewählte Verbindung wahrscheinlich funktionieren wird und man wie geplant am Ziel ankommt.  Unsere Künstliche Intelligenz sagt auf Basis der historischen Zugverlaufsdaten und potentiell relevanter Information wie Feriendaten oder Wetter vorher, ob man mit einer möglichen Zugverbindung auch wirklich ankommt. Eine solche Vorhersage ist nicht nur interessant für die Fahrgäste, sondern auch für die Bahn selber, da sie die Information nutzen könnte, um die Fahrpläne zu verbessern. Als Vision ließe sich mit unserem Zugverbindungsvorhersagesystem also der öffentliche Verkehr verlässlicher machen und somit den Umstieg für mehr Menschen attraktiver.
Um eine verlässliche Vorhersage zu ermöglichen, haben wir eine Vielzahl unterschiedlicher Daten zusammengetragen, was viel komplexer war als ursprünglich vermutet. Zum Beispiel gibt es kaum historische Wetterdaten, für die man nicht zahlen muss,  und viele undokumentierte und nicht funktionierende APIs der Bahn.
                Zu den von uns gesammelten Daten zählen:
                •    Historische Zugdaten und Daten aus Fahrplänen
                •    Ferien und Feiertage
                •    Wetterdaten
                •    Breiten/Längengrade und Abstände zwischen den Bahnhöfen
                Auf Basis dieser Daten haben wir verschiedene Regressionsmodelle und Classifier trainiert. Besonders der Random Forrest Classifier konnte gut verschiedene Verspätungsintervalle vorhersagen. Über eine Weboberfläche sucht der Nutzer gewünschte Verbindungen heraus und der Classifier sagt die Verspätungsintervalle vorher. Diese werden  analysiert, zu einer Verbindungswahrscheinlichkeit kombiniert und die Verbindungen dann entsprechend farblich dargestellt.
                Das Projekt ist aber noch lange nicht fertig: Uns fehlen  Informationen zu Nahverkehrszügen und wir berücksichtigen noch keine zugrundeliegende Gründe von Verspätung (wie z.B. Signalstörung). Der Prototyp ist aber voll funktionsfähig und bietet so eine gute Grundlage für weitere Arbeit an diesem spannenden Problem.