Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

FlixBus/DELFI: Haltestellenname nicht valide #128

Open
dancesWithCycles opened this issue Apr 2, 2023 · 9 comments
Open

FlixBus/DELFI: Haltestellenname nicht valide #128

dancesWithCycles opened this issue Apr 2, 2023 · 9 comments
Labels
DELFI Falsche Angaben Hier liegt ein inhaltlicher Fehler vor

Comments

@dancesWithCycles
Copy link

Referenz

Hallo liebe Mitmenschen,
Auf der Webseite gtfs.delfi.swingbe.de fuehrt ein Report-Link zur Auswertung vom Delfi-Datensatz im GTFS-Format.

Screenshot_2023-04-02_15-53-41

Dieser Report wird jeden Dienstag und Donnerstag erstellt und ist hier abrufbar.

Beschreibe den Fehler

Die Haltestelle

"000000012215","","Inowrocław, Nr 3432C ul. Bpa. Antoniego Laubitza - Bazylika ",,"52.799743000000","18.262939000000",0,,0,"",""

beinhaltet ein Leerzeichen am Ende und der Name scheint nicht valide zu sein, wenn ich ihn mit OSM vergleiche.

Screenshot_2023-04-02_15-57-31

Screenshot_2023-04-02_15-58-15

Diese Haltestelle wird von dieser Fahrt verwendet.

"4781294_3",21523,2078129664,"Toruń, dworzec autobusowy","",0,,187886,0,1

Diese Fahrt ist in dieser Route/Linie enthalten.

"4781294_3",13794,"N1335","Torun - Berlin - Frankfurt - Paris - Troyes",3,"73D700","FFFFFF",""

Diese Linie wird dem folgenden Unternehmen zugeordnet.

13794,"FlixBus-de","https://www.delfi.de","Europe/Berlin","",""

Jetzt zu meiner Frage:

  • Wer ist fuer die Erstellung dieser Daten verantwortlich? Auf der Webseite von Delfi finde ich nur Kontakte zu den Bundeslaendern aber nicht zu Datenlieferenten.

Aktualisierungszeitpunkt der GTFS-Daten:

Validator version: 3.1.1

Validation date and time: 2023-03-30 at 01:12:34 CEST

Downloadlink der GTFS-Daten:

https://de.data.public-transport.earth/gtfs-germany.zip
@dancesWithCycles dancesWithCycles added the Falsche Angaben Hier liegt ein inhaltlicher Fehler vor label Apr 2, 2023
@derhuerst derhuerst added the DELFI label Apr 3, 2023
@DELFI-Team
Copy link

Hallo zusammen,

vielen Dank für den Hinweis.
Wir haben haben Ihre Anfrage an das Unternehmen "Flixbus" weitergeleitet, welches uns diese ausländische Haltestelle zuliefert und verantwortlich ist.
Wir sind grundsätzlich erster Ansprechpartner für den GTFS-Datensatz, weshalb standardmäßig bei Lieferanten die URL "www.delfi.de" hinterlegt ist und leiten Anfragen dann ggf. weiter.

Von Flixbus haben wir haben die folgende Rückmeldung erhalten:

Der vollständige Name der Haltestelle lautet:
"Inowrocław, Nr 3432C ul. Bpa. Antoniego Laubitza - Bazylika Mniejsza pw. NMP" (insgesamt 77 Zeichen).
Der Name wird aufgrund seiner Überlänge in den Daten abgeschnitten.

Systemseitig sind bei DELFI max. 30 Zeichen für Haltestellennamen möglich.
Auf die Daten der "OpenStreetMap" haben wir leider keinen Einfluss. Dort gilt möglicherweise eine andere Begrenzung der max. Zeichen für Haltestellennamen.

Viele Grüße,
Ihr DELFI-Team

@derhuerst
Copy link
Collaborator

Der vollständige Name der Haltestelle lautet: "Inowrocław, Nr 3432C ul. Bpa. Antoniego Laubitza - Bazylika Mniejsza pw. NMP" (insgesamt 77 Zeichen). Der Name wird aufgrund seiner Überlänge in den Daten abgeschnitten.

Für stop_name gilt laut Spezifikation:

Name of the location. The stop_name should match the agency's rider-facing name for the location as printed on a timetable, published online, or represented on signage. […]

Ich bin der Meinung, dass der stop_name der obengenannten Haltestelle nicht die Adresse ("Inowrocław, Nr 3432C ul. Bpa. Antoniego Laubitza") beinhalten sollte; Diese sollte in stop_desc untergebracht werden, welches wie folgt definiert ist:

Description of the location that provides useful, quality information. Should not be a duplicate of stop_name.

Anzumerken ist, dass der aktuelle (2023-05-02) Flix-GTFS-Feed diese Haltestelle nur (noch?) wie folgt ausweist:

stop_id,stop_name,stop_lat,stop_lon,stop_code,stop_desc,zone_id,stop_url,location_type,parent_station,wheelchair_boarding,stop_timezone,platform_code
1f2b61e4-9e6c-4a01-8f3b-c99833f1944c,"Inowrocław,  Laubitza",52.799743,18.262939,INW,,,,,,,Europe/Warsaw,

@derhuerst
Copy link
Collaborator

Systemseitig sind bei DELFI max. 30 Zeichen für Haltestellennamen möglich.

Im Jahr 2023 halte ich diese Beschränkung für nicht mehr akzeptabel:

  • Es gibt Haltestellen, die aus gutem Grund mit mehr als 30 Zeichen benannt sind; "Bazylika Mniejsza pw. Imienia NMP" z.B. hat 33 Zeichen; Das Problem verschlimmert sich außerdem, wenn die Beschränkung 30 Bytes definiert, und in Haltestellennamen Unicode-Zeichen außerhalb der ASCII-Plane verwendet werden (z.B. "Otto Mønsteds Plads (Rysensteensgade)" in Dänemark mit 38 Bytes).
  • Ich verstehe die Motivation, die Zeichenzahl eines Textwerts zu beschränken, um technische Fehler zu vermeiden (bspw. 10^12 Zeichen), aber 30 Zeichen erscheint mir heutzutage unnötig klein gewählt; Ich schlage als neue Beschränkung 1024 Bytes vor.

@NVBWSeifert
Copy link

es gibt in unserem Fall (DIVA Release 19) 15 Formen des Haltestellennamens. die meisten Formen des Namens sind für einen speziellen Zweck (z.B. für Fahrplandruck, für DFI, für die EFA-Auskunft, etc.). Welcher der Namensfelder dann für den GTFS-Datensatz genommen wird, ist evtl. nicht einheitlich geregelt. Es kann also sein, das die Namen eines Lieferanten kürzere Namen und eine andere Form (z.B. mit oder ohne Gemeindenamen) hat als beim nächsten. Bei dem zusammenfassen in DELFI für GTFS kann da evtl. einen Mischmasch geben. Ich wollte hier nur den technischen Background im Fall der Mentz Software DIVA geben.

@derhuerst
Copy link
Collaborator

Maybe tagging someone like @jacopofar will help clarifying which formats & GTFS fields Flix can deliver to DELFI? 🤔 (Just ignore this if it seems out-of-scope to you.)

@jacopofar
Copy link

Answering in English for rapidity: I do not work on that but maybe can help nonetheless or report to someone who knows about it.

I don't know If I understand correctly the problem, you are asking what's the logic for the name of the station in the GTFS export? Or a way to get a short name to fit the limitation of this DELFI system?

@dancesWithCycles
Copy link
Author

I don't know If I understand correctly the problem, you are asking what's the logic for the name of the station in the GTFS export? Or a way to get a short name to fit the limitation of this DELFI system?

Hi @jacopofar ,
That DELFI is using a 30 character long substring for the stop name when generating the GTFS export is one issue by itself that leads to invalid stop names according to GTFS validator tools and best practises.

Another issue is the data fusion at DELFI. Transport companies or associations from all over Germany are sending static transport data exports in maybe different file formats to DELFI on a regular basis. DELFI puts all that data together to a single German-wide GTFS file. Some transport companies or associations stick to the specification of stop name and some do not. That leads to odd observations like that one in this issue.

"Inowrocław, Nr 3432C ul. Bpa. Antoniego Laubitza - Bazylika "

A stop name containing an address and spaces at the end that does not comply with the specification and not with osm and maybe leads to other compatibility issues as well.

@jacopofar
Copy link

I see, is this data still there? The current export does seem to contain the name without the address

@derhuerst
Copy link
Collaborator

derhuerst commented May 2, 2023

I see, is this data still there? The current export does seem to contain the name without the address

Indeed!

Regardless of DELFI's specific needs (but assuming that GTFS is the format delivered to DELFI by Flix – it may be a different one), I think it would be best for Flix's GTFS feed to follow the spec as closely as possible, namely:

  • letting stop_name what is written on the local sign (usually enough information to identify/distinguish the stop within a local context), and
  • letting stop_desc contain a longer more detailed text describing the stop's location/surrounding, e.g. the full address.

Thanks for looking into this BTW!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
DELFI Falsche Angaben Hier liegt ein inhaltlicher Fehler vor
Projects
None yet
Development

No branches or pull requests

5 participants