Startseite› Verbesserungsvorschläge

Standardisierte Orte

Wiesenmichel
Wiesenmichel ✭✭✭
5. December bearbeitet 5. December in Verbesserungsvorschläge

Grüß Gott,

wieder einmal nehme ich das Thema "Standardisierte Orte" auf. Zur Erinnerung wie mein Vorschlag lautet(e):

  1. FS erfasst die physischen Orte anhand ihrer Koordinaten. Der Ortsname ist keine unveränderliche, eindeutige Kennung.
  2. Die Community ergänzt die Orte mit einer virtuellen Verwaltungshierarchie, die insbesondere die zeitlichen Veränderungen erfasst.
  3. Der Eingeber sucht ledigliche den richtigen Ort für eines der Ereignisse (Geburt, Taufe, Einsegnung, Heirat, Tod, Bestattung, Wohnungswechsel usw.) heraus.
  4. Aufgrund der beiden Daten (Koordinaten, Ereignisdatum) berechnet FS die jeweils zum Ereignisdatum gültige Verwaltungshierarchie.
  5. Datumskorrekturen, Ortskorrekturen wirken sich automatisch richtig aus.
  6. Das Prüfen auf Konflikte entfällt damit ersatzlos.
  7. Wie bereits praktisch vorgestellt, kann das Erstellen der Verwaltungshierachie dynamisch erfolgen, so dass auch Fehler beim Erfassen der Hierarchie sofort korrigiert werden können.

Warum einfach, wenn es auch kompliziert geht?

Gut, diese einfache Lösung hat sicher Nebenwirkungen. Eine davon besteht darin, dass man einem fest vorgegebenen Standardisierten Ort keine Hausnummer (ggf. Straße) zuordnen kann. Schon erhebt sich die nächste Frage (oder der nächste Verbesserungsvorschlag)

Warum geht FS nicht bis auf die Ebene der Häuser herunter?

Aufgrund meiner begrenzten Ressourcen und Geschichtskenntnisse kann ich derzeit nur einen Lösungsvorschlag für einen Ort, der mich mehr interessiert, anführen. So könnte der historische Zustand am 01.12.1801 zusammen mit dem aktuellen Zustand eines fertig erfassten Ortes aussehen (ohne Gewähr)

grafik.png

Und schon sieht man, dass eine am 01.12.1801 geborene Person Österreicher war. Ja, ich sehe gleich schon weiteren Verbesserungsbedarf. Wenigstens einmal sollten die Koordinaten des Ortes angegeben werden. Langfristig kommt dann noch irgendwann die Stecknadel auf einer Landkarte hinzu. Das letzte Zeitintervall zeigt mit zusätzlich, dass es 1806 eine wesentliche Veränderung im Leben meines Probanden geben wird.

grafik.png

Genug der Geschichte. Kehren wir in die Praxis zurück.

Anlass dieses Artikels ist das Profil

https://www.familysearch.org/de/tree/person/details/KZ7J-4LT

Offensichtlich geht FS einen anderen Weg und baut eine riesige Datenbank (wenn man den IDs glauben kann) mit jedem einzelnen Ort und seinen Veränderungen auf, um dann bei der Qualitätsüberprüfung Fehlermeldungen der Art

grafik.png

Warum muss der Eingeber erst einmal eine falschen Orthierarchie auswählen?

grafik.png

Um dann von der Qualitätssicherung zu erfahren, dass seine Auswahl falsch ist, weil der Eingeber mangels der Auswahlmöglichkeiten den letzten Eintrag gewählt hat.

Nebenbei: Es würde mich brennend interessieren, welches Lomnitschka (Lomnička) im Bezirk Kralowitz gemeint ist.

grafik.png

Hier kommen wir an ein zweites Problem. Woran erkenne ich den richtigen Ort in dieser Vorschlagsammlung, die ja offensichtlich nicht nur den physischen Ort sondern auch übergeordnete (virtuelle) Verwaltungsebenen anbietet. Auch überschneiden sich die Zeitbereiche, was eigentlich unlogisch ist. Theoretisch muss ein physischer Ort eine durchgängige Verwaltungshistorie haben, ggf. muss man den Platzhalter "unbekannt" für einige Lücken einführen, um diesen Zustand zu erreichen

Aber jetzt wird es spannend, denn es gibt mehrere Lomnitschkas, und zwei davon auch noch im Bezirk Pilsen-Nord, keine 32 km auseinander. OSM macht es uns noch einfacher und färbt inzwischen seine Stecknadeln noch farbig ein:

grafik.png

Warum werden von FS keine Koordinaten angezeigt? Kennt FS diese vielleicht nicht?

Warum benutzt FS keine eindeutige Ortsbezeichnung ein? Hier 'Lomnička u Plas'. Durch die parallelen deutschen Namen gibt er weitere Probleme: Lomnitschka und Lomitschka usw.

Es gibt sicher noch mehr dazu zu sagen, Euer Waltschrat

1
1
Up Down
1 Stimmen

Active · Zuletzt aktualisiert 5. December

Kommentare

  • Wiesenmichel
    Wiesenmichel ✭✭✭
    7. December

    Grüß Gott,

    führen wir die Gedanken auf einer erweiterten Ebene fort. Das Thema heißt 'Toponym Resolution' und wird durch die KI selbst gut beschrieben.

    Toponym Resolution

    (oder Geokodierung) ist der Prozess, bei dem ein Ortsname (Toponym) in einem Text, wie z.B. "Boston", eindeutig einer realen geografischen Position (Koordinaten, Polygon) zugeordnet wird, indem Mehrdeutigkeiten (z. B. "Boston" in Massachusetts vs. "Boston" in England) durch Analyse des Textkontexts (Sprache, umliegende Orte, historische Daten) und Nutzung von Geodatenbanken (Gazetteers) aufgelöst werden, um räumliche Analysen zu ermöglichen.

     Kernaufgaben

    • Erkennung (Geotagging): Finden aller Ortsnamen in einem Text.
    • Auflösung (Geokodierung): Zuordnung jedes erkannten Toponyms zu einer eindeutigen geografischen Entität. 

    Herausforderungen

    • Mehrdeutigkeit: Namen können sich wiederholen (z.B. mehrere Orte namens "Springfield") oder variieren (z.B. "Byzantium" zu "Istanbul").
    • Kontextabhängigkeit: Die Bedeutung hängt vom umgebenden Text und Wissen ab (z.B. "Paris" in einem historischen Dokument ist anders als das heutige Paris). 

    Methoden und Techniken

    • Gazetteer-Matching: Abgleich mit Listen von Orten und ihren Geodaten.
    • Kontextanalyse: Nutzung der umgebenden Wörter (adaptive Kontextmerkmale) zur Bestimmung des richtigen Ortes.
    • Maschinelles Lernen/Deep Learning: Klassifikationsmodelle zur Entscheidung zwischen möglichen Interpretationen.
    • Referenzsysteme: Nutzung von Wissensbasen wie GeoNames oder Wikidata. 

    Bedeutung

    • Ermöglicht große semantische und geografische Analysen digitaler Textsammlungen.
    • Erlaubt das „Geotagging“ von Dokumenten, um sie auf Karten zu lokalisieren. 

    Wir haben in FS eine sehr große Textsammlung mit vielen tausend Ortsbezeichnungen, die meist untereinander im engen, lokalen Zusammenhang stehen. Bei der Transkription fallen neben den Personennamen die Ortsnamen als Nebenprodukt an.

    Mit der Geokodierung werden diese einer 'eindeutigen geografischen Entität' (sprich im Normalfall einem physischen Wohnplatz, genauer einem Haus) mit ihren Koordinaten zugeordnet (interne FS Aufgabe). Diese und nicht der Ortsname sind die unveränderbaren, eindeutigen Merkmale eines physischen Ortes. Sozusagen im Rückschritt kann man dann den Ortsnamen durch Zusätze zu einem Toponym machen, so dass der Eingeber den einigermaßen geläufigen Namen bei der Suche vorfindet.

    Im Punkt "Herausforderungen" sind die wesentlichen Probleme wie Mehrdeutigkeit und zeitliche Veränderbarkeit beschrieben. Dazu passt dann auch, das Anlegen der Verwaltungshierarchie anzugehen.

    Die feinere Granularität bis auf Hausebene herab hat den Vorteil, dass ein Koordinatenpaar zur Beschreibung ausreicht. Bei größeren Entitäten bietet sich ein Polygon an. Und schon sind wir wieder bei meinen schon einmal vorgeschlagenen Voronoi-Diagrammen, die ja nichts anderes darstellen als eine Polygonüberdeckung der Erdoberfläche mit Polygonen, deren Zentren jeweils ein zentraler Ort ist.

    In Google findet man unter dem Stichwort 'Toponym Resolution' weitere spannende Einblicke in diese Aufgabenstellung.

    Euer Waltschrat

    0
Clear
No Groups Found

Kategorien

  • Alle Kategorien
  • 538 FamilySearch-Hilfe
  • 171 Allgemeine Fragen
  • 147 Familienstammbaum
  • 22 Erinnerungen
  • 70 Suchen
  • 56 Indexierung
  • 8 FamilySearch-Benutzerkonto
  • 20 FamilySearch-Center
  • 8 Community-Zentrum
  • 147 Verbesserungsvorschläge
  • Gruppen