Das Projekt ist im Rahmen des Kultur-Hackathons für offene Kulturdaten Coding da Vinci Süd 2019 entstanden.
Kommt bei Ihnen zu Hause immer nur das Gleiche auf den Tisch? Sind Sie auf der Suche nach kulinarischer Vielfalt in Ihrem Alltag? Noch ist nicht Hopfen und Malz verloren!
Die „Schmankerl Time Machine“ lädt Sie zu einem lukullischen Streifzug durch die traditionsreiche Münchner Wirtshausgeschichte der vergangenen 150 Jahre ein. Verschaffen Sie sich einen Überblick über die Legenden am Münchner Gastrohimmel, über verglühte Sterne und nie verblühende Evergreens. Stellen Sie sich aus einem Portfolio von über 380 Speisekarten und den damit verlinkten Rezepturen Ihr unvergessliches Menü von Morgen zusammen. Wie wäre es mit einem Hummercocktail, gefolgt vom Hasen in der Terrine und Rehnüsschen, Fürst Pückler als krönendem Abschluss? Lassen Sie sich bei Ihrer Menükreation von den Vorschlägen anderer Nutzer inspirieren. Laden Sie die Speisekarte Ihres favorisierten Münchner Genusstempels hoch, um das Angebot noch zu erweitern.
Let’s Schmankerl!
Eine ausführliche Projektbeschreibung kann unter PROJEKTBESCHREIBUNG.md eingesehen werden.
Ein Snapshot der extrahierten Daten ist im Ordner Daten zu finden.
- addresses Adressen, die in den Speisekarten annotiert wurden.
- categories Kategorien der Speisen und Getränke (Vorspeisen, Hauptgerichte etc.).
- entries Verknüpfung der Speisen und Getränke zu den Speisekarten, inkl. Preis und Mengenangaben.
- items Beschreibung der Speisen und Getränke.
- menus Metadaten zu den Speisekarten.
- owners Inhaber der Lokalitäten, die in den Speisekarten annotiert wurden.
- recipies Verknüpfung der Speisen und Getränke zu Chefkoch.de (verfügbar unter: https://chefkoch.de/rezepte/{recipy_id}/).
- restaurants Metadaten zu den Lokalitäten.
- zones Einträge auf Speisekarten und deren Koordinaten (Bounding Boxes).
Im Ordner Notebooks befinden sich einige Beispiel-Notebooks zur Auswertung, die u. a. die zeitliche Verteilung der Speisekarten darstellen.
Im Ordner Webanwendung befindet sich der gesamte Code für die Shiny Web-Applikation, die unter https://www.dhvlab.gwi.uni-muenchen.de/schmankerltimemachine/ aktuell bei der IT-Gruppe Geisteswissenschaften gehostet wird.
Für das Extrahieren der Daten aus der aus Transkribus exportierten TEI-Datei (Koordinaten in Form von Bounding Boxes) liegt das folgende Python-basierte Skript bereit. Es erzeugt CSV-Dateien für die einzelnen Speisen und Getränke, Einträge auf Karten, Besitzer und Adressen etc.
# python >= 3.6
pip install --user -r requirements.txt
python3 extract.py TEI.xml
- Transkribus: OCR-Erfassung der Speisekarten und Werkzeug für die Annotation der Speisen und Getränke.
- RStudio Shiny-Server: Plattform für die Web-Applikation, die auf der Open-Source-Umgebung R basiert.
- Jupyter Notebooks: Python-Funktionen, die die Daten importieren, bereinigen und einige exemplarische Statistiken enthalten.
- Leaflet: JavaScript-Bibliothek für die Darstellung der interaktiven Karte(n) in der Web-Applikation.
Sämtliche Abbildungen der Speisekarten sowie die im Projekt entstandenen Daten werden im Forschungsdatenrepositorium der LMU München (Open Data LMU) dauerhaft und mittels einer DOI eindeutig referenzierbar abgelegt: https://doi.org/10.5282/ubm/data.146.
Für die Zitation des Projekts oder Teilen daraus, empfehlen wir folgende Angabe:
Cakir, Osman / Kohl, Linus / Reisser, Alexandra / Schneider, Stefanie / Schulz, Julian: Schmankerl Time Machine: Eine kulinarische Zeitreise durch die Speisekarten traditionsreicher Münchner Gaststätten. 18. Mai 2019. Open Data LMU: https://doi.org/10.5282/ubm/data.146.
Eine Spezifikation der Daten im Metadatenschema DataCite 4.2 steht zur Nachnutzung bereit: Codav DataCite. Die Spezifikation folgt der DataCite Best-Practice-Policy, die derzeit im Rahmen des Projekts eHumanities – interdisziplinär ausgearbeitet wird.
Wir freuen uns über Ihre Unterstützung bei der Annotation weiterer Speisekarten mit Transkribus. Hierfür haben wir ein Crowdsourcing Projekt angelegt. Beiträge in Form von Programmen oder Verbesserungen sind sehr willkommen: Öffnen Sie in diesem Fall bitte einen Pull-Request.
- Osman Cakir (Website, ORCID, Twitter)
- Linus Kohl (Website, ORCID, LinkedIn, Twitter)
- Alexandra Reißer (ORCID, LinkedIn, Twitter)
- Stefanie Schneider (Website, ORCID, Twitter)
- Julian Schulz (Website, ORCID, Twitter)
- Abbildungen der Speisekarten wurden unter der Lizenz CC BY-SA 4.0 von der Münchner Stadtbibliothek / Monacensia im Hildebrandhaus bereitgestellt.
- Daten, die im Rahmen des Projekts entstanden sind, unterliegen ebenfalls der Lizenz CC BY-SA 4.0.
- Quelltext unterliegt der GNU GPL v3-Lizenz.
Wir bedanken uns sehr herzlich bei den Organisatoren des diesjährigen Wettbewerbs und der Projektkoordination von Coding da Vinci.