JudaicaLink Documentation

Allgemeine Informationen

  • Einführung in JudaicaLink
  • Erste Schritte
  • Häufig gestellte Fragen (FAQ)

Benutzerhandbuch

  • Übersicht des Benutzerhandbuchs
  • Suchanleitung
  • Inhaltsverhandlung
  • Datensätze in JudaicaLink

Projekte

  • JudaicaLink Labs
  • JudicaLink Seite
  • JudaicaLink Pubby
  • JudaicaLink-Generatoren
    • Funktionen der JudaicaLink-Generatoren
    • So verwenden Sie JudaicaLink-Generatoren
      • Einrichtung der Umgebung
      • Ausführen eines Generators
      • Ausführen von Django-Befehlen
      • Validierung der RDF-Ausgabe
      • Laden von Daten in JudaicaLink
    • Hinzufügen eines neuen Generators
    • Fehlerbehebung & Unterstützung
  • DjangoRDF
  • RDF-Generator

Entwicklerhandbuch

  • Setup-Anleitung
  • Bereitstellungsanleitung
  • Zu JudaicaLink-Projekten beitragen
  • API-Referenz
  • Docker-Einrichtung und Bereitstellung

Fortgeschrittene Themen

  • SPARQL-Leitfaden
  • RDF-Modell
JudaicaLink Documentation
  • JudaicaLink-Generatoren
  • Quelltext anzeigen

JudaicaLink-Generatoren

JudaicaLink Generators ist eine Sammlung von Skripten und Tools, die entwickelt wurden, um strukturierte und unstrukturierte Daten in RDF-Tripel zur Integration in den JudaicaLink-Wissensgraphen zu transformieren. Diese Generatoren nehmen Eingaben aus verschiedenen Quellen wie Websites, Tabellenkalkulationen und bibliografischen Datenbanken und konvertieren sie in Linked Data.

Funktionen der JudaicaLink-Generatoren

  • Automatische RDF-Generierung aus verschiedenen Datenformaten.

  • Datenanreicherung unter Verwendung externer Normdateien wie GND und Wikidata.

  • Stapelverarbeitung großer Datensätze.

  • Integration mit Django-Befehlen zur Verwaltung und Ausführung von Generatoren.

So verwenden Sie JudaicaLink-Generatoren

Einrichtung der Umgebung

  1. Clone the repository

git clone https://github.com/judaicalink/judaicalink-generators.git
cd judaicalink-generators
  1. Create a virtual environment (Recommended)

python -m venv venv
source venv/bin/activate  # On macOS/Linux
venv\Scripts\activate  # On Windows
  1. Install dependencies

pip install -r requirements.txt

Ausführen eines Generators

Jedes Generatorskript ist für die Verarbeitung bestimmter Datensätze verantwortlich. Um einen Generator auszuführen

python generators/<generator_script>.py

Zum Beispiel

python generators/yivo_generator.py

Ausführen von Django-Befehlen

Einige Generatoren sind in Django-Verwaltungsbefehle integriert, um eine bessere Orchestrierung zu ermöglichen. Sie können sie wie folgt ausführen:

  1. Navigieren Sie zum Projektverzeichnis

cd judaicalink-generators
  1. Run a specific Django command

python manage.py run_generator yivo

Verfügbare Befehle:

  • run_generator <dataset> – Führt einen Generator für einen bestimmten Datensatz aus.

  • list_generators – Listet alle verfügbaren Generatoren auf.

  • validate_rdf – Überprüft RDF-Ausgaben auf Fehler.

Validierung der RDF-Ausgabe

Sobald RDF-Daten generiert wurden, ist es unerlässlich, sie zu validieren, bevor sie in den Triplestore geladen werden. Verwenden Sie den folgenden Befehl

rapper -i rdfxml -o turtle output.rdf

Oder validieren Sie mit dem Django-Verwaltungsbefehl

python manage.py validate_rdf output.rdf

Laden von Daten in JudaicaLink

Nach der Validierung können RDF-Daten in den JudaicaLink SPARQL-Endpunkt geladen werden

curl -X POST --data-binary @output.rdf -H "Content-Type: application/rdf+xml" https://data.judaicalink.org/fuseki/ds/data

Alternativ, wenn Django-Befehle verwendet werden

python manage.py load_rdf output.rdf

Hinzufügen eines neuen Generators

Um einen neuen Generator zu erstellen:

  1. Erstellen Sie ein neues Python-Skript im Ordner `generators/`.

  2. Implementieren Sie die Datenextraktion und RDF-Transformation.

  3. Verwenden Sie die RDFLib-Bibliothek, um Tripel zu generieren.

1from rdflib import Graph, URIRef, Literal, Namespace
2
3g = Graph()
4jl = Namespace("https://data.judaicalink.org/ontology/")
5
6entity = URIRef("https://data.judaicalink.org/resource/example")
7g.add((entity, jl.label, Literal("Example Entity")))
8
9g.serialize("output.rdf", format="xml")
  1. Testen und validieren Sie die RDF-Ausgabe.

Fehlerbehebung & Unterstützung

  • Generator produziert keine Ausgabe? Überprüfen Sie die Datenquelle und stellen Sie sicher, dass sie zugänglich ist.

  • RDF validation errors? Run validate_rd and fix syntax issues.

  • SPARQL-Endpunkt wird nicht aktualisiert? Stellen Sie sicher, dass die RDF-Daten korrekt geladen sind.

  • Brauchen Sie Hilfe? Kontaktieren Sie uns unter https://labs.judaicalink.org/contact/

— JudaicaLink-Generatoren spielen eine entscheidende Rolle bei der Transformation von Rohdaten in Linked Open Data. Befolgen Sie bewährte Praktiken, um eine hochwertige RDF-Ausgabe sicherzustellen! 🚀

Zurück Weiter

© Copyright 2025, JudaicaLink Team.

Erstellt mit Sphinx mit einem theme bereitgestellt von Read the Docs.