diff --git a/README.md b/README.md index 53008c3cacd2a27080d3b921dd74ceef3e0cdedc..1645a77ad29829044040b31478b6284edb3cdc41 100644 --- a/README.md +++ b/README.md @@ -2,9 +2,9 @@ ## Queries to get data from several endpoints -* SPARQL-Endpoint (https://www.classicmayan.org/trip/dataset.html?ds=/metadata) +* SPARQL-Endpoint (<https://www.classicmayan.org/trip/dataset.html?ds=/metadata>) * TextGrid-Search -* ConedaKor (https://classicmayan.kor.de.dariah.eu/entities.json) +* ConedaKor (<https://classicmayan.kor.de.dariah.eu/entities.json>) ## Save data to TextGrid Repository @@ -17,10 +17,7 @@ Additionally it provides function to save data into the TextGrid-Repository to g Publizierfähige (Bild)-Daten und Metadaten werden von ConedaKor in das TextGrid Repository (OwnStorage) eingespielt, um dann per TextGrid OAI-PMH (MetadataFormat **oai_idiom_mets** aus Projekt „idiom“ <https://dev.textgridlab.org/1.0/tgoaipmh/oai?verb=ListRecords&metadataPrefix=oai_idiom_mets>) in die Visual Library der Uni Bonn übernehmen zu können. -(vorläufige) Beispiel-Links zur VL: - -* <https://maya.test.vls.io> -* <https://maya.test.vls.io/content/titleinfo/55267> +Link zur VL: <https://digitale-sammlungen.ulb.uni-bonn.de> #### Workflow @@ -29,7 +26,7 @@ Publizierfähige (Bild)-Daten und Metadaten werden von ConedaKor in das TextGrid * Bilder und Metadaten sind dort mit Zeitstempel versehen, d.h. wann erstellt, wann geändert, wann gelöscht. * **Nur** die Metadaten der Bilder werden von KOR nach TextGrid via KOR API geharvestet, hier wird geprüft, ob etwas neu ist (neues Bild, neuer Metadateneintrag) oder geändert bzw. gelöscht wurde (Bild geändert, bzw. Metadaten geändert, gelöscht). In den Metadaten werden dann die Bild-Links mitgeschickt, die von der Visual Library Harvest benutzt werden, die Bilder in KOR abzuholen. * Über die KOR API werden die Metadaten nun abgefragt: Harvesten, wenn etwas neu (neues Bild, neue Metadaten) ist bzw. wenn bestehende Einträge geändert wurden. -* Die Metadaten der Bilder werden dann in TextGrid importiert (non-public), damit die Bilder mit ihrer TextGRid URI aus den RDF-Formulardaten referenziert werden können. +* Die Metadaten der Bilder werden dann in TextGrid importiert (non-public), damit die Bilder mit ihrer TextGrid URI aus den RDF-Formulardaten referenziert werden können. * Gespeichert wird in der Kollektion „ConedaKORMediumMetadata“ im Projekt „idiom“, bisher 6 Unterkollektionen 1-6 mit jeweils 2500 Datensätzen. * Fragen * Wie verhält es sich, wenn Daten aktualisiert werden? Werden diese überschrieben oder blieben sie bestehen? --> Die Daten werden überschrieben (TextGrid#UPDATE), da es sich (momentan noch) nicht um publizierte Daten handelt. @@ -41,8 +38,8 @@ New ready-to-go images from ConedaKor shall be published in the TextGrid Reposit 1. Determine the latest object in project “idiom“ (TGPR-0e926f53-1aba-d415-ecf6-539edcd8a318), collection “ConedaKorMediumMetadata“: Look for the latest subcollection entry in the Navigator, “6“ at the moment, and take the date from “Last change“ or “<generic><generated><lastModified>“ value from the subcollection, please right click on the entry to “Show technical metadata“ to get the needed date. 2. Determine which data already has been imported to TG and was **updated** in ConedaKOR (for **updating** the objects in TG), **AND** which data has been **added** to ConedaKOR (for **creating** new objects)! - * Get all objects from ConedaKOR created **before THE DATE** (e.g. 2022-03-18), and modified **after THE DATE** --> <https://classicmayan.kor.de.dariah.eu/entities.json?kind_id=1&created_before=2022-03-18&updated_after=2022-03-18&include=technical,dataset> - * Get all newly created objects from ConedaKOR after **THE DATE** of latest import (e.g. 2022-03-18) --> <https://classicmayan.kor.de.dariah.eu/entities.json?kind_id=1&created_after=2022-03-18&include=technical,dataset> + * Get all objects from ConedaKOR created **before THE DATE** (e.g. 2022-03-18), and modified **after THE DATE**: <https://classicmayan.kor.de.dariah.eu/entities.json?kind_id=1&created_before=2022-03-18&updated_after=2022-03-18&include=technical,dataset> + * Get all newly created objects from ConedaKOR after **THE DATE** of latest import (e.g. 2022-03-18): <https://classicmayan.kor.de.dariah.eu/entities.json?kind_id=1&created_after=2022-03-18&include=technical,dataset> 3. Import or update all the new image metadata using the class **org.classicmayan.tools.ConedaKor2TextGridRep.java** * Check the properties file “idiomQueries.properties“ and create your own copy of it (**!DO NOT PUSH YOUR COPY INTO THE GIT REPOSITORY!**, for there are secret secrets involved!) * Set your chosen config filename in class **org.classicmayan.tools.IdiomConstants.java**. @@ -71,9 +68,9 @@ Check for newly imported/updated items in TextGrid OAI-PMH (please set timestamp * All aggregations of “ConedaKorMediumMetadata“ collection: <https://textgridlab.org/1.0/tgsearch/navigation/agg/textgrid:3x63n.0> * All children of “5“ collection: <https://textgridlab.org/1.0/tgsearch/info/textgrid:3x63m.0/children> * All children of “6“ collection: <https://textgridlab.org/1.0/tgsearch/info/textgrid:3xpzt.0/children> -* Latest object's metadata: <https://textgridlab.org/1.0/tgsearch/info/textgrid:3xsn8.0/metadata?sid=[Put in SID here]> -* Search for KOR IDs in TG metadata titles: <https://textgridlab.org/1.0/tgsearch/search?q=title:27361&sid=[Put in SID here]> -* Search for KOR IDs in TG metadata notes: <https://textgridlab.org/1.0/tgsearch/search?q=notes:27361&sid=[Put in SID here]> +* Latest object's metadata: <https://textgridlab.org/1.0/tgsearch/info/textgrid:3xsn8.0/metadata?sid=SID> +* Search for KOR IDs in TG metadata titles: <https://textgridlab.org/1.0/tgsearch/search?q=title:27361&sid=SID> +* Search for KOR IDs in TG metadata notes: <https://textgridlab.org/1.0/tgsearch/search?q=notes:27361&sid=SID> #### ConedaKOR queries diff --git a/pom.xml b/pom.xml index dc25a91f0b50e1990b5828d4a2cb56e93c9fe68f..60c24087ce91429170bc8524b72a97097fae5a07 100644 --- a/pom.xml +++ b/pom.xml @@ -12,6 +12,7 @@ <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding> <const.version>4.4.1</const.version> <cyclonedx-maven-plugin.version>2.7.0</cyclonedx-maven-plugin.version> + <java.version>1.8</java.version> <javax-mail.version>1.4.7</javax-mail.version> <jaxws-api.version>2.2.6</jaxws-api.version> <jdom2.version>2.0.6.1</jdom2.version> @@ -19,12 +20,12 @@ <jetty-maven-plugin.version>9.4.12.v20180830</jetty-maven-plugin.version> <json.version>20190722</json.version> <junit.version>4.12</junit.version> - <maven.compiler.source>1.8</maven.compiler.source> + <maven-compiler-plugin.version>3.0</maven-compiler-plugin.version> <maven.compiler.target>1.8</maven.compiler.target> <maven-deploy-plugin.version>2.8.2</maven-deploy-plugin.version> <orientdb.version>3.0.4</orientdb.version> <slf4j.version>1.7.25</slf4j.version> - <tgclient.version>4.4.3</tgclient.version> + <tgclient.version>4.5.0</tgclient.version> </properties> <dependencies> <dependency> @@ -148,6 +149,19 @@ <artifactId>maven-deploy-plugin</artifactId> <version>${maven-deploy-plugin.version}</version> </plugin> + <plugin> + <groupId>org.apache.maven.plugins</groupId> + <artifactId>maven-compiler-plugin</artifactId> + <version>${maven-compiler-plugin.version}</version> + <configuration> + <source>${java.version}</source> + <target>${java.version}</target> + <fork>true</fork> + <showDeprecation>true</showDeprecation> + <showWarnings>true</showWarnings> + <encoding>${file.encoding}</encoding> + </configuration> + </plugin> </plugins> </build> <repositories> diff --git a/src/main/java/org/classicmayan/tools/ConedaKor2TextGridRep.java b/src/main/java/org/classicmayan/tools/ConedaKor2TextGridRep.java index 93d4eeb403ad416520bab18f291f123397bb6ad6..093a616259299d9fb412d1d7a69f3005d68b5084 100644 --- a/src/main/java/org/classicmayan/tools/ConedaKor2TextGridRep.java +++ b/src/main/java/org/classicmayan/tools/ConedaKor2TextGridRep.java @@ -30,6 +30,7 @@ import org.json.JSONException; import org.json.JSONObject; import info.textgrid.clients.tgcrud.CrudClientException; import info.textgrid.namespaces.metadata.core._2010.ObjectType; +import info.textgrid.namespaces.metadata.core._2010.ProvidedType; import info.textgrid.namespaces.middleware.tgcrud.services.tgcrudservice.AuthFault; import info.textgrid.namespaces.middleware.tgcrud.services.tgcrudservice.IoFault; import info.textgrid.namespaces.middleware.tgcrud.services.tgcrudservice.MetadataParseFault; @@ -180,8 +181,15 @@ public class ConedaKor2TextGridRep { .getLatestSubcollectionObject(this.itgo.getConedaKorMediumMetadataCollectionURI()); this.latestSubcollectionURI = this.latestSubcollectionObject.getGeneric().getGenerated().getTextgridUri().getValue(); - this.latestSubcollectionTitle = - this.latestSubcollectionObject.getGeneric().getProvided().getTitle().get(0); + + // Check for null title (then SID is most likely invalid!) + ProvidedType p = this.latestSubcollectionObject.getGeneric().getProvided(); + if (p == null) { + String message = + "TextGrid metadata can not be fetched! Maybe your configuration is invalid (please check for valid RBAC Session ID in configuration!)"; + throw new IOException(message); + } + this.latestSubcollectionTitle = p.getTitle().get(0); this.latestSubcollectionSize = this.tgsearch.getChildren(this.latestSubcollectionURI); // Check for URI (and title) of latest entry in latest subcollection.