Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

subjectConcept/term: Add language variants from upstream lod #73

Open
mokko opened this issue Nov 9, 2022 · 8 comments
Open

subjectConcept/term: Add language variants from upstream lod #73

mokko opened this issue Nov 9, 2022 · 8 comments
Labels
enhancement - feature request New feature or request

Comments

@mokko
Copy link
Owner

mokko commented Nov 9, 2022

FvH: schau mal diese Datei dort verwendest du das Subject set und gibst die URL aus

<lido:subjectSet lido:sortorder="5"><!--ObjKeyWordsGrp-->
   <lido:subject>
      <lido:extentSubject/>
      <lido:subjectConcept>
         <lido:conceptID lido:type="URL" lido:source="iconclass">[http://iconclass.org/41D2421
         </lido:conceptID] (http://iconclass.org/41D2421%3C/lido:conceptID)>
      </lido:subjectConcept>
   </lido:subject>
</lido:subjectSet>

[MM: Obiges XML scheint nicht richtig formatiert zu sein; sieht aus wie ein Copy/Paste Fehler.]

FvH:
Ich dachte dafür würdest du das Vokabularmodul auswerten. es wäre einfach super wenn im set auch der Term stehen würde ähnlich wie unten
Bitte mit der xml:lang="de" oder welche Sprachen auch immer verwendet wurden

<lido:subjectSet lido:sortorder="10"><!--Europeana-Fashion##Material##Materialien zur Dekoration, Besatz und technischen Ausrüstung##Werkstoffe pflanzlichen Ursprungs##Holz-->
   <lido:displaySubject xml:lang="de">Holz</lido:displaySubject>
      <lido:subject>
         <lido:subjectConcept>
            <lido:conceptID lido:type="local" lido:source="SMB/RIA">4254553</lido:conceptID>
            <lido:conceptID lido:type="URI" lido:source="aat">[http://vocab.getty.edu/aat/300011914</lido:conceptID](http://vocab.getty.edu/aat/300011914%3C/lido:conceptID)>
            <lido:conceptID lido:type="URI" lido:source="europeanafashion">[http://thesaurus.europeanafashion.eu/thesaurus/10577</lido:conceptID](http://thesaurus.europeanafashion.eu/thesaurus/10577%3C/lido:conceptID)>
           <lido:term xml:lang="de">Holz</lido:term>
      </lido:subjectConcept>
   </lido:subject>
</lido:subjectSet>
@mokko
Copy link
Owner Author

mokko commented Nov 9, 2022

Da das XML oben Probleme hat, suche ich ein besseres Beispiel. Ich gucke also in meiner letzten Version des gleichen Projekts (20221009\KB-zeichnetMode-join-group182397-links.lido.xml) und finde dort beispielsweise

<lido:subjectWrap>
   <lido:subjectSet><!--Europeana-Fashion##Modeobjekte##Kleidung##trägerspezifische Kleidung##Damenbekleidung-->
      <lido:displaySubject xml:lang="de">Damenbekleidung</lido:displaySubject>
      <lido:subject>
         <lido:subjectConcept>
            <lido:conceptID lido:type="local" lido:source="SMB/RIA">4254882</lido:conceptID>
            <lido:conceptID lido:type="URI" lido:source="aat">http://vocab.getty.edu/aat/300379344</lido:conceptID>
            <lido:conceptID lido:type="URI" lido:source="europeanafashion">http://thesaurus.europeanafashion.eu/thesaurus/10434</lido:conceptID>
            <lido:term xml:lang="de">Damenbekleidung</lido:term>
         </lido:subjectConcept>
      </lido:subject>
   </lido:subjectSet>
   <lido:subjectSet><!--Europeana-Fashion##Modeobjekte##Visuelle und verbale Kommunikation##analoge Medien##Zeichnung-->
      <lido:displaySubject xml:lang="de">Zeichnung</lido:displaySubject>
      <lido:subject>
         <lido:subjectConcept>
            <lido:conceptID lido:type="local" lido:source="SMB/RIA">4254998</lido:conceptID>
            <lido:conceptID lido:type="URI" lido:source="aat">http://vocab.getty.edu/aat/300033973</lido:conceptID>
            <lido:conceptID lido:type="URI" lido:source="europeanafashion">http://thesaurus.europeanafashion.eu/thesaurus/10307</lido:conceptID>
            <lido:term xml:lang="de">Zeichnung</lido:term>
         </lido:subjectConcept>
      </lido:subject>
   </lido:subjectSet>
   <lido:subjectSet lido:sortorder="1"><!--Europeana-Fashion##Modeobjekte##Kleidung##wichtigste Kleidungsstücke##wichtigste, den ganzen Körper bedeckende Kleidungsstücke##Kleid-->
      <lido:displaySubject xml:lang="de">Kleid</lido:displaySubject>
      <lido:subject>
         <lido:subjectConcept>
            <lido:conceptID lido:type="local" lido:source="SMB/RIA">4254938</lido:conceptID>
            <lido:conceptID lido:type="URI" lido:source="aat">http://vocab.getty.edu/aat/300046159</lido:conceptID>
            <lido:conceptID lido:type="URI" lido:source="europeanafashion">http://thesaurus.europeanafashion.eu/thesaurus/10005</lido:conceptID>
            <lido:term xml:lang="de">Kleid</lido:term>
         </lido:subjectConcept>
      </lido:subject>
   </lido:subjectSet>
</lido:subjectWrap>

@mokko
Copy link
Owner Author

mokko commented Nov 9, 2022

@FrankvonHagel: Dort ist doch schon Kleid als xml:lang="de" gekenzeichnet. Möchtest du ersthaft, dass ich URLs auch mit Sprachen kennzeichne? xml:lang ist in conceptID in Spec nicht vorgesehen. Also verstehe ich offensichtlich nicht, was du haben möchtest.

@mokko
Copy link
Owner Author

mokko commented Nov 9, 2022

Und nochmal als Hintergrund: Da ich ja URL nicht aus dem Vokabular-Modul über Schnittstelle von RIA herausbekommen habe, habe ich das Mapping in einer separaten Datei abgelegt (vocmap.xml). Das ist natürlich keine optimale Lösung. Besser wäre natürlich, wenn das Mapping komplett in RIA wäre.

Dort steht so etwas wie

<voc name="subjects">
   <!-- sort source alphabetically please -->
   <concept>
	<source lang="de">Anzug</source>
	<target name="aatUri">http://vocab.getty.edu/page/aat/300209863</target>
	<target name="fashionUri">http://thesaurus.europeanafashion.eu/thesaurus/10015</target>
   </concept>
   <concept>
	<source lang="de">Armband</source>
	<target name="aatUri">http://vocab.getty.edu/aat/300045991</target>
	<target name="fashionUri">http://thesaurus.europeanafashion.eu/thesaurus/10164</target>
   </concept>
...

@FrankvonHagel
Copy link

FrankvonHagel commented Nov 17, 2022

Ich weiß0 nicht ob ich es richtig verstehe. Aber die
http://vocab.getty.edu/page/aat/300209863
http://thesaurus.europeanafashion.eu/thesaurus/10015
sind doch die URLs für dem Term "Anzug" würden also in concept ID gehören.

Toll wären nun die anderen Sprachangaben die in ID ID 4254931 stecken. keine Ahnung ob du daran kommst
Anzug -> de
κοστούμια -> el
suits (main garments) -> en
costume -> fr
חליפות
-> he
completi -> it
pakken (kleding) -> nl

@mokko
Copy link
Owner Author

mokko commented Nov 17, 2022

Dann müsste ich ein API von Getty bzw. Europeana mit der bekannten URL anfragen und die Varianten bei uns eintragen. Geht, wenn so ein API frei zugänglich ist. Aber warum muss ich das machen? Können das nicht die Portale machen? Ist das wirklich das Wichtigste, was Du von mir brauchst? Dann würde ich dir das vielleicht Weihnachten schreiben, ich wette aber dir fällt noch etliches andere ein.

@mokko
Copy link
Owner Author

mokko commented Nov 17, 2022

sind doch die URLs für dem Term "Anzug" würden also in concept ID gehören.

Das steht doch in Lido auch in conceptID. Guck mal nach.

@mokko mokko changed the title subjectConcept/term: Sprachauszeichnung subjectConcept/term: Add language variants from upstream data source Nov 17, 2022
@mokko
Copy link
Owner Author

mokko commented Nov 18, 2022

sind doch die URLs für dem Term "Anzug" würden also in concept ID gehören.

Das steht doch in Lido auch in conceptID. Guck mal nach.

@mokko mokko added enhancement - feature request New feature or request and removed question labels Nov 18, 2022
@mokko
Copy link
Owner Author

mokko commented Nov 18, 2022

Bevor wir Sprachvarianten aus Normdaten importieren, was zwar zu redundanter Datenhaltung führt (bei Normdaten und bei uns), aber als teilweise Übersetzung der Daten fungiert, sollten wir zunächst einen Lookup implementieren, bei dem wir Begriffe in unserem System halb automatisch im entfernten System nachschlagen und so die ID bei uns eintragen.

Damit würden wir das Ausfüllen von vocmap.XML teilweise automatisieren.

@mokko mokko changed the title subjectConcept/term: Add language variants from upstream data source subjectConcept/term: Add language variants from upstream lod Nov 18, 2022
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement - feature request New feature or request
Projects
None yet
Development

No branches or pull requests

2 participants