-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Viaf Matching based on Searchindex #8
Comments
@pronguen Günter |
Hallo Günter, Danke für diesen interessanten Test! Das funktioniert tip top bei mir. Ich habe in der Morph-Datei deine "combine"-Funktion ein bisschen verändert, damit auch der Titel berücksichtigt wird (6d7ea4b). Hauptänderung ist das flushWith-Attribut mit "record" als Wert. Aber wenn der Titel von der MatchViaf-Funktion berücksichtigt ist, gibt diese dann keine Ergebnisse mehr :( Ausserdem habe ich die VIAF-Links für Nicolas Bouvier analysiert. Ergebnisse:
Mein Schluss: Um die Anzahl der Links zu reduzieren sollten wir unsere Daten nur mit den VIAF-Daten, die der Klasse "Person" sind, vergleichen. Als Vokabularname für die VIAF-ID habe ich "skos:closeMatch" verwendet:
Ein anderes Problem: die VIAF-Links werden alle zusammen geliefert. Wir brauchen nur ein Link. Fall zwei oder mehr Links für uns auch ok sind, sollen diese Links in unterschiedlichen Tags erscheinen. Deshalb soll (glaube ich) deine Funktion verändert werden, damit sie die VIAF-Links als unterschiedliche Streams liefert. Nicolas |
Hallo Nicoals, freut mich, dass es bei Dir gleich geklappt hat und danke für die Auswertungen. Meine Antwort jetzt nur kurz, ich bin heute ein wenig kränklich und werde kaum arbeiten können. Hier kurze Anmerkungen:
Wenn wir nichts mehr voneinander hören - schönes Wochenende. Nächste Woche bist Du wieder n den Ferien? |
Ja, ich bin sicher, dass der Titel geliefert wird. Ich hatte es gestern getestet. Ergebnis der Regel ohne Postprocess:
|
@pronguen @oschihin @sschuepbach @fxbensmann
Hallo Nicolas,
wie gestern im skype erwähnt, habe ich mich gestern Nachmittag damit beschäftigt, unsere aktuellen Transformationen mit einem Matching gegen VIAF zu erweitern.
Wenn Du diesen Mechanismus benutzen möchtest, musst Du einen Update auf das repository mfWorkflows laufen lassen und Dir die neueste library
https://drive.switch.ch/public.php?service=files&t=04787368f4d733e6279c01aae7891cfd
als Plugin herunterladen.
Neu gibt es in der config Datei
https://github.com/linked-swissbib/mfWorkflows/blob/master/config/java-options.conf
einen Eintrag (-DindexURL=http://sb-s8.swissbib.unibas.ch:8080/solr/viaf), der es der MF Funktion ermöglicht, Autoren gegen den bei uns aufgebauten VIAF Index zu matchen.
Im Moment benutze ich nur Personennamen, keine Körperschaften und Kongresse.
Ein kleines Testergebnis hier:
https://github.com/linked-swissbib/mfWorkflows/blob/master/src/main/resources/transformation/person/personOutputviaf.rdf
Wie wir die gewonnen IDs weiterverarbeiten, müssen wir uns noch überlegen. Möglicherweise in einem Folgecommand, darüber möchte ich mir aber auch noch mit Sebastian Gedanken machen.
Für den Testauthor Bouvier matchen recht viele IDs.
Ich habe mir Viaf ein wenig (allerdings natürlich noch nicht ausreichend) angesehen.
Eine mögliche Einschränkung wäre der Einbezug eines 'Werkattributs'. Ich bezeichne das mal so, wohl nicht sehr bibliothekarisch...
Hier im Morphscript:
https://github.com/linked-swissbib/mfWorkflows/blob/master/src/main/resources/transformation/person/personOutputviaf.rdf
Leider wird der value im combine tag nicht berücksichtigt. Im Moment weiss ich nicht warum.
Hast Du eine Idee?
Meine Bitte(n):
Dieses Verfahren ersetzt natürlich nicht die Methoden und Mechanismen von Felix. Wir werden heute beginnen, bei uns in Basel die Infrastruktur von Gesis aufzubauen, um seine Verfahren bei uns nachvollziehen und begleiten zu können. Am Ende werden wir -hoffentlich- ein "best of" erhalten.
Matchingverfahren und daraus Ergebnisse zu erzielen hat für mich im Moment eine sehr hohe Priorität. Wir brauchen das unbedingt, um unsere Projektziele zu erreichen. Wue gestern bereits im Skype kurz angesprochen, gibt es hier im Moment recht viele Aktivitäten. Weitere sind:
Weitere sind zum Beispiel:
https://librecatproject.wordpress.com/2015/06/03/matching-authors-against-viaf-identities/
oder
https://twitter.com/infolis_project
(ein Projekt an dem Gesis ja auch beteiligt ist)
Erstmal soviel,
Günter
The text was updated successfully, but these errors were encountered: