Page MenuHomePhabricator

Kansallisgallerian kuvien tunnistaminen
Open, In Progress, Needs TriagePublic

Description

Kansallisgalleriasta (kokoelmat.fng.fi) on tuotu Commonsiin kuvia, joissa oleva tunnistenumero löytyy Finnasta.

Tunniste ei ole suoraan käytettävissä vaan vaatii hieman päättelyä Finna-API:n id:tä varten.

Esimerkki:

Kuvia on tuotu myös flickr:stä:

Ja joitakin on tuotu Europeanasta.

Selvitä accession numberin perusteella Finnan hyväksymä tunniste?
Kansallisgallerian API:lla voi saada tietoa?

Finnan recordista löytyy "fullRecord" kentästä XML:ää, jossa kansallisgallerian tietoja.

Event Timeline

Kansallisgalleriasta saa ladattua jsonin, jossa on kaikk(?) esineet. Tuo on parisataa megatavua, mutta siinä toistuu samoja asioita jokaisen esineen kohdalla kuten taiteilijan syntymävuosi. Varmaankin ajatuksena ollut että helpompi käsitellä noin? (78784 objectID:tä dumpissa eli varmaankin tuon verran julkisesti saatavia olevia tietoja?)

Inventaarionumerossa on vastaava accession number joka löytyy Finnasta. Kuvista luetellaan useita versioita eri koossa ja jpeg- sekä webp-muodoissa. Tekstit on monin paikoin kerrottu useammalla kielellä myös, joka myös toistuu paljon.

Lisenssi näyttää olevan järjestään CC0

Muutoin näyttää pitkälti samantapaiselta käsiteltävältä kuin Finnan API (poislukien jsonin muotoseikat)

Kaikki kuvat ovat siis CC0 ja rajapinta palauttaa julkisesti saatavilla olevat. Tiedoissa voi olla mukana ID:tä, joiden kohteet eivät ole saatavilla.

Rajapinta palauttaa gzip-pakattua jsonia ja ilman autentikointia pääsee käyttämään ("Authentication is not required.").

Wikidatassa on property Kansallisgallerian teostunniste (P9834), jota on käytetty esimerkiksi teoksen Haavoittunut enkeli (Q471289) kohdalla.

Propertyyn P9834) tulee tunnusnumero, joka on jsonissa objectId-kentässä (esim. 624337 Schjerfbeckin teokselle Toipilas (Q5478273)). Propertyyn inventaarionumero (P217) tulee inventaarionumero (esim. A I 223).
Propertyyn kuvaileva URL (P973) tulee linkki kuten http://kokoelmat.fng.fi/app?si=A+I+223

Huom: ilmeisesti fng.fi ei enää toimi ja nykyisin pitäisi käyttää urlia muotoa: https://www.kansallisgalleria.fi/fi/object/624337

P9834 käytöstä commonsin structured datassa näyttää tulevan kuitenkin herjaa:
item-requires-statement constraintHelp Discuss
An entity with Finnish National Gallery artwork ID should also have a statement location.

item-requires-statement constraintHelp Discuss
An entity with Finnish National Gallery artwork ID should also have a statement inception.

item-requires-statement constraintHelp Discuss
An entity with Finnish National Gallery artwork ID should also have a statement inventory number.

item-requires-statement constraintHelp Discuss
An entity with Finnish National Gallery artwork ID should also have a statement collection Finnish National Gallery.

allowed-entity-types constraintHelp Discuss
The property Finnish National Gallery artwork ID should not be used on this type of entity, the only valid entity type is Wikibase item.

^^^ tuo viimeinen mietityttää että mitä tuo tarkoittaa wikibase-rajoituksella ja onko tuo ilmoitu turha commonsin puolella?

Joo, ei nuo muut varoitukset sinänsä ole kovin ihmeellisiä kun ne tulee jos jokin muu arvo puuttuu. Tuo viimeinen lähinnä mietityttää:
" ID should not be used on this type of entity, the only valid entity type is Wikibase item. "
Eli onko propertyn määrityksessä jotain vikaa kun se herjaa structured datassa käytöstä?

Kansallisgallerian kuville Commonsissa näyttää järjestään olevan lähteet "references" -kentässä, jonka sisältö tulee wikidatan propertyistä. eli urlit ja lähdetiedot eivät ole suoraan commonsissa. Commonsin dokumentaation mukaan käytettyjä propertyjä ovat mm. catalog code (P528), described at URL (P973), described by source (P1343)

Kansallisgallerian api:sta saa objects-listauksen (max. 200) ilman autentikaatiota, haku id:n mukaan vaatii authentication tokenin, joka on nykyään Githubin autentikointitoken (jossa siis 2FA).

Helpompaa on ladata objects.json ja käsitellä sitä suoraan pythonissa kuin alkaa käsitellä autentikointia..

Ipr1 changed the task status from Open to In Progress.Feb 6 2024, 1:37 PM
Ipr1 moved this task from Backlog to Doing on the Fiwiki-Wikidata-Commons board.