Page MenuHomePhabricator

Tallenna kuvasiskojen professorikuvat Wikimedia Commonsiin
Open, LowPublic

Description

Studio Kuvasiskojen kokoelmassa Finnassa on noin 2200 kuvaa. Näistä noin 100 on suomalaisista professoreista joista on fiwikissä ainakin Pajulla projekti kirjoittaa artikkelit joten kuvat voisi tallentaa commonsiin.

Esimerkkiscripti
scripti hakee Finnasta kuvasiskojen miespuoleset professorikuvat tallentaa yksi kerrallaan varmistuksen jälkeen kuvan

Huom: phash/dhash tarkistus toimii pelkästään kuvien kanssa jotka ovat indeksissä. Eli tuoreet kuvat ei löydy sillä ja scripti luottaa pelkästään yhteenvetotarkistukseen. Joskin tallennus epäonnistuu jos siellä on samalla nimellä kuva tai sha1:llä jo ennestään.

Esimerkkikuva

TODO

  • Lisää scriptiin, että se lisää structured data on commons tietoina samat tiedot kuin T338017:ssa (P195, P9478, P7482 )
  • Lisää scriptiin, että se lisää tallennuksen yhteydessä structured data on commons tietoina P6216 (copyright status) ja P275 (copyright licence tiedot
  • Lisää scriptiin, että se lisää tallennuksen yhteydessä structured data on commons tietoina P571 (inception licence) tieto
  • Tallenna miespuoleisten professorien kuvat
  • Muokkaa hakua siten, että se hakee naispuoleiset professorikuvat
  • Muokkaa "subjects" arvoista tulevia luokkia siten, että tallennettavat luokat ovat järkeviä (funktio create_categories()
  • Tallenna naispuoleisten professorien kuvat

Huomioita

  • Käytetään template:Photograph -tietolaatikkona
  • tiedoston nimeen pistetään sulkeisiin "accession number" / finnan "identifierString" yksilöimään kuvaa
  • Käsiteltävät kuvat eli Finnan hakutulokset tulee funktiosta get_finna_by_filter() ja siellä url-parametrissa "lookfor" joka rajaa tällä hetkellä tulokset sellaisiin kuviin joiden asiasanoina ovat "miesten puvut" ja "professorit"
  • scripti ei tallenna tällä hetkellä mitään structured data on commons tietoja

Event Timeline

Zache updated the task description. (Show Details)

Sellainen huomio commonsin kuvien tallennuksesta, että commonsin aktiivit arvostaa sitä, että mitä paremmin kuvat on valmiiksi luokiteltu botin toimesta, niin se on yksi syy miksi tallennan tässä tyylillä "miespuoleiset professorit", koska se on niin tarkkarajainen ryhmä että sille voi helposti lisätä luokituksia koodilla.

http://museoliittorepox.vserver.fi on lisätty commonsin MediaWiki:Copyupload-allowed-domains sivulle joten kuvien tallennus onnistuu pywikibotilla / mediawiki API:lla suoraan urlista eikä tarvitse ladata kuvaa omalle koneelle. Tämä toimii siis siten, että uploadissa voi antaa tiedoston sijaan parametrina urlin kuvaan joka tallennetaan.

Zache triaged this task as Low priority.Aug 14 2023, 6:52 AM
  • muuta uploadia tallettamaan jotain muuta
  • subject-tagien mukaan kategorioita?
  • JOKA-kuvien sijainnin tallentaminen? (osoitteena tms. sijaintina? voi olla myös koordinaattina?)