Wikidatan, lema bakoitzak bere POS behar du, hau da, zehazki POS bat behar du. POS balio posibleetan, kaos pixka bat dago, baina kategoria nagusiak hauexek dira (SPARQL):
- substantiboa (14.493)
- aditza (3.967)
- izenondoa (3.750), adjektiboa (275) eta izenlaguna (312)
- interjekzioa (43)
- juntagailua (28) eta aurkaritzako juntagailua (24)
- adberbioa (15)
Gehiago dago, baina ganontzekoak kontuan ez hartzea proposatzen dut.
Ahotsak Wikibase-n (awb), POS lexemetan EZ BEREIZTEA proposatzen dut, hasiera batean behintzat, ahotsak-eko lema-ereduari jarraituz. Ahotsak.eus-en, lemek ez dute POS bereizketarik, hau da, "agindu" izena eta "agindu" aditzaren formak lema beraren azpian zerrendatzen dira.
Wikidaten dauden euskarazko lemak eta formak jasoko ditut awb-n, POS desberdinetako lemak batuz. Lemak wikidatan zer POS duen ere jasoko dut, informazio hori awb-n zuzenean eskuragarri izateko. Forma bakoitzaren wikidatako kokalekua kopiatuko dut. Beraz, forma bakoitzak wikidatan zer POS-ari dagokion jakiteko bidea dugu (wikidata galdetuz).