Page MenuHomePhabricator

Strange Citoid behavior for juhaszadoszakerto.hu
Open, Needs TriagePublic

Description

https://www.juhaszadoszakerto.hu/?p=1218 ends up with

[
  {
    "key": "Q3JI4ULH",
    "version": 0,
    "itemType": "blogPost",
    "tags": [],
    "title": "A munkaidő keret szabályai",
    "blogTitle": "Juhász Adószakértő Iroda",
    "date": "2018-01-04",
    "url": "https://www.juhaszadoszakerto.hu/?p=1218",
    "abstractNote": "Amit a munkaidő keretről tudni érdemes. A munkaidőkeret a munkáltató kezében egy eszköz arra, hogy a működéséhez, a termelés sajátosságához igazítsa a munkavégzést, kiküszöbölje a hullámzó foglalkoztatást, akkor osztva be a dolgozót, amikor a munkájára szükség van. Így nem arra kell figyelnie, hogy a munkavállaló minden nap 8 órát dolgozik-e, hanem a keret szerinti óraszámmal ...",
    "language": "hu",
    "accessDate": "2018-12-25",
    "author": [
      [
        "Filed under",
        "Hírek"
      ],
      [
        "",
        "aktualitások"
      ],
      [
        "",
        "Ügyfeleinknek"
      ]
    ],
    "source": [
      "Zotero"
    ]
  }
]

That's mostly correct, but the author value is actually the category tag line ("Filed under: news, actual, for our clients"). I guess it tries to interpret any HTML element with class=byline as the author? That seems like a bad idea.

Event Timeline

Tgr created this task.Dec 25 2018, 6:31 AM
Restricted Application added a subscriber: Aklapper. · View Herald TranscriptDec 25 2018, 6:31 AM
Mvolz moved this task from Backlog to Zotero on the Citoid board.Mar 7 2019, 2:51 PM