Page MenuHomePhabricator

[REQUEST] WMTW facebook page want to have zhwiki yearly-aggregate top 10 articles viewed in 2016.
Closed, ResolvedPublic

Description

What's requested:

  • (en) Wikimedia Taiwan facebook page editor would like to request the year-aggregate(2016/1/1-12/31) top 10 most viewed pages on Chinese Wikipedia.
  • (zh-hant) 台灣分會想知道中文維基百科2016-1-1到12-31全年總閱讀量的前十個條目

Why it's requested:

  • (en) The statistics data related to Chinese Wikipedia is always hot topic to post on social media. It would be a nice piece of material if we can get the raw data and post it on our social media for making it viral.
  • (zh-hant) 中文維基百科相關的統計數據是社群媒體上很有趣的話題,如果有相關的數據,我們可以在社群媒體上發布,引起討論。

When it's requested:

  • (en) As soon as possible, it would be still a trendy topic during the first week of 2017, before the second week.
  • (zh-hant) ASAP,在1月第二週前能夠出來,都還可以操作。

Other helpful information:

Event Timeline

I was wondering if anyone could gather such data myself and find out how to.
So I searched for "wiki page views".
One result was https://en.wikipedia.org/wiki/Wikipedia:Statistics#Page_views
That page links to https://tools.wmflabs.org/pageviews/ .
That page has a link "topviews" to https://tools.wmflabs.org/topviews/ .
On Top Views, unfortunately "Date type" does not offer "Yearly" but only "Monthly".
So if gathering the data through some UI is possible through some other way, it seems to not be very obvious how. :(

@Shangkuanlc : Query for the top 100 is running, will post the result here once it has completed. As mentioned earlier, it will need some manual cleanup to extract the top 10 articles (essentially just removing non-mainspace entries; which would be tricky to do within that database query).
@Aklapper: Thanks for your research - FYI, this task came out of a Facebook discussion where I had already noted that this particular question is probably easiest to answer via a direct query of the - internal - pageview_hourly database. It might indeed be worth adding a "yearly" option to https://tools.wmflabs.org/topviews/ as this is a recurring question (I ran a similar query for the WMF Communications team last year).

@Tbayer & @Aklapper : Thank you for the instant response. My feedback would be double yes. Yes we can manually screen the top 100, and yes the yearly button would help greatly if it is possible.

The query result is below (it actually took less than an hour to complete). Looks like entertainment topics were popular. This should be enough information for you to generate the actual top 10 articles list, by restricting to mainspace (and also removing the entry for the minus sign page, which does not correspond to real views for that page, as explained e.g. in a recent thread on Analytics-l). Let me know in case there are further questions.

SELECT CONCAT('https://zh.wikipedia.org/wiki/',page_title), SUM(view_count) AS views
FROM wmf.pageview_hourly
WHERE
   year = 2016
   AND project = 'zh.wikipedia'
   AND agent_type = 'user'
GROUP BY page_title
ORDER BY views DESC LIMIT 100;

_c0     views

https://zh.wikipedia.org/wiki/Wikipedia:首页 78681290
https://zh.wikipedia.org/wiki/Special:搜索 31770108
https://zh.wikipedia.org/wiki/- 19893954
https://zh.wikipedia.org/wiki/Special:链接搜索 7752836
https://zh.wikipedia.org/wiki/Running_Man 6697490
https://zh.wikipedia.org/wiki/太陽的後裔 5273920
https://zh.wikipedia.org/wiki/瑯琊榜_(電視劇) 3824878
https://zh.wikipedia.org/wiki/我是歌手_(第四季) 3697336
https://zh.wikipedia.org/wiki/甘味人生 3528805
https://zh.wikipedia.org/wiki/芈月传 3326844
https://zh.wikipedia.org/wiki/馬惜珍家族 3264002
https://zh.wikipedia.org/wiki/马澄坤 3136751
https://zh.wikipedia.org/wiki/TWICE 3032802
https://zh.wikipedia.org/wiki/宋仲基 2992646
https://zh.wikipedia.org/wiki/月之戀人-步步驚心:麗 2619959
https://zh.wikipedia.org/wiki/Special:监视列表 2531415
https://zh.wikipedia.org/wiki/你的名字。 2379038
https://zh.wikipedia.org/wiki/1989一念間 2324335
https://zh.wikipedia.org/wiki/Special:用户登录 2312893
https://zh.wikipedia.org/wiki/Doctors 2295200
https://zh.wikipedia.org/wiki/W_(電視劇) 2146014
https://zh.wikipedia.org/wiki/終極一班4 2140015
https://zh.wikipedia.org/wiki/防彈少年團 2138730
https://zh.wikipedia.org/wiki/雲畫的月光 2125985
https://zh.wikipedia.org/wiki/奔跑吧兄弟 2117197
https://zh.wikipedia.org/wiki/綜藝玩很大 2115774
https://zh.wikipedia.org/wiki/Re:從零開始的異世界生活 2098864
https://zh.wikipedia.org/wiki/女医·明妃传 1821190
https://zh.wikipedia.org/wiki/EXO 1805659
https://zh.wikipedia.org/wiki/愛上哥們 1737683
https://zh.wikipedia.org/wiki/周子瑜 1659986
https://zh.wikipedia.org/wiki/一把青_(電視劇) 1657532
https://zh.wikipedia.org/wiki/城寨英雄 1612823
https://zh.wikipedia.org/wiki/六四事件 1612169
https://zh.wikipedia.org/wiki/我的老師叫小賀 1594128
https://zh.wikipedia.org/wiki/霍建華 1576432
https://zh.wikipedia.org/wiki/微微一笑很傾城 1542096
https://zh.wikipedia.org/wiki/习近平 1538065
https://zh.wikipedia.org/wiki/後菜鳥的燦爛時代 1530614
https://zh.wikipedia.org/wiki/胡歌 1518953
https://zh.wikipedia.org/wiki/自殺突擊隊 1513404
https://zh.wikipedia.org/wiki/Special:Search 1500824
https://zh.wikipedia.org/wiki/Wiki 1488818
https://zh.wikipedia.org/wiki/我的極品男友 1485012
https://zh.wikipedia.org/wiki/朴寶劍 1478184
https://zh.wikipedia.org/wiki/首页 1474260
https://zh.wikipedia.org/wiki/SpeXial 1439116
https://zh.wikipedia.org/wiki/蔡英文 1429324
https://zh.wikipedia.org/wiki/2016年美國總統選舉 1407609
https://zh.wikipedia.org/wiki/唐納德·川普 1407251
https://zh.wikipedia.org/wiki/我和我的十七歲 1385721
https://zh.wikipedia.org/wiki/任意依戀 1379579
https://zh.wikipedia.org/wiki/殭 1373667
https://zh.wikipedia.org/wiki/宋慧喬 1369708
https://zh.wikipedia.org/wiki/Running_Man節目列表 1349599
https://zh.wikipedia.org/wiki/ONE_PIECE 1347262
https://zh.wikipedia.org/wiki/2016年Running_Man節目列表 1319260
https://zh.wikipedia.org/wiki/精灵宝可梦系列 1317906
https://zh.wikipedia.org/wiki/藍色海洋的傳說 1314804
https://zh.wikipedia.org/wiki/又,吳海英 1280061
https://zh.wikipedia.org/wiki/孤單又燦爛的神-鬼怪 1264338
https://zh.wikipedia.org/wiki/名偵探柯南動畫集數列表 1247413
https://zh.wikipedia.org/wiki/春花望露 1243772
https://zh.wikipedia.org/wiki/中華民國 1236217
https://zh.wikipedia.org/wiki/請回答1988 1231507
https://zh.wikipedia.org/wiki/臺灣 1180789
https://zh.wikipedia.org/wiki/玖壹壹 1160423
https://zh.wikipedia.org/wiki/第88屆奧斯卡金像獎 1150202
https://zh.wikipedia.org/wiki/花千骨 1147331
https://zh.wikipedia.org/wiki/捕鼠器裡的奶酪 1141054
https://zh.wikipedia.org/wiki/火影忍者 1135583
https://zh.wikipedia.org/wiki/死侍 1128138
https://zh.wikipedia.org/wiki/2016年夏季奧林匹克運動會 1115120
https://zh.wikipedia.org/wiki/暗殺教室 1113045
https://zh.wikipedia.org/wiki/青云志 1109497
https://zh.wikipedia.org/wiki/中华人民共和国 1109089
https://zh.wikipedia.org/wiki/飛魚高校生 1104828
https://zh.wikipedia.org/wiki/朴信惠 1093430
https://zh.wikipedia.org/wiki/BIGBANG 1078969
https://zh.wikipedia.org/wiki/李鍾碩 1073952
https://zh.wikipedia.org/wiki/無限挑戰 1071005
https://zh.wikipedia.org/wiki/2016年中華民國立法委員選舉 1062655
https://zh.wikipedia.org/wiki/滾石愛情故事 1054103
https://zh.wikipedia.org/wiki/趙麗穎 1050169
https://zh.wikipedia.org/wiki/GFRIEND 1047989
https://zh.wikipedia.org/wiki/嫉妒的化身 1041020
https://zh.wikipedia.org/wiki/江泽民 1035924
https://zh.wikipedia.org/wiki/狼王子 1026486
https://zh.wikipedia.org/wiki/逃避雖可恥但有用 1012396
https://zh.wikipedia.org/wiki/香港 1008059
https://zh.wikipedia.org/wiki/幕後玩家 999882
https://zh.wikipedia.org/wiki/我們結婚了 999003
https://zh.wikipedia.org/wiki/植劇場 998543
https://zh.wikipedia.org/wiki/必娶女人 994676
https://zh.wikipedia.org/wiki/日本 992883
https://zh.wikipedia.org/wiki/周杰倫 988354
https://zh.wikipedia.org/wiki/我是歌手 979544
https://zh.wikipedia.org/wiki/黃致列 976600
https://zh.wikipedia.org/wiki/THE_K2 970506
https://zh.wikipedia.org/wiki/我的少女時代 969338

100 rows selected (2830.778 seconds)
Beeline version 1.1.0-cdh5.5.2 by Apache Hive

(NB: For convenience I included the link to the desktop version for each page, but the numbers refer to the aggregate pageviews for desktop, mobile web and apps.)

Offtopic: @Aklapper, since you are here, any ideas why the string "1073952" in the previous comment auto-links to https://phabricator.wikimedia.org/rPWBC107395203dd361b48b0bd678eda00074d66d83af ? Is this a bug in Phabricator?

Thanks you. I am forwarding this to Reke. The related post will be shown in facebook page https://www.facebook.com/WSOTK/ later this week.

(For the archives: the resulting FB post is here.)

Also, here is a FB video broadcasting also used this data (“一直剝維基, Keep Peeling Wiki", a livecast talkshow the chapter launched since December, 2016) , see 1:09-11:00.