Page MenuHomePhabricator

Export "Direttivo:" and "Ufficio:" namespaces from https://wiki.wikimedia.it/ to then be able to drop private contents
Closed, ResolvedPublic8 Estimated Story Points

Description

Preamble

The MediaWiki https://wiki.wikimedia.it/ has a namespace called Direttivo: that was designed to be a reserved space for board members and a namespace called Ufficio: designed to keep secret stuff of the staff. These namespaces are not readable by any normal registered user and, as a consequence, after some years, it seems now nobody 100% knows (board, staff, ecc.) what these namespaces contain.

These namespaces were also useful to write drafts, but now this practice is not in use anymore by the board. The drafts are now written on nextCloud or Etherpad.

Description of the issue

At the moment the wiki has a stable situation where our access levels just work but stuff like T270456 make us believe that it is very delicate to maintain this architecture. This creates a deadlock where you don't want to try to update your software because you don't know if this could reveal a whole range of confidential information.

See also:

At the same time, the wiki is somehow growing and the service provider asked us to keep our resources in mind to optionally do something (delete something, ecc.). Just to say that it may be related to T279144 or not.

Proposed solution

It was requested to export these namespaces (Direttivo: and Ufficio:) from https://wiki.wikimedia.it/ to then be able to delete their contents from the wiki end eventually being able to start using these namespaces for other purposes (for example, to have read-only namespaces).

To export the contents there are some ways:

Resolution checks

Mark this as resolved when, for all pages in namespace Ufficio and Direttivo:

  • you can access offline the last revision
    • in their original wikitext
    • bonus point: in an HTML export
  • you have the whole history (in native XML format or SQL format or any format suitable for import)

Once exported, these contents should be archived elsewhere (e.g. nextCloud) for historical purposes.

Any idea is welcome for this migration. Assuming that probably no one is interested in these contents until they are exported 🙄

Tools

Query that was requested by @dario.crespi.wmit to monitor the situation:

1SELECT
2 page_id,
3 page_namespace,
4 page_is_redirect,
5
6 -- show a cute name
7 CONCAT( 'Ufficio:', page_title ) page_cutetitle,
8
9 -- total number of incoming links
10 ( SELECT COUNT(*) FROM pagelinks WHERE pl_namespace = page_namespace AND pl_title = page_title ) incoming_links_total,
11
12 -- total number of incoming links from the namespace "Ufficio:" that is 114
13 ( SELECT COUNT(*) FROM pagelinks WHERE pl_namespace = page_namespace AND pl_title = page_title AND pl_from_namespace = 114) incoming_links_from_ufficio,
14
15 -- total number of incoming links from the namespace "Ufficio:" that is 102
16 ( SELECT COUNT(*) FROM pagelinks WHERE pl_namespace = page_namespace AND pl_title = page_title AND pl_from_namespace = 102) incoming_links_from_direttivo
17FROM
18 page
19
20WHERE
21 -- where the namespace is "Ufficio:" that is 114
22 -- NOTE: If you change this, change the CONCAT()
23 page_namespace = 114
24ORDER BY
25 incoming_links_total DESC

Related Objects

Event Timeline

valerio.bozzolan renamed this task from Export the whole Direttivo: namespace in https://wiki.wikimedia.it/ to Export the whole Direttivo: namespace from https://wiki.wikimedia.it/.Apr 2 2021, 1:51 PM
valerio.bozzolan triaged this task as Low priority.

eventually move the content elsewhere

Was a process devised to replace the current practice of making a draft in this namespace and then moving it to Associazione namespace?

eventually move the content elsewhere

Eventually (prima o poi) or optionally (eventualmente)?

Was a process devised to replace the current practice of making a draft in this namespace and then moving it to Associazione namespace?

Apparently no one in the board is interested in making secret drafts on a wiki or on that wiki. They prefer nextCloud or Etherpad.

There was at most an interest in having a namespace writable only by the board but still readable by anyone, but that's a second step.

Apparently no one in the board is interested in making secret drafts on a wiki or on that wiki.

Hard to believe: just last month they drafted a page in the Direttivo namespace and then moved it out of it.

OK. I've talked with @Ysogo who is now aware of this issue and very excited in seeing this namespace destroyed excruciatingly. asd

valerio.bozzolan renamed this task from Export the whole Direttivo: namespace from https://wiki.wikimedia.it/ to Export "Direttivo:" and "Ufficio:" namespaces from https://wiki.wikimedia.it/ to then be able to drop private contents.Jul 30 2021, 9:41 AM
valerio.bozzolan set the point value for this task to 8.

This is happening right now and will be concluded this week. I've sent a reminder to staff and board.

(Language: it)

Comunicazione tecnica wikina

Segnalo che gli sviluppatori che si stanno occupando della pulizia dei namespace "riservati" della wikina (Ufficio e Direttivo) hanno iniziato e quasi completato le lavorazioni.

Se per caso ci viene in mente qualche pagina in questi namespace che è importante / recente / con ultime modifiche, consiglierei di verificare che contenga informazioni pubblicabili e consiglierei semplicemente di pubblicarla in un altro namespace.

In caso non si possa pubblicare in altri namespace (ad esempio perchè contiene email o altre info personali), consiglio allora di migrare il singolo contenuto nella nostra nextCloud o su un CryptPad per continuare a fare modifiche in tranquillità e in riservatezza sul singolo documento.

Detto ciò NON è necessario trasferire in blocco a mano tutto quanto:

Senza nessuna azione manuale, i namespace Ufficio e Direttivo (e le loro talk) saranno comunque archiviati e accessibili su nextCloud (separato dalla wikina) affinchè per eventuali ripensamenti si possa riaccedere a questi vecchi contenuti.

Fra oggi e domani questi namespace saranno semplicemente messi in protezione di scrittura, per qualche giorno (affinché ci sia un po' di tempo per riprendere consapevolezza su tali contenuti e dare altri suggerimenti o segnalazioni). Poi si procederà ad eliminare questi contenuti riservati e a lasciarli solo su nextCloud.

Ricordo che tutto questo è stato fatto per tentare di semplificare la gestione degli accessi della wikina, e semplificare le discussioni sull'aggiunta di possibili altre estensioni, come VisualEditor (che al momento è in stallo per legittimi motivi di sicurezza su potenziali pubblicazioni involontarie di documenti riservati - dato che MediaWiki non è progettato per proteggere segreti).

Non influirĂ  molto ma magari si libererĂ  anche un po' di spazio sul server di Gvf che ce l'ha chiesto da tempo, anche se su questo in realtĂ  ha influito sicuramente di piĂą la pulizia fatta da Nemo, svuotando GB e GB di cache.

A disposizione per chiarimento da poter girare a me in privato o a Paolo Mauri o a Francesca Lissoni.

semplificare le discussioni sull'aggiunta di possibili altre estensioni, come VisualEditor

Improbabile. Finché esiste il namespace Associazione, non cambia nulla su questo fronte. L'unico cambiamento significativo sarebbe avere due wiki separati, uno interamente pubblico e l'altro con namespace privati. Questa possibilità è stata considerata molti anni fa ma è stata considerata poco prioritaria dal 2015 in poi, quando si è cominciato a pensare che il sito pubblico principale fosse quello in Wordpress.

Sì c'è da continuare a sensibilizzare i soci sul corretto uso della wikina evitando di incoraggiare l'uso di questa MediaWiki per tenere informazioni segrete.

Il namespace Associazione deve continuare ad essere pensato come strumento di comodity, non di security, quindi per creare ambienti "pubblicati ma ragionevolmente meno pubblici". Quindi, nel caso qualche informazione fosse pubblicata, per volere o per errore, ogni successiva risoluzione sarĂ  applicata soltanto per continuare con questa comoditĂ , non per risolvere millantati problema di sicurezza o di data leak (oltretutto quando la licenza giĂ  incoraggia la copia e la diffusione di questi contenuti).

segnalo che ns Ufficio ora contiene solo redir orfani (check via query), è quindi eliminabile
ns Direttivo in progress

For the records the extension Nuke only works on recent changes so we've installed the extension DeleteBatch, activated just for the IP address of @dario.crespi.wmit.

BTW the extension DeleteBatch needed an hammer hit. Here for posterity:

https://github.com/valerio-bozzolan/mediawiki-extensions-DeleteBatch/commit/8abecc58ef3402e85d95f6a5596f3fd6b2658dda