Page MenuHomePhabricator

Incident Report: BigBlueButton di Ergonet non accessibile - cvs5133.ergonet.host
Closed, ResolvedPublic

Description

Questa settimana (giugno 2025) ho notato che:

Chiedo quindi cortesemente di produrre un piccolo report che possa spiegare cosa è appena successo, nel mentre che si lavora al recupero dei materiali, ASAP, se non sono stati già irrimediabilmente distrutti da Ergonet.

La distruzione di un servizio senza coinvolgere nessuno è inammissibile. Non comprendo come sia possibile che sia staff, che il consiglio direttivo, abbiano autorizzato una recessione del contratto di Ergonet:

  • 🔴 senza minimamente coinvolgere la commissione tech (di nuovo - la quale commissione ha 7 giorni per rispondere al consiglio - SE venisse contattata quando serve - e qui serviva)
  • 🔴 senza coinvolgere sufficientemente i soci / utenze potenzialmente impattate (non ho visto alcun avviso in lista soci)

Chi fa cosa

  • il recupero dei video può farlo chi può fisicamente telefonare a Ergonet ASAP (e.g. @dario.crespi.wmit ? il quale credo avesse accessi - P.S. bozz non ha accessi) - chiedo di tenere aggiornati tutti in questo task
  • questo report potrebbe farlo chi ha preso questa decisione (cioè non NanoHosting, ma chi nello staff e nel consiglio direttivo ha recesso il contratto / distrutto il servizio) spiegando come sia possibile la situazione descritta in alto.

Limitazioni di responsabilità

Invito a considerare che NanoHosting NON può essere ritenuto responsabile perché è appena arrivato e non può conoscere lo storico di Wikimedia Italia e non può conoscere quali regolamenti il consiglio direttivo debba seguire (e.g. regolamento commissioni, contattarle 7 giorni prima), ecc. quindi prego a Wikimedia Italia di non dare la colpa all'ultimo arrivato per degli errori che sono chiaramente di Wikimedia Italia.

Event Timeline

Aggiornamento lavori

La nuova macchina (https://meeting.wikimedia.it/ erogata da NanoHosting) ha importato le vecchie registrazioni video dal server di Ergonet.

Per visualizzare le registrazioni è necessario modificare i vecchi link come riportato nella guida su Wikina https://wiki.wikimedia.it/wiki/BigBlueButton nella sezione ( Migrazione 2025 )

Per quanto riguarda invece i link presenti su Moodle quest'ultimi sono stati aggiornati automaticamente dalla piattaforma e puntano già al nuovo server.

Gli utenti su Greenlight invece dovranno necessariamente registrarsi nuovamente sulla piattaforma (https://meeting.wikimedia.it/) e ricreare le stanze necessarie. L'accesso a Ergonet non permetteva la migrazione di tale software.

I membri del direttivo e dello staff (oltre a i volontari autorizzati dell'area tech) avranno accesso come amministratori su Greenlight per poter monitorare l'utilizzo di tale software.

Inoltre chi verrà autorizzato dal direttivo avrà anche accesso root alla macchina dove è situato BigBlueButton, come da contratto di fornitura.

Problematiche

Attualmente alcuni video (< 5%) sono ancora in conversione in quanto risultavano corrotti in fase di importazione da Ergonet.

Sarà mia cura aggiornarvi al più presto, su questi video mancanti.

TODO

  • Creazione nuova macchina BigBlueButton
  • Settaggio URL meeting.wikimedia.it
  • Attivazione Greenlight
  • Collegamento Moodle al nuovo server BigBlueButton
  • Importazione vecchi video-registrazioni (vedere problematiche per esiguo numero di registrazioni)
  • Fornire accesso amministrativo a membri dello staff (es: Dario Crespi)
  • Fornire accesso root a volontari dell'area Tech autorizzati dal direttivo (sotto garanzia di non compromettere l'utilizzo del software)
  • Pulizia della Wikina con archiviazione di informazioni datate e non più corrette.
NanoH changed the task status from Open to In Progress.Jun 26 2025, 2:50 PM
NanoH triaged this task as Medium priority.
NanoH moved this task from Backlog to 🏛️ Organiz/Infra on the WMIT-Infrastructure board.

Gli utenti su Greenlight invece dovranno necessariamente registrarsi nuovamente sulla piattaforma (https://meeting.wikimedia.it/) e ricreare le stanze necessarie.

OK. Grazie Fabio.

L'accesso a Ergonet non permetteva la migrazione

Quindi i video di Greenlight sono stati distrutti (dal consiglio direttivo)? Se la risposta è "forse sì" oppure "sì" oppure "non lo so", per favore domattina dalle 09:00 aiutaci a chiamare Ergonet in loop chiedendo con urgenza il recupero dati di quella Greenlight. Idealmente sarebbe chi nello staff/direttivo che ha autorizzato questa distruzione che dovrebbe occuparsene, ma nessuno lo sta facendo.

Ciao Bozz. NO attenzione.

Le registrazioni video sono state migrate da Ergonet sia quelle fatte usando Moodle SIA quelle realizzate usando Greenlight come accesso alle stanze.

Quello che NON era possibile migrare e solo il pannello Greenlight (il pannello significa le utenze con username e password e le stanze come nominativi), questo perché tale software gira su un docker il quale non era accessibile tramite accesso FTP da loro fornito. Era stata mia cura già in passato chiedere telefonicamente ad Ergonet l'accesso a tale area ma mi era stata negata per loro policy interna (l'accesso infatti richiedere di terminare un servizio docker postgress al quale si appoggia greenlight, effettuare un backup di tale DB a freddo e poi tirare su di nuovo il servizio docker - ps: il tutto si trovava nella cartella di /root che come sai è la cartella dell'amministratore del sistema).
Ergonet non permetteva l'accesso SSH che serviva proprio per migrare anche Greenlight.

Inoltre anche recuperando Greenlight non sarebbe stato possibile migrare gli URL in quanto Ergonet NON permetteva di avere un dominio personalizzato e quindi non si poteva far puntare un dominio loro sull'infrastruttura esterna di Wikimedia.
cvs5133.ergonet.host => verso un nuovo BBB esterno a loro

I video sono presenti sul nuovo server, per recuperare i link per visualizzarli è possibile seguire la guida su Wikina inerente BigBlueButton.
Brevemente basta sostituire nel link "cvs5133.ergonet.host" con "meeting.wikimedia.it".

Esempio:
https:// cvs5133.ergonet.host /playback/presentation/2.0/playback.html?meetingId=a77c4ede293a5ef7962bd1b48cea72d2d97d1372-1750943692525
https:// meeting.wikimedia.it /playback/presentation/2.0/playback.html?meetingId=a77c4ede293a5ef7962bd1b48cea72d2d97d1372-1750943692525

Fabio.

Per esempio, qui avrei un'intervista a cui dovrei ri-accedere urgentemente (che ho condotto a Deborah De Angelis circa il 5 giugno - 3 settimane fa - per l'evento MERGE-it)

https://cvs5133.ergonet.host/playback/presentation/2.0/playback.html?meetingId=52b7a394f9f3ed2e17c4d38015ccb8db67cb53e3-1749135337089

https://meeting.wikimedia.it/playback/presentation/2.0/playback.html?meetingId=52b7a394f9f3ed2e17c4d38015ccb8db67cb53e3-1749135337089

Però non è accessibile, 404 Not Found. Grazie per l'aiuto

Ciao Bozz, per pochissime registrazioni (alcune di Aprile-Giugno) stiamo avendo dei problemi nell'importazione per colpa di alcuni file corrotti (già sul server di Ergonet da quanto ci risulta).

Il restante delle registrazioni fin dal 2020 invece sono presenti e migrate già sul nuovo server.

Ti aggiorno appena abbiamo novità.

Fabio.

OK. Piccolo memo di questo ↓ poiché quel video, prima della recessione del contratto, era accessibile, e onestamente se nessuno nel direttivo/staff ha ancora chiamato Ergonet per tentare un recupero dati, ho difficoltà a non accusare il direttivo e lo staff di sabotaggio.

Se la risposta è "forse sì" oppure "sì" oppure "non lo so", per favore domattina dalle 09:00 aiutaci a chiamare Ergonet in loop chiedendo con urgenza il recupero dati di quella Greenlight. Idealmente sarebbe chi nello staff/direttivo che ha autorizzato questa distruzione che dovrebbe occuparsene, ma nessuno lo sta facendo.

Ciao Bozz, ti riporto il lavoro fatto e gli eventi fino ad oggi.

Dopo diversi problemi accaduti e documentati anche qui su pabricator con Ergonet si è deciso di migrare BBB (BigBlueButton) che era raggiungibile all'indirizzo cvs5133.ergonet.host.

I problemi e le considerazioni che il direttivo ha valutato sono:

  • Problemi continui con certificati SSL scaduti e quindi impossibilità ad usare BBB (ticket: ZFO-375-34026, ZFO-375-34026, BLW-964-41920)
  • Cancellazione di altra istanza BBB senza preavviso (cvs5153.ergonet.host) e senza possibilità di recupero dei dati (ticket: ZFO-375-34026)
  • Impossibilità di aggiornare BBB (ticket: JWO-554-78479)
  • Mancato monitoraggio del disco occupato con errore di funzionamento (ticket: DNF-290-99347)
  • Impossibilità di avere un dominio personalizzato (vedere wikina)
  • Costo più del doppio rispetto alla concorrenza (il doppio rispetto al mercato)
  • Assistenza telefonica solo al mattino, pomeriggio solo tramite ticket
  • Scarsa conoscenza del software BigBlueButton anche da loro stessi confermata e l'unica loro soluzione proposta di volta in volta era rifare la macchina da zero perdendo tutti i dati (questa era la loro politica)
  • Impossibilità ad accedere tramite SSH alla macchina anche con richiesta di utente senza permessi di root/sudo

Date queste considerazioni il direttivo ha deciso di cambiare il fornitore di BBB.
Nel farlo ha chiesto prima un consulto a me e poi una consulenza alla lista Tech.

Dopo tale consultazione è avvenuta la migrazione vera e propria da me eseguita con dismissione di Ergonet.

In fase di migrazione di 434 video-registrazioni sul server e circa 200Gb di dati tramite FTP (unica modalità che loro davano a disposizione con accesso SOLO alla cartella /var/bigbluebutton) ho provveduto a creare una nuova istanza di BBB dedicata a Wikimedia meeting.wikimedia.it e a migrare tali dati.

In fase di migrazione abbiamo testato a campione diverse registrazioni, dopo essere state convertite per poter funzionare con la nuova versione di BBB e del nuovo URL e risultavano funzionanti. Non era possibile verificare registrazione per registrazione una ad una a mano visto l'ingente quantitativo, dopo aver testato un certo numero di registrazioni e il corretto funzionamento di migrazione si è dato per scontato che TUTTE le registrazioni fossero funzionanti (su questo punto ci ritornerò più avanti). Inoltre è stata effettuata una verifica da parte mia che tutti i file fossero stati migrati tramite FTP (45736 su 45736 files).

Dopo una segnalazione su una registrazione mancante ci siamo accorti che 7 registrazioni video su 450 erano corrotte e tali registrazioni erano tutte nel mese di Aprile-Maggio 2025. La motivazione del fatto che tali registrazioni fossero corrotte purtroppo non è verificabile in quanto:

  • Ergonet ha cancellato tutti i dati appena è stata effettuata la migrazione, cancellando DEFINITIVAMENTE i dischi per loro policy di dismissione servizi (ticket UZK-815-60165)
  • Ergonet pur contattata telefonicamente ha confermato che non c'è nessuna possibilità di recupero dei dati (ho parlato proprio con un tecnico e non c'era effettivamente modo di recuperare vista la loro infrastruttura di virtualizzazione basata per i dischi su LVM non continuativo)
  • Ergonet non ha la possibilità di confermare o smentire che tali dati erano già corrotti sul loro server oppure si sono corrotti durante il trasferimento FTP
  • I log del server BBB presso Ergonet sono stati cancellati e non è possibile quindi sapere se c'era un errore in fase di registrazione o di salvataggio dei dati
  • I backup che facevano parte del servizio (dei quali io non posso confermare l'esistenza) dicono che sono stati cancellati anch'essi

I file delle 7 registrazioni in nostro possesso purtroppo sono completamente corrotti e non più usabili così come sono. Inoltre mancano proprio i file XML (events.xml) di tali eventi e quindi non è possibile per me fornire esattamente un report del nome delle stanze di tali registrazioni. Posso solo confermare che si trattano di registrazioni nel mese di Aprile-Maggio 2025 per via del nome e data di creazione della cartella.

Probabilmente i file si sono corrotti durante il trasferimento (anche se da quanto mi risulta non ci sono stati errori FTP) oppure si erano corrotti dopo la loro creazione, ma non mi è possibile capire a posteriori quale dei due eventi sia capitato.

Questione a parte invece è il software Greenlight che non era migrabile perché Ergonet non permetteva l'accesso ad un backup di tale area, infatti per migrare tale software sarebbe stato necessario un accesso SSH e dover dare alcuni comandi per la migrazione manuale (docker). Inoltre Greenlight per via del suo funzionamento interno avrebbe creato problemi per via del cambio di URL causato dalle vecchie registrazioni. Su questa parte si richiede la nuova registrazione sulla nuova istanza https://meeting.wikimedia.it

Tutte le registrazioni che erano state fatte usando Greenlight sono ancora presenti sul server e se necessario basta richiedere a me l'elenco di tutte le registrazioni. Per motivi di privacy non è possibile dare un elenco pubblico.

Le registrazioni fatte tramite Moodle invece sono state automaticamente linkate con il nuovo URL (meeting.wikimedia.it).


Considerazioni

Mi permetto di segnalare a tutti che l'errore sulle 7 registrazioni mancanti è imputabile solamente a me che ho effettuato la migrazione (indipendentemente dalle cause che l'hanno causato).
E stato un mio errore non verificare tutte le registrazioni o creare un tool automatico che andasse a verificare eventuali problematiche ma viste le 434 registrazioni ho dato per scontato (e qui è l'errore) che tutte funzionassero correttamente.

La scelta di migrare BBB è stata si valutata dal direttivo, ma viste le numerose considerazioni tecniche, era stata confermata da ME la fattibilità e quindi eventuali errori di carattere tecnico sono imputabili a me.

Ergonet ha confermato la cancellazione di tutti i dati il giorno stesso in cui sono stati migrati e non permette nessun recupero di queste 7 registrazioni. Inutile dire che attuare sistemi di backup dislocati esternamente rispetto al fornitore è importante in quanto un singolo fornitore può irrimediabilmente cancellare tutto senza possibilità di recupero.

Per quanto riguarda le considerazioni sui ruoli del direttivo, dello staff e dell'area tech non entrerò nel merito perché non di mia competenza, MA mi permetto di dire a livello personale che da quanto risulta a me ne l'area direttivo ne l'area staff ha mai paventato un sabotaggio su un servizio interno da loro stessi usato.

Spero che questo mio report sia utile inoltre a imparare gli errori commessi in modo che non riaccadano.

Fabio.

NanoH claimed this task.