Page MenuHomePhabricator

Elhuyar - Wikispeech - eu
Closed, DeclinedPublic

Description

Wikispeech teknologia euskaraz jartzeko elkarlana abiatuko dugu Elhuyar Fundazioarekin. Teknologia honi esker artikuluak entzuteko aukera dago automatikoki.

Event Timeline

Theklan triaged this task as Medium priority.Dec 29 2017, 2:44 PM
Theklan created this task.
Theklan created this object with visibility "Wikimedia-User-Group-Basque (Project)".

Kaixo!
Honen inguruko albiste gehiagorik ba al dago? Hilabetea pasa da eta martxoan argitaratuko ote den jakin nahiko nuke.

Eskerrik asko!

Theklan changed the visibility from "Wikimedia-User-Group-Basque (Project)" to "Public (No Login Required)".Feb 27 2018, 6:33 PM

Lana praktikamente bukatuta dago, baina kontu batzuk daude lotu eta zuei azaltzeko. Zuekin bildu nahi genuke hemen, erakusteko eta horren inguruan hitz egiteko.

5ean eguerdian edo bil naitekela pentsatzen dut. Nola ikusten duzue?

Bileran komentatu bezala, gure aldetiko garapen gehiena eginda dago. Gelditzen da esaldikako banaketaren inguruko gauza batzuk konpontzea (Wikispeech luzapenak euskarazko laburdurak ez ditu kontuan hartzen eta laburdura askoren amaierako puntua esaldi-banaketatzat hartzen du), eta ari naiz hori konpontzeko suediarrekin harremanetan. Eta gero kodean egindako aldaketak igotzea faltako litzateke. Horrekin, Wikispeech martxan jartzen dutenean eta WMFko zerbitzari batean instalatu, euskarazkoa ere instalatuko litzateke (nahiz eta, ziurrenik, arazoren batzuk izatea posible den eta orduan ere zerbait egin behar izateko aukerak egon...)

Hala ere, Wikispeech luzapena bera guztiz amaitu, balidatu eta Wikipediatan erabilgarri jartzea ez dute aurreikusten urtearen bigarren erdia baino lehenago egitea... Beraz, euskarazko Wikipedian lehenago martxan jarri nahiko balitz, bi gauza egin beharko lirateke:

  • Wikispeech luzapena, oraindik beta egoeran egonik ere, euskarazko Wikipedian jar daitekeen ikusi. EWKE arduratuko da honetaz.
  • Hori posible ikusten bada, zerbitzari batean instalatzen diren zatiak (Elhuyarrek moldatutako wikispeech_mockup eta euskarazko TTSa) Elhuyarreko zerbitzari batean instalatu beharko lirateke.

Bidali diet jadanik korreoa ditugun aukerak azaltzen.

Meto en la conversación a @Qgil y @Kippelboy, para ver si podemos tener algún tipo de feedback sobre esta situación.

Veamos, por lo que he podido ver la instalación de WikiSpeech en Wikimedia está encallada aquí:

T180021: Security review for extension Wikispeech

Según la última actualización, la pelota está en manos de WMSE.

En un mundo ideal, todos los esfuerzos se deberían concentrar en arreglar los problemas que estén parando esa security review. Una vez la extensión esté disponible en los servidores de Wikimedia, me supongo que añadir soporte de idiomas será más sencillo. ¿Estáis de acuerdo o hay algo que falla en este razonamiento?

Lo segundo es que os recomiendo que identifiquéis las tareas en Phabricator que os están bloqueando, y si no existen las creéis (en inglés) y las marquéis como bloquers. De lo contrario quien os puede ayudar en la comunidad internacional lo va a tener complicado para entender en qué situación está el proyecto, y más aún cómo ayudar.

bueno, según lo tengo entendido, y que me corrija @ElhuyarFundazioa si me equivoco, por nuestra parte podríamos instalarlo y estaría funcionando. Otra cosa es que no se nos permita instalar la extensión en euwiki, por cuestiones de seguridad. En ese caso sí, sería imprescindible desbloquear esto cuanto antes.

Por otra parte... ¿cómo se marca como bloquer? Querría marcar esa y explicar la razón.

Sí, si hubiese posibilidad de instalar la extensión (aun estando en beta) en la Wikipedia en euskera, se podría poner en marcha, ya que aunque, como bien dices, el proyecto está en revisión (así me lo comentaron sus desarrolladores) y hasta que finalice ésta no instalarán el servidor TTS en un servidor de WMF, nosotros podríamos instalar el servidor TTS temporalmente en un servidor nuestro, puesto que por nuestra parte ya hemos hecho los desarrollos necesarios en la parte del servidor TTS.

Por nuestra parte, hasta ahora nos hemos centrado en incluir el TTS en euskera en la parte del servidor y, como he dicho, se puede considerar que dicho trabajo está finalizado. Pero nos hemos encontrado con un problema. El segmentado del texto en frases se hace en la extensión, no en el servidor, y no se tienen en cuenta las abreviaturas. Si aparece un punto, un espacio y luego una mayúscula se considera que empiece una frase nueva, aunque antes del punto fuese una abreviación. Esto causa problemas, en euskera ("K.a. IV. mendean", es decir, "siglo IV a.C.") y en inglés también ("many actors, e.g. John Wayne"). Se lo comenté a los desarrolladores, hasta ahora no se habían dado cuenta y por lo que parece ahora tienen otras prioridades, pero nos dijeron que podíamos hacerlo nosotros. Por lo tanto, seguramente procedamos a colaborar también en la extensión para arreglar la segmentación de las abreviaturas. Lo que no sé es si ésto puede retardar más la revisión de la extensión...

Aklapper subscribed.

This task has been assigned to the same task owner for more than two years. Resetting task assignee due to inactivity, to decrease task cookie-licking and to get a slightly more realistic overview of plans. Please feel free to assign this task to yourself again if you still realistically work or plan to work on this task - it would be welcome!

For tips how to manage individual work in Phabricator (noisy notifications, lists of task, etc.), see https://phabricator.wikimedia.org/T228575#6237124 for available options.
(For the records, two emails were sent to assignee addresses before resetting assignees. See T228575 for more info and for potential feedback. Thanks!)

Unfortunately closing per comment in T178676#6633073.
(Also see T178676#6613534 for info on using non-public tasks in Phab.)