Some characters are shown as ? in the Wiki page. For example,
ü is converted to the letter ü correctly. But ş is not converted to ş as it should. Instead it just shows ?
Reference: http://www.fileformat.info/info/unicode/char/search.htm?q=%26%23x15F&preview=entity
Versions
Html2Wiki-REL1_30-2cebb1f.tar MediaWiki v1.30 Apache2 v2.4.18 PHP v7.2.2 Ubuntu 16.04 Mysql v15.1 Wiki Default Charset Encoding = tr_TR
LocalSettings.php
$wgShellLocale = "C.UTF-8"; $wgLanguageCode = "tr";
All other extensions
# Enabled extensions. Most of the extensions are enabled by adding
# wfLoadExtensions('ExtensionName');
# to LocalSettings.php. Check specific extension documentation for more details.
# The following extensions were automatically enabled:
wfLoadExtension( 'Cite' );
wfLoadExtension( 'CiteThisPage' );
wfLoadExtension( 'ConfirmEdit' );
wfLoadExtension( 'Gadgets' );
wfLoadExtension( 'ImageMap' );
wfLoadExtension( 'InputBox' );
wfLoadExtension( 'Interwiki' );
wfLoadExtension( 'LocalisationUpdate' );
wfLoadExtension( 'Nuke' );
wfLoadExtension( 'ParserFunctions' );
wfLoadExtension( 'PdfHandler' );
wfLoadExtension( 'Poem' );
wfLoadExtension( 'Renameuser' );
wfLoadExtension( 'SpamBlacklist' );
wfLoadExtension( 'SyntaxHighlight_GeSHi' );
wfLoadExtension( 'TitleBlacklist' );
wfLoadExtension( 'WikiEditor' );
wfLoadExtension( 'Html2Wiki' );
$wgNamespacesWithSubpages[NS_MAIN] = true;
wfLoadExtension( 'Nuke' );Steps to reproduce
- Upload a ZIP file on the Special:Html2Wiki page which comprises of several HTML files encoded in HTML Entity (Hex).
Example input (part of the HTML code)
<span lang="TR" style="font-size:11.0pt;line-height:115%;font-family:"Calibri","sans-serif"">Allah için sevmek ne demek diye düşünmüştüm yakınlarda kendi dünyamda. Eskiden Allah için sevmeyi beraber ”dini” birşeyler yaptığımız arkadaşları sevmek diye düşünürdüm. Bazen Allah için sevmenin karşılıksız sevmek olarak yorumladığını da görüyorum. Bugünlerde Allah için sevmenin çok daha farklı olduğunu anlıyorum. Kendi içimde yaptığım muhasebeyi sizlerle de paylaşmak istiyorum. </span>
- Go to one of the generated Wiki pages
- Some characters are displayed as ?
Example output (part of the HTML code)
Allah için sevmek ne demek diye dü?ünmü?tüm yak?nlarda kendi dünyamda. Eskiden Allah için sevmeyi beraber ?dini? bir?eyler yapt???m?z arkada?lar? sevmek diye dü?ünürdüm. Bazen Allah için sevmenin kar??l?ks?z sevmek olarak yorumlad???n? da görüyorum. Bugünlerde Allah için sevmenin çok daha farkl? oldu?unu anl?yorum. Kendi içimde yapt???m muhasebeyi sizlerle de payla?mak istiyorum.
Expected output (part of the HTML code)
Allah için sevmek ne demek diye düşünmüştüm yakınlarda kendi dünyamda. Eskiden Allah için sevmeyi beraber ”dini” birşeyler yaptığımız arkadaşları sevmek diye düşünürdüm. Bazen Allah için sevmenin karşılıksız sevmek olarak yorumladığını da görüyorum. Bugünlerde Allah için sevmenin çok daha farklı olduğunu anlıyorum. Kendi içimde yaptığım muhasebeyi sizlerle de paylaşmak istiyorum.
Problem persists every time I convert HTML to Wiki. Regardless of the HTML file I am uploading. Even when I upload one HTML file, same issue occurs.