Interjú Andreas Kainz fejlesztővel

Andreas Kainz A LibreOffice közösség rendszeresen készít interjúkat fejlesztőkkel, hozzájárulókkal, akik nélkül az idén 8 éves LibreOffice nem tartana ott ahol tart. Ezekről az interjúkról rendszeresen beszámolunk itt a LibreOffice.hu weboldalon is, a magyar szerzők interjúit pedig – frissítve, a szerzővel egyeztetve – lefordítjuk magyarra is (lásd itt).

A közösség ezúttal Andreas Kainz-cal készített interjút. Kainz munkáival gyakran találkozhatnak a LibreOffice felhasználók, mert egyrészről a LibreOffice 5.4-ben bemutatkozott Notebookbar az ő keze nyomán jött létre, másrészről pedig számtalan olyan apróságot tett a LibreOffice-ba, amely megkönnyíti a mindennapi használatát (Elementary és Breeze ikonkészlet, új táblázatstílusok stb.).

Az interjúból számtalan dolog kiderül még Andraesról és a terveiről.

Forrás: TDF Blog.

 

Szabad magyar szótár 1.7, Zsort 1.0

A 2018. május 12-i Szabad szoftver konferencián került bejelentésre, és most megjelent az utóbbi évek legnagyobb magyar nyelvi vonatkozású szabad szoftveres fejlesztésének eredménye, a Szabad magyar szótár 1.7-es változata. A magyar szóalaktan leírását is tartalmazó szótár minden eddiginél pontosabb magyar helyesírás-ellenőrzést nyújt a LibreOffice, a Google Chrome, Mozilla Firefox, Scribus vagy akár az olyan kereskedelmi programok, mint a Google Dokumentumok, Adobe InDesign és macOS felhasználói számára.

A béta kiadások sokezres javításaihoz és szókincsbővítéséhez képest a végleges kiadás további 13 ezer szó-, morféma- és betűhatárra vonatkozó szótári bejegyzéssel bővült, amely lehetővé tette az első helyesen működő magyar betűrendbe soroló szabad szoftver, a Zsort elkészítését is.

A nyelvi fejlesztések a nyomdai minőségű automatikus magyar elválasztás megvalósításával folytatódhatnak a jövő évben. Kérjük, hogy ehhez adója 1%-ának felajánlásával segítse az FSF.hu Alapítványt, a magyar nyelvi fejlesztések fő támogatóját! A fejlesztések részletei:

Zsort 1.0

A Zsort (ejtsd zé-szort vagy zsort) a Szabad magyar szótár 1.7-es változatán és a Hunspell helyesírás-ellenőrzőn és morfológiai elemzőn, valamint a GNU sorton alapuló gAWK program, amely a következő előnyös tulajdonságokkal rendelkezik a helyesiras.MTA.hu akhsort webes betűrendbe soroló szolgáltatásához képest: (1) a felbontandó „ál-többjegyű” mássalhangzókat minden szótári szó (pl. más|szor) és heurisztikusan felismert összetett szó (pl. adás|szünet|kérés) esetében felismeri (2) 50 szónál több szó is rendezhető vele, akár több millió is (3) nem fagy le több szóból álló kifejezésekre, címekre, hanem helyesen képes azokat is rendezni (4) szabad program, így működése megismerhető, a kód módosítható és szabadon terjeszthető. További előnyei: (5) működése bár a GNU C Library-n (glibc) alapul, nem függ annak legújabb javításaitól (Koblinger Egmont javításaival a glibc 2.26 végre az IBM ICU/Unicode CLDR adatbázisához hasonlóan rendezi a kettőzött többjegyű mássalhangzók egyszerűsített alakjait). (6) A kifejezésekre vonatkozó rendezési szabályok mellett javítja a glibc különleges hibáját is, a zsanér, zsáner és a hasonlóan azonos alakú, csak a hosszú magánhangzók helyében eltérő szóalakok sorrendjének felcserélését is.

A Zsortot 4 millió különböző szóalakon összehasonlítva az IBM ICU/Unicode CLDR magyar rendezési algoritmusával, azonnal nyilvánvalóvá válik a különbség: 25 ezer szónak változik meg a pozíciója, amennyiben nem tekintünk minden cs, dz, dzs, gy, ly, ny, sz, ty, zs, ccs, ddzs, ggy, lly, nny, ssz, tty és zzs jelsorozatot automatikusan (kettőzött) többjegyű mássalhangzónak, hanem megvizsgáljuk a szavak tövét és toldalékolását, és annak megfelelően döntünk a szavak sorrendjéről, például a község, tizennyolc stb. szavak nem zs, vagy kettőzött ny betűt tartalmaznak. 5 további szó a 25 ezerből (sorkezdő mínuszjel jelöli a régi, és pluszjel jelöli a javított pozíciót):

--- szavak.icu 2018-05-17 15:36:53.958051037 +0200
+++ szavak.zsort 2018-05-17 15:37:07.209816339 +0200
@@ -1331,8 +1331,8 @@
 ablakmélyedéseknél
 ablakmélyedési
 ablakmélyedésig
-ablakmélyedést
 ablakmélyedésszerű
+ablakmélyedést
 ablakmenedzserek
 ablakmenü
 ablakméret
...
 zsoldosseregre
 zsoldosseregünk
 zsoldosseregünkkel
+zsoldosszellem
+Zsoldosszerenádot
+Zsoldosszerenádra
 zsoldost
 Zsoldost
 Zsoldostáborban
@@ -4039942,9 +4039945,6 @@
 zsoldosvezérről
 zsoldosvezért
 zsoldosvilág
-zsoldosszellem
-Zsoldosszerenádot
-Zsoldosszerenádra
 zsoldosztás
 zsoldosztásra
 zsoldot
@@ -4040806,11 +4040806,11 @@
 zsongásról
 zsongássá
 zsongással
+zsongásszerű
 zsongást
 zsongású
 zsongásuk
 zsongásunkat
-zsongásszerű
 zsongat
 zsongatja
 zsongatják

A teljes lista itt tekinthető meg, a program félezer soros, a teszteseteket is tartalmazó forráskódja pedig itt.

Szabad magyar szótár 1.7.

A szótárfejlesztés kiemelt célja a legnépszerűbb, a magyar nyelv támogatásában is élen járó szabad irodai programcsomag, a LibreOffice, ahol a szótár az alapja a magyar szinonimaszótárban és a nyelvhelyesség-ellenőrzőben használt szótövezésnek, toldalékolásnak és morfológiai elemzésnek is, valamint az új toldalékoló felhasználói szótárnak. A legújabb szótár is úton van a LibreOffice 6.1 és 6.0-s változatába.  A bevezetőben is felsorolt, Hunspell helyesírás-ellenőrzőt tartalmazó programok is a Szabad magyar szótár felhasználói, ahogy ez a szótár az alapja a Magyar Tudományos Akadémia helyesiras.mta.hu Helyes-e így? néven futó szolgáltatásának is. A Szabad magyar szótár bár nem helyesírási tanácsadó szolgáltatások üzemeltetésére készült, a legutóbbi fejlesztésekkel közelebb került ehhez: szótára, valamint a Hunspell program több ezer szótári szó esetében támogatja már a kiejtés alapú javaslattevést, pl. Niccse  → Nietzsche, valamint a tipikus egybeírási hibák felismerését és pontos javítását: idegenszavakat → idegen szavakat, rákövetkező → rá következő, csirkefarhát → csirke far-hát stb.

Az új magyar helyesírási reform és a magyar szókincs változásainak követéséről, illetve a kapcsolódó fejlesztésekről részletesen szólnak a béta kiadások hírei.

A szótár- és programhibák a LibreOffice és a magyar fordítók OpenScope felületének hibabejelentője mellett most már a Szabad magyar szótár GitHub projektoldalán is bejelenthetők.

Okos(abb) magyar helyesírás-ellenőrzés

Jó hír az írással napi szinten foglalkozók számára, hogy a LibreOffice április elején megjelenő 6.0.3-as hibajavító kiadása már nem jelez helyesírási hibát a különleges, de amúgy helyesírásilag tökéletes szóalakokra.

Ilyen a fenti címben szereplő „okos(abb)”, ahol az „abb”-ot a program (hasonlóan pl. a Microsoft Office-hoz) idáig aláhúzta. Mostantól csak akkor, ha a zárójelek nélküli szóalak (itt: „okosabb”) valóban hibás.

A magyar szótördelési algoritmus és a helyesírási szótár javítása (felhasználva az eredetileg az arab és a héber számára kifejlesztett Hunspell-tulajdonságot, a nem kívánt karakterek törlését az ellenőrizendő szóból) a következő alakok helyes kezelését tette lehetővé:

– a ragozott zárójeles hivatkozások: (1)-nek, [2]-ben, a)-ról, b)-hez;

– a szavakon belüli zárójelezés: „oldal(ak)”, kell(ene);

– a megváltozott méretet jelölő kapcsos zárójeles kezdőbetű az idézetekben: „[A]zt” és „[a]mazt”;

– idézőjeles címek toldalékolása: „A Jedi visszatér”-ben, a „Tisza”-ban (a helyes toldalékot jelezte hibásnak a program);

– kérdőjeles és felkiáltójeles nevekben: Yahoo!-ról, Ki nevet a végén?-ből.

Kapcsolódó hibajegy: tdf#116072.

L. még magyar nyelvi fejlesztések az FSF.hu Alapítvány támogatásával.

LibreOffice HSQLDB formátum importálása

LibreOffice logó A LibreOffice programcsomag Base nevű programja egy kényelmes grafikus felületet biztosít egy, a háttérben futó adatbázis-kezelő alkalmazására. A háttérben többféle adatbázis-kezelő rendszer futhat. Lehet ez beágyazott adatbázis: HyperSQL (HSQLDB) vagy Firebird, illetve lehet külső rendszerhez is kapcsolódni. A utóbbi hónapokban a munkám a Base beágyazott adatbázisait érinti.

Alapértelmezettként a program HyperSQL adatbázist használ, ha a felhasználó beépített adatbázist hoz létre. Ez több szempontból – Java runtime függőségként jelentkezik, Java /C++ áthívások szükségesek – szerencsétlen, ezért a TDF úgy döntött, hogy a jövőben a Firebird adatbázist helyeznék előtérbe. Kitettek egy pályázati kiírást, ami lehetővé teszi a HyperSQL adatbázisok importálását Firebird adatbázisba.

A fent említett tendert a Collabora elvállalta, és a teendőket a következő részfeladatokra osztottuk:

  1. A Firebird driver jelentősebb hibáinak kijavítása,
  2. Az adatbázis séma importálása,
  3. Az adatbázis – bináris állományban tárolt – adatainak importálása,
  4. Az új elemek integrálása, tesztek írása, stb.

Első feladatként tehát rendberaktuk a Firebird drivert, ami magába foglalta a legfontosabb hibák kijavítását (pl. tdf#70425), és a hiányzó típusok implementálását (tdf#104734).

A séma importálásához egy új könyvtárat hoztam létre „dbahsql” névvel. A HyperSQL adatbázis-kezelő rendszer a sémát egy szövegfájlban tárolja SQL utasítások formájában. A könyvtár ezeket az utasításokat olvassa ki, és átalakítja úgy, hogy a Firebird elfogadja őket. Például van egy-két adattípus, amit a két rendszer máshogy oldott meg ( a LONGVARCHAR típust például a BLOB típusnak egy speciális verziójával lehet létrehozni Firebird esetén).

A bináris adatok importálása, és a tesztelés egyelőre még csak a jövő zenéje.

További információkat és a jövőbeni fejleményeket a blogomon lehet megtalálni, angol nyelven. Ugyanezt a témát itt ecsetelgetem.

Ezúton köszönöm, hogy Bunth Tamás beszámolt a LibreOffice-on végzett munkájáról!

Magyar nyelvi fejlesztések IV.

Névelős kereszthivatkozások

A LibreOffice Writer egyik leghasznosabb, rengeteg szerkesztési időt megspóroló funkciója az automatikus kereszthivatkozások. Igazi újdonságként a LibreOffice 6.1 fejlesztői változata a kereszthivatkozást megelőző helyes magyar névelő (az 1. oldalon, de a 2. oldalon) kiválasztását is automatizálja.

Magyar területi beállítás esetén a Mezők párbeszédablak új, a kis és nagybetűs névelős kereszthivatkozások beszúrását támogató menüpontokat tartalmaz, l. a képernyőképen és az alábbi videóban.

“Magyar nyelvi fejlesztések IV.” bővebben

GSoC: QuarkXPress formátumtámogatás

https://developers.google.com/open-source/gsoc/images/gsoc2016-sun-373x373.png

A TDF 2014-ben indította útjára a Document Liberation Project-et, rövidítve DLP (magyarul itt, angolul itt és itt található róla összefoglaló). A projekt célja, hogy a régi, már nem támogatott, zárt formátumokban tárolt anyagokat ODF-be lehessen konvertálni, így meggátolni azt, hogy azok „elvesszenek” (vagyis kivezessék a felhasználót a termékcsapdából).

A projekt az utóbbi években sem állt le, igaz sok hír nem jött, most azonban – a Google Summer of Code segítségével – újabb fejlesztések láttak napvilágot. Egy litván programozó, Aleksas Pantechovskis (interjú) idén arra vállalkozott, hogy QuarkXPress formátumtámogatást készít a LibreOffice-hoz.

Aleksas és mentora David Tardon (RedHat Inc.) egy új könyvtárat – libqxp – hozott létre. Ezzel lehetővé vált, hogy a QuarkXPress 3.1–4.1 verziók (áttekintés) által használt formátumot képes beolvasni a LibreOffice.

https://i2.wp.com/blog.documentfoundation.org/wp-content/uploads/2017/08/dlp_button_1.png?w=400&ssl=1

De mi a helyzet az egyéb formátumokkal? Laurent Alonso a Microsoft PowerPoint 2 (Windows) és PowerPoint 4 (Mac és Windows) és a Windows 95-ös PowerPoint formátumának beolvasásán dolgozik (libmwaw). Amennyiben van régi prezentációja, ezen formátumok valamelyikében, a LibreOffice 6.0-ban már meg fogja tudni nyitni őket és a tartalmuk többnyire elérhető lesz. Ehhez minél több régi prezentációra van szüksége, így ha van a birtokodban ilyen, ne habozz és küld el neki! Ezzel nagyban segítheted a importkönyvtár fejlesztését!

A StarOffice „ősrégi”, bináris fájlformátuma (.sda, .sdc, .sdd, .sdw fájlkiterjesztések) a LibreOffice 4.0-val kikerült a támogatott formátumok közül. Sokan azt gondolták, hogy a későbbi XML alapú és az OpenOffice.org (OOo) 2005-ig használt fájlformátuma is megszűnik és már csak az ODF formátum támogatása marad, természetesen ez nem így történt. Szintén Laurent munkájának köszönhetően újra van lehetőség az „ősrégi”, bináris fájlformátumban is importálni LibreOffice-ban (libstaroffice).

Laurent elsősorban a táblázatkezelő és prezentációkészítő fájlkonverzió lehetővé tételén dolgozott. Azt fontos tudni, hogy az sdw (szövegszerkesztő) fájlkonverzió még nagyon kezdetleges állapotban van.

A DLP projekt sikeres működéséhez elengedhetetlen, hogy minél több(féle) régi fájlformátumban készült dokumentumot kapjanak a fejlesztők, így ha rendelkezel ilyen régi fájlformátumban készült fájlokkal és tartalma akár nyilvános is lehet, ne habozz és támogasd a projektet a régi dokumentum beküldésével. A lehetséges közreműködésről bővebben a DLP honlapján tájékozódhatsz.

Forrás TDF blog.

A LibreOffice súgójának megújítása

LibreOffice logó A LibreOffice súgóját 2003–2004 között tervezték meg és végül 2005-ben jelent meg, akkor még az OpenOffice.org részeként. Tulajdonképpen a LibreOffice online súgójának megjelenéséig – ami tulajdonképpen egy Wiki – technikai értelemben nem történt érdemi változás a súgóban.

“A LibreOffice súgójának megújítása” bővebben

Magyar innováció a LibreOffice 6.0-ban

A hamarosan megjelenő LibreOffice 6.0 irodai programcsomag magyar vonatkozású újdonsága a toldalékoló és összetettszó-kezelő felhasználói szótár. A következő egyperces videó ennek működését mutatja be a LibreOffice 6.0 fejlesztői változatában:

Magyar nyelvi fejlesztések I.

Az új magyar helyesírási reformhoz kötődő szabad szoftveres magyar nyelvi fejlesztés 2015-ben vette kezdetét (l. ennek részletes ismertetését). Az FSF.hu Alapítvány támogatásának köszönhetően a fejlesztés nem áll le, első eredményeként a LibreOffice helyesírási szótárából eltávolításra kerültek az elavult helyesírású szavak és toldalékolási szabályok (tdf#95024). Példák a már elutasított szóalakokra (a listában szereplő töveket külön vagy más alakban írjuk ma már, a toldalékolt szavakat pedig kötőjellel), gyakorisági sorrendben: zártkörű, nagyméretű, kisméretű, ésszerűtlen, útbaigazít, véghezvisz, nemzetiszínű, ésszerűsödik, cserbenhagy, ésszerűsít, chips, reváns, látencia, bura, napéjegyenlőség, síkraszáll, cigánygyerek, házinyúl, árboc, eszencia, latens, piercing, célratörés, Sydneyt, talián, Zsanettel, sorbaállás, frizsider, sztyep, sósperec, magasrendű, csodaszép, sóskifli, rubeóla, Huxleyt, fejbentartás, samanizmus, Nikolettel, fantaziál, elektroencefalográfia, Nagymedve, Henriettel, dinó, Anettel, harcbavetés, nüánsz, Ivettel, Stanleyről, Disneytől, bedekker, nagyfokú, elektroencefalogram, elektroencefalográf.

A szótár előzetes kiadásának további újdonságai:

Sok új idegen szó és átírás: acerola, albedó, anthrax, baklava, bermuda, bestiarium, biometrikus, blogger, bonmot, bourbon, bowling, break, campanile, campus, ciabatta, defibrillátor, dévédé, dietetika, diszacharid, dragomán, durián, ego, epilátor, europid, euroszkeptikus, falafel, fieszta, gaucho, gnocchi, gouda, guava, hacker, hekker, hospice, illiberalizmus, intimtorna, intró, jalapeño, jujuba, kabrió, kanül, karambola, kesu, klapancia, kolonoszkópia, komment, konnotáció, kozmetológus, lasagne, licsi, lúzer, machinátor, manga, monitoring, monsieur, muffin, nanogép, op-art, outlet, palimpszeszt, pécé, pirszing, píszí, playback, poligráf, pomeló, purhab, rafting, ranch, raszta, remix, rep, retró, roadshow, roaming, rukkola, sármos, shake, showman, ska, slam, stand-up, stria, szadomazó, szaké, szantál, szcenárió, szmájli, sztrók, triller, troll, úzó, varánusz, vok, vombat, xilit, zumba, zsenília stb.
“Magyar nyelvi fejlesztések I.” bővebben