Okos(abb) magyar helyesírás-ellenőrzés

Jó hír az írással napi szinten foglalkozók számára, hogy a LibreOffice április elején megjelenő 6.0.3-as hibajavító kiadása már nem jelez helyesírási hibát a különleges, de amúgy helyesírásilag tökéletes szóalakokra.

Ilyen a fenti címben szereplő „okos(abb)”, ahol az „abb”-ot a program (hasonlóan pl. a Microsoft Office-hoz) idáig aláhúzta. Mostantól csak akkor, ha a zárójelek nélküli szóalak (itt: „okosabb”) valóban hibás.

A magyar szótördelési algoritmus és a helyesírási szótár javítása (felhasználva az eredetileg az arab és a héber számára kifejlesztett Hunspell-tulajdonságot, a nem kívánt karakterek törlését az ellenőrizendő szóból) a következő alakok helyes kezelését tette lehetővé:

– a ragozott zárójeles hivatkozások: (1)-nek, [2]-ben, a)-ról, b)-hez;

– a szavakon belüli zárójelezés: „oldal(ak)”, kell(ene);

– a megváltozott méretet jelölő kapcsos zárójeles kezdőbetű az idézetekben: „[A]zt” és „[a]mazt”;

– idézőjeles címek toldalékolása: „A Jedi visszatér”-ben, a „Tisza”-ban (a helyes toldalékot jelezte hibásnak a program);

– kérdőjeles és felkiáltójeles nevekben: Yahoo!-ról, Ki nevet a végén?-ből.

Kapcsolódó hibajegy: tdf#116072.

L. még magyar nyelvi fejlesztések az FSF.hu Alapítvány támogatásával.

Hová tűnt a hiányjel?

A hiányjel, azaz aposztróf nem tűnt el a LibreOffice-ból, csak alapértelmezetté vált a írógépes aposztróf (') automatikus cseréje, hogy angol és francia dokumentumokban a ma már alapkövetelménynek számító nyomdai aposztrófot (’) kapjuk meg a Shift-1 lenyomásával.

Magyar dokumentumokban a Shift-1 lenyomása a magyar belső idézőjeleket (» és «) illeszti be az írógépes aposztróf helyett. Ha  a Shift-1 után visszavonjuk az utolsó műveletet (ami itt az automatikus javítás), azaz lenyomjuk például a Ctrl-Z-t, megkapjuk a korábbi (helyesírásilag is elfogadhatatlan) aposztrófot. De mit tegyünk, ha nyomdai aposztrófot szeretnénk gyorsan és egyszerűen, és éppen nem angol vagy francia szöveget szerkesztünk?

A LibreOffice 5.4 és 6.0 következő hibajavító kiadásai után egyszerűen csak gépeljünk tovább: az aposztrófot tartalmazó angol, francia és magyar szavak automatikusan a helyes alakban jelennek meg a beírás után, például  L«Oréal → L’Oréal, It«s It’s, hál« isten! hál’ isten. A szó végi vagy szó eleji aposztrófoknál, ahol ez az automatikus javítás nem működik, kétszer nyomjuk le a Shift-1-et: Pali bá«« → Pali bá’, »«89-ben → ’89-ben.

Van lehetőség arra is, hogy egyből tipográfiai aposztrófot kapjunk a Shift-1 lenyomásával. Ehhez az Eszközök→Automatikus javítás→Automatikus javítás beállításai… menüponttal elérhető párbeszédablak Nyelvfüggő beállítások lapján a Záró (meg a Kezdő) idézőjeleknek állítsuk be az U-2019 hexadecimális Unicode kódon, az Általános központozás részhalmazban elérhető aposztrófot.

(Kapcsolódó hibajegyek: tdf#38395, tdf#115382)

LibreOffice HSQLDB formátum importálása

LibreOffice logó A LibreOffice programcsomag Base nevű programja egy kényelmes grafikus felületet biztosít egy, a háttérben futó adatbázis-kezelő alkalmazására. A háttérben többféle adatbázis-kezelő rendszer futhat. Lehet ez beágyazott adatbázis: HyperSQL (HSQLDB) vagy Firebird, illetve lehet külső rendszerhez is kapcsolódni. A utóbbi hónapokban a munkám a Base beágyazott adatbázisait érinti.

Alapértelmezettként a program HyperSQL adatbázist használ, ha a felhasználó beépített adatbázist hoz létre. Ez több szempontból – Java runtime függőségként jelentkezik, Java /C++ áthívások szükségesek – szerencsétlen, ezért a TDF úgy döntött, hogy a jövőben a Firebird adatbázist helyeznék előtérbe. Kitettek egy pályázati kiírást, ami lehetővé teszi a HyperSQL adatbázisok importálását Firebird adatbázisba.

A fent említett tendert a Collabora elvállalta, és a teendőket a következő részfeladatokra osztottuk:

  1. A Firebird driver jelentősebb hibáinak kijavítása,
  2. Az adatbázis séma importálása,
  3. Az adatbázis – bináris állományban tárolt – adatainak importálása,
  4. Az új elemek integrálása, tesztek írása, stb.

Első feladatként tehát rendberaktuk a Firebird drivert, ami magába foglalta a legfontosabb hibák kijavítását (pl. tdf#70425), és a hiányzó típusok implementálását (tdf#104734).

A séma importálásához egy új könyvtárat hoztam létre „dbahsql” névvel. A HyperSQL adatbázis-kezelő rendszer a sémát egy szövegfájlban tárolja SQL utasítások formájában. A könyvtár ezeket az utasításokat olvassa ki, és átalakítja úgy, hogy a Firebird elfogadja őket. Például van egy-két adattípus, amit a két rendszer máshogy oldott meg ( a LONGVARCHAR típust például a BLOB típusnak egy speciális verziójával lehet létrehozni Firebird esetén).

A bináris adatok importálása, és a tesztelés egyelőre még csak a jövő zenéje.

További információkat és a jövőbeni fejleményeket a blogomon lehet megtalálni, angol nyelven. Ugyanezt a témát itt ecsetelgetem.

Ezúton köszönöm, hogy Bunth Tamás beszámolt a LibreOffice-on végzett munkájáról!

Magyar innováció a LibreOffice 6.0-ban

A hamarosan megjelenő LibreOffice 6.0 irodai programcsomag magyar vonatkozású újdonsága a toldalékoló és összetettszó-kezelő felhasználói szótár. A következő egyperces videó ennek működését mutatja be a LibreOffice 6.0 fejlesztői változatában:

Magyar nyelvi fejlesztések I.

Az új magyar helyesírási reformhoz kötődő szabad szoftveres magyar nyelvi fejlesztés 2015-ben vette kezdetét (l. ennek részletes ismertetését). Az FSF.hu Alapítvány támogatásának köszönhetően a fejlesztés nem áll le, első eredményeként a LibreOffice helyesírási szótárából eltávolításra kerültek az elavult helyesírású szavak és toldalékolási szabályok (tdf#95024). Példák a már elutasított szóalakokra (a listában szereplő töveket külön vagy más alakban írjuk ma már, a toldalékolt szavakat pedig kötőjellel), gyakorisági sorrendben: zártkörű, nagyméretű, kisméretű, ésszerűtlen, útbaigazít, véghezvisz, nemzetiszínű, ésszerűsödik, cserbenhagy, ésszerűsít, chips, reváns, látencia, bura, napéjegyenlőség, síkraszáll, cigánygyerek, házinyúl, árboc, eszencia, latens, piercing, célratörés, Sydneyt, talián, Zsanettel, sorbaállás, frizsider, sztyep, sósperec, magasrendű, csodaszép, sóskifli, rubeóla, Huxleyt, fejbentartás, samanizmus, Nikolettel, fantaziál, elektroencefalográfia, Nagymedve, Henriettel, dinó, Anettel, harcbavetés, nüánsz, Ivettel, Stanleyről, Disneytől, bedekker, nagyfokú, elektroencefalogram, elektroencefalográf.

A szótár előzetes kiadásának további újdonságai:

Sok új idegen szó és átírás: acerola, albedó, anthrax, baklava, bermuda, bestiarium, biometrikus, blogger, bonmot, bourbon, bowling, break, campanile, campus, ciabatta, defibrillátor, dévédé, dietetika, diszacharid, dragomán, durián, ego, epilátor, europid, euroszkeptikus, falafel, fieszta, gaucho, gnocchi, gouda, guava, hacker, hekker, hospice, illiberalizmus, intimtorna, intró, jalapeño, jujuba, kabrió, kanül, karambola, kesu, klapancia, kolonoszkópia, komment, konnotáció, kozmetológus, lasagne, licsi, lúzer, machinátor, manga, monitoring, monsieur, muffin, nanogép, op-art, outlet, palimpszeszt, pécé, pirszing, píszí, playback, poligráf, pomeló, purhab, rafting, ranch, raszta, remix, rep, retró, roadshow, roaming, rukkola, sármos, shake, showman, ska, slam, stand-up, stria, szadomazó, szaké, szantál, szcenárió, szmájli, sztrók, triller, troll, úzó, varánusz, vok, vombat, xilit, zumba, zsenília stb.
“Magyar nyelvi fejlesztések I.” bővebben

A magyar LibreOffice

A LibreOffice szabad szoftveres fejlesztésként kivételes lehetőséget nyújt a magyar nyelv támogatására, amelynek szép példája a program kiváló és naprakész honosítása. A 7 éves magyar LibreOffice közösséget köszöntve, a következő lista az elmúlt pár év magyar nyelvi vonatkozású fejlesztéseit sorolja fel a LibreOffice programkódjában.

“A magyar LibreOffice” bővebben

Interjú Bunth Tamással

LibreOffice logó Ahogy az már megszokható a LibreOffice.hu weboldalon rendszeresen közzéteszünk interjúkat magyar fejlesztőkkel (pl. itt, itt és itt). Ennek célja, hogy megismerhetőkké váljanak a magyar fejlesztők, illetve, hogy ne csak „elvont kockáknak” tűnjenek, hanem hús-vér embereknek is. 🙂

2016-ban a Google Summer of Code (GSoC) keretén belül Bunth Tamás dolgozott a LibreOffice-on. Vele készített interjút a TDF Blogja, melyet az alább olvasható magyarul. Az eredeti interjúhoz képest némiképp „frissítve”, valamint néhány kérdéssel kiegészítve.

“Interjú Bunth Tamással” bővebben

LibreOffice Portable

A LibreOffice 5.2.6 és az 5.3.1 után megjelent azok hordozható – portable – változata.

A népszerű irodai programcsomag hordozható változata újdonságot nem ad hozzá az normál változathoz, hanem azok „újracsomagolt” változata.

Mindkét változat elérhető a Portableapps.com weboldaláról.

LibreOffice 5 béta 3

LibreOffice logó A héten megjelent a LibreOffice következő nagyobb kiadásának az 5.0-ának az újabb bétája.

A béta 2 egy blocker hiba miatt kimaradt, így mindegyik (32 és 64 bites kiadásokból egyaránt) a 3. béta a releváns. Ezt leszámítva a LibreOffice csapata tartja magát az 5.0 előzetes ütemtervéhez.

Az újdonságokról a Wiki ad tájékoztatást, a kiadás részletes változásairól bővebben itt. A 3. béta elérhető a hivatalos letöltőoldalon (közvetlen link) és közvetlenül FTP-n keresztül.

Megjegyzés:

A teszteléshez nem kell lecserélni megszokott LibreOffice-verziónkat. Több különböző verziójú LibreOffice is remekül elvan a számítógépen, és nem zavarják egymást, ha a következőképpen járunk el:

Windows:
A telepítés így történjen:
msiexec /a LibreOfficeDev_5.0.0.0.beta3_Win_x86.msi /qb TARGETDIR=C:\LOTest\5.0.0.0beta3
Utána nyissuk meg a C:\LOTest\5.0.0.0beta3\program\bootstrap.ini fájlt egy editorral. Az utolsó sorban írjuk át a UserInstallation értéket erre: $ORIGIN/../Data. Így a tesztprofil egy új könyvtárban fog létrejönni, a C:\LOTest\5.0.0.0beta3\Data alatt, és nem írjuk felül az éles használatra telepített LibreOffice profilját az %APPDATA%-ban.

Linux:
Töltsük le az RPM-csomagot. DEB alapú disztró esetén is az RPM-et töltsük le. Csomagoljuk ki a tar.gz-t, és lépjünk be a kicsomagolt könyvtárba.
for i in RPMS/*.rpm; do rpm2cpio $i | cpio -idmv; done
Utána nyissuk meg a program/bootstraprc fájlt egy editorral. Mint a Windows esetén, az utolsó sorban itt is írjuk át a UserInstallation értéket erre: $ORIGIN/../Data.