Magyar nyelvi fejlesztések IV.

Névelős kereszthivatkozások

A LibreOffice Writer egyik leghasznosabb, rengeteg szerkesztési időt megspóroló funkciója az automatikus kereszthivatkozások. Igazi újdonságként a LibreOffice 6.1 fejlesztői változata a kereszthivatkozást megelőző helyes magyar névelő (az 1. oldalon, de a 2. oldalon) kiválasztását is automatizálja.

Magyar területi beállítás esetén a Mezők párbeszédablak új, a kis és nagybetűs névelős kereszthivatkozások beszúrását támogató menüpontokat tartalmaz, l. a képernyőképen és az alábbi videóban.

“Magyar nyelvi fejlesztések IV.” bővebben

Magyar újdonságok (videóval)

Több új, magyar nyelvvel kapcsolatos képesség és javítás került be a LibreOffice fejlesztői, illetve legfrissebb kiadott változatába az FSF.hu Alapítvány támogatásával:

  • A mintaillesztéses automatikus csere: a cserélendő szó elejére, vagy végére írjunk .* (pont-csillag) karakterláncot, ha szeretnénk, hogy toldalékkal is cserélje a szót a nemrégiben megjelent LibreOffice 4.2.4., ahogy ezt a mellékelt videó példái mutatják:
    automatjavA HUP-.*Hungarian Unix Portal csere megadása esetén a HUP-ról, HUP-nak szavak Hungarian Unix Portalról, Hungarian Unix Portalnak szövegre cserélődnek automatikusan. A „.*…” minta cseréje a három pontra pedig egy régi problémát old meg: a három egymást követő pont cseréje a tipográfiailag megfelelő hármaspont karakterre korábban nem működött, ha a három pont a szóhoz tapadt, vagyis ahogy többnyire használja a magyar nyelv. (Megjegyzés: a fejlesztés eredetileg a Szabad Szoftver Kompetencia Központban készült, de korábban csak a csillag szolgált a szó eleji, vagy végi toldalék megadására, amely valamelyik nyelv automatikus javítási szótáránál, amely használta a csillag karakter, problémát okozott);

  • az előző fejlesztésnek megfelelően frissült több száz bejegyzés – köztük a szóhoz tapadó három pont cseréje – a LibreOffice 4.3 automatikus javítási szótárában: változások listája. Több tucat új bejegyzés is megadásra került, például a szó végi indexszámok közvetlenül beszúrhatók a kalap, és aláhúzás karakterekkel és az automatikus csere segítségével: m^2 → m², CO_2 → CO₂ (az így beszúrt Unicode indexszámokkal itt elkerülhető a dokumentumszerkesztők tipográfiai hibája, az átméretezett, halvány számok használata indexként).
  • Szintén a LibreOffice 4.3-at érintő javítás: a kettőzött többjegyű mássalhangzók feltételes elválasztójelnél való elválasztása az Unicode szabványnak megfelelően (korábban a feltételes elválasztójel beszúrása letiltotta az ilyen elválasztást, l. hibajegy. Részletesebben: például ha az „asszony” szóba beszúrtunk egy feltételes elválasztójel karaktert a Ctrl-kötőjellel az „as” után, akkor a szót nem választotta el a LibreOffice (ami persze még mindig jobb, mint az „as-szony”, ahogy hasonlókat a Firefoxnál látni, amely nem integrálta megfelelően a Hyphen elválasztási könyvtárat). Most viszont már a helyes asz-szony formájában kerül elválasztásra a feltételes elválasztójelet tartalmazó szó a LibreOffice-ban. Az Eszközök–Nyelv–Elválasztás… feltételes elválasztójeleket beszúró párbeszédablakában is már felkínálásra kerülnek a kettőzött többjegyű mássalhangzóknál lévő elválasztási pontok (bár nem ez ajánlott az automatikus elválasztásra, hanem a bekezdésformázás Szövegbeosztás lapján lévő automatikus elválasztás).
  • A LibreOffice 4.3 saját szótárában lehetőség van a kettőzött többjegyű mássalhangzók elválasztásának megadására is a következő új szintaxissal: Rád[zs]dzsal (Ráddzsal → Rádzs-dzsal), ko=nya=kos=meg[y]gye=zik (konyakosmeggyezik → ko-nya-kos-megy-gye-zik). Ezeket a példákat is a LibreOffice korábban nem, vagy csak rosszul tudta elválasztani. (Folt az angol súgóhoz az új szintaxis leírásával.)
  • Minden nyelvet érint a helyesírás-ellenőrzés és a nyelvhelyesség-ellenőrzés felületének javítása, ahol több zavaró hibát is sikerült megoldani (részletesen: a helyesírás-ellenőrzési párbeszédablakban a „Mindent mellőz” funkció választása az ugyanabban a mondatban előforduló ismételt hibára is vonatkozik már; ugyanitt a nyelvhelyességi hibák kék aláhúzása a „Mindent mellőz”-re eltűnik a megjelenített dokumentumból; a nyelvhelyességi hibák helyi menüjében a „Mellőz” nem a „Mindent mellőz” funkciónak felel már meg; illetve a helyi menüben van már „Mindent mellőz” is a „Mellőz” menüpont mellett, hibajegyek: fdo#56954, fdo#73917, fdo#73868), illetve helyreállításra került a magyar és angol nyelvhelyesség-ellenőrző mértékegység-konvertálási lehetősége (folt).
  • Windows hálózati környezetben a magyar és más nyelvű helyesírás-ellenőrzés képessége időnként elveszett a platform fájlnévkezelési sajátosságai miatt. A Hunspell helyesírás-ellenőrző ezért a standard fopen() helyett most már a Windows saját fájlkezelési függvényét használja a LibreOffice windowsos változatában (hibajegy). Ez a hibajavítás a LibreOffice 4.2.5-ben fog megjelenni.

Magyar mondatellenőrzés Ubuntun és a kiadványszerkesztésben

A LibreOffice kiegészítők oldalán frissült a magyar mondatellenőrző kiegészítő, így az már sikeresen telepíthető az Ubuntu Linux új változatain és minden olyan operációs rendszeren, amely „gyári” LibreOffice változatából kimaradt a magyar mondatellenőrzés képessége (a hu.LibreOffice.org-ról letöltött LibreOffice változatok beépítve tartalmazzák a magyar mondatellenőrzőt). A mondatellenőrző telepítése a LibreOffice Eszközök»Kiterjesztéskezelő… ablak Hozzáadás… gombjával lehetséges. Lehetőségeinek megtekintéséhez válasszuk ki a Kiterjesztéskezelő ablakban a Lightproof Grammar Checker (magyar) kiterjesztést, és kattintsunk a megjelenő Beállítások gombra.

A magyar mondatellenőrző nemcsak nyelvhelyesség-ellenőrzést végez, hanem támogatja a szerkesztői munkát is: angolszász mértékegységeket képes átváltani SI-re (l. mellékelt kép), a Numbertext kiegészítő telepítése után pedig egyezteti a szövegben szereplő pénzegységeket és számneves átírásukat. Tipográfiai lehetőségeivel segítséget nyújt a kiadványkészítésben. Kiválóan példázza ezt és a LibreOffice kiadványszerkesztési képességeit a Neveléstudomány folyóirat vagy a nemrégiben megjelent Zsidóság – tradicionalitás és modernitás tanulmánykötet. Az említett kiadványok tördelőszerkesztője, Pénzes Dávid LibreOffice a Neveléstudomány szolgálatában című cikkében foglalta össze tapasztalatait a 2012-es Szabad Szoftver Konferencia és Kiállítás konferenciakötetében.

A frissített kiegészítő tartalmazza Olivier Ronez (a magyar mondatellenőrző Lightproof keretrendszerén alapuló francia Grammalecte mondatellenőrző szerzőjének) javítását is, amely helyreállítja a magyar mondatellenőrzés hatékonyságát is a legújabb LibreOffice-okon.

Bobay István, aki elsőként küldött hibajelzést az ubuntus LibreOffice-szal kapcsolatban, a kiegészítő javítását és a program használhatóságát is megerősítette: „…örömmel tapasztaltam, hogy az új változat kifogástalanul működik, rögtön kipróbáltam. Ez egy igen kiváló és zseniális fejlesztés, a munkámban sokat segít, köszönet érte.” Köszönet neki és minden hibajelzést küldőnek, valamint a magyar mondatellenőrző fejlesztését 2009-ben, LibreOffice-integrációját pedig 2011-ben támogató FSF.hu Alapítványnak!

Új magyar fejlesztések a LibreOffice-ban

Hivatalosan is helyet kapott a mondatellenőrzők fejlesztésére szolgáló Lightproof keretrendszer a LibreOffice forráskódjában [a git fában szereplő „the awesome python grammar checker” meghatározás Michael Meeks, a LibreOffice vezető fejlesztőjének humorát dicséri]. Az FSF.hu Alapítvány által támogatott fejlesztés fő újdonsága a kódtisztítás és a LibreOffice-ban alapértelmezetté váló magyar mondatellenőrzés mellett a külön is letölthető Lightproof szabályszerkesztő. Ez a LibreOffice-kiegészítő nagymértékben leegyszerűsíti a magyar és más mondatellenőrzők fejlesztését, mivel a LibreOffice Writeren belül képes ellenőrizni, lefordítani és a futó mondatellenőrzőben frissíteni a helyenként összetett, és tetszőleges Python felhasználói programkódot is tartalmazó mondat-ellenőrzési szabályokat (ezek nem feltétlenül függetlenek a LibreOffice-tól, mivel képesek a LibreOffice más komponenseit is használni, így a magyar mondatellenőrző a LibreOffice Hunspell helyesírás-ellenőrző komponensét használja alaktani elemzésre, a brit és amerikai mértékegységek opcionális átalakításánál a Calc táblázatkezelő megfelelő függvényét hívja meg, vagy a számmal és számnévvel is leírt pénzmennyiségek konzisztenciájának ellenőrzésénél a LibreOffice – jelenleg még külön telepíthető – Numbertext kiegészítőjétől függ).

A hamarosan kiadásra kerülő LibreOffice 3.5 új, alapértelmezett magyar mondatellenőrzője segít a gyakran eltévesztett földrajzi nevek helyesírásában (lásd bővebben). Érdekes és hasznos újdonság, hogy a LibreOffice 3.5 új lehetőségének köszönhetően a nehezen értelmezhető hibajelzéseknél bővebb magyarázatot is kérhetünk, a magyar Wikipédia kapcsolódó szócikkét olvasásra megnyitva. A magyar mondatellenőrző legújabb, 1.4.3-as változata is elérhető már külön kiegészítőként, pár kisebb hibajavítással (például nem húzza alá a mínusz számokat a Writer táblázatcellákban, téves gondolatjeles felsorolásnak gondolva).

Magyar és angol mondatellenőrzés a LibreOffice 3.5-ben

Az FSF.hu alapítvány támogatásával sor került a magyar fejlesztésű Lightproof mondatellenőrző keretrendszer magyar és angol moduljainak bővítésére és integrálására, így a LibreOffice következő fejlesztői változata, a 3.5 béta 2 már ezekkel az újdonságokkal jelenhet meg. A modulok külön kiterjesztésként is kipróbálhatók: magyar (28 kB), angol (16 kB).
A magyar mondatellenőrző esetében a földrajzi nevek kezelése az egyik legfontosabb újdonság, például az észak, dél stb. jelölést tartalmazó kötőjeles nevek (Közép-Európa, közép-európai, de semmiképp sem Közép-Európai), budapesti hidak (Erzsébet híd, és nem Erzsébet-híd), egyéb kivételek (Fertő tó, és nem Fertő-tó) kerülnek ellenőrzésre. Az angol Lightproof modul nem szűr ki még annyi nyelvtani hibát, mint a Java-függőség és kisebb fokú integráció miatt elvetett LanguageTool, de nem is ad annyi téves hibajelzést, ami kiemelt fejlesztési szempont volt mind a magyar, mind az angol Lightproof modul esetében. Ezek a szempontok az angol modul néhány szabályával kerültek bemutatásra a planet.libreoffice.org-on. Az angol modul olyan, még nem ismertetett lehetőségei, mint az opcionális oda-vissza mértékegységváltás a gyakoribb amerikai és brit, illetve SI mértékegységek között, vagy a szintén opcionális, a kiadói gyakorlattól függő gondolatjelek (szóközökkel tagolt nagykötőjel, vagy szóköz nélkül használt hosszabb kvirtmínusz) ellenőrzése, később kerülnek részletesen ismertetésre, ahogy a magyar modul egyéb újdonságai is (ebből a legérdekesebb a bővebb webes hibaleírás, ami a LibreOffice 3.5-ben az új Lightproof modulokkal azt eredményezi, hogy egy további kattintással például a magyar helyesírási szabályzat megfelelő pontját is elolvashatjuk a jelzett hibánál).
A modulok beállítására ideiglenesen csak a LibreOffice kiterjesztéskezelőjén (Eszközök » Kiterjesztéskezelő…) keresztül van lehetőség, a feltelepített Lightproof, vagy a 3.5 béta 2 esetében az alapértelmezett magyar, illetve angol szótári kiegészítő nevére, majd a megjelenő Beállítások… gombra történő kattintással.

Magyar mondatellenőrző a LibreOffice bővítménytárában

Az OpenOffice.org kiegészítők elérhetetlensége miatt (ismételt betöltés után jelentkezik be sokszor csak az oldal) a magyar mondatellenőrző (Lightproof magyar modul) elérhetővé vált a LibreOffice kísérleti bővítménytárában is. További leírás a magyar mondatellenőrző legutóbbi kiadásáról, és a LibreOffice bővítménytáráról.

LibreOffice-t a KEH-be!

A KEH nem alszik. Részben talán a hibás magyar Microsoft Office miatt, újabb durva helyesírási hibával borzolja a magyartanárok és rokon lelkeik kedélyét. A LibreOffice segíthetett volna (legalábbis a hivatkozott sajtóközlemény hibás helyezetnek alakjának kiszűrésében, de a Formula 1 Magyar Nagydíj sem jó: helyesen Formula–1 magyar nagydíj vagy az AkH. 146. alapján lehet Formula–1 Magyar Nagydíj is, de a nagykötőjel nem hiányozhat), l. a következő, KEH-nek küldött javaslatban:
“LibreOffice-t a KEH-be!” bővebben

Magyar nyelvi ellenőrző a LibreOffice-hoz

Elkészült a nyílt forráskódú magyar nyelvi ellenőrző javított, bővített kiadása, ami most már LibreOffice alatt is menti a beállításait. Az új kiadás többek közt figyelmeztet az olyan nagy médiafigyelmet kapott nyelvi és helyesírási hibákra is, mint „áld meg” és „jó kedvel”, vagy „Budapest Liszt Ferenc Nemzetközi Repülőtér”. A kiegészítő az Eszközök» Kiterjesztéskezelő ablak Hozzáadás gombjával telepíthető. Telepítés után indítsuk újra a programot a gyorsindítóból is kilépve. A működést és az újdonságokat tesztdokumentum segítségével is ellenőrizhetjük.

Az első szembetűnő változás (lásd a mellékelt képre kattintva), hogy bővült az ellenőrző beállítófelülete (ami az Eszközök» Beállítások» Nyelvi beállítások» Magyar nyelvi ellenőrzés menüponton keresztül, és az Eszközök» Kiterjesztéskezelő» Lightproof hu_HU kiválasztása, és a megjelenő Beállítások gomb megnyomásával is elérhető). Az egyik legérdekesebb új korrektúrázási lehetőség az ismertebb angolszász mértékegységek átváltásának felkínálása. Az új opciók lehetővé teszik az olyan ellenőrzések kikapcsolását, amelyek a LibreOffice fejlett Graphite betűkészletei, a Linux Libertine G és Biolinum G használata esetén feleslegesek (ilyen az idézőjelek, gondolatjel, három pont, mínuszjel cseréje, ami a betűkészlet szintjén automatikusan végbemegy vagy mehet, bővebben lásd a Kiadványszerkesztés LibreOffice Writer szövegszerkesztővel jegyzetben).

A magyar köznyelvben nehezen értelmezhető (az iskolai tananyag részét nem képező), ezért átváltásra felkínált mértékegységek a Fahrenheit-fok (°F), mérföld, yard, láb, hüvelyk, gallon, pint, font súly („font súlyú” alakban írva). Az átváltást és a felkínált különböző kerekítéseket a Libreoffice CONVERT_ADD és ROUND táblázatkezelő függvényei végzik el, a toldalékolást (pl. „15 mérfölddel” → 24 kilométerrel) pedig a Hunspell program. Érdekességként, a fejlesztés kapcsán a gallon váltószámának pontosítására is sor került a LibreOffice forráskódjában (l. programfolt, az eltérés 0,02% volt). A mértékegységek felismerése alapértelmezett, de a nyelvi ellenőrző Mértékegységek beállításával kikapcsolható. (Hasonló mértékegység-váltó a Microsoft Office-ban is rendelkezésre állt, de az ezt megvalósító, korábban nagy újdonságként beharangozott intelligens címkéket száműzték a Microsoft Office 2010-ből. A helyére szánt, a kijelölt szövegrészek helyi menüjén keresztül elérhető mértékegység-váltó gyakorlatilag el van rejtve a felhasználók elől körülményes használata miatt.)

Az új mondat-ellenőrzési szabályok számos durva helyesírási hiba felismerésében segítenek: ilyen hibák a „halott róla”, „el kellet mennie”, hord el az irhád!, küzd vissza magad!, vagy a köztársasági elnök újévi köszöntőjének hivatalos átiratából elhíresült tévesztések, „Isten, áld meg a magyart! Jó kedvel, bőséggel!”. (A Himnusz sorai helyesen: „Isten, áldd meg a magyart / Jó kedvvel, bőséggel”!)

A ferihegyi Liszt Ferenc nemzetközi repülőtér jogszabályban rögzített neve, a Budapest Liszt Ferenc Nemzetközi Repülőtér több hibát is tartalmaz: a repülőterek nevének köznévi tagjait kisbetűvel írjuk (AkH. 190.), a helység- és helynevet tartalmazó felsorolásokat pedig vesszővel választjuk el (AkH. 298.): Budapest, Liszt Ferenc nemzetközi repülőtér, vagy Liszt Ferenc nemzetközi repülőtér, Budapest. A Földrajzinév-bizottság elvetette a magyartalan, illetve helyesírási hibás nevet, földrajzi helyesírási hibaként kiemelve még a Ferihegy védett földrajzi név elhagyását (ami jelenleg is érvényes földrajzi név, Budapest egyik városrésze), helyette a kormány javaslatát maximálisan tiszteletben tartva a Liszt Ferenc Nemzetközi Repülőtér, Budapest–Ferihegy elnevezést javasolta. A megfelelő indoklást is tartalmazó határozat azonban nem készülhetett el, mert a bizottság több tagját, köztük az elnököt felmentették, többeket elbocsátottak a munkahelyükről, köztük Mikesy Gábor nyelvészt, az OSOR.eu-n is szereplő Vingis szabad szoftveres állami térinformatikai rendszer egyik fejlesztőjét. A két hivatalos magyarázat szerint azért, mert a minisztériumoktól delegált bizottsági tagok nem kérték ki a tárcák véleményét, vagy azért, mert nem támogatták a „kormány kinyilvánított és egyértelmű kérését”. (Azóta az elbocsátott munkatársak helyzete valamelyest rendeződött, l. Dutkó Andrással, a bizottság volt elnökével készült interjút, ami a bizottságot ért támadásokra is reagál.) A Földrajzinév-bizottság jogkörét külön kormányrendeletben korlátozták, hogy „kiemelt közérdek” esetén a magyar nyelv védelme másodlagos szempont lehessen. A rendelet egyben felmentette a bizottság tagjait, illetve minimalizálta a leendő új tagság létszámát is. Az abszurd ügy hátterét jól megvilágítja a Térinformatika-online cikke, amihez csak annyit lehet hozzátenni, hogy mi okozta az eredeti hibás javaslatot: a kormánypárti javaslattevők a jogszabályokban szereplő „Budapest Ferihegy Nemzetközi Repülőtér” névben a Budapest Ferihegyet (a repülőtér nemzetközi nevét) „Budapest Liszt Ferenccel” helyettesítették. A Földrajzinév-bizottság sárba tiprásával megszületett törvény a joganyagban szereplő különböző meghatározásokat, köztük a „Budapest (Ferihegy)”, „Ferihegy”, „Ferihegyi repülőtér”, „Ferihegyi nemzetközi kereskedelmi repülőtér” elnevezéseket egységesen az új, a bizottság által 20:1 arányban leszavazott névre cserélte le. A magyar nyelvi ellenőrző a „Liszt Ferenc nemzetközi repülőtér”, „ferihegyi Liszt Ferenc nemzetközi repülőtér”, „Ferihegy”, valamint a „Budapest, Liszt Ferenc nemzetközi repülőtér” elnevezések használatát javasolja a nyelvi szakértők által egyöntetűen elutasított hibás megnevezés helyett.

A magyar nyelvi ellenőrző mögött álló Lightproof keretrendszert afrikaans, arab, francia (Grammalecte) és orosz nyelvi ellenőrzők készítésénél is felhasználták. A keretrendszer és a magyar nyelvi ellenőrző modul fejlesztése az FSF.hu Alapítvány támogatásával valósult meg.

Lightproof 1.4

Megjelent a Lightproof nyelvi ellenőrző keretrendszer új, 1.4-es változata (benne a szintén most megjelent magyar nyelvi szabályok forrásával). A javított keretrendszerrel elkészített nyelvi ellenőrzők ismét működnek az OpenOffice.org Mac OS X-es változata alatt is. A fejlesztés másik újdonsága, hogy saját Python függvényeket is megadhatunk a nyelvi szabályállományokban, amiket aztán felhasználhatunk a szabályokhoz kapcsolódó feltételvizsgálatokban, illetve javaslatokban.

Lightproof-hu_HU 1.2

Megjelent a magyar nyelvi ellenőrző legújabb változata, amely javítja az előző kiadás hibáit, és új szabályokat is ismer.

  • Javított névelő-ellenőrzés a számok előtt. (Egy lemaradt $-jel miatt a számok előtti névelőket ellenőrző szabály rossz esetben is illeszkedett, aláhúzva az a névelőt a tizenvalahány és százvalahány előtt is.)
  • Kibővített idézőjelekre vonatkozó javaslatok
    • ASCII idézőjelek cseréje: ,,vmi” → „vmi”, >>vmi<< → »vmi«
    • Belső idézőjelek helyes sorrendje: «vmi» → »vmi«
    • Angolszász nem dupla idézőjelek felismerése: ‘vmi’ → „vmi”, »vmi«
  • Nem törő szóközök felismerésének javítása a pénzösszegek konzisztencia-ellenőrzésénél.
  • Szűkebb ezrestagolók (nem törő keskeny szóköz, U+202F) használatának támogatása (a tipográfiai opciók között).

Letöltés