Magyar innováció a LibreOffice 6.0-ban

A hamarosan megjelenő LibreOffice 6.0 irodai programcsomag magyar vonatkozású újdonsága a toldalékoló és összetettszó-kezelő felhasználói szótár. A következő egyperces videó ennek működését mutatja be a LibreOffice 6.0 fejlesztői változatában:

A nyelvtechnológiai innováció a felhasználók (újságírók, szerkesztők, lektorok és írók!) kezébe adja a helyesírási szótár bővítését, hogy új (szaknyelvi, kitalált stb.) szavaikat a magyar nyelvtan és helyesírás szerint fogadja el a program minden toldalékolt és összetett szóban szereplő alakjukkal együtt.

A videóban oszlopnyi képzett és összetett szóról tűnik el a piros aláhúzás minden egyes új szó (egy nyelvi mintaszóval való) megadása után. Az első példában a korábban elutasított „youtuber” szó kerül felvételre, amelyhez a hasonló végződésű „ember” szó a nyelvi minta, és így a „youtuberek”, „youtuberekéről”, „youtuberes”, „youtubereseinket”, „leyoutubereztétek” és „youtubercsapatát” példaszavakról is egyből eltűnik a piros aláhúzás. Ez az új lehetőség egy több száz oldalas könyv vagy folyóiratok (mint a LibreOffice-ban készülő Neveléstudomány) lektorálásánál igen értékes segítséget nyújt.

A fejlesztés alapja a világszerte ismert, a Firefoxtól és a Google Chrome-tól kezdve a macOS-be és a Photoshopba is beépített magyar fejlesztésű szabad szoftver, a Hunspell helyesírás-ellenőrző és morfológiai elemző program. A toldalékoló és összetettszó-kezelő felhasználói szótár nemcsak magyar, hanem közel ötven más nyelven, így németül, franciául, olaszul, angolul és oroszul is működőképes a Hunspell-fejlesztés kiemelt célját képező szabad és ingyenes magyar nyelvű irodai programcsomagban, a LibreOffice-ban.

A LibreOffice 6.0 béta 2 előzetes kiadással már kipróbálható az új lehetőség: Windowson angol, spanyol és francia nyelven, míg Linuxon a magyar helyesírási szótárat tartalmazó „lefordított magyar felhasználó felület”-et is telepítve magyar nyelven is. (A LibreOffice 6.0 várhatóan két hónapon belül, 2018. január végén kerül kiadásra, amelyet havonként még több hibajavító kiadás fog követni, így a béta 2 program valóban csak kipróbálásra javasolt még.)

A kipróbáláshoz a videóban és az alábbi képernyőképen is látható módon, az újonnan létrehozott felhasználói szótárat az alapértelmezett „összes nyelv” helyett magyar (vagy angol stb.) nyelvűre kell állítanunk az új Nyelvi minta mező eléréséhez.

A LibreOffice 6.0-ban magyar nyelvű felhasználói szótárat létrehozva rendelkezésre áll a Nyelvi minta mező, amelynek segítségével új szavainkat toldalékolva és szóösszetételekben is felismeri a helyesírás-ellenőrző. A nyelvi minta a magyar Hunspell helyesírási szótár egy tetszőleges szótöve lehet, amelynek toldalékolása megegyezik az új szóéval.

A fejlesztő Németh László. A fejlesztés az FSF.hu Alapítvány támogatásával készült el 2017-ben. Az alapítvány támogatója a magyar szabad szoftveres közösség.

Köszönjük a támogatást!

FSF.hu Alapítvány
Németh László

“Magyar innováció a LibreOffice 6.0-ban” bejegyzéshez 10 hozzászólás

  1. Mi van akkor ha vegyes nyelvű dokumentumról van szó, mondjuk magyar és arab nyelvűről? Mindkét nyelvet képes lesz helyén kezelni?

  2. Először is: köszönjük, és mint újságszerkesztő, vadul lelkesedem ezért a rég várt fejlesztésért. (Nem, mintha eddig vadul követeltem volna, mert érzékeltem, hogy ez egy nagyon nehéz probléma lehet, de mindig is hiányzott.)

    Másodszor: minél hatékonyabb egy eszköz, annál durvább hibákat lehet vele elkövetni…
    Magamban vagyok bizonytalan, hogy képes vagyok-e jó mintát megadni. Ha az általam megadott minta nem minden kontextusban felel meg, akkor a LO nem fogja hibásnak jelölni, tehát benne fogam hagyni a szövegben. Dehát, ugye, bármikor törölhetem is a szótárból a rossz tételt.

    1. Köszönöm, ez egy régóta tervezett fejlesztés volt, amelyet most az alapítványi támogatásnak köszönhetően meg tudtam valósítani!

      A mintaszó nehézsége nyelvtől függ: míg a németben gyakorlatilag csak egy ugyanolyan szófajú szót kell megadni, a magyarban kicsit több kell: a hangrendnek is meg kell egyeznie („kecske”, „macska”, vagy „hörcsög”), illetve egy-két toldalék esetében (I/3. birtokos személyrag -ja, -je, -a, -e vagy mindkettő, a szó mássalhangzóra vagy magánhangzóra végződik), jó, ha van egyezés. Annyiban nem bonyolult ez, hogy a legtöbb új szó, amely felvételre kerül, idegen eredetű, így a toldalékolásuk is egységes és egyszerű, elég egy kicsit is hasonló szót kikeresni. Pl. a hiányzó „riboszomális” szóhoz jó minta a „kromoszomális”, de a „hamis”, „okos” vagy „komor” is. Ha meg véletlenül nem sikerül tökéletes mintát adni, valóban egyszerűen javítható.

  3. A /hibabejelentes oldalon az van hogy angolul jelentsük be. És ha egy menü nevét hibásan fordították magyarra, a magyar dokumentáció rossz, vagy a magyar helyesírás-ellenőrző? Azt is angolul jelentsük be a központiba, ahol mondjuk egy kínai olvassa majd el? Most ilyet nem akarok bejelenteni, csak be akartam lépni, nehogy inaktivitás miatt törlődjön az azonosítóm.

    1. A magyar fordításra és nyelvi eszközökre vonatkozóan magyar nyelven is várjuk a hibajelzéseket:

      http://otrs.fsf.hu/

      (Sajnos a hasonló régi helyesírással kapcsolatos hibajegyek költözés közben nem kerültek át az új hibabejelentőbe, de Úr Balázsnak köszönhetően ki vannak gyűjtve, és feldolgozásuk el is kezdődött, l. például a már letiltott „Alpokok”, „Kárpátokok” stb. hibás alakokat, amelyek a korábbi hírben is említésre kerültek: http://libreoffice.hu/magyar-nyelvi-fejlesztesek-i/.)

      Feltüntetjük ezt a címet is az oldalon.

      Köszönjük a hibabejelentést!

    2. Nyugodtam be lehet a magyar fordítás hibáját is angolul küldeni. Aki olvassa, az tudni fogja, hogy kinek kell továbbküldeni.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöljük.