Megújult magyar elválasztási minták és programkönyvtár

Nagy Bence, a méltán népszerű moly.hu könyves oldal gazdája a nyáron MPL/GPL/LGPL licenc alatt adta ki a szintén általa gondozott Huhyphn TeX magyar elválasztási mintákat (eddig csak egyedi LGPL engedély birtokában kerültek be az LGPL-es LibreOffice alá a magyar elválasztási minták). A LibreOffice-ba a minták bővített változata kerül be, mivel a TeX szedőrendszerrel szemben a LibreOffice automatikusan is képes elválasztani a kettőzött többjegyű mássalhangzókat (a Hyphen programkönyvtár Liang–Knuth-féle elválasztási algoritmusának magyar fejlesztésű kiterjesztésével.) A fejlesztéshez kapcsolódóan a LibreOffice elválasztási programkönyvtára is (sok) új változattal jelentkezik, ami a magyar elválasztás számára is tartogat érdekességeket. Ilyen például a kötőjeles szavak OpenOffice.org 3.3-mal elromlott elválasztásának javítása: pl. az ideig-ó•ráig, magyar–o•rosz szavakban jelölt hibás elválasztási helyek már nem fognak jelentkezni a LibreOffice javított változatában. Sőt, a kötőjeltől két betű távolságra lévő, ebben az esetben azonban még zavaróan közeli, pl. Kossuth-dí•jas, hé•be-hó•ba, helyesírás-el•lenőrző elválasztások is letilthatók lettek (ez az elválasztási mintaállomány elején található COMPOUNDLEFTHYPHENMIN=3 és COMPOUNDRIGHTHYPHENMIN=3 értékek 2-re állításával kapcsolható vissza).

A Hyphen programkönyvtár új változata rögtön négy kiadást ért meg rövid idő alatt, mert újabb és újabb hibákra derült fény a Hyphen és a LibreOffice elválasztásában. Az OpenOffice.org 3.3-mal, ahol a kötőjel a szavak részévé vált minden nyelv számára (a korábban már így működő magyar helyesírás-ellenőrzéshez hasonlóan), az elválasztás is megváltozott: az elválasztóprogram is megkapja a kötőjelet, ami megzavarja a minta alapú és a LibreOffice ettől független kötőjelnél alkalmazott elválasztását is. A Hyphen programkönyvtár legutóbbi kiadása a LibreOffice azon hibáját is javítja, hogy időnként – bár volna rá hely – nem kötőjelnél választja el a kötőjeles összetett szavakat a LibreOffice, hanem előtte. Sajnos az itt használt módszer nem alkalmas a nagykötőjeles szavak hasonló hibájának javítására (mivel a háttérben elválasztási minták távolítják el a kötőjelnél elválasztott szó kötőjelét, hogy ne kettő kiskötőjel kerüljön egymás mellé a LibreOffice által hozzáadott elválasztójellel), de legalább nem úgy választja el a nagykötőjelet a program (mint korábban előfordult), hogy még egy (kis)kötőjelet is ad hozzá (–-). A sok javítás mellett a program most már a LibreOffice szót is helyesen fogja elválasztani: Li•breOf•fi•ce helyett csak Libre•Office-ként.

“Megújult magyar elválasztási minták és programkönyvtár” bejegyzéshez egy hozzászólás

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük