Magyar nyelvi fejlesztések I.

Az új magyar helyesírási reformhoz kötődő szabad szoftveres magyar nyelvi fejlesztés 2015-ben vette kezdetét (l. ennek részletes ismertetését). Az FSF.hu Alapítvány támogatásának köszönhetően a fejlesztés nem áll le, első eredményeként a LibreOffice helyesírási szótárából eltávolításra kerültek az elavult helyesírású szavak és toldalékolási szabályok (tdf#95024). Példák a már elutasított szóalakokra (a listában szereplő töveket külön vagy más alakban írjuk ma már, a toldalékolt szavakat pedig kötőjellel), gyakorisági sorrendben: zártkörű, nagyméretű, kisméretű, ésszerűtlen, útbaigazít, véghezvisz, nemzetiszínű, ésszerűsödik, cserbenhagy, ésszerűsít, chips, reváns, látencia, bura, napéjegyenlőség, síkraszáll, cigánygyerek, házinyúl, árboc, eszencia, latens, piercing, célratörés, Sydneyt, talián, Zsanettel, sorbaállás, frizsider, sztyep, sósperec, magasrendű, csodaszép, sóskifli, rubeóla, Huxleyt, fejbentartás, samanizmus, Nikolettel, fantaziál, elektroencefalográfia, Nagymedve, Henriettel, dinó, Anettel, harcbavetés, nüánsz, Ivettel, Stanleyről, Disneytől, bedekker, nagyfokú, elektroencefalogram, elektroencefalográf.

A szótár előzetes kiadásának további újdonságai:

Sok új idegen szó és átírás: acerola, albedó, anthrax, baklava, bermuda, bestiarium, biometrikus, blogger, bonmot, bourbon, bowling, break, campanile, campus, ciabatta, defibrillátor, dévédé, dietetika, diszacharid, dragomán, durián, ego, epilátor, europid, euroszkeptikus, falafel, fieszta, gaucho, gnocchi, gouda, guava, hacker, hekker, hospice, illiberalizmus, intimtorna, intró, jalapeño, jujuba, kabrió, kanül, karambola, kesu, klapancia, kolonoszkópia, komment, konnotáció, kozmetológus, lasagne, licsi, lúzer, machinátor, manga, monitoring, monsieur, muffin, nanogép, op-art, outlet, palimpszeszt, pécé, pirszing, píszí, playback, poligráf, pomeló, purhab, rafting, ranch, raszta, remix, rep, retró, roadshow, roaming, rukkola, sármos, shake, showman, ska, slam, stand-up, stria, szadomazó, szaké, szantál, szcenárió, szmájli, sztrók, triller, troll, úzó, varánusz, vok, vombat, xilit, zumba, zsenília stb.

Kimaradt szavak, új szóalkotások: agymosott, bérmaszülő, cicamica, dombornyomott, extraszűz, fogvacogtató, gyorsétkezde, gyorshitel, hitelkárosult, jegestea, kaszat, kényszervágott, melegrekord, nagyember, pihepuha, rezzenetlen, szegényellenes, téligumi, Tina, V4, versenysemleges, Zsombi stb.

Évszámok helyesírása: Az 2001–2099 közötti évszámok új, kötőjel nélküli írásmódjának támogatása (az egyéb számok továbbra is kötőjellel írandók): kétezeregy, kétezerkilencvenkilenc.

Szótárhibák javítása: pl. behaviourizmus (behaviorizmus vagy bihéviorizmus), autóbuszmegálló (autóbusz-megálló), metilalkohol (metil-alkohol), Alpokok (Alpok már többesszámban) stb.

Korpuszelemzés alapján sok, korábban a nem tárgyas ragozású igék csoportjába sorolt szóval bővült a tárgyas ragozású igék csoportja: bezsákolta, elbukta, végigasszisztálja, átpolitizálja, búgta, cincogta, dorombolta, vakkantotta, röfögte,  habogta, makogta, mekegte, susogja, zsongja, vicsorogta, hallucinálta, dudorászta, kicsodálkozta és kidühöngte magát, végigunatkozza, szomjúhozza, öltözzétek fel stb.

A szótári köznevekből képzett tulajdonnevek -beli, -féle toldalékolásának elfogadása: Neveléstudomány-beli, Arany-féle

Rövidítések toldalékolásának bővítése: bt.-beli, kft.-beli, nyrt.-beli, Btk.-beli stb.

A rendhagyó szótári összetett szavak többszörös összetételben való szereplésének javítása: egylégterű (egy légterű), kéttantermes (két tantermes), turistaútleveles (turista-útleveles)

A Hunspell helyesírás-ellenőrző javításai (c44200) kiegészítik az új helyesírásnak megfelelő többszörös szóösszetételek felismerését. Így a 7-szótagos, -i képzőre végződő többszörösen összetett szavak most már minden esetben elfogadásra kerülnek (a képzős tagot – pl. biztosítás – tartalmazó szavak korábban csak további toldalékkal kerültek elfogadásra: nyugdíjbiztosításit). Most már felismert szavak: nyugdíjbiztosítási, műsorszolgáltatási, aláírásgyűjtési, tanügyigazgatási, munkahelyteremtési, elsősegélynyújtási, egyházlátogatási, rendszerirányítási, bérlakásépítési, balesetmentességi, ügyiratkezelési, létszámleépítési, jogszabályalkotási, adóvégrehajtási, védjegylajstromozási, egyházalapítási, nyugdíjfolyósítási, útvonaltervezési, közteherviselési, kényszertartózkodási, alagútépítési, önköltségszámítási, ügyvitelszervezési, sportszakigazgatási, pénzügyigazgatási, létszámgazdálkodási, részköltségszámítási, lakóházépítési, emlékműállítási, színházalapítási, raktárgazdálkodási, baromfitenyésztési, rendszerváltoztatási, rendszerintegrálási, színházlátogatási, rendszerkiépítési, raktárirányítási, leltárértékelési, könyvtárlátogatási, készpénzbefizetési, térfogatszámítási, erőműépítési stb.

Szintén a Hunspell ellenőrzőt érintő javításnak köszönhető a korábban elfogadott, kötőjelet tartalmazó szavak tiltása: n-t (n-et) össze-vissza (összevissza), örökkön-örökké (örökkön örökké).

A szótárfejlesztő eszközök és a szótárleírás megvalósult optimalizálásával felgyorsult a szótárfejlesztés és a parancssori helyesírás-ellenőrzés. Utóbbira példa: az -s és -c végű, de idegen ejtésű szavak toldalékolási szabállyal való leírása nemcsak kisebb szótárat eredményezett a több száz külön felvett toldalékos alak eltávolításával, hanem lehetővé teszi a parancssori Hunspell programban az idegen szavak automatikus toldalékolással való felvételét

Így a felhasználó most már helyesen adhat meg ilyen töveket maga is a parancssori Hunspell felületén, vagy a Hunspell saját szótárában (l. man Hunspell):

Linus/Thomas
corpus/opus
Alec/Cadillac

így a Hunspell a szótári Thomas szerint helyesen ragozza a felhasználó által felvett Linus szót: Linusszal, Linusszá, az opus alapján a corpus szót: corpusszal, corpusszá, a Cadillac alapján az Alec szót: Aleckel, Alecké, vagyis nem a hibás változatokat erőlteti, illetve fogadja el (Linussal, corpussal, Aleccel stb.), mint korábban.

Kisebb LibreOffice fejlesztésként rugalmasabbá vált a LibreLogo program, így a LibreOffice 5.4 következő kiadása már Ubuntu és macOS operációs rendszereken is rendelkezni fog magyar lokalizációval (tdf#113592).

A magyar LibreOffice

A LibreOffice szabad szoftveres fejlesztésként kivételes lehetőséget nyújt a magyar nyelv támogatására, amelynek szép példája a program kiváló és naprakész honosítása. A 7 éves magyar LibreOffice közösséget köszöntve, a következő lista az elmúlt pár év magyar nyelvi vonatkozású fejlesztéseit sorolja fel a LibreOffice programkódjában.

Tovább »

LibreOffice az MTA kutatóközpontjában

recitiPénzes Dávid, a Neveléstudomány munkatársa hívta fel a figyelmet az ODF, azaz OpenDocument formátum, és a LibreOffice hazai akadémiai műhelyekben való terjedésének újabb örvendetes példájára. A reciti, az MTA BTK Irodalomtudományi Intézetének tartalomszolgáltató portálja a közlésre szánt kéziratokat ODT-ben (OpenDocument szöveges formátumban) várja, amelyek létrehozásához a nyílt forrású – ingyenesen letölthető – LibreOffice használatát javasolja.

A LibreOffice, a népszerű, szintén nyílt forráskódú Zotero hivatkozás-kezelővel kiegészítve kiválóan alkalmas a bölcsészettudományi kutatások eredményeinek összefoglalására, és ahogy az ELTE Neveléstudomány folyóirata példázza, végső formába öntésére is.

Tovább »

Heti LibreOffice hírek (2.)

A LibreOffice Weekly News 2. számának tartalmából:

  • Megjelent a LibreOffice 4.2.5, több mint 150 javítással; valamint a 4.3 kiadásra jelölt első változata is (l. korábbi híreinket: 4.2.5, 4.3 RC 1). A minőségbiztosítással foglalkozó nyilvános LibreOffice csevegőcsatornán segítséget is nyújtanak a hibák bejelentésében.
  • Szymon Kłos és Palenik Mihály is azon dolgozik a Google Summer of Code keretében, hogy a régi, nem átméreteződő párbeszédablakok mind le legyenek cserélve a képernyőfelolvasókkal is lényegesen jobban együttműködő új változatokra. A projektvezető Caolan McNamara statisztikája alapján az átállás megkezdése óta elkészült 741 db mellé már csak 99 db .ui állomány elkészítése van hátra a maradék 46 párbeszédablak + 53 ablakon belüli lap leírásához;
  • A nyomtatásra nem kerülő karakterek színe választható lesz a LibreOffice 4.4-től, mert most fehér háttér előtt az új kék szín nem mindig látható jól.
  • A Fortune üzleti magazinban megemlítették a LibreOffice-t is annak kapcsán, hogy az elektromosautó-gyártó Tesla licencdíjmentessé tette a szabadalmait a szabad szoftverek példájára hivatkozva.
  • Látványos eredménye van a LibreOffice forráskódján futtatott „kivágás-beillesztés” kódkeresőnek, amelynek segítségével az ismétlődő, vagy közel ismétlődő programrészeket kisebbre lehet cserélni.
  • Szintén gsoc-os feladatként megújulhat a szín- és sablonkezelés is a LibreOffice-ban: Pintér Krisztián első körben azon dolgozik, hogy a betöltött dokumentum színei kényelmesen elérhetők legyenek színpaletta formájában. Efe Gürkan Yalaman pedig a sablonkezelőt az eddiginél jobban fogja integrálni a nyitóképernyővel.
  • Andrzej Hunt munkájaként a csempés dokumentumkirajzolást támogató LibreOfficeKit GTK-s widget egyszerűen integrálható lesz más programokkal. Így az ODF dokumentumok akár az alapértelmezett dokumentummegjelenítőkkel, például Linuxon az Evince vagy Okular programmal is megtekinthetők és nyomtathatók lehetnek a jövőben.
  • Rachit Gupta munkájának eredményeképp kényelmesebbé válik az egyéni LibreOffice felület kialakítása, képes beszámolójában megtekinthető a LibreOffice Mozilla Personas képelőnézeteket mutató keresőfelülete is.

LibreOffice 4.3 RC1

Megjelent a LibreOffice 4.3 kiadásra jelölt első tesztváltozata, a béta 2-es változathoz képest több mint 50 új hibajegy lezárásával. Ezt még további két kiadásra jelölt változat fogja követni, amelyekben a most még nem naprakész magyar honosítás is frissítésre kerül.

A 4.3-as ágra váltáshoz javasolt megvárni az első 3-4 javító kiadást (4.3.3–4.3.4) is, de a kíváncsiak, illetve a tesztelők most már egy béta tesztelésen átesett változatot próbálhatnak ki számos újdonsággal.

Heti LibreOffice hírek

Megjelent a heti kiadású, elsősorban fejlesztőknek, valamint a LibreOffice fejlesztése iránt érdeklődőknek szóló LibreOffice Weekly News első száma. Az érdekesebb hírek:

  • Bekerült a LibreOffice 4.2-be, és a későbbi változatokba az Access2Base kiegészítő alapértelmezettként. Ennek segítségével lényegesen egyszerűbb szakalkalmazásokat fejleszteni, vagy MS Accessben fejlesztett szakalkalmazásokat migrálni, l. bővebben a fejlesztés honlapján.
  • A 4.2-es ágba, melyet érintett a hiba, OpenSSL biztonsági javítás került be.
  • 20 ezer dokumentumon futott le egy memóriateszt: két probléma már javításra is került, amelynek eredményeképp a nagy Writer dokumentumok betöltődése négyszer gyorsabb.
  • Google Summer of Code projektként számos izgalmas fejlesztés van folyamatban, például (1) dokumentumtárolás támogatása SharePoint és MS OneDrive kiszolgálókon, (2) kis vagy távoli képernyőre optimalizált (csempés) Calc és Impress dokumentum-megjelenítés.
  • Párizs ad otthont június 27–28. között a legközelebbi LibreOffice fejlesztői találkozónak.
  • Számos dolog könnyítheti meg a programfordítást: (1) Windows alatt is gyorsabb lehet a tervek szerint, (2) pár nyelvi változattal is folyamatosan tesztelve lesz ezentúl a LibreOffice, hogy időben kiderülhessenek az ezzel kapcsolatos hibák (3) újra fordul a LibreOffice FreeBSD alatt.

Hasonló heti hírek előzetesen holnap, végleges változatban pedig vasárnap jelennek meg.

Magyar újdonságok (videóval)

Több új, magyar nyelvvel kapcsolatos képesség és javítás került be a LibreOffice fejlesztői, illetve legfrissebb kiadott változatába az FSF.hu Alapítvány támogatásával:

  • A mintaillesztéses automatikus csere: a cserélendő szó elejére, vagy végére írjunk .* (pont-csillag) karakterláncot, ha szeretnénk, hogy toldalékkal is cserélje a szót a nemrégiben megjelent LibreOffice 4.2.4., ahogy ezt a mellékelt videó példái mutatják:
    automatjavA HUP-.*Hungarian Unix Portal csere megadása esetén a HUP-ról, HUP-nak szavak Hungarian Unix Portalról, Hungarian Unix Portalnak szövegre cserélődnek automatikusan. A „.*…” minta cseréje a három pontra pedig egy régi problémát old meg: a három egymást követő pont cseréje a tipográfiailag megfelelő hármaspont karakterre korábban nem működött, ha a három pont a szóhoz tapadt, vagyis ahogy többnyire használja a magyar nyelv. (Megjegyzés: a fejlesztés eredetileg a Szabad Szoftver Kompetencia Központban készült, de korábban csak a csillag szolgált a szó eleji, vagy végi toldalék megadására, amely valamelyik nyelv automatikus javítási szótáránál, amely használta a csillag karakter, problémát okozott);

  • az előző fejlesztésnek megfelelően frissült több száz bejegyzés – köztük a szóhoz tapadó három pont cseréje – a LibreOffice 4.3 automatikus javítási szótárában: változások listája. Több tucat új bejegyzés is megadásra került, például a szó végi indexszámok közvetlenül beszúrhatók a kalap, és aláhúzás karakterekkel és az automatikus csere segítségével: m^2 → m², CO_2 → CO₂ (az így beszúrt Unicode indexszámokkal itt elkerülhető a dokumentumszerkesztők tipográfiai hibája, az átméretezett, halvány számok használata indexként).
  • Szintén a LibreOffice 4.3-at érintő javítás: a kettőzött többjegyű mássalhangzók feltételes elválasztójelnél való elválasztása az Unicode szabványnak megfelelően (korábban a feltételes elválasztójel beszúrása letiltotta az ilyen elválasztást, l. hibajegy. Részletesebben: például ha az „asszony” szóba beszúrtunk egy feltételes elválasztójel karaktert a Ctrl-kötőjellel az „as” után, akkor a szót nem választotta el a LibreOffice (ami persze még mindig jobb, mint az „as-szony”, ahogy hasonlókat a Firefoxnál látni, amely nem integrálta megfelelően a Hyphen elválasztási könyvtárat). Most viszont már a helyes asz-szony formájában kerül elválasztásra a feltételes elválasztójelet tartalmazó szó a LibreOffice-ban. Az Eszközök–Nyelv–Elválasztás… feltételes elválasztójeleket beszúró párbeszédablakában is már felkínálásra kerülnek a kettőzött többjegyű mássalhangzóknál lévő elválasztási pontok (bár nem ez ajánlott az automatikus elválasztásra, hanem a bekezdésformázás Szövegbeosztás lapján lévő automatikus elválasztás).
  • A LibreOffice 4.3 saját szótárában lehetőség van a kettőzött többjegyű mássalhangzók elválasztásának megadására is a következő új szintaxissal: Rád[zs]dzsal (Ráddzsal → Rádzs-dzsal), ko=nya=kos=meg[y]gye=zik (konyakosmeggyezik → ko-nya-kos-megy-gye-zik). Ezeket a példákat is a LibreOffice korábban nem, vagy csak rosszul tudta elválasztani. (Folt az angol súgóhoz az új szintaxis leírásával.)
  • Minden nyelvet érint a helyesírás-ellenőrzés és a nyelvhelyesség-ellenőrzés felületének javítása, ahol több zavaró hibát is sikerült megoldani (részletesen: a helyesírás-ellenőrzési párbeszédablakban a „Mindent mellőz” funkció választása az ugyanabban a mondatban előforduló ismételt hibára is vonatkozik már; ugyanitt a nyelvhelyességi hibák kék aláhúzása a „Mindent mellőz”-re eltűnik a megjelenített dokumentumból; a nyelvhelyességi hibák helyi menüjében a „Mellőz” nem a „Mindent mellőz” funkciónak felel már meg; illetve a helyi menüben van már „Mindent mellőz” is a „Mellőz” menüpont mellett, hibajegyek: fdo#56954, fdo#73917, fdo#73868), illetve helyreállításra került a magyar és angol nyelvhelyesség-ellenőrző mértékegység-konvertálási lehetősége (folt).
  • Windows hálózati környezetben a magyar és más nyelvű helyesírás-ellenőrzés képessége időnként elveszett a platform fájlnévkezelési sajátosságai miatt. A Hunspell helyesírás-ellenőrző ezért a standard fopen() helyett most már a Windows saját fájlkezelési függvényét használja a LibreOffice windowsos változatában (hibajegy). Ez a hibajavítás a LibreOffice 4.2.5-ben fog megjelenni.

LibreLogo.org

LibreLogo.org is a new portal dedicated to the easy, Logo-like programming environment of LibreOffice for turtle vector graphics. Main topics: introduction of LibreLogo (see here), development news, education, graphic design and free culture. A short illustrated list of the recent English language articles:

2014-04-03 Hungarian and Norwegian educational materials – a Hungarian LibreLogo textbook (made in LibreOffice) and a Norwegian LibreLogo tutorial

2014-04-01 Color and transparency gradients – LibreOffice 4.3 will support color and transparency gradients in LibreLogo…

2014-03-18 UI/UX fixes – not only the vivid random colors in LibreOffice 4.3

2014-02-20 Word squares – from Unix to LibreOffice…

2014-02-17 LibreLogo poster – in PDF version, for classrooms…

2014-02-11 LibreLogo in LibreOffice 4.2 – PENCAP, FORWARD „text”, SVG and SVG SMIL generation…

2014-02-11 LibreLogo at FOSDEM 2014 – „infinite” maze flyer and a small improvement…

Javított magyar mondatellenőrzés

A Lightproof magyar moduljának új, 1.5-ös kiadása a következő újdonságot és fontos javításokat tartalmazza:

  • Szóközökkel „r i t k í t o t t” szöveg felismerése (keskeny szóköz opció bekapcsolásánál), majd cserejavaslat nem törő keskeny szóközökre, ill. szóközök nélküli alakra. A funkciót Pénzes Dávid, a Neveléstudomány szerkesztője javasolta a kéziratokban gyakran előforduló közvetlen formázás gyors javítására.
  • A szavak hibás exponenciális idejű elemzésének javítása, amely nagyon hosszú szavaknál akár a LibreOffice lefagyását is okozhatta (a hibát a mondatellenőrző által használt CPython megszokotthoz képest kevésbé optimalizált regexp programkönyvtára, és a magyar nyelvi szabályokba csúszott leírási hiba együttese eredményezte, l. 72757-es hibajegy). A Lightproof lefagyását Pénzes Dávid, a LibreOffice lefagyását (amely akkor jelentkezik, ha a Python mondatellenőrző lefagyása után más Python komponenst, például a LibreLogót szeretnénk használni) Lakó Viktória jelezte.
  • Az elromlott (a menüben nem állítható) keskeny szóköz opció működésének helyreállítása;
  • tizedestört vagy sorszám ellenőrzése: a javított változat már nem figyelmeztet, ha pont követi, tehát sorszám;
  • nagy számok ezrestagolásánál többszörös illeszkedés javítása (nincs párhuzamos hibajelzés a szám elejére vonatkozóan).

A LibreOffice.org-ról letölthető, a magyar mondatellenőrzőt tartalmazó LibreOffice következő változatai (4.1.5, 4.2, beleértve a december 20-án már megjelent 4.2 RC1-es változatot) tartalmazzák a javításokat, illetve a fenti címről letöltött mondatellenőrző-kiterjesztés külön is telepíthető.