Magyar nyelvi fejlesztések V.

Az FSF.hu Alapítvány támogatásával folyó fejlesztések legfrissebb újdonságai:

  • Bővített nyelvhelyességi szabályok és javított szótördelés az automatikus hivatkozások toldalékának és névelőjének ellenőrzésére, pl. *(2)-ban,  *n)-t – helyesen n)-et –, *az b) pontban (videó);
  • új magyar átírások a helyesírási szótárban: pl. sznekk, soppingol, videófilm (már nem videofilm), a vitatott dínó újra helyes dinóként is, valamint számos más javítás és bővítés, részben Tuna András, Pénzes Dávid, Gyuris Gellért, Úr Balázs gyűjtése alapján.

Fals hibajelzés helyett valódi segítség

Ilyen volt…

Ahogy az előző, Okos(abb) helyesírás c. hírből kiderült, nincs már hibás piros aláhúzás a mellékelt képen látható esetekben. Ezzel, és az alább felsorolt fejlesztésekkel lehetővé vált, hogy az automatikus kereszthivatkozások gyakori problémáját, a számozás változása miatt hibássá váló ragozást és névelőt kék aláhúzás jelezze, ahogy az első képen, illetve videóban is látható.

  • Új mondatellenőrzési szabályok a Lightproof magyar moduljában: 1, 2, 3.
  • LibreOffice javítása: automatikus hivatkozások tartalmának átadása a mondatellenőrző számára (a tdf#69416 hibajegy javítása során megjelent regresszió megoldása).
  • LibreOffice javítása: a ragozott a), b), c) stb. automatikus hivatkozások jobb szótördelése (fals hibajelzés megszüntetése, pl. a „b)-ben” esetén már nincs pirossal aláhúzva a „ben” akkor sem, ha automatikus kereszthivatkozás szerepel a zárójel előtt).
  • Tesztállomány (tdf#116072 hibajegy csatolmánya)
  • Egyéb javítás. A mondatellenőrző felismeri a következő típusú gyakori szótévesztéseket is: *a fájlal (helyesen a fájllal), *a szexel (a szexszel), *a pénzel (a pénzzel), pl. „az emberek akkor tanulnak meg a pénzel gazdálkodni” [Domokos László: meg kell tanítani a pénz értelmes elköltését, Állami Számvevőszék hírportálja, 2018. február 16.] (videó)

Helyesírási szótár

Új, frissített helyesírási szótár került a LibreOffice-ba. A folt (azaz a kódváltozás) mérete most erősen optimalizálva van, és csak a ténylegesen új vagy megváltozott tulajdonságú, illetve törölt szavak láthatóak benne, a makealias névre hallgató Hunspell szótártömörítő továbbfejlesztésének köszönhetően. Példák a pár ezer javításból:

  • Míg hivatalosan nem derül ki, melyik a helyes, a dínó (AkH. 12. kiadás, Akadémiai Kiadó, 2015) újra helyes dinóként is (Magyar helyesírási szótár, Akadémiai Kiadó, 2017). (A dinóval szemben a Vietnám megerősítést nyert, l. Mostantól: Vietnám!, Magyar nyelvi szolgáltató iroda, e-NYELV.hu, 2017. október 17., így az elavult Vietnamot csak a nem alapértelmezett „AkH. 11.” felhasználói szótár bekapcsolásával fogadja el helyesnek a LibreOffice);
  • Számos hibásan egybeírt szó kerül most elutasításra: *tanárnéni (tanár néni), *múltnyáron, *tökhülye (tök hülye), *összkerékmeghajtású (összkerék-meghajtású), *dióméretű, *adójellegű, *macskaformájú, de pl. a zárvatartás már egyben is helyes, hasonlóan a nyitvatartáshoz.
  • Érdekes új szavak: saolin, gyorskorcsolyázik, celeb, trendi, depilál, langalló, eszterág, B1, B12-vitamin, nyúzat, csíkolat, előtelep, kabaktermés, orsolyita, johannita, funky, gospel, soul, vlog, twitterezik, facebookozik, guglizik, vizualizál, promotál, frappé, light, lightos, nachos, popcorn, retriver (nem *retriever), gekkó, degu, impala, cikász, favella, enyhely; biosz, zacsi, sali, aluliskolázott, karonülő, blazár, magnetár, 60-an, ezervalahányszáz, megötvenháromszorozták, homofób, demens, kontraszelektál, kontraproduktív, bürokratizál, fejetlenkedik, feudalizál, kézivezérelt, kafkai, idejemúlt, NER.
  • Érdekes javítások: *orvgazda és *orrgazda → orgazda, *fujj (pfuj), *brossúra (brosúra), *boxeralsó (bokszeralsó), *sprotni (csak sprottni), *topp, *pártag (párttag), *pármai (parmai), terrabájt (helyes javaslat is: terabyte).
  • A -val,-vel toldalék minden alakja önállóan is felvételre került, hogy (kötőjellel kezdve) is elfogadásra kerüljön, a hivatkozások és toldalékolt idézőjelbe tett kifejezések elfogadása céljából, pl. a -rel toldalék „A jedi visszatér”-rel kifejezésben.

Megemlítendő még a kicsi, de hasznos fejlesztés, amely megkönnyíti az aposztróf beszúrását a magyar nyelvű felhasználók számára, l. Hová tűnt az aposztróf?

“Magyar nyelvi fejlesztések V.” bejegyzéshez 6 hozzászólás

  1. A kerdesem: letezik-e, es ha nem, akkor tervben van-e olyan megoldas, hogy a mezobe kerulo szamot helyesen ragozza. Pl:
    […]-szor
    ami nem mindig “szor”, neha “szer”, neha “ször” kellene, attol fuggoen, hogy milyen szam kerul bele a mezobe:
    1001-szer
    1005-ször
    1006-szor

    Jo lenne erre valami automatizmus, amivel megmondhatom, hogy a mezo utan nem feltetlenul azt szeretnem latni, amit beirtam (“szor”), hanem a harom lehetseges opcio kozul azt, ami nyelvtanilag odaillik.

    Van/lesz erre lehetoseg?

    1. Ideális megoldás az Adobe által használt GREP stílus (l. https://indesignsecrets.com/5-cool-things-you-can-do-with-grep-styles.php) megvalósítása volna a LibreOffice-ban, így a felhasználónak semmit nem kellene csinálnia a megfelelő „GREP” szabályok esetén. Leírja pl. hogy (5)-ször, és ha a mezőtartalom megváltozik, akkor automatikus javul a toldalék is.

      Van egyébként toldalékolás a LibreOffice-ban most is, pl. gépeljük be, hogy „egérrel”, a Ctrl-F7-et lenyomva a szón, megkapjuk a „rágcsálóval” helyesen toldalékolt szinonimát is.

      A számok egy kicsit mostohán voltak kezelve idáig. Most sok minden javításra került, de a -szor/-szer/-ször még mindig nem tökéletes a toldalékolásnál (sem) a legutóbbi béta kiadásban:

      ~/hunspell/src/tools$ ./analyze ~/magyarispell-1.7/hu_HU_u8_gen_alias.{aff,dic} /dev/stdin
      egy tízszer
      generate(egy, tízszer) = egyszer
      kettő tízszer
      generate(kettő, tízszer) = kettőször
      generate(kettő, tízszer) = kettedször (! – a fejlesztői változatban már javítva)
      három tízszer
      generate(három, tízszer) = háromszor
      négy tízszer
      generate(négy, tízszer) = négyszer
      öt tízszer
      generate(öt, tízszer) = ötször
      hat tízszer
      generate(hat, tízszer) = hatszor
      hét tízszer
      generate(hét, tízszer) = hétszer
      nyolc tízszer
      generate(nyolc, tízszer) = nyolcszor
      kilenc tízszer
      generate(kilenc, tízszer) = kilencszer
      húsz tízszer
      generate(húsz, tízszer) = hússzor
      1 10-szer
      generate(1, 10-szer) = 1-edszer (!)
      2 10-szer
      generate(2, 10-szer) = 2-edszer
      3 tízszer
      generate(3, tízszer) = 3-adszor
      4 tízszer
      generate(4, tízszer) = 4-edszer
      5 6-szor
      generate(5, 6-szor) = 5-Ăśdször (! – a fejlesztői változatban javítva)

      Fejlesztés alatt van a Numbertext programkönyvtár C++11 implementációja (l. http://www.numbertext.org), és kicsit a nyelvi leírások bővítése, beleértve talán a számok magyar esetragjainak leírását is, hogy Hunspell nélkül is menjen a számok toldalékolása.

  2. Számoknál – 23 ezer, 4 millió, stb. – szóköz kellene a helyesírás szerint, másfelől tipográfiai hiba javítása miatt kifejezetten nem törhető szóköz való ide, de még akkor is, ha nagyobb számokról van szó: 30 000 (és valaki nem ponttal írná ezt -> automatikus javításban.)

    Szám és az azt követő mértékegység közé is nem törhető szóköz való.

    Az esetleges téves mértékegység gépelést (pl. C°) is javítani kell: (°C, °F, °K)

    23 °Ckal, 23 °Con (°F, °K szintén) hibás; helyesen: °C-kal

    1. Köszönöm a javaslatokat!

      A következő kiadás már tartalmazni fogja a °F-ot és °K-ot is, a °C már a javasolt működik:

      °Con
      & °Con 2 0: °C-on, °-on

      °Ckal
      & °Ckal 2 0: °C-kal, °-kal


      & C° 10 0: °C, °, C, Cs, Cl, Ch, Cg, cm, C., C °

      A LibreOffice Linux Libertine G és Linux Biolinum G betűtípusával automatikus a nagy számok számjegyeinek tagolása.

      A nagy számok tagolására nem figyelmeztet alapból a mondatellenőrző, de bekapcsolható az Eszközök->Nyelvi beállítások->Magyar mondatellenőrző lap Nagy számok tagolása szóközökkel opciójával. Ez nem törő szóközöket illeszt be javaslatként, de ha a Keskeny szóköz opciót is kiválasztjuk a lapon, akkor a javaslat nem törő keskeny szóközöket használ (hasonlóan az említett betűtípusokhoz).

      1. Nem erről szólt a hozzászólás, de meg kell jegyeznem, hogy a Kelvin nagy K-ja mellé semmiképpen nem kell a ° fok jel. Se elé, se mögé.
        ((És dupla zárójelben, hogy a százalék %, ezrelék ‰ és a szög-fok ° /és törtrészei: szögperc, szögmásodperc/ azok a mértékegység (jellegű) jelek, amiket szóköz nélkül “ragasztunk” az értékhez. A milliomodrészt: ppm – tudtommal – már szóközzel kell írni…))

        1. A Kelvint tényleg nem °-kal írjuk! Köszönöm a javítást!

          A °C egybeírását a számmal, vagy a % és az ezrelékjel különírását javítja a mondatellenőrző: https://farm1.staticflickr.com/815/41003262721_d11da3e729_o_d.png

          Van egy-két érdekes vonatkozó szabály még, amit ismer a Hunspell és a magyar szótára, például nem engedi a mértékegységeket nagybetűsíteni: csak a „kg” helyes, a „Kg” és a „KG” nem.

Hozzászólás a(z) Németh László bejegyzéshez Kilépés a válaszból

Az e-mail-címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük