Lightproof 1.4

Megjelent a Lightproof nyelvi ellenőrző keretrendszer új, 1.4-es változata (benne a szintén most megjelent magyar nyelvi szabályok forrásával). A javított keretrendszerrel elkészített nyelvi ellenőrzők ismét működnek az OpenOffice.org Mac OS X-es változata alatt is. A fejlesztés másik újdonsága, hogy saját Python függvényeket is megadhatunk a nyelvi szabályállományokban, amiket aztán felhasználhatunk a szabályokhoz kapcsolódó feltételvizsgálatokban, illetve javaslatokban.

Új gépre OpenOffice.org-ot ajánl az Origo

„Biztosan nem kell sokat várni az első Excel, Word vagy Powerpoint dokumentum megnyitására vagy szerkesztésére sem, ezért nem rossz, ha már most letölti az OpenOffice legújabb verzióját, amely a magyar nyelvű helyesírás-ellenőrzője mellett már a legújabb fajta Microsoft Office-szal készült fájlokat is meg tudja nyitni.” – írja a legolvasottabb magyar internetes magazin karácsonyi cikkében. A cikkben hivatkozott Szoftverbázis OpenOffice v3.11 (magyar) oldalról több mint 100 000-szer töltötték le az OpenOffice.org FSF.hu Alapítvány által kiadott magyar változatát.

Újdonságok a magyar nyelvi ellenőrzésben

Az előző hírben (A Lightproof lehet a nemzetközi OpenOffice.org nyelvi ellenőrzője) már szerepelt, hogy elkészült a magyar nyelvi ellenőrző natív beállítóablakot is tartalmazó változata. A beállítható szabályok között igazi újdonságok is helyet kaptak, mint például a szerződésekben, számlákban gyakran előforduló, számmal és betűkkel is megadott pénzösszegek konzisztencia-ellenőrzése. “Újdonságok a magyar nyelvi ellenőrzésben” bővebben

A Lightproof lehet a nemzetközi OpenOffice.org nyelvi ellenőrzője

A magyar fejlesztésű Lightproof nyelvi ellenőrző ma megjelent változata jelentős fejlesztésekkel bővült. Az FSF.hu Alapítvány támogatásával készült program egyedülálló módon alkalmassá vált arra is, hogy alapértelmezett nyelvi ellenőrzője legyen a nemzetközi OpenOffice.org-nak.

A magyar nyelvi ellenőrző natív beállítóablakkal rendelkezik, ami elérhető az OpenOffice.org kiterjesztéskezelőjében és nyelvi beállításai között is. A másik újdonság, hogy a Lightproof nyelvi modulok most külön telepíthetők (így a magyar nyelvi ellenőrző kiterjesztés lightproof-hu_HU néven érhető el ezentúl), ami előfeltétele volt a különböző Linux-terjesztésekbe, illetve a nem alapítványi OpenOffice.org-változatokba való bekerülésnek.

A Lightproof több mint magyar nyelvi ellenőrző: fejlesztőkörnyezetet biztosít más nyelvi ellenőrzők fejlesztéséhez. A fejlesztőkörnyezet a magyaron kívül angol és orosz nyelvi ellenőrző OpenOffice.org-kiterjesztést is tartalmaz, és a legújabb kiadásban megjelent egyszerűsített szintaxisú szabályokkal és beállítóablak-készítővel még egyszerűbbé teszi az új nyelvek hozzáadását. A gyors fejlesztés mellett további előny, hogy mivel a Lightproof együttműködik az OpenOffice.org-ban meglévő Hunspell helyesírás-ellenőrző és alaktani elemző programmal és az általa kezelt szótárakkal, a kiterjesztések mérete meglepően kicsi maradhat: a több száz szabályt és az új, többnyelvű beállítóablakot is tartalmazó magyar nyelvi ellenőrző kiterjesztés mindössze 19 kB-os.

A Lightproof legújabb változata része lesz a jövő év elején az FSF.hu Alapítvány kiadásában megjelenő, számos egyéb újdonságot is tartalmazó magyar OpenOffice.org 3.2-nek.

Előadás az OpenOffice.org konferencián: nyelvtechnológiai újdonságok

Az OpenOffice.org-ba idén számos nyelvtechnológiai újdonság és hibajavítás került be, amelyről november 6-án tartottam egy összefoglaló előadást a VII. OpenOffice.org konferencián, Orvietóban, Olaszországban.
Az egyik leglényegesebb újdonság a mondatellenőrző programozási interfész, amelyet már számos bővítmény (például a LanguageTool és a Lightproof) használ. Működik a tövezés és toldalékolás a szinonimaszótárakat kezelő tezaurusz komponensben (a Hunspell meghívásával), javításra került az OpenOffice.org 3.0-ban elromlott brit angol elválasztás, és számos régi angol elválasztási hiba is kikerült a programból. Az elválasztómodul jobban támogatja most az összetett szavak elválasztását is, ami nemcsak a magyar, hanem a holland, német stb. nyelvek új elválasztási mintáinak fejlesztését is megalapozza. Az összetett szavak helyesírás-ellenőrzése is javult, most már a svéd, norvég, de az indiai nyelvek speciális igényeit is kiszolgálja. A be- és kimeneti karakterátalakítás jól működő koreai szótár elkészítését tette lehetővé, illetve Unicode normalizálást biztosít az olyan speciális ékezetes betűket tartalmazó nyelvek számára, mint a vietnami és az afrikai joruba. További részletek az előadás magyarra fordított diáiban, PDF formátumban vagy a következő képre kattintva Flash formátumban is (köszönhetően az OpenOffice.org Impress PDF és Flash támogatásának). Köszönöm az FSF.hu Alapítvány támogatását, amit a konferencián való részvételhez nyújtott!

Németh László

Dán és török nyelvi támogatás a Numbertextben

Kiadásra került a számokat betűvel kiíró Numbertext OpenOffice.org Calc kiterjesztés legújabb változata. A kiterjesztés több hibajavítást, valamint új dán és török nyelvi modulokat tartalmaz. A támogatott nyelvek száma így 27-re nőtt (a nyelvi változatokat nem számítva).

A dán nyelv érdekessége a 20-as számrendszeren alapuló tízesek 50-től 90-ig, amelyek a rokon norvég és svéd nyelvből már kikoptak. A következő humoros jelenet ebből csinál viccet: egy dán hajó segítséget remél Oslótól, de baj van a koordinátáival. További információk: NUMBERTEXT.org.

OpenOffice.org-hibajavítás menet közben

Az OpenOffice.org konferencián három rövid előadásban mutattam be az OpenOffice.org nyelvtechnológiai újdonságait. Sajnos az egyik fejlesztés, az angol elválasztás jelentős javítása nem várt hibát okozott: az opcionális elválasztójelek beszúrását segítő párbeszédablakban nem jelent meg többé javaslat az angol szavak elválasztására (mindez nem érinti az automatikus elválasztást, ami a fő beállításokban vagy a bekezdésformázás Szövegbeosztás lapján kapcsolható be). A hiba javítására a visszaúton került sor. A hibát javító folt olyan jól sikerült, hogy az OpenOffice.org 3.2-vel visszatérhet a magyar szótárcsomag az unicode-os magyar elválasztási minták használatára is (amit a párbeszédablak hibás Unicode-támogatása miatt kellett 8 bites kódolású szótárral helyettesíteni).

Köszönöm a fejlesztéshez kapott közvetlen (a javított OpenOffice.org Lingucomponent modul fordítása: Szalai Kálmán), szoftveres (OpenOffice.org 3.2 alapú OxygenOffice tesztkörnyezet: Szalai Kálmán) és hardveres támogatást (kölcsön noteszgép a konferenciára: Németh Krisztián, szivargyújtó-inverter és Dacia márkájú áramforrása: Tímár András)! Utunkat és ezzel ezt a fejlesztést is az FSF.hu Alapítvány támogatta.

Németh László

Újdonságok az OpenOffice.org magyar mondatellenőrzőjében

Az FSF.hu Alapítvány támogatásával elkészült az OpenOffice.org magyar mondatellenőrzőjének új változata, jelentősen bővített magyar nyelvi szabályokkal. Példák az újonnan felismert típushibákra: *megszeretném nézni; *meglett csinálva, *had ne kelljen, *több, mint zavaró, *olyat amilyet, *macska illetve kutya, *a fészer mellet, *a csomagban helyett kapott stb. (l. tesztállomány). Ha már telepítve volt korábban, a mondatellenőrző OpenOffice.org-bővítmény az Eszközök→Kiterjesztéskezelő segítségével is frissíthető az OpenOffice.org-ban.

Mondatellenőrzés az OpenOffice.org-ban

Az újdonságok hátterében az áll, hogy a Lightproof 1.2 mondatellenőrző most már együttműködik az OpenOffice.org Hunspell morfológiai (szóalaktani) elemzőjével. A program új változatában tetszőleges, szófaji és toldalékolási (de gyakorlatilag bármilyen egyéb szótári) információt is tartalmazó kifejezésekkel írhatók le a nyelvi hibajelenségek.

A kiadással a fejlesztés nem zárult le. A következő változatban jelennek meg a választható mondat-ellenőrzési szabályok, amelyek között nemcsak a rossz helyesírók, hanem a korrektúrával napi szinten foglalkozók számára készült szabályokat is találni majd. Az utóbbira példa a korábban már említett, a legújabb fejlesztéssel már kipróbált (de a kiadásban még nem szereplő) összetettszó-tiltó szabály, amely kérésre aláhúzza azokat a gyanús összetett szavakat, amelyek elütés vagy hibás optikai karakterfelismerés révén előálló értelmetlen szavak is lehetnek.

A nyílt forráskódú Lightproof OpenOffice.org-bővítmény mérete az új fejlesztésekkel és a mellékelt forráskóddal sem haladja meg a 40 kB-ot. A kis méret annak is köszönhető, hogy a bővítmény a Hunspell morfológiai elemzőt és a morfológiai adatokat is tartalmazó magyar helyesírási szótárát az OpenOffice.org UNO programozási felületén keresztül használja. A tömörség másik oka a magas szintű Python programozási nyelv, amiben például egy programsor értékeli ki az új mondat-ellenőrzési szabályok logikai kifejezéseit.

A magyar fejlesztésű Lightproof program nemcsak platformfüggetlen, hanem nyelvfüggetlen is. A Hunspell-integrációnak köszönhetően pedig már kezeli a bonyolult alaktannal rendelkező és az egybeíró (sok összetett szót használó) nyelveket is, így sikeresen mutatkozhat be november elején a következő OpenOffice.org konferencián az OpenOffice.org szélesebb nemzetközi közönsége előtt.

A Microsoft Office és az OpenOffice.org magyar nyelve

Ahogy több független (az egyik esetben Mártonfi Attila, az MTA Nyelvtudományi Intézet munkatársa, a mérvadó, Osiris Kiadónál megjelent Helyesírás című kötet társszerzője segítségével készült) vizsgálat korábban megmutatta, a magyar szavak helyesírás-ellenőrzésében a Microsoft Office elmarad az ingyenes, nyílt forráskódú OpenOffice.org-tól.1,2 Az elmúlt évek fejlesztéseinek köszönhetően a többi nyílt forráskódú nyelvi eszköz (elválasztóprogram, nyelvhelyesség-ellenőrző, szinonimaszótár) is felzárkózott és számos pontban felül is múlja zárt vetélytársát. “A Microsoft Office és az OpenOffice.org magyar nyelve” bővebben

Új helyesírási szótár az MR2 és a Sláger Rádió hallgatóinak (is)

Hamarosan több millió magyar felhasználóhoz jut el a szabad magyar helyesírási szótár legújabb, 1.5-ös változata a frissített Firefox- és OpenOffice.org kiterjesztések révén.

Az új szótár részben az OpenOffice.org tövező-toldalékoló szinonimaszótárának működését javítja, részben pedig bővített és javított szókincset tartalmaz. Példák az új szavakra:

ABBA, afrodiziákum, allergológia, árvaellátás, blog, blogol, cigányellenesség, dekupázs, episztémé, feta, fröccsöntött, íjászkodik, immunanyag, impaktfaktor, infokommunikáció, Jobbik, középszürke, lovári, mediáció, melegfelvonulás, mém, MR2, narratíva, netbook, Obama, offshore, ORFK, ökogazdálkodás, pita, plakátol, PSZÁF, Renée, romológia, szender, szexel, szupercella, szuperóriás, szitár, szonár, szopizik, szórványmagyar, sztenderdizál, szútra, talajvesztett, tangram, társasozik, tenyésztojás, termálkút, tofu, vegykezelt stb.;

Az új szókincs egy része más szálon is kötődik az OpenOffice.org-hoz: például az OVSZ, trombocita, immunhematológia, szervátültetett stb. szavak bekerülésének egyik apropója, hogy az Országos Vérellátó Szolgálat OpenOffice.org használatára áll át idén a Novell Magyarország segítségével, a csere mintegy 500 felhasználót érint. A hibás *Novellel alak helyett most már csak a Novell-lel a helyes. A felismert Boros, Bochkor szavak mellé a Voga is csatlakozott, nem kis részben a Sláger Rádió 2009. szeptember 7-i Bumeráng adásának köszönhetően, ahol a névadók több mint egymillió rádióhallgatóval ismertették meg az OpenOffice.org Writert és Impresst, az OpenOffice.org szövegszerkesztőjét és bemutatókészítőjét. Akik elmulasztották volna: OpenOffice.org a Sláger Rádióban. Az OpenOffice.org magyar honosításáért felelő FSF.hu Alapítvány neve is régóta hiányzott a szótárból, ennek pótlására is most került sor.

A változások részletes listája.