A számítógépen tárolt dokumentumok
idõtálló formátuma: az SGML/XML

Egyszeres felvitel, sokirányú felhasználás

- beszámoló -

Moldován István
MKE EKSZ elnök
moldovan@lib.bke.hu

 

Idõpont: 1999. május 18.
Helyszín: Országos Széchényi Könyvtár
Szervezõ: Magyar Könyvtárosok Egyesülete Elektronikus Könyvtár Szekció
http://www.bibl.u-szeged.hu/mke_eksz

Moderátor: Bakonyi Géza, JATE Egyetemi Könyvtár
http://www.bibl.u-szeged.hu

Elõadók:

Május 18-án az OSZK VIII. emeleti tanácstermében zajlott le nagy sikerrel az MKE Elektronikus Könyvtári Szekció által rendezett szakmai nap, amely az SGML/XML szabvánnyal, technológiával és néhány alkalmazásával ismertette meg az érdeklõdõket. A közel 50 fõs közönség többsége könyvtárakból érkezett, de voltak érdeklõdõk múzeumokból, kiadókból, számítógépes cégektõl, a postától, sõt a MATÁV-tól is. Az SGML-rõl egyre többet hallunk, mint egy varázsszóról, a jelentésérõl, jelentõségérõl azonban még sokunknak nincsenek igazán ismeretei. Rendezvényünk ezen próbált meg segíteni.

A bevezetõ elõadást Domokos László, a STEP Kft ügyvezetõ igazgatója tartotta. Áttekinthetõ és közérthetõ módon mutatta be az SGML technológia közegét, az információs társadalom változó elektronikus formátumait, a digitális információ hatékony feldolgozásának igényét. A számítástechnika elterjedésével egyre nagyobb tömegû információ jön létre különbözõ elektronikus dokumentumok formájában. Ezen formátumok azonban változóak - jól ismerünk olyan elterjedt szövegszerkesztõket, amelyek saját, korábbi verziójukkal is alig-alig kompatibilisek -, az információk hatékony visszakeresésére önmagukban nem alkalmasak, eszközfüggõek. Az elektronikus formátumok többsége még nem szakadt el annyira a nyomtatott világtól, hogy a hangsúlyt ne a formai elemekre, a formázásra tegye, hanem a tartalomra, a benne lévõ információkra. Az SGML, amely 1988. óta hivatalos ISO szabvány (ISO 8879) ezekre a problémákra kínál egy lehetséges, ígéretes megoldást. Az SGML lényegében az Interneten jól ismert HTML formátumleíró nyelv "szülõanyja", hiszen a HTML tulajdonképpen egy redukált SGML alkalmazás. Lényege, hogy a szöveg tartalmi, struktúrális elemeit egyszerû, bármilyen programmal olvasható ASCII karakterekkel jelölje meg. A túl bonyolult és összetett SGML szabvány mellett jelent meg a közelmúltban az XML nyelv, amely már egy egyszerûsített, Internetre alkalmazott SGML-nek tekinthetõ. Az XML szabványt elkezdték támogatni a számítástechnikai ipar kiemelkedõ szereplõi is, így a közeljövõben megjelenõ szövegszerkesztõk, táblázatkezelõk, Web böngészõk már ismerni, felismerni fogják. A szövegek SGML-ben való tárolása drága SGML szerkesztõkkel, idõ- és költségigényes munka, de hosszú távon a befektetések megtérülését ígéri.

Szalai Attila, a Neumann Ház informatikusa az SGML konkrétabb, könyvtári alkalmazásait ismertette. Az SGML szabványok fejlõdésük során elérték a könyvtári világot is és kifejlesztették a szabványos bibliográfiai rekordformátum, a MARC SGML leírását is. Ennek jövõbeli bevezetésével, elterjedésével lehetõvé válhat az így feldolgozott rekordok kezelése, visszakeresése SGML eszközökkel is. Sõt, teljes szövegû elektronikus dokumentumok esetén közvetlen kapcsolat teremthetõ a bibliográfiai leírás és a teljes szöveg között. Ezt az eljárást alkalmazzák egy jelenleg futó projekt munkájában, amelyrõl részletesebben

Tószegi Zsuzsa, a Neumann Ház igazgatónõje számolt be. A tavaly indult Digitális Halhatatlanok, majd Digitális Irodalmi Akadémia névre keresztelt projektet a kulturális minisztérium indította és a Petõfi Irodalmi Múzeum és Kortárs Irodalmi Központ szervezi. A projekt keretében 33 magyar író és költõ teljes életmûve kerül fel majd digitális formában a hálózatra. Ennek a Neumann Ház lesz majd a szolgáltatója és technikai kivitelezésének felügyelõje. A munka során úgy döntöttek, hogy ezt az óriási irodalmi szöveget SGML szabványban rögzítik és fogják szolgáltatni. Az anyagot az ún. TEI kódolással rögzítik, amelyet a hazai, szélesebbkörû elterjedés végett magyarítottak.

Turi László röviden az SGML szabvány egyik konkrét alkalmazását, a TEI-t (Text Encoding Initiative-t) smertette. Az SGML csak egy általános szabvány arra, hogyan lehet a szövegben rögzíteni annak tartalmi, strukturális elemeit. Az egyes szakterületeken azonban még ki kell dolgozni ennek konkrét alkalmazásait. Négy amerikai egyetem oktatói évekkel ezelõtt létrehozva a TEI-t, a bölcsészettudományok által vizsgált szövegtípusok területén (pl. próza, versek, dráma, fordítások, nyelvészeti korpuszok, szótárak, kritikai forráskiadások, történettudományi források) dolgozták ki a konkrét SGML alkalmazásokat és fejlesztik a mai napig.

Pajzs Júlia szintén egy konkrét SGML alkalmazást ismertetett, annak érthetõbbé tétele érdekében. Az MTA Nyelvtudományi Intézetben már évek óta dolgoznak a Magyar Nagylexikon kiadásán. Az Intézet már az SGML szabvány megjelenése elõtt elkezdte szépirodalmi szövegek rögzítését, nyelvészeti elemezés céljából, az SGML elvi alapjai alapján. Késõbb ez a szövegállomány képezte alapján a Magyar Történelmi Szövegtárnak, amelyben 19-20. századi magyar szépirodalom 17 millió szavában lehet lehet összetett, nyelvészeti visszakeresést végezni. Az Intézetben az SGML szabványban nem szereplõ, de a speciális igényeket kielégítõ továbbfejlesztéseket is végeztek a szövegek kódolásán.

Prószéky Gábor a jól ismert Helyes-e és egyéb magyar számítógépes nyelvészeti termék fejlesztõje az SGML technológia alkalmazásáról beszélt a szótárak készítésében. Bemutatta legújabb fejlesztésüket, a MoBiDictionary-t, amely egy virtuális Internetes szótár. A kliens-szerver alapú szótár segítségével az általuk készített és - a tervek szerint - egyéb Internetes szótárakban lehet majd egyszerre, könnyen, gyorsan keresni.

A rendezvény moderátora Bakonyi Géza volt, aki a JATE Központi Könyvtárában maga is foglalkozik az SGML technológia könyvtári alkalmazásával, sõt oktatóként már a jövõ könyvtárosait illetve a továbbképzésben résztvevõket is megismerteti ezekkel az új, a többség számára egyelõre misztikus fogalmakkal. Az elõadások után a közönség kérdésekkel igyekezett tisztábbá tenni néhány fogalmat és felvetõdõ problémát, de a többség számára - vélhetõen - ez a rendezvény inkább az SGML-lel való közelebbi megismerkedésre szolgált.

Az elõadók elõadásaikból, egyéb tájékoztató anyagokból, cikkekbõl a Szekció Web oldalán egy külön SGML oldalt tervezünk szerkeszteni, egyrészt, hogy azok is tájékozódhassanak a rendezvényünkrõl, akik nem voltak ott másrészt, hogy a témával kapcsolatos további információs anyagoknak is otthont adjunk.

- *** -


visszaVissza a MKE-EKSz nyitólapra