Cseh Gergő Bendegúz – Lux Zoltán: Informatika a Történeti Levéltárban

Cseh Gergő Bendegúz – Lux Zoltán: Informatika a Történeti Levéltárban

(Megjelent: Trezor 3. 283-294)

A Történeti Levéltár iratainak jellege a számítástechnikai feldolgozás szempontjából

A Történeti Levéltár mint a Történeti Hivatal jogutóda, a közelmúlt magyar történelmének különleges intézménye; feladata az 1945 és 1990 között működött állambiztonsági szervek által keletkeztetett iratanyag őrzése és jogszabályok szerint kezelése. Az intézmény által átvett iratanyag speciális jellege és állapota, valamint a különböző jogszabályokban rögzített – a Levéltári törvényben foglaltakon túli – többletfeladatokból következően az intézmény informatikai rendszerének kialakítása során nem alkalmazhattunk kész számítástechnikai megoldásokat. Mindamellett a levéltári informatika hazai, valamint külföldi tapasztalatait is csak korlátozott mértékben kamatoztathattuk.

A jogelőd Történeti Hivatal által kezelt iratanyag részletes leírása nem tárgya írásunknak(1), meg kell azonban említeni néhány olyan fő jellegzetességet, melyek az informatikai rendszer tervezésekor meghatározóak voltak.

A „megörökölt” korabeli segédletek az iratok tárgy szerinti kutatását semmilyen formában nem támogatták: a mintegy százezer, eredeti irattári rendben őrzött dosszié között sem tartalmi elemek, sem az egyes iratok időrendi, földrajzi stb. paraméterei alapján nem volt lehetséges tudományos kutatást folytatni. Rendelkezésre álltak ugyan bizonyos tárgymutató könyvek, ezek azonban nem az eredeti iratok korabeli segédletei voltak, hanem részben az állambiztonsági szervek dolgozóinak, részben pedig az anyagot 1990 után kezelő munkatársak saját készítésű és magánhasználatú regiszteres tárgymutatói. Keletkezésük körülményeiből adódóan ezek a mutatók távolról sem ölelték fel az iratanyag egészét, nem egységes szempontok szerint készültek és nem voltak mentesek a szubjektív szempontoktól, hibáktól sem. Ráadásul a rendkívül sokrétű, szerteágazó, számos ügyet és érintettek százait átfogó dossziék sokaságát általában egy-két tárgyszó alá szorították be, ami az utólagos visszakeresést csak igen korlátozottan segítette.

A különböző típusú (vizsgálati, operatív, munka, beszervezési stb.) dossziékhoz készült eredeti naplók adattartalmuk miatt kutatási segédletként teljességgel használhatatlanok voltak, mivel az irat jelzetén és címén kívül – ez utóbbi általában csak egy név vagy fedőnév – a téma azonosítására alkalmas információt egyáltalán nem tartalmaznak. Ráadásul a több évtizedes folyamatos igénybevétel és a szakszerűtlen kezelés(2) következtében ezen naplók többsége rendkívül veszélyeztetett állapotba került és sok helyütt helyrehozhatatlan károsodást is szenvedett.

Az iratok visszakeresését segítő korabeli segédletek közül az operatív nyilvántartást végző mindenkori állambiztonsági szervezeti részleg által vezetett ún. operatív kartonok bizonyultak leginkább használhatónak, ez a mintegy 160 000 kartont tartalmazó nyilvántartó rendszer azonban korántsem tartalmazta az iratokban szereplő személyek teljes körét. Az operatív vagy vizsgálati eljárás alá nem vont személyeket ugyanis nem vették fel az operatív nyilvántartásba, ezért a tudományos kutatás vagy az állampolgári adatszolgáltatás szempontjából fontos, milliós nagyságúra tehető névanyagnak csak egy töredékéhez juthattunk el a fenti kartonrendszer segítségével.

A dossziék a korabeli iratkezelési gyakorlat és a papírminőség fogyatékosságai következtében többségükben rossz állapotban, szakadozottan, ragasztószalagokkal foltozottan kerültek a Történeti Hivatalba, ezért az informatikai rendszer tervezése során az eredeti anyagokat kímélő digitális biztonsági másolatok készítésére és nagy mennyiségben való használatukra is fel kellett készülnünk.

Az állambiztonsági szervek által készített, illetve összegyűjtött iratanyag túlnyomó többsége az Adatvédelmi törvény által megfogalmazott ún. különleges adatok – faji eredetre, politikai véleményre, pártállásra, vallásos meggyőződésre, egészségi állapotra, kóros szenvedélyre, szexuális életre stb. vonatkozó adatok tömegét tartalmazza, ezen kívül bőséggel tartalmaz jelenleg is minősített iratokat. Ezeknek az adatoknak a fokozott védelme – a közérdekű adatok nyilvánosságának biztosítása mellett – az intézmény kiemelt feladatai közé tartozik.

A jogszabályok az intézményt a levéltári törvényben megfogalmazott szakmai követelményeken túl olyan feladatokkal is megbízták, melyek teljesítése alapvetően meghatározta az informatikai rendszerrel szemben támasztott komoly követelményeket is. Az állampolgárok információs önrendelkezési jogának biztosítása, valamint a közbizalmi funkciókat betöltő személyek állambiztonsági múltját vizsgáló bizottságoknak – közkeletű nevükön az átvilágító-bizottságoknak – történő adatszolgáltatási kötelezettség pontos, gyors és megbízható teljesítése elképzelhetetlen lett volna az informatikai rendszer célirányos kialakítása és az iratok mielőbbi gondos feldolgozásának megkezdése nélkül. Az említett adatszolgáltatási kötelezettségek tehát olyan, más levéltárakhoz képest rendkívüli többletfeladatokat róttak és rónak jelenleg is a Történeti Levéltárra, melyeket csak az átlagosnál magasabb létszámmal és a számítástechnikai rendszer kialakítására, valamint adatokkal való feltöltésére fordított, más levéltárakhoz viszonyítva komoly pénzügyi források révén lehetett teljesíteni.

A Történeti Hivatal megalakulását követően megindult a legfontosabbnak vélt dossziék névmutatójának elkészítése, a leggyakrabban használt segédletek adatainak – pontosítással egybekötött – számítógépes rögzítése, valamint a leginkább igénybe vett dossziék digitalizálása. A kezdetben használt, nem specializált adatbázis-kezelő szoftver mintegy két év alatt érte el teljesítőképessége határait: ezután már a kezelendő adatok mennyisége, de különösen a digitalizált oldalak kezelési problémái, illetve a különleges biztonsági követelmények miatt feltétlenül szükség volt nagy teljesítményű, különleges igények teljesítésére is képes új központi adatbázis kifejlesztetésére.

Az informatikai rendszerrel szemben támasztott legfontosabb követelmények

A Történeti Levéltár iratanyaga fenti jellemzőinek ismeretében az új informatikai rendszer megtervezésekor az alábbi főbb követelmények fogalmazódtak meg(3):

A kialakítandó adatbázisnak alkalmasnak kellett lennie arra, hogy a dossziékban szereplő, akár több milliós névanyagot gyorsan, megbízható módon kezelje, a redundáns, feleslegesen ismétlődő adatok kiszűrését is lehetővé tegye és az érintett személyek adatai alapján a rájuk vonatkozó dossziék visszakeresését a lehető legtöbb formában és szempont szerint biztosítsa.

A tudományos kutatás szempontjait figyelembe véve az iratok tárgy szerinti kutatását oly módon kellett biztosítsa, hogy az egyes dossziékkal kapcsolatban rögzített közel ötven adattípus (melyek az adott dosszié típusával, címével, keletkezésének időrendi és földrajzi körülményeivel, fizikai jellemzőivel, tárgy-besorolásával és egyéb jellemzőivel kapcsolatban tartalmaznak információkat) bármelyike alapján legyen visszakereshető az adott dosszié.

Az eredeti iratok védelme, további károsodásuk megelőzése érdekében az új informatikai rendszernek nagy mennyiségben és gyorsan kellett biztosítania digitális biztonsági másolatok kezelését, szükség esetén az anonimizálás (a kutató vagy az állampolgári betekintő számára nem megismerhető adatok „kitakarásának”) biztosítását, valamint a digitalizált munkapéldányok elektronikus úton történő továbbítását.

Az intézmény napi ügyintézésének hatékony támogatása érdekében a központi adatbázisban kellett kezelni az ügyfél- és kutatószolgálati nyilvántartásokat is, hogy a dossziék nyilvántartása, valamint azok használatának, az azokból történt adatszolgáltatásoknak a nyilvántartása napra készen összevethető legyen.

A személyes adatok, valamint a minősített adatok védelme érdekében az informatikai rendszernek differenciált hozzáférési és módosítási jogosultság-rendszerrel kellett rendelkeznie, biztosítania kellett az adatok megtekintésének, módosításának, törlésének folyamatos naplózását, ki kellett zárnia az adatokhoz való illetéktelen hozzáférés és a szándékos vagy véletlen károkozás lehetőségét.

A fenti, vázlatosan összefoglalt követelmények megfogalmazása és a közben szerzett működési tapasztalatok együttesen tekinthetők a felkészülés-tanulás időszakának. Ezt követően 2000 tavaszán kezdődött meg a Történeti Hivatal új központi adatbázisának fejlesztése; a munka első üteme 2001 tavaszán zárult le. Az új adatbázisnak az iratok nyilvántartására szolgáló elemét ekkor vezettük be, az ügyfélszolgálati nyilvántartások kezelésére szolgáló modul – az időközben felmerült változtatási igények, valamint az intézmény központi számítógépének túlterheltsége miatt – csak 2003 tavaszától működik.

A Történeti Levéltár központi adatbázisának főbb technikai jellemzői

A Történeti Levéltár központi adatbázis kiszolgálója Oracle 8.1.7. szerver. A felhasználói programok SQL-net-en keresztül kapcsolódnak az adatbázishoz és kliens/szerver módon működnek. Tekintettel arra, hogy az adatbázisrendszer továbbfejlesztését a különböző, már most látható igényeket figyelembe véve több évre tervezzük, az Oracle adatbázis-kezelő újabb verzióinak alkalmazását is valószínűnek tartjuk.

Az adatbázis felhasználói programjával két fizikailag elkülönülő adatbázishoz lehet kapcsolódni. Ez praktikusan arra ad lehetőséget, hogy legyen egy folyamatosan elérhető kísérletezésre, gyakorlásra, új funkciók megtanulására használható teszt-adatbázis. Mindkét adatbázis teljesen azonosan működik azzal a különbséggel, hogy fizikailag más Oracle adatfájlhoz kapcsolódnak.

Az adatbázisban nem csak a dossziék (később részletezendő) technikai és tartalmi leírását tároljuk, hanem a dossziék oldalainak digitalizált képét is. A képfájlok vagy mikrofilmről vagy (általában) A4-es nagyságú eredeti dossziéoldalakról kerülnek digitalizálásra *.tif formátumban. A képfájlok átlagos mérete 150–300 KB. Egy–egy dosszié-leíráshoz a dosszié terjedelmétől függően akár 1000 darab képfájl is kapcsolódhat. A képfájlokat külön táblában tároljuk, amelynek rekordjait (sorait) egy közvetítő (kapcsoló) tábla segítségével rendeljük a dosszié tábla megfelelő rekordjaihoz (soraihoz). Lehetőség van akár a dossziék teljes szövegének tárolására is, azonban ezt a lehetőséget még nem használjuk. Az optikai karakterfelismerés (OCR) tapasztalataink szerint jelenleg nem alkalmas arra, hogy a többségükben gyenge minőségű papírra készült, sokszor rossz állapotú írógéppel írt, kézírásos megjegyzésekkel tarkított eredeti iratokat kellő hatékonysággal értelmezze és szöveges állományokká alakítsa át. Még az újabb, „tanítható” karakterfelismerő programok is csak rendkívül időigényes utóellenőrzéssel és manuális módosításokkal képesek értelmes szöveggé alakítani a képfájlokat, ebben az esetben azonban a munka elvégzésére fordítandó energia és annak hasznosulása már korántsem áll arányban egymással.

Az eredeti dossziék digitalizálása – akár papírról, akár korábbi mikrofilm-másolatról készül – egyaránt szolgálja az eredeti iratok állagmegóvását, valamint az iratanyag sokrétűbb és párhuzamos hasznosíthatóságát. A digitális képfájlok esetében lehetőség nyílik arra, hogy a szükséges letakarásokat, kivágásokat is elektronikus úton, az adatbázis saját fotószerkesztő programjával hajtsuk végre, majd az ily módon tárolt, anonimizált másolati példányt megőrizzük későbbi felhasználásra.

Az adtabázisban tárolt információk jelentős részének minősített jellege, valamint a személyes adatok fokozott védelme miatt nagy hangsúlyt kellett fektetni az adatokhoz történő hozzáférést szabályozó jogosultsági rendszer kialakítására. Az adatbázis felhasználói programjában valamennyi menüponthoz és kezelőgombhoz való hozzáférés minden – feladatkör szerint kialakított – felhasználói csoport esetén külön megadható. Van, aki csak lekérdezhet egy információt, van, aki módosíthatja vagy törölheti is, de az is részletesen szabályozható, hogy kik nyomtathatnak, kik tarthatják karban a különböző segédtáblákat (nevek, tárgyszavak, kódok, stb.), vagy kik adhatnak másoknak jogot az általuk elérhető hozzáférésekhez és funkciókhoz.

Minden egyes rekord esetében is megadhatóak hozzáférési korlátozások. A rendszergazdai jogosítványokkal rendelkező felhasználó megadhatja az úgynevezett kezdeti hozzáférési jogokat. Ez azt jelenti, hogy ha a rekord bevivője nem „rendelkezik” külön a rekordhoz történő hozzáférésekről (persze szintén csak abban az esetben, ha ahhoz joga van), akkor a bekerülő új rekordok az így megadott jogok alapján lesznek hozzáférhetőek. Ez alapesetben általában nem jelent korlátozást. Azonban akinek jogosultsága van a rekordok bevitele során a hozzáférési jogok módosítására, az megadhatja, hogy egy bizonyos rekordot csak kik láthatnak, módosíthatnak, nyomtathatnak. Ez fontos például minősített iratok esetében.

Az adatbázisrendszerben nemcsak a hozzáférések finom szabályozására, de a rendszerben történt bármilyen művelet nyomon követésére is lehetőség van. Visszakereshető például, hogy mely felhasználó mikor milyen keresést indított el az adatbázisban, s külön az is, hogy a találatok közül mely rekordokat nyitotta (nézte) meg. Visszakereshetővé teszi a rendszer az adatbázisban történt bármilyen módosítást, törlést is. Úgynevezett „shadow” táblákba kerül a módosított rekord módosítás előtti állapota (a módosítás idejének és a módosító felhasználónak a bejegyzésével). Ugyanez vonatkozik természetesen a rekordok törlésére is. Tehát ebből az adatbázisból lényegében nem lehet teljesen kitörölni semmit, mivel a shadow táblákba automatikusan minden bekerül, ami valaha is benne volt az adatbázisban. Így a levéltár adatbázisrendszerében egy már-már orwelli koncepció látszik megvalósulni: minden felhasználóról lehet tudni, hogy mikor milyen adatra keresett, azok közül mely adatokat nézte is meg, mit módosított. Minden egyes rekord esetében lehet tudni, hogy azt ki vitte be az adatbázisba, ki, mikor módosította és ki, mikor nézte meg. Jóllehet ez kissé rémisztően hathat, az adatbázis és az iratanyag speciális jellege esetünkben mindenképpen indokolja a fokozott ellenőrzést az iratokban szereplők személyes adatainak mind teljesebb védelme érdekében.

A Történeti Levéltár közel 50 munkaállomásán fut jelenleg az ABTLINFO elnevezésű program, melynek pillanatnyilag a 71. sorszámot viselő verzióját használjuk. Az első verzió feltelepítése óta eltelt két év alatt nem csak fejlesztések és javítások történtek a programon, hanem sok apró módosítás is, mely a felhasználók napi munkáját volt hivatott megkönnyíteni. Az adatbázis napi használata során ugyanis számtalan olyan kisebb-nagyobb változtatási igény merült fel, melyeket a tervezés során nem lehetett előre látni, a program gyakorlati alkalmazásának hatékonyságát azonban jelentősen javítja.

Az iratokban szereplő személyek számítógépes névmutatójának készítése

Mint azt említettük, a feldolgozó munka egyik legfontosabb feladata, hogy az iratokban szereplő személyek adatai egy gyors és pontos visszakeresést biztosító névmutató rendszerbe kerüljenek. Ennek egyetlen megbízható, ám meglehetősen aprólékos módja az adott dossziék oldalankénti névmutatózása, amit szinte az intézmény megalakulása óta több munkatárs végez folyamatosan. A névmutató készítése természetesen több mechanikus gépírói feladatnál, mivel a redundáns adatok elkerülése érdekében minden, az iratokban előforduló nevet a rendelkezésre álló adatok alapján össze kell vetni az adatbázis közel 400 000 nevet tartalmazó nyilvántartásával. Ez az azonosítás, figyelembe véve az iratokban szereplő személyek adatainak hiányos, gyakran pontatlan, egyértelmű azonosításra ritkán alkalmas voltát, komoly körültekintést és az adott iratanyag alapos ismeretét megkövetelő, meglehetősen időigényes feladat.

A dosszié terjedelmétől, az ügy jellegétől függően rendkívül sok, akár 1000–2000 személy is kapcsolódhat egyetlen dossziéhoz. Ezeket a „neveket” a képfájlokhoz hasonlóan szintén úgynevezett kapcsolótáblákkal rendeljük a dossziék normalizált, technikai és tartalmi adatait tartalmazó „dosszié” rekordokhoz. Az egyes dossziékhoz rendelhető személyek nagy száma miatt különösen alaposan kellett kialakítani a felhasználói programnak az egy dossziéhoz rendelt személyek adatait tartalmazó lista ablak lehetséges funkcionalitásait. Így például a dossziéhoz történő személy-hozzárendelés ablakban a hozzárendelt személyek listaablakában lehetőség van külön keresésre, szűrésre (a hozzárendeltek közül is csak bizonyosok megjelenítése), és bármely adat szerinti sorba rendezésre.

2003 őszéig mintegy 1500 dosszié adatait dolgoztunk fel a fenti módon, a dossziékból, valamint egyéb nyilvántartásokból összesen közel 400 000 nevet rögzítettünk(4) a központi adatbázisban.

A dossziék tartalmi feltárása

Az egyes iratok tartalmi feltárása a névmutató készítésénél is nagyobb körültekintést, az adott irat, valamint a korszak mélyebb ismeretét feltételező tevékenység, melyet értelemszerűen csak az iratot leginkább ismerő történész, levéltáros munkatársak végezhetnek. Az egyes dossziék leírására szolgáló mintegy ötven adattípus felöleli az irat minden olyan fizikai és tartalmi jellemzőjét (típus, terjedelem, évkör, földrajzi paraméterek, tárgyszavak, kódok, minősítések, fizikai állapot, restaurálási eljárások stb.), melyek a későbbi visszakeresést bármilyen módon elősegíthetik.

A tartalmi feltárás meghatározó lépése tárgyszavak és/vagy kódok hozzárendelése a dossziékhoz (vagy akár a személyekhez is). A központi adatbázis tervezésekor arra a helyzetre kellett megoldást találni, hogy az alapvetően feltáratlan és részleteiben ismeretlen iratanyag esetében alkotható-e egységes, statikus kód- és tárgyszórendszer, melybe az iratok a későbbiekben besorolhatók lesznek. Az állambiztonsági szervek intézményrendszerének, valamint a korszak politikatörténetének ismeretében az intézmény történész munkatársai kialakítottak egy strukturált kódrendszert, de a feldolgozás rugalmasságának biztosítása érdekében emellett létrehoztunk egy dinamikusan bővíthető tárgyszórendszert is. Az ABTLINFO esetében a tárgyszó egy strukturálatlan, viszonylag szabadon hozzárendelhető tartalomra utaló kifejezést jelent, az ún. dosszié-kódok pedig lényegében egy tezauruszt alkotnak strukturált alá és fölé rendelési viszonyokkal. Mindkét esetben a dosszié, illetve a személy rekordokhoz történő hozzárendelés kapcsolótábla segítségével történik. Lehetőség van egy adott tárgyszó vagy kód használatának „leállítására” is. Ezután már nem lehet újabb rekordokhoz azokat hozzárendelni, azonban azokhoz, amelyekhez az előbbiek során hozzá lett rendelve, azok esetében a kapcsolat megmarad, visszakeresni még lehet a segítségével.

A fentieken túl a különböző történeti, jogi, szociológiai stb. kutatások szempontjából fontos a dossziékra vonatkozó hosszabb-rövidebb tartalmi kivonatok rögzítése, vagy akár egyes részletek (szükség esetén akár a teljes dosszié) szövegének tárolása is. Így olyan kifejezésekre is lehet keresni, amelyekre az adott tárgyszó és kódrendszerben nem lenne lehetőség. A sokoldalú és árnyalt visszakeresést támogatja a rendszernek a tetszőleges szabadszöveges visszakeresést lehetővé tevő része. Itt azt is meg lehet adni, hogy a megadott kifejezést mely rekordok között, mely mezőkben, milyen csonkolással(5), kis és nagybetű megkülönböztetéssel illetve azonosnak vételével, vagy akár a kifejezés bizonyos karaktereinek ismeretlennek tekintésével(6) keresse.

A dossziék tematikus feltárása kapcsán nehezebb statisztikailag kimutatni az elvégzett munka eredményességét. Egy több száz, esetleg ezer oldal terjedelmű, több száz személyről szóló és sok ügyet átfogó dosszié tematikus feltárása ugyanis praktikusan soha nincs „kész”, mindig lehet újabb szempontokat találni, új tárgyszavakat rögzíteni, részletesebb kivonatot készíteni. A feltáró munka eredményességét mindenesetre jelzi az a tény, hogy 2002 végéig a hivatal munkatársai mintegy 3000 dosszié tematikus feldolgozását végezték el első körben, több mint 16 000 esetben rendeltek tárgyszót, 10 000 esetben pedig tárgykört jelző kódot a dossziékhoz.

Az eredeti iratok digitalizálása

A levéltár informatikai koncepciójának központi eleme szinte az intézmény megalakulásától kezdve az volt, hogy a veszélyeztetett állapotú, illetve gyakran használt iratokat digitalizált másolatokkal kell „kiváltani”: ez alkalmat ad egyrészt a rongálódott iratok további állagromlásának megakadályozására és szakszerű restaurálási munkálatok elvégzésére, másrészről viszont a központi adatbázisban tárolt digitális másolatok sokoldalú és hatékony, párhuzamos használatot tesznek lehetővé az állampolgári és a kutatói irat-előkészítés során. Az adatbázis lehetőséget nyújt a digitalizált oldalak valamennyi anonimizált változatának tárolására is. A kutatások és betekintések során kiadott oldalakat tárolva, a kutatási kérelmekhez a továbbiakban gyakorlatilag a már kikért dossziékat nem kell újból fénymásolni, hanem azt akár digitálisan is rendelkezésre lehet bocsátani. Betekintések esetén pedig a kiadásra történő előkészítésnek csak egy részét kell elvégezni.

A központi adatbázisban 2003 őszén közel 2000 teljes digitalizált dosszié hozzáférését tettük lehetővé, ami több mint kétszázezer oldal iratanyagot jelent.

Az ügyfélszolgálati nyilvántartó rendszer és a központi adatbázis összekapcsolása, valamint az intézmény munkafolyamatainak számítástechnikai koordinálása

Az intézmény ügyfél- és kutatószolgálata szinte a kezdetektől elektronikus úton tartja nyilván az egyes állampolgári kérelmekkel, valamint a tudományos kutatásokkal kapcsolatos alapvető információkat. A központi adatbázis tervezése során a fejlesztővel szemben támasztott egyik alapkövetelmény volt, hogy ezeket a nyilvántartásokat integrálja a leendő központi irat-nyilvántartó rendszerbe. Ennek az összekapcsolásnak nyilvánvaló gyakorlati hasznát az jelentette, hogy a napi ügymenet gördülékenyebbé tétele mellett az egyes iratok használatáról, az állampolgári adatszolgáltatás és a tudományos kutatás során igénybe vett iratokról napra kész és pontos áttekintést kaphasson a jogosult felhasználó. A fejlesztés második ütemében készült el a program ilyen irányú kiegészítése, ennek bevezetésére azonban az intézmény központi szerverének szükségessé vált bővítése miatt csak 2003 tavaszán kerül sor.

Az ügyfélnyilvántartó rendszer szervesen kapcsolódik majd az adatbázis iratanyag-feltáró részéhez. Egy adott személyre vonatkozóan különféle jogokon (saját, házastárs, rokon, meghatalmazott) többen kérhetnek betekintést. Az ügyfél a rendszer egy felhasználója, akinek jóllehet jelenleg még nincs önálló hozzáférése az adatbázishoz, a későbbiek során azonban akár erre is mód nyílhat. Az ügyfelek személyes adatai a munkatársak adataihoz hasonlóan bekerülnek az adatbázis lehetséges felhasználóit tartalmazó személyek adattáblájába.

Az adatbázis kialakítása során az ügyfél- és kutatás-nyilvántartás integrálása során merült fel annak igénye, hogy lényegében magát a Történeti Levéltáron belüli munkafolyamatot, „workflowt” is modellezni kellene. Így mindazt a papírmozgást, ami a betekintési vagy kutatási kérelem beérkezése után a hivatalon belül történik, a központi adatbázis keretein belül valósítsuk meg.

A rendszerben bevezettük az „intézkedés” és a „feladat” fogalmait és a nekik megfelelő táblastruktúrát. Intézkedésnek neveztük lényegében mindazokat a „műveleteket” amelyek az ügyfelek, illetve kutatók és a Történeti Levéltár között zajlanak, feladatnak pedig azt neveztük, ami a hivatal különböző munkatársai között zajlik.

Egy új betekintési kérelem beérkezése egy „Új kérelem” intézkedés rekord létrehozását jelenti. Ebben a rekordban az ügyfélszolgálaton rögzítenek a betekintés szempontjából minden fontos, rendelkezésre álló információt. Az ügyfélszolgálat arra jogosult munkatársa „átadja” a teendőket a betekintéseket előkészítő osztály vezetőjének, aki azt „továbbítja” azaz hozzárendeli az osztály valamely munkatársához és beállítja a feladat elvégzésének határidejét. A hozzárendeléssel létrejön egy bejegyzés az adott felhasználó munkalistájában, amely jelzi a feladat elvégzésének határidejét. A felhasználók a munkalistájukban lévő, elvégzési határidejükhöz közeledő feladatokról rendszeresen jelzést (üzenetet) kapnak. A feladat elvégzése, azaz a betekintéshez szükséges dossziék összegyűjtése és az adott feladathoz, illetve intézkedéshez történő hozzárendelése megtörténtekor a feladatot kiadó „felettes” jelzést, üzenetet kap. Ezután a szükséges ellenőrzési szakaszok után, ami szintén kiadott és elvégzett feladatok formájában képeződik le az adatbázisban, az irat előkészítő osztály vezetője egy újabb feladat létrehozásával visszaküldi az „ügyet” az ügyfélszolgálati osztály megfelelő munkatársának, aki ezután értesítheti az ügyfelet a fellelt iratok átvételi, illetve betekintési lehetőségéről. Az ügy „hivatali menete” során az adatbázisban ennél lényegesen több intézkedés rekord képződik (például a kérelem elfogadásáról, adatkiegészítésről, türelemkérésről, stb.), ezek azonban csak kiegészítik a vázolt folyamatot.

Az ügyfelek nyilvántartásához hasonlóan zajlik a kutatóké is azzal a különbséggel, hogy kutatás esetén az adott téma kizárólag egy kutatóhoz kapcsolódhat. A kutatók szintén az adatbázis személy táblájába bekerült személyek lehetnek. Előfordulhat, hogy ugyanaz a személy egyrészt kutatóként egy vagy több kutatáshoz, ügyfélként pedig egy vagy akár több betekintéshez is hozzá van rendelve. A konkrét iratokhoz való hozzáférés kutatóként valamint ügyfélként különböző, az iratok előkészítési folyamata azonban hasonló.

A Történeti Levéltárban az iratanyagok feltárása folyamatos, a teljes iratanyagnak csupán csekély hányadát sikerült teljesen feltárni és hozzá névmutatót készíteni. Mind a betekintések, mind a kutatások tekintetében egy-egy lezárt üggyel kapcsolatban a folyamatos feltárásnak, köszönhetően időről-időre előkerülnek újabb felhasználható információk, vagyis dosszié részek. Az ügyfélszolgálati és kutatószolgálati modul bevezetésével lehetőség nyílik a már lezárt betekintésekhez és kutatásokhoz kapcsolódó a tényleges betekintést követően fellelt dossziék kimutatására. Ezzel a kezdetben kevesebb információhoz jutó betekintők és kutatók hozzájuthatnak számukra még fontos adatokhoz, iratokhoz is.

Az intézmény informatikai rendszerének jövője

Az intézmény informatikai rendszere jelenleg is messzemenően támogatja az alapfeladatok ellátását; nélküle az állampolgári adatszolgáltatás és a kutatók kiszolgálása is összehasonlíthatatlanul körülményesebb és alacsonyabb hatékonyságú volna. Mindez nem jelenti azonban azt, hogy akár csak megközelítőleg is kihasználtuk volna a rendszerben rejlő lehetőségeket. A szakmai munka eredményességének, valamint a napi ügyintézés hatékonyságának növelése érdekében a következő területeken szükséges továbbfejleszteni az informatikai rendszert.

Az újabb fejlesztések nyomán megteremtődött a lehetősége annak, hogy az intézmény munkatársainak napi feladatait számítástechnikai eszközök segítségével koordináljuk, a feladatok kiosztását és elvégzésük ellenőrzését az informatikai rendszer segítségével támogassuk.

A jelenleg kizárólag a dossziék adatainak nyilvántartására szolgáló ABTLINFO-t alkalmassá kell tenni az iratanyagunk kisebb, de igen fontos részét kitevő ún. működési iratok adatainak kezelésére is a nemzetközi levéltári szabványnak [International Standard Archival Description, ISAD (G)] megfelelően. A későbbiekben ez a továbbfejlesztett központi adatbázis szolgálna fond- és állagjegyzékként, de raktári jegyzékek, raktártopográfiák leválogatására és egyedi ügyiratok darabszintű feldolgozására is alkalmasnak kell lennie. Az egyes fondok és állagok eltérő jellegéből adódóan nem dolgozható fel minden irategyüttes azonos szinten: némelyek ügyirat-szintű feldolgozást (névmutatózás, tárgyszavazás, kivonat készítése stb.) igényelnek – jellemzően ilyen irategyütteseknek számítanak a különböző típusú dossziék –, másokhoz elegendő magasabb szinteken (tétel, doboz, sorozat stb.) információkat fűzni. Amennyiben az új adatbázis lehetőséget teremt minden, levéltári szakmai szempontok alapján meghatározott szinten az információk rögzítésére (tehát minden szinten lehetséges neveket, tárgyszavakat, mennyiségi adatokat, évkört, raktári helyet stb.) hozzárendelni az irathoz, a későbbiekben ebből könnyűszerrel leválogatható lesz szinte minden szükséges levéltári segédlet.

Az egykori állambiztonsági szervek operatív és vizsgálati tevékenységük során nagy mennyiségben készítettek, gyűjtöttek össze, illetve foglaltak le fényképeket. Ennek a fotóanyagnak egy része csekély történeti értékkel bír (különböző igazolványképek, bizonyítási eljárás során készült fotók stb.), nagy mennyiségű azonban azoknak a fényképeknek a száma, melyek a 20. századi magyar történelem rendkívül értékes képi emlékei. A második világháború utáni népbírósági perekhez felhasznált fényképanyag ugyanúgy pótolhatatlan történeti értékű, mint például az 1956-os fotógyűjtemény, vagy különböző egyházi rendezvényekről, ellenzéki megmozdulásokról készített, másutt fel nem lelhető fényképek. Ezeknek a fényképeknek döntő többsége operatív és vizsgálati dossziék szerves része, más részük pedig önálló albumokba kötött gyűjtemény. A fotók adatainak pontos feltárása és rögzítése egy „virtuális rendezés” keretében indult meg. Jövőbeni feladat e történeti értékű fényképállomány „hasznosulása” érdekében egy fotóadatbázis kifejlesztése, mely az ABTLINFO rendszerébe illeszkedik.

A levéltár fokozatosan eleget tesz azon jogos kutatói igényeknek, melyek az általa kezelt iratanyag fond- és állagjegyzékének, valamint raktári jegyzékeknek hozzáférhetővé tételére vonatkoznak. A levéltári szakmai követelményeknek és a széleskörű társadalmi elvárásnak megfelelően adatbázisunk egy jól körülhatárolható részét hozzáférhetővé tettük a tudományos kutatók számára. Az iratanyag jelenlegi feldolgozottsági szintje mellett ez az egyetlen megoldás arra, hogy a folyamatosan bővülő információs bázis napra kész módon álljon a kutatók rendelkezésére. A nyilvánosság elé kerülő adatbázis természetesen nem tartalmazza az ügyfélszolgálati nyilvántartásokat, a személyiségi jogokat érintő adatokat, valamint az iratok minősítésével kapcsolatos információkat sem.

A fenti informatikai fejlesztések révén az intézmény általános levéltári feladatainak, valamint speciális helyzetéből adódó többletkötelezettségeinek ellátásához széleskörű, összetett számítástechnikai háttérre támaszkodhat majd.

A fond- és állagjegyzék, a raktári jegyzékek, valamint egyes iratok darabszintű feldolgozására is alkalmas központi adatbázis módot nyújt akár milliós nagyságrendű névanyag és több százezer oldal digitális másolat gyors és megbízható kezelésére. Lehetőség lesz az iratanyag bármely szintű tartalmi feltárására vagy raktártopográfiák leválogatására. Az ügyfélszolgálati nyilvántartások integrálása révén a felhasználók – jogosultságaik függvényében – napra kész adatokat kaphatnak egy adott állampolgári kérelem vagy tudományos kutatás állapotáról és sorsáról, automatikusan összevethetők lesznek a beérkezett kérelmek a feldolgozott névanyaggal, lekérdezhető lesz egy adott irat használatának a „története”, megfelelő fejlesztések esetén pedig az egyes dossziék pillanatnyi helye is pontosan nyomon követhető lesz. Az intézmény vezetői saját részlegük munkáját a központi adatbázis segítségével koordinálhatják: ezen keresztül szignálhatnak ügyiratokat, tűzhetnek ki határidőket és ellenőrizhetik azok betartását. A központi adatbázishoz kapcsolódó fotóadatbázis révén virtuálisan rendezhető és feldolgozható lesz a levéltár történeti értékű fényképanyaga. A tudományos kutatók jelenleg a kutatóteremben elhelyezett nyilvános munkaállomásokon, a későbbiekben pedig az intézmény internetes honlapján is használhatják majd a központi adatbázis meghatározott információit, kereséseket és leválogatásokat is végezhetnek.

Az intézmény a fent vázolt informatikai rendszerre támaszkodva próbál megfelelni a jogszabályok által meghatározott feladatoknak: az adatvédelmi szempontok betartása közepette nyújtandó különböző típusú adatszolgáltatási kötelezettségeknek, a kutatók kiszolgálásának, valamint az iratanyag mind mélyebb és alaposabb levéltári feldolgozásának.

Jegyzetek

(1) Lásd erre vonatkozóan: Petrikné Vámos Ida: Iratok a Történeti Hivatalban. Vázlat a volt állambiztonsági szervek iratanyagának irattani feltárásához. In Trezor 1., Történeti Hivatal évkönyve 1999. (Szerk.: Gyarmati György) Bp. Történeti Hivatal, 1999.

(2) Az állományvédelmi szempontokat semmilyen formában nem vették ugyanis figyelembe az iratok kötésekor, fűzésekor, a szakadozott oldalak ragasztgatásakor. Lásd erre vonatkozóan B. Balsai Jolán írását az állományvédelemről e kötetben.

(3) Természetesen a fejlesztő céggel szemben támasztott írásbeli követelményrendszer az itt vázlatosan jelzett pontokon túl is számos, részletekbe menő igényt fogalmazott meg, ezek ismertetése azonban nem tárgya írásunknak.

(4) A fenti megoldások ellenére az adatok redundanciáját nem sikerült teljes mértékben kiküszöbölni, mivel a sok esetben pontatlanul, hiányosan vagy hibásan rögzített személyes adatok nem adnak egyértelmű támpontot a különböző helyről származó töredék-információk egyesítésére.

(5) Csonkolt keresésnek nevezzük azt, amikor a megadott kereső kifejezést egy szövegkörnyezetben is keressük, azaz nem csak azokat a rekordokat szeretnénk megtalálni, ahol az adat karakterről karakterre megegyezik a kereső karakterlánccal (kifejezéssel), hanem megengedjük azt is, hogy a kereső kifejezés előtt és/vagy utána is lehetnek karakterek. Ez nem csak hosszabb leíró jellegű mezők esetében lehet hasznos, hanem már nevek esetében is, például gondoljunk a Zilachy névre, amelyet ha esetlegesen elírtak, például a szóvégi „y” helyett „i”-t írtak, akkor a „Zilach” kereső kifejezéssel mindkettő megtalálható.

(6) Ha például tudjuk, hogy a keresett személyt Kovács Gábornak hívták, de a „Kovács” név el lehetett írva akár „Kováts”-ra, akkor ha csupán a kereső kifejezést a végéről csonkolva keressük, akkor a „Kovács” nevű személyek nagy számából adódóan a keresés eredménye áttekinthetetlen lehet. Ezekben az esetekben lehet hasznos, ha például a „Ková__ Gábor” kereső kifejezést használjuk csonkolás nélküli beállítással, ahol a „_” jel pontosan egy, de tetszőleges karaktert jelent. A „Ková__ Gábor” kereső kifejezéssel így megtalálható a „Kovács Gábor” és a „Kováts Gábor” is.