Networkshop, Kaposvár, 2011. április 27-29.
1
18. századi folyóiratok komplex feldolgozása a Debreceni
Egyetemen
Koltay Klára, [email protected]
Networkshop, Kaposvár, 2011. április 27-29.
2
Cél
• A DE Nyelvtechnológia és bioetika kutatási program alprogramja
• A 18 – 19. századi sajtónyilvánosság feltárása program számára korabeli szövegek kutathatóvá tétele egy kiindulási pontból– Megbízható folyóirat- és hírlapszövegek
elérhetőségének biztosítása– Könnyen kezelhető elrendezés(ek)ben– Hozzáférési pontok megteremtése– Meglévő szövegkiadások integrálása
Networkshop, Kaposvár, 2011. április 27-29.
3
Feladat• A program honlapján elérhetővé tenni a
már rendelkezésre álló anyagokat, szövegkiadásokat (Magyar Museum, Orpheus, Uránia)
• Az eddig fel nem dolgozott periodikák digitalizálása, repertorizálása
• Meglévő eszközök használata– illeszkedjen a Digitális Könyvtár elemei közé– meglévő infrastruktúra és kompetenciák
használata
Networkshop, Kaposvár, 2011. április 27-29.
4
AlapstruktúraDEA (D-SPACE)Digitalizált szövegek
tárolása1. metaadatok
folyóiratfüzetenként böngészhető füzetlista
2. kétrétegű pdf, „durva” felismertetéssel teljes szövegű kereshetőség (nem megbízható)
KÖNYVTÁRI RENDSZERCikk-leírások (külön adatbázisban)MARC leírásoktárgyszavazás + besorolási rekordokKatalógus jellegű keresésekLINK -- a DEÁ-ban tárolt cikkekhez
HONLAP„Repertórium” = cikkrekordokból automatikusan képződőidőrendi listák, rövid leírásokkalLINK – a DEÁ-ban tárolt füzetekhez; cikkekhez -- a cikkleírásokhoz
Networkshop, Kaposvár, 2011. április 27-29.
5
Digitalizált oldalakDigitalizálás:
600 dpi, minolta PS7000 Vízjelezés:
Több helyről, példányból összefésült digitális példányok tulajdonos, kutató igénye: minden oldalon legyen látható a forrás
Networkshop, Kaposvár, 2011. április 27-29.
6
Felismertetés javítás nélkül• Illeszkedjen a DEA gyakorlatához
– Lehetőség teljes szöveges keresésre• Felismertetés eredménye nem elég jó• Javítás jelentős élő munka ráfordítását
igényelné; ezt a munkát inkább a cikkrekordok által biztosított keresési szempontok gazdagítására fordítjuk
Networkshop, Kaposvár, 2011. április 27-29.
7
Felismertetés eredményessége
Networkshop, Kaposvár, 2011. április 27-29.
8
„bulgakow”
Networkshop, Kaposvár, 2011. április 27-29.
9
DEÁ-ba töltés füzetenként
• Füzetekről készülnek metaadatok• Szolgáltatott fájlok: füzet pdf-ek• Eredeti szkennelt oldalak illetve a
munkafolyamatokhoz különböző fázisaihoz tartozó fájlok füzet metaadatokhoz betöltve (nem láthatóak a felhasználók számára)
Networkshop, Kaposvár, 2011. április 27-29.
10
Metaadatok a DEA-ban
Füzetek címe számozási adatokkal:•Nem következetes a dokumentumon•Formalizált számozási adatok:
•sorbarendezés•azonosíthatóság
•Eredeti állapot a kapcsolt digitalizált állományban
Networkshop, Kaposvár, 2011. április 27-29.
11
Böngészés a DEÁ-ban
Kategória: Régi magyar folyóiratokGyűjtemények: egy-egy folyóirat
Kategória és gyűjtemény kezdőoldalak „felöltöztetése”• folyóiratra vonatkozó információk• link az adatbázishoz a cikkszintű kereséshez
Networkshop, Kaposvár, 2011. április 27-29.
12
Cikkfeldolgozás könyvtári adatbázisban
Célok:• Cikk szintű kereshetőség a DEA-ban tárolt
anyagokhoz + link a DEÁ-ban tárolt pdf megfelelő oldalára
• Nyersanyag egy honlapon böngészhető repertóriumhoz
• Teljes szövegű keresés pontatlanságainak kiegyensúlyozása
• Katalógus pontosságú keresések biztosítása – Közös adatbázisban minden feldolgozott folyóirat
• A könyvtári adatbázishoz létrehozott besorolási rekordokból 18. századi névadatbázis
Networkshop, Kaposvár, 2011. április 27-29.
13
Leírás alapelvei, kérdéses pontjaiAzonosíthatóság • Cikkhatárok• Címek • Összefoglaló/”jellemző mondat”• Szerzőségi adatok• Füzetek számozási adataiKereshetőség• Nevek (személy, földrajzi) – egységesítés,
besorolási rekordok• Ismeretlen nevek is• Művek, fordítások,• Tárgyszavak
Networkshop, Kaposvár, 2011. április 27-29.
14
Networkshop, Kaposvár, 2011. április 27-29.
15
Networkshop, Kaposvár, 2011. április 27-29.
16
Besorolási rekordokModern névalakok
Folyóiratokban előforduló névváltozatokkal„Ismeretlenek” – életrajzi megjegyzésekkelBibliográfiai és besorolási rekordok
kapcsolatán alapuló globális javítás lehetősége két fázisú feldolgozás:– Besorolási rekordok képzése nem mindig
pontos azonosítással (gyorsaság, hallgatók által készített leírások)
– Utólagos azonosítások, egységesítések
Networkshop, Kaposvár, 2011. április 27-29.
17
Besorolási rekordok
Networkshop, Kaposvár, 2011. április 27-29.
18
Részlegesen azonosított nevek
Networkshop, Kaposvár, 2011. április 27-29.
19
„Ismeretlenek” későbbi azonosításra hozzájuk tartozó előfordulásokkal
Networkshop, Kaposvár, 2011. április 27-29.
20
A szolgáltatás a DEENK digitális könyvtárában
1. Böngészés a digitalizált tartalmakban• DEA• Régi böngésző
2. Cikk-keresés• Keresés az
adatbázisban• Visszatérés a megtálált
tételhez a DEÁ-ba
Networkshop, Kaposvár, 2011. április 27-29.
21
Repertóriumok a program honlapján
• Automatikusan generálódnak a bibliográfiai rekordok alapján– Egy karbantartási pont: minden javítás a
bibliográfiai rekordokban történik – Listák adattartalma szükség szerint utólag
alakítható
Networkshop, Kaposvár, 2011. április 27-29.
22
Folyóiratkötet/szakasz füzet
• Füzet pdf letölthető
• Füzetek cikklistája megjeleníthető
Networkshop, Kaposvár, 2011. április 27-29.
23
• Füzet számozása formalizált kezdőlap kép szemlélteti az eredeti számozást• Cikkről címétől link a pdf megfelelő oldalára• Szerző/cím, rezümé linkek a cikkhez, a teljes leíráshoz
Networkshop, Kaposvár, 2011. április 27-29.
24
Teljes leírás besorolási adataivaltovábbi keresések a katalógusban
Networkshop, Kaposvár, 2011. április 27-29.
25
A program állásaMár elérhető elemek folyamatosan bővülő tartalommal:• Korábban digitalizált anyagok: Magyar Múzeum,
Mindenes Gyűjtemény, Orpheus, Regélő („Digitális könyvtár”DEA) (http://www.lib.unideb.hu/hu/digitalis_konyvtar_folyoiratok )
• Jelenleg digitalizált anyagok folyamatosan hozzáférhetővé válnak a DEÁ-ban: Magyar Hírmondó, Hadi és Más Nevezetes Története, Pozsonyi Magyar Múzsa, bétsi Magyar Múzsa
(http://ganymedes.lib.unideb.hu:8080/dea/handle/2437/97458 )
• Elérhető cikk-leírások: Regélő, folyamatban: Magyar Hírmondó, Hadi és Más Nevezetes Történetek, Pozsonyi és bétsi Magyar Múzsa
(http://webpac.lib.unideb.hu/rege/ )
Hamarosan megjelennek: folyóiratlisták első verziói a már elkészült bibliográfiai rekordok alapján
Networkshop, Kaposvár, 2011. április 27-29.
26
KöszönetDigitalizált anyagok illetve az eredeti
dokumentumok rendelkezésre bocsátásával jelentősen hozzájárultak a programhoz:
• Debreceni Református Kollégium Nagykönyvtára
• Ráday Gyűjtemény• Fővárosi Szabó Ervin Könyvtár• Magyar Tudományos Akadémia Könyvtára• Pannonhalmi Főapátsági Könyvtár
Top Related