18. századi folyóiratok komplex feldolgozása a Debreceni ... · 18. századi folyóiratok...

Post on 14-Oct-2020

12 views 0 download

Transcript of 18. századi folyóiratok komplex feldolgozása a Debreceni ... · 18. századi folyóiratok...

Networkshop, Kaposvár, 2011. április 27-29.

1

18. századi folyóiratok komplex feldolgozása a Debreceni

Egyetemen

Koltay Klára, DEENKkkoltay@lib.unideb.hu

Networkshop, Kaposvár, 2011. április 27-29.

2

Cél

• A DE Nyelvtechnológia és bioetika kutatási program alprogramja

• A 18 – 19. századi sajtónyilvánosság feltárása program számára korabeli szövegek kutathatóvá tétele egy kiindulási pontból– Megbízható folyóirat- és hírlapszövegek

elérhetőségének biztosítása– Könnyen kezelhető elrendezés(ek)ben– Hozzáférési pontok megteremtése– Meglévő szövegkiadások integrálása

Networkshop, Kaposvár, 2011. április 27-29.

3

Feladat• A program honlapján elérhetővé tenni a

már rendelkezésre álló anyagokat, szövegkiadásokat (Magyar Museum, Orpheus, Uránia)

• Az eddig fel nem dolgozott periodikák digitalizálása, repertorizálása

• Meglévő eszközök használata– illeszkedjen a Digitális Könyvtár elemei közé– meglévő infrastruktúra és kompetenciák

használata

Networkshop, Kaposvár, 2011. április 27-29.

4

AlapstruktúraDEA (D-SPACE)Digitalizált szövegek

tárolása1. metaadatok

folyóiratfüzetenként böngészhető füzetlista

2. kétrétegű pdf, „durva” felismertetéssel teljes szövegű kereshetőség (nem megbízható)

KÖNYVTÁRI RENDSZERCikk-leírások (külön adatbázisban)MARC leírásoktárgyszavazás + besorolási rekordokKatalógus jellegű keresésekLINK -- a DEÁ-ban tárolt cikkekhez

HONLAP„Repertórium” = cikkrekordokból automatikusan képződőidőrendi listák, rövid leírásokkalLINK – a DEÁ-ban tárolt füzetekhez; cikkekhez -- a cikkleírásokhoz

Networkshop, Kaposvár, 2011. április 27-29.

5

Digitalizált oldalakDigitalizálás:

600 dpi, minolta PS7000 Vízjelezés:

Több helyről, példányból összefésült digitális példányok tulajdonos, kutató igénye: minden oldalon legyen látható a forrás

Networkshop, Kaposvár, 2011. április 27-29.

6

Felismertetés javítás nélkül• Illeszkedjen a DEA gyakorlatához

– Lehetőség teljes szöveges keresésre• Felismertetés eredménye nem elég jó• Javítás jelentős élő munka ráfordítását

igényelné; ezt a munkát inkább a cikkrekordok által biztosított keresési szempontok gazdagítására fordítjuk

Networkshop, Kaposvár, 2011. április 27-29.

7

Felismertetés eredményessége

Networkshop, Kaposvár, 2011. április 27-29.

8

„bulgakow”

Networkshop, Kaposvár, 2011. április 27-29.

9

DEÁ-ba töltés füzetenként

• Füzetekről készülnek metaadatok• Szolgáltatott fájlok: füzet pdf-ek• Eredeti szkennelt oldalak illetve a

munkafolyamatokhoz különböző fázisaihoz tartozó fájlok füzet metaadatokhoz betöltve (nem láthatóak a felhasználók számára)

Networkshop, Kaposvár, 2011. április 27-29.

10

Metaadatok a DEA-ban

Füzetek címe számozási adatokkal:•Nem következetes a dokumentumon•Formalizált számozási adatok:

•sorbarendezés•azonosíthatóság

•Eredeti állapot a kapcsolt digitalizált állományban

Networkshop, Kaposvár, 2011. április 27-29.

11

Böngészés a DEÁ-ban

Kategória: Régi magyar folyóiratokGyűjtemények: egy-egy folyóirat

Kategória és gyűjtemény kezdőoldalak „felöltöztetése”• folyóiratra vonatkozó információk• link az adatbázishoz a cikkszintű kereséshez

Networkshop, Kaposvár, 2011. április 27-29.

12

Cikkfeldolgozás könyvtári adatbázisban

Célok:• Cikk szintű kereshetőség a DEA-ban tárolt

anyagokhoz + link a DEÁ-ban tárolt pdf megfelelő oldalára

• Nyersanyag egy honlapon böngészhető repertóriumhoz

• Teljes szövegű keresés pontatlanságainak kiegyensúlyozása

• Katalógus pontosságú keresések biztosítása – Közös adatbázisban minden feldolgozott folyóirat

• A könyvtári adatbázishoz létrehozott besorolási rekordokból 18. századi névadatbázis

Networkshop, Kaposvár, 2011. április 27-29.

13

Leírás alapelvei, kérdéses pontjaiAzonosíthatóság • Cikkhatárok• Címek • Összefoglaló/”jellemző mondat”• Szerzőségi adatok• Füzetek számozási adataiKereshetőség• Nevek (személy, földrajzi) – egységesítés,

besorolási rekordok• Ismeretlen nevek is• Művek, fordítások,• Tárgyszavak

Networkshop, Kaposvár, 2011. április 27-29.

14

Networkshop, Kaposvár, 2011. április 27-29.

15

Networkshop, Kaposvár, 2011. április 27-29.

16

Besorolási rekordokModern névalakok

Folyóiratokban előforduló névváltozatokkal„Ismeretlenek” – életrajzi megjegyzésekkelBibliográfiai és besorolási rekordok

kapcsolatán alapuló globális javítás lehetősége két fázisú feldolgozás:– Besorolási rekordok képzése nem mindig

pontos azonosítással (gyorsaság, hallgatók által készített leírások)

– Utólagos azonosítások, egységesítések

Networkshop, Kaposvár, 2011. április 27-29.

17

Besorolási rekordok

Networkshop, Kaposvár, 2011. április 27-29.

18

Részlegesen azonosított nevek

Networkshop, Kaposvár, 2011. április 27-29.

19

„Ismeretlenek” későbbi azonosításra hozzájuk tartozó előfordulásokkal

Networkshop, Kaposvár, 2011. április 27-29.

20

A szolgáltatás a DEENK digitális könyvtárában

1. Böngészés a digitalizált tartalmakban• DEA• Régi böngésző

2. Cikk-keresés• Keresés az

adatbázisban• Visszatérés a megtálált

tételhez a DEÁ-ba

Networkshop, Kaposvár, 2011. április 27-29.

21

Repertóriumok a program honlapján

• Automatikusan generálódnak a bibliográfiai rekordok alapján– Egy karbantartási pont: minden javítás a

bibliográfiai rekordokban történik – Listák adattartalma szükség szerint utólag

alakítható

Networkshop, Kaposvár, 2011. április 27-29.

22

Folyóiratkötet/szakasz füzet

• Füzet pdf letölthető

• Füzetek cikklistája megjeleníthető

Networkshop, Kaposvár, 2011. április 27-29.

23

• Füzet számozása formalizált kezdőlap kép szemlélteti az eredeti számozást• Cikkről címétől link a pdf megfelelő oldalára• Szerző/cím, rezümé linkek a cikkhez, a teljes leíráshoz

Networkshop, Kaposvár, 2011. április 27-29.

24

Teljes leírás besorolási adataivaltovábbi keresések a katalógusban

Networkshop, Kaposvár, 2011. április 27-29.

25

A program állásaMár elérhető elemek folyamatosan bővülő tartalommal:• Korábban digitalizált anyagok: Magyar Múzeum,

Mindenes Gyűjtemény, Orpheus, Regélő („Digitális könyvtár”DEA) (http://www.lib.unideb.hu/hu/digitalis_konyvtar_folyoiratok )

• Jelenleg digitalizált anyagok folyamatosan hozzáférhetővé válnak a DEÁ-ban: Magyar Hírmondó, Hadi és Más Nevezetes Története, Pozsonyi Magyar Múzsa, bétsi Magyar Múzsa

(http://ganymedes.lib.unideb.hu:8080/dea/handle/2437/97458 )

• Elérhető cikk-leírások: Regélő, folyamatban: Magyar Hírmondó, Hadi és Más Nevezetes Történetek, Pozsonyi és bétsi Magyar Múzsa

(http://webpac.lib.unideb.hu/rege/ )

Hamarosan megjelennek: folyóiratlisták első verziói a már elkészült bibliográfiai rekordok alapján

Networkshop, Kaposvár, 2011. április 27-29.

26

KöszönetDigitalizált anyagok illetve az eredeti

dokumentumok rendelkezésre bocsátásával jelentősen hozzájárultak a programhoz:

• Debreceni Református Kollégium Nagykönyvtára

• Ráday Gyűjtemény• Fővárosi Szabó Ervin Könyvtár• Magyar Tudományos Akadémia Könyvtára• Pannonhalmi Főapátsági Könyvtár