Főoldal > Timetable > Session details > Contribution details

Közreműködés Előadás

Debreceni Egyetem - B terem
3. TARTALOMSZOLGÁLTATÁSOK: KÖNYVTÁRAK, LEVÉLTÁRAK, MÚZEUMOK

Kéziratok digitalizációja a 21. században

Előadók

  • Dr. PALKÓ Gábor

Elsődleges szerzők

Témakör

3.4 Elektronikus könyvtárak, kiállítások, portálok, repozitóriumok

Magyar nyelvű tematika (min. 1000 karakter, max. 2000 karakter)

Már önmagában annak a tisztázása is komoly feladat, mit értünk a digitális korban kéziraton. A Digital Manuscripts to Europeana (DM2E) projekt, amely mintegy 140.000 digitális objektum metaadatait juttatta el az Europeana-ba, nemcsak a kézírásos anyagokat tekintette kéziratnak, de minden olyan kulturális objektumot, melyet digitális fakszimileként, illetve szövegátírásként metaadatokkal reprezentálni lehet. A projekt a szemantikus web logikája alapján kezelte a szövegobjektumokat, illetve azok hierarchiáját és metaadatolását. Számos projekt ezzel szemben máig átírás nélküli képként vagy kétrétegű formában tesz közzé „kéziratokat” szabványos leíró adatok nélkül, ami nehézkessé vagy akár lehetetlenné teszi a szövegtest szegmentumainak adatolását és hivatkozhatóságát, megnehezíti az adatgazdagítást és a keresést, valamint a hosszú távú megőrzés szempontjából is problémákat vet fel. Az előadásban néhány, a fakszimile és az átírás összekapcsolására, a szöveg egyes részleteinek szemantikus gazdagítására, annotálására szolgáló modellt és gyakorlatot ismertetek.

Angol nyelvű előadáscím

Digitized manuscripts in the 21. Century

Angol nyelvű tematika (min. 1000 karakter, max. 2000 karakter)

It is difficult a task in itself to decide what we call a digitized manuscript The project entitled Digital Manuscripts to Europeana (DM2E) that ingested the metadata of approximately 140.000 digital objects to Europeana regarded not just the handwritten documents as manuscripts but each digital cultural heritage object that can be represented through metadata of facsimile and/or text transcription. The project treated the digital objects, their hierarchical relations and metadata according to the standards of the semantic web. Meanwhile a number of projects still publish manuscripts in picture or dual layer formats without transcription and standardized descriptive data, which makes data enrichment, search, sub text level analysis and references complicated or even impossible. This method implies long term preservation risks as well. During the presentation I will describe some models and practices concerning combination of picture and text, and semantic enrichment and annotation of text segments.