Főoldal > Timetable > Session details > Contribution details

Közreműködés Előadás

Debreceni Egyetem - A terem
3. TARTALOMSZOLGÁLTATÁSOK: KÖNYVTÁRAK, LEVÉLTÁRAK, MÚZEUMOK

A jók és a rosszak - metaadatok minőségmérése

Előadók

  • KIRÁLY Péter

Elsődleges szerzők

  • KIRÁLY Péter (Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG))

Témakör

3.8 Új technológiák alkalmazása a tartalomszolgáltatásban

Magyar nyelvű tematika (min. 1000 karakter, max. 2000 karakter)

Számos olyan kulturális és tudományos adatbázis van (könyvtári katalógusoktól kutatási adatok archívumáig), ahol a tényleges adatok, objektumok kizárólagos hozzáférési módja a metaadatokon keresztül vezet. Ha az objektumról szóló metaadat hiányos, félrevezető, nem elég specifikus az objektumra nézve, a felhasználó nem fog hozzáférni a tényleges műhöz, adathoz, és kárba vész mindaz a befektetés is, amit a metaadat létrehozásába fektettek. Szakértő szem alkalmasint ki tudja szúrni ezeket a gyenge minőségű rekordokat, de mi van, ha rekordok tízezreit, millióit kellene átrostálni egy ilyen minőségi szűrőn? Az elmúlt évtizedben többen is foglalkoztak ezzel a problémával és születtek tudományos cikkek melyek egy-egy kisebb adatbázist tanulmányozva elvi javaslatokat tettek algoritmizálható mérőszámok bevezetésére. Ezek az elvi megoldások azonban kevésnek bizonyultak és 2015-ben mind az Europeananál, mind a Digital Public Library of Americaban elkezdtek gondolkozni a gyakorlati megoldáson, a W3C keretén belül pedig megalakult egy munkacsoport amely a minőségmérések eredményeinek publikálási sémájára tesz javaslatot. A saját kutatásom célja, hogy egy nyílt forráskódú minőség-ellenőrzési eszközt készítsek (Metadata Quality Assurance Framework - http://pkiraly.github.io/), amelyet széles körben lehet alkalmazni különféle metaadat-katalógusok minőségének ellenőrzésére. Az implementálás megmutatja az eddigi tudományos eredmények alkalmazhatóságát és némely esetben bizonyára finomítani is fogja azokat, a főbb eredmény azonban az lesz, ha a különféle intézmények ennek segítségével javítani tudják a metaadatok és ezáltal a szolgáltatások minőségét. Az előadásban bemutatok néhány minőséggel kapcsolatos problémát, az irodalomban javasolt mérési módokat, és a keretrendszer eddigi eredményeit.

Angol nyelvű előadáscím

The Goods and the Bads - metadata quality measurements

Angol nyelvű tematika (min. 1000 karakter, max. 2000 karakter)

In several large digital collections the only way a user could access a digital object (such as a digitized cultural heritage material or a born digital research data) is via its metadata. If metadata is not precise, contains inappropriate or less information users miss the object, and the data creators’ energy they put in the creation and maintenance of it will not lead to results. In past years there were research projects about the quality of metadata: defining what it is, how to measure it and suggesting methods to improve it. However nobody created any open source tool, which the organizations facing the problem could use. In 2015 several organizations put more energy to the problem: Europeana, the Digital Public Library of America and even W3C. My own research project aims to create an open source implementation of the measuring, which is flexible enough to work together with different kinds of metadata schemas (Metadata Quality Assurance Framework - http://pkiraly.github.io/). It is scalable as well, so fit for small organizations up to big international consortia. The tool implements (and in some cases even improves) the theoretical results, but the main result would be if the organizations could improve their metadata and thus their services with the help of the tool. In the presentation I will show some metadata issues, the metrics and the current results of the tool.

Telefonszám (ha eltér az előadóknál megadottaktól)

+49 0157 51024474