Főoldal > Timetable > Session details > Contribution details

Közreműködés Előadás

Debreceni Egyetem - B terem
3. TARTALOMSZOLGÁLTATÁSOK: KÖNYVTÁRAK, LEVÉLTÁRAK, MÚZEUMOK

Tudománymetriai és tartalmi elemzések szövegbányászati módszerekkel

Témakör

3.8 Új technológiák alkalmazása a tartalomszolgáltatásban

Magyar nyelvű tematika (min. 1000 karakter, max. 2000 karakter)

A rohamosan szaporodó full-text adatbázisok új, eddig még kevéssé kihasznált lehetőségeket tartogatnak számunkra, hiszen azon túl, hogy biztosítják a hozzáférést felhasználóink felé, megadják annak a lehetőségét is, hogy a bennük található szövegeket digitális szövegkorpuszként kezeljük. Ezáltal a full-text anyagokat az értő kutató szövegbányászati vizsgálódásnak vetheti alá, mely számos eredménnyel kecsegtet: lehetőség nyílik a mélyreható tartalmi elemzésre, például egy-egy folyóirat időbeliségét figyelembe véve tématrendek rajzolódnak ki. Hivatkozásvizsgálatokat végezhetünk: felderíthetővé válik egy-egy folyóirat akár teljes hivatkozási hálója, ezáltal olyan tudománymetriai elemzések előtt nyitva utat, amelyre korábban nem volt lehetőség. A kibontakozóban lévő digitális bölcsészet jelentős mértékben támaszkodik a szövegbányászati megoldásokra, ezért közgyűjteményi tartalomszolgáltatóként, illetve a full-text adatbázisok gazdáiként érdemes foglalkoznunk a témával. Az előadás szerzője könyvtárosként és neveléstudományi PhD hallgatóként egyaránt foglalkozik a témával. A kutatási téma a papíralapú kiadványok digitalizálásától egészen a konkrét hivatkozásvizsgálatokig és tartalmi elemzésig végigköveti a folyamatot, egy lépésről-lépésre kidolgozott módszer bemutatásával, amely akár modellértékű is lehet a későbbi hasonló kutatások számára.

Angol nyelvű előadáscím

Scientiometrics and text mining researches

Angol nyelvű tematika (min. 1000 karakter, max. 2000 karakter)

The author studies in his research the possibilities of full-text databases. He chooses a renowned journal in his pilot project, which is the most important and oldest Hungarian educational research journal: the Magyar Pedagógia. It was founded in 1892 and it has been appeared nowadays yet. He digitized all volumes (114) and he created a 50.000 pages text corpus from the journal articles (ca. 6500 scientific studies). He used an automatic OCR technology to recognition of letters and words, furthermore put all metadata to a database, therefore it can be analyzed by authors, titles or keywords much easier, because it is a very well structured database, which is built by cataloguing librarians. The presenter wants to analyse this full text corpus with a special and innovative informatic tool, the text mining. It could show latent information and connections from the text structure. For instance we can see how many articles deal with educational reform and how change this topic as time went by. Along with the text mining analyses the author wants to concentrate to scientiometrics also, because the full-text data allow of this opurtinity. The creation of an enormous graph with all authors and all references are among the goals. Data mining is a prevalent solution in Digital Humanities, but text mining is a less widespread solution. The research is special and novel in Hungarian research practice, hence we could talk about an innovative and necessary research. The author would like to introduce a brand new tool to the Hungarian librarian’s toolkit, which will be able to produce lots of substantial outcomes in the future and it can help in various disciplinaries with the assistance of librarians.