15th International Symposium of Information Science

The 15th International Symposium of Information Science (ISI) is taking place from March 13-15 at Humbold University in Berlin.

We are presenting a poster for „An Information System for the Analysis of
Color Distributions in MovieBarcodes“.

An Information System for the Analysis of Color Distributions in MovieBarcodes

Downloads:


Right after the official program of the ISI 2017 we will organize a „Satellite Workshop on the Relationship of Information Science and the Digital Humanities“. For more information please check out the workshop website: https://is-dh.tumblr.com/

Projektvorstellung auf der Journée créole 2017

Zusammen mit Dr. Evelyn Wiesinger und Dr. habil. Alexander M. Teixeira Kalkhoff aus der Romanistik, werde ich am 3. März 2017 in Regensburg auf der Journée créole ein aktuelles Projektvorhaben im Bereich der digitalen Aufbereitung und der quantitativen Analyse von Kreolsprachen – insbesondere des Créole guyanais – vorstellen.

Arbeitstitel des Vortrags/Projekts:

Digitale Aufbereitung eines Kreolkorpus: state of the art, Desiderata und technische Machbarkeit

Journée créole 2017

Ziele des Projekts

1. Überführung der MS Word-Korpusdatein in XML

Ausgangslage: Transkriptionen von Interviews mit Sprechern des Créole Guyanais wurden von Evelyn Wiesinger erstellt und liegen aktuell als MS Word-Dokumente vor.

creol corpus

Ziel: Informationsextraktion mithilfe regulärer Ausdrücke und Überführung in eine XML-Struktur

creol xml

2. Semi-automatische Glossierung der Korpusdaten

Mithilfe maschineller Lernansätze sollen anhand manuell generierter Trainingsdaten weitere Transkripte automatisiert mit Glossierungsinformationen (vgl. Leipzig Glossing Rules) annotiert werden.

creol glossing

3. Quantitative Analysen der textuellen Korpusdaten

Hier sollen Standardverfahren aus der Korpuslinguistik (Frequenzen, Konkordanzen, Kollokationen, etc.) zum Einsatz kommen.

4. Alignierung von Kreol-Audioaufnahmen und textueller Transkription

Die Alignierung von Audio und Text erfolgt zunächst mit den MAUS-Tools.

Audio Text Alignment

Im nächsten Schritt sollen in einem Web-Interface Audiospur und Transkription parallel dargestellt werden. Ein erster JavaScript-Prototyp für HTML/JS-Audio-Text-Alignierung wurde bereits vom Kollegen Alexander Bazo entwickelt: TranscriptPlayer.js

5. Web-Korpus-Interface zur Suche nach Schlüsselwörtern / Metadaten

Alle so erschlossenen Daten sollen am Ende in einem webbasierten Informationssystem mit integriertem Analyse-Dashboard und einer umfangreichen Suchfunktion verfügbar sein. Beispielhafte Suchanfragen, die mit dem System umgesetzt werden können:

  • Finde alle Sätze die aus mehr als 5 Wörtern bestehen und in denen ein frz. Wort vorkommt.
  • Finde alle Sätze von weiblichen Kreolsprecherinnen, in denen das Wort „mo“ vorkommt.

Das Ergebnis der Suchanfragen soll jeweils eine quantitative Analyse der Ergebnismenge sowie eine interaktive Darstellung der entsprechenden Text- und Audiodaten sein.

Verwandte Projekte und Literatur:

DHd 2017 in Bern

Auch in diesem Jahr ist die Regensburger Arbeitsgruppe Digital Humanities mit zwei Beiträgen auf der DHd vertreten, die erstmalig in der Schweiz stattfindet. Die DHd ist die größte Digital Humanities-Konferenz im deutschsprachigen Raum (ca. 300 Teilnehmer), und wird seit 2014 jährlich an unterschiedlichen Standorten abgehalten (2014: Passau, 2015: Graz, 2016: Leipzig, 2017: Bern).

Wir präsentieren zwei Posterbeiträge zu laufenden Digital Humanities-Projekten an der Universität Regensburg.

Den vollständigen Abstractband der Konferenz finden Sie hier als PDF-Download (33 MB).

1. Digitale Erschließung einer Sammlung von Volksliedern aus dem deutschsprachigen Raum

Dieser Beitrag beschreibt ein laufendes Projekt zur digitalen Erschließung einer großen Sammlung von Volksliedern aus dem deutschsprachigen Raum, mit dem Ziel diese später über ein öffentliches Informationssystem verfügbar zu machen. Im Poster werden Herausforderungen bei der digitalen Erschließung dieser Sammlung diskutiert. Konkret stellen wir die Ergebnisse einer OCR-Studie für die automatische Erkennung von Liedtexten sowie auch eine OMR-Studie für die Erfassung der monophonen, handschriftlichen Melodien vor. Es zeigt sich, dass OMR-Tools hier keine zufriedenstellenden Ergebnisse liefern können. Als alternativer Erschließungsansatz wurde deshalb ein webbasiertes Transkriptionstool für einen Crowdsourcing-Ansatz umgesetzt.

Allegro-Transkriptionstool: http://138.68.106.29/

liedblatt-poster_thumbnail

Downloads

  • Poster-Download über ResearchGate (PDF)
  • Paper-Download über ResearchGate (PDF)

2. PaLaFra: Entwicklung einer Annotationsumgebung für ein diachrones Korpus spätlateinischer und altfranzösischer Texte

Weiterhin stellen wir das DFG/ANR-geförderte Kooperationsprojekt PaLaFra (Vom Latein zum Französischen: Aufbau und Analyse eines digitalen Korpus spätlateinischer und altfranzösischer Texte) vor.

palafra-poster_thumbnail

Quelle Kartenausschnitt: Karte: MacKay, Angus. & Ditchburn, David. (1997). Atlas of medieval Europe. London ; New York: Routledge.

Downloads

  • Poster-Download über ResearchGate (PDF)
  • Paper-Download über ResearchGate (PDF)

 

 

Masterstudiengang Digital Humanities in Regensburg

Ab sofort ist die Webseite zum im WS 2017/18 beginnenden Masterstudiengang Digital Humanities online. Interessierte Studierende können sich bis spätestens 1. Juli 2017 bewerben.

Master Digital Humanities Regensburg

Für wen ist der Masterstudiengang interessant?

Ziel des Masterstudiengangs ist es, Studierende, die bereits einen geistes- oder kulturwissenschaftlichen Abschluss haben, methodisch weiter zu bilden. Hierzu gehört die Vermittlung anwendungsorientierter Kenntnisse in Programmierung, Datenerhebung und -auswertung sowie Sprach- und Texttechnologie. Als weiterführender Studiengang werden Studierende aufbauend auf diesen Kenntnissen dazu befähigt, selbstständig Projekte durchzuführen. Ein Schwerpunkt ist dabei die Fähigkeit, mit geeigneten digitalen Werkzeugen Textkorpora (z. B. digital vorliegende historische Quellen, Sprachkorpora oder Texte aus den sozialen Medien) zu analysieren und die Ergebnisse der Analysen in geeigneter Form zu interpretieren, aufzubereiten und diese zu kommunizieren.

 

Information Science and the Digital Humanities

ISI 2017 Workshop on the Relationship of Information Science and the Digital Humanities

Photo credits: The header image is kindly provided by Grégoire Jeanneau via Unsplash.com.

Date: March 15, 2017, 2 – 6 pm
Venue: Berlin School of Library and Information Science
Deadline for position papers: February 16, 2017
Workshop website: https://is-dh.tumblr.com/

Workshop organizers:

  • Manuel Burghardt (University of Regensburg, Media Informatics Group)
  • Markus Kattenbeck (University of Regensburg, Information Science Group)
  • Vivien Petras (Humboldt-Universität zu Berlin, Berlin School of Library and Information Science)

INFORMATION SCIENCE AND THE DIGITAL HUMANITIES

Digital technology is fundamentally changing the way how we do research (Berry, 2011). For the humanities, digital tools and resources are particularly challenging, as they study complex, highly ambiguous cultural artifacts (e.g. poems, paintings, symphonies) and therefore have a long tradition of using hermeneutic, qualitative methods. However, we are at a tipping point, where many of these cultural artifacts are available in digital form, and thus force the humanities to ask new questions and to apply new, quantitative methods (Jockers, 2013, p. 4). This development has been coined the digital humanities, and has been thriving over the last couple of years. While the digital humanities themselves are discussing about how to define and demarcate this new, interdisciplinary field of study (Berry, 2012; Gold, 2012; Terras, Nyhan, & Vanhoutte, 2013), information science is currently also discussing its relationship to the digital humanities (Balck et al., 2015; Balck, 2016; Burghardt, et al., 2015; Frank, 2016; Gladney, 2012; Hobohm, 2015; Robinson et al., 2015; Sula, 2013; White & Gilbert, 2016).

The goal of the ISI 2017 satellite workshop is to contribute to this ongoing discussion and to negotiate the relation of information science and the digital humanities by bringing together people from both fields. Workshop participants are asked to present concrete examples that highlight similarities and differences, synergies and rivalries between the two fields. On the basis of these examples, which may include personal experiences from research projects, curricula in academia, funding strategies, etc., we will systematically investigate the relation of information science and the digital humanities.

CALL FOR PARTICIPATION

The satellite workshop will be held at the Berlin School of Library and Information Science and will begin after the official closing ceremony of the International Symposium of Information Science (ISI, http://isi2017.ib.hu-berlin.de/) 2017, on March 15, from 2 – 6 pm.

The workshop may be attended by (1) participants who want to present a specific example for the relation of information science and the digital humanities, and by (2) general participants, who want to join the discussion. This workshop is free of charge (workshop registration via email is required). If you are planning to participate in the workshop, please send an email to Manuel Burghardt (manuel.burghardt@ur.de) or Markus Kattenbeck (markus.kattenbeck@ur.de) until February 16, 2017. The goal of the workshop presentations is to share different examples of projects / case studies / curricula / etc. that are stimulating discussions about the relation of the two fields. Potential topics for short workshop presentations include the following:

  • Relationship of curricula in DH and IS
  • Teaching information literacy for the humanities
  • Digital libraries and research data management for the humanities
  • Information infrastructures and virtual research environments for the humanities
  • Information behavior in the humanities
  • Humanist-computer interaction: Tool science and user interface design

If you are going to present an example in the workshop, please attach a short position paper that summarizes your personal opinion on the relation of information science and the digital humanities (1-2 pages) based on any of the these topics. Participants who have had their position paper accepted by the workshop organizers will have approx. 15 minutes of time to present their topic and position to the other participants. All presentations will be discussed in the workshop to investigate the relationship of information science and the digital humanities. There will also be final discussion to wrap up the overall workshop topic.

REFERENCES

  • Balck, S., Büttner, S., Ducks, D., Lehfeld, A.-S., Schneider, E., & Vietze, E. (2015). Mit den Informationswissenschaften von Daten zu Erkenntnissen. In DHd 2015, Graz.
  • Balck, S. (2016). (X)Disziplinarität der Informationswissenschaft. LIBREAS. Library Ideas, 30. http://libreas.eu/ausgabe30/balck/
  • Berry, D. M. (2011). The Computational Turn. Thinking About the Digital Humanities.
  • Berry, D. M. (2012). Understanding Digital Humanities. Palgrave Macmillan.
  • Burghardt, M., Wolff, C., & Womser-Hacker, C. (2015). Informationswissenschaft und Digital Humanities. Information – Wissenschaft & Praxis, 66(5–6), 287–294.
  • Frank, I. (2016). Fortschritt durch Rückschritt — vom Bibliothekskatalog zum Denkwerkzeug. Eine Idee. LIBREAS. Library Ideas, 30. http://libreas.eu/ausgabe30/frank/
  • Gladney, H. M. (2012). Long-term digital preservation: A digital humanities topic? Historical Social Research, 37(3), 201–217.
  • Gold, M. K. (2012). Debates in the Digital Humanities. Minneapolis: University of Minnesota Press.
  • Jockers, M. L. (2013). Macroanalysis. Digital Methods & Literary History. University of Illinois Press.
  • Hobohm, H.-C. (2015). Transdisziplinäre Aspekte der Informationswissenschaften als Kernaufgaben der Informationsberufe. In Informationswissenschaft: Theorie, Methode und Praxis / Sciences de l’information: théorie, méthode et pratique, 4(1). https://bop.unibe.ch/iw/article/view/2682/3987
  • Robinson, L., Priego, E., & Bawden, D. (2015). Library and Information Science and Digital Humanities: Two Disciplines , Joint Future? In C. Pehar, F.; Schlögl, C. & Wolff (Ed.), Re:inventing Information Science in the Networked Society. Proceedings of the 14th International Symposium on Information Science, ISI 2015 (pp. 44–54). Glückstadt: Verlag Werner Hülsbusch.
  • Sula, C. A. (2013). Digital Humanities and Libraries: A Conceptual Model. Journal of Library Administration, 53(1), 10–26. http://doi.org/10.1080/01930826.2013.756680
  • Terras, M., Nyhan, J., & Vanhoutte, E. (2013). Defining Digital Humanities – A Reader. Farnham (UK): Ashgate Publishing.
  • White, J. W. & Gilbert, H. (2016). Laying the Foundation. Digital Humanities in Academic Libraries. Purdue University Press.

*Photo credits: The header image is kindly provided by Grégoire Jeanneau via Unsplash.com.

Syllabus – Introduction to DH and Text Analysis

I have recently adjusted the syllabus of my course on digital humanities and text analysis and wanted to share some of the methods, tools and resources that I currently use. For some great tutorials and exercises on computer-based text analysis, you might want to check out the following:

Preliminary remarks

The target audience for the course are students in the media informatics Master’s program, i.e. students have a background in programming and data modelling. The course is divided in 3 phases: During phases 1+2, students spend 2×2 hours per week in class and learn the fundamentals of digital humanities and text analysis. Phase 3 is a free project phase, where groups of students work on their individual digital humanities projects and regularly meet with the lecturer to discuss the progress of their project.

Phase 1: Introduction to Digital Humanities

Week 1a

  • General introduction to the course
  • Introducing the DSH reading challenge: throughout the course, each student will present a preselected paper from the Digital Scholarship in the Humanities journal by summarizing its basic research goals, methods and results in 5 minutes (+5 minutes of general discussion)

Reading assignment: Prensky, M. (2001). Digital Natives, Digital Immigrants Part I. On the Horizon, 9(6), 1–6.

Week 1b

  • Discussing the „digital“ and its implications, as in digital revolution, digital society, digital culture, digital natives,

Reading assignment: Snow, C. P. (1959). The Two Cultures. London: Cambridge University Press.

Week 2a

  • Discussing „humanities“
  • What is special / challenging about digital humanities? Can you adopt the idea of digital natives and digital immigrants to scholarly disciplines?

Reading assignment: Michel, J.-B., Shen, Y. K., Aiden, A. P., Veres, A., Gray, M. K., Pickett, J. P., … Aiden, E. L. (2011). Quantitative analysis of culture using millions of digitized books. Science (New York, N.Y.), 331(6014), 176–82.

Week2b

Reading assignment: Svensson, P. (2010). The Landscape of Digital Humanities. Digital Humanities Quarterly, 4(1), 1–31.

Week3a

  • Defining the digital humanities: Overview and discussion of existing definitions
  • Working definition for the course:
    (1) DH as use of digital tools / methods / resources in the humanities, and
    (2) DH as humanities, investigating digital culture.

Week3b

  • Basic introduction to literary studies
  • Overview of literary theories and typical research questions in that field
  • Exercise: Analyzing “Every breath you take” in class

Reading assignment: Moretti, F. (2000). Conjectures on world literature. New Left Review, (Jan / Feb), 54–68.

Phase 2: How to do digital humanities? A hands-on introduction to computer-based text analysis.

Week4a

  • Introduction to (close and) distant reading
  • Examples for the application of distant reading approaches
  • Tools for distant reading (Voyant, To See or Not to See)

Week4b

Week5a

  • Introduction to data cleaning with the bash command line and regular expressions
  • Tools: UnixShell, CygWin

Week5b

  • Beyond raw text – annotating with XML / TEI
  • Utilizing document markup with XSLT

Week6a

Week6b

  • Analyzing text: frequencies, concordances and collocations
  • Tools: Voyant, AntConc

Week7a

  • How to interpret frequencies ­– Introduction to statistics
  • Tool: R studio

Week7b

  • Introducion to stylometry
  • Tool: R Stylo

Week8a

  • Introduction to topic modeling
  • Tool: MALLET

Week8b

  • Distant reading the DSH: throughout the course, students have “close read” and discussed typical articles from the DSH journal – at the end of the course, we apply frequency lists and topic modeling to a larger corpus of DSH articles.

Phase 3: DH projects

Students work on their own research projects and apply text analysis techniques

Example topics:

  • Stylistic change in the different editions of the fairytales by brothers Grimm’s
  • Intertextuality: Shakespeare in literature / film / lyrics
  • Quantitative analysis of drama according to speakers, structure, speech, etc.
  • etc.

 

Masterstudiengang „Digital Humanities“ an der Universität Regensburg

Im Rahmen des Förderprogramms „Digitaler Campus Bayern“ fördert das Bayerische Ministerium für Bildung und Kultus, Wissenschaft und Kunst ein kooperatives Studienprogramm der Universitäten Regensburg, Erlangen-Nürnberg und München im Bereich „Digital Humanities“. In Regensburg wird dabei ein Masterstudiengang „Digital Humanities“ entstehen, der zum WS 2017/2018 startet.

Ausführliche Informationen finden sich in der offiziellen Pressemitteilung (Originalquelle).

Pressemitteilung vom 10. Oktober 2016

Für die Jahre 2016 bis 2020 hat das Bayerische Ministerium für Bildung und Kultus, Wissenschaft und Kunst für ein von den Universitäten Regensburg, Erlangen-Nürnberg und München geplantes, kooperatives Studienangebot im Bereich Digital Humanities eine Anschubfinanzierung von bis zu 3,6 Millionen Euro genehmigt. Finanziert wird diese Förderung aus dem Innovationsprogramm „Digitaler Campus Bayern“ der Bayerischen Staatsregierung; dessen Ziel ist es, die bayerischen Hochschulen beim Aufbau von informationstechnischer Infrastruktur oder der Einrichtung von neuen Studienangeboten in den digitalen Technologien zu unterstützen.

Das kooperative Studienangebot bezieht den Forschungsbereich der Digital Humanities unter Beteiligung der Social Sciences in die Lehre ein. Digital Humanities umschreibt das Vorgehen, in den Geistes- und Kulturwissenschaften moderne Informationstechnologien und digitale Ressourcen für die wissenschaftliche Arbeit zu verwenden. Die Kooperation der drei Universitäten sieht dabei die Einrichtung bzw. den Ausbau von Studiengängen an den drei Standorten vor. Dabei profitieren die Studierenden in besonderer Weise von standortübergreifenden Veranstaltungen wie z.B. jährlichen Summer Schools, und der Öffnung von Lehrangeboten über die Standorte und Studiengänge hinweg.
Im Einzelnen entwickeln die Studiengänge unterschiedliche inhaltliche Schwerpunkte und richten sich an je spezifische Zielgruppen:

In Regensburg werden Prof. Dr. Christian Wolff, Inhaber des Lehrstuhls für Medieninformatik, und Prof. Dr. Bernd Ludwig vom Lehrstuhl für Informationswissenschaft den Master-Studiengang „Digitale Medien in den Geistes- und Kulturwissenschaften“ einrichten. Der Studiengang startet voraussichtlich im Wintersemester 2017/18 und richtet sich insbesondere an Lehramtsstudierende in den geistes- und kulturwissenschaftlichen Fächern. Absolventen des Fachs sollen in der Lage sein, Tätigkeiten mit IT-Bezug und fachlicher Nähe zu den B.A.-Studienfächern außerhalb des Lehramts zu übernehmen. Innerhalb des Lehramts sollen sie digitale Arbeitstechniken über das bisherige Maß hinaus in die jeweiligen Fächer einbringen können.

Die Gesamtkoordination des kooperativen Studienangebots liegt bei Prof. Dr. Heidrun Stein-Kecks vom Institut für Kunstgeschichte an der Friedrich-Alexander Universität Erlangen-Nürnberg. Sie ist zugleich Sprecherin des Interdisziplinären Zentrums Digitale Geistes- und Sozialwissenschaften, das für Konzept und Durchführung des Studiengangs verantwortlich zeichnet.
In Erlangen wird der grundständige Bachelor-Studiengang „Digitale Geistes- und Sozialwissenschaften“, der bisher nur im Zweitfach studierbar war, ausgebaut. Der Studiengang ist breit gefächert angelegt und führt in interdisziplinärer Vernetzung in das neue Forschungsfeld ein. Durch die Kooperation mit der Technischen Fakultät gewinnt der Studiengang ein ausgeprägtes informationstechnologisches Profil. Besondere thematische Schwerpunkte liegen in den Bereichen Bild und Medien, Sprache und Text sowie Raum und Gesellschaft. Praxis- und projektorientierte Module zielen auf eine anwendungsorientierte Verzahnung der Informatik und der Digitalen Geistes- und Sozialwissenschaften, wobei ein besonderes Augenmerk auch auf die Reflexion der Auswirkungen der Digitalisierung auf Gesellschaft und Wissenschaft gelegt wird. Individuelle Schwerpunktsetzungen in einem freien Wahlbereich führen zu spezifischen Vertiefungen, auch im Hinblick auf die Kombination mit einem weiteren Fach aus dem Studienangebot der großen Philosophischen Fakultät und Fachbereich Theologie. Die fundierten fachlichen und methodischen Kompetenzen im Umgang mit digitalen Technologien in Wissenschaft und Gesellschaft eröffnen den Studierenden attraktive Perspektiven in dynamisch wachsenden Forschungs- und Arbeitsfeldern an den Schnittstellen von Technologie, Gesellschaft und Kultur.

In München ist Dr. Christian Riepl, Leiter der IT-Gruppe Geisteswissenschaften, Ansprechpartner für das Projekt. Zusammen mit den sprachwissenschaftlichen Disziplinen koordiniert er die Einrichtung des optionalen BA-Nebenfaches „Digital Humanities – Sprachwissenschaften“ an der Fakultät für Sprach- und Literaturwissenschaften der LMU: die Förderung im Rahmen des„Digitalen Campus Bayern“ bietet hier die Möglichkeit, das seit vielen Jahren in der Forschung und forschungsnahen Lehre unter anderem in den Bereichen Korpuslinguistik, Geolinguistik, perzeptive Linguistik und Sprachgeschichte gewonnene IT-Wissen grundlegend und systematisch zu sammeln, im Rahmen eines optionalen Nebenfaches „Digital Humanities – Sprachwissenschaften“ in bestehende BA-Studiengänge der großen sprachwissenschaftlichen Disziplinen (Anglistik, Germanistik, Romanistik,) zu integrieren und fachnah in der sprachwissenschaftlichen Praxis zu vermitteln. Das Vorhaben kann in München an ein bereits in der ersten Antragsrunde des „Digitalen Campus Bayern“ bewilligtes Projekt „IT-for-all: Digitale Datenanalyse in den Geschichts- und Kunstwissenschaften“ anknüpfen und die dort entstandene digitale Lehr- und Forschungsinfrastruktur DH-VLab technisch weiterentwickeln und fachlich ausbauen.