This is a read only archive of pad.okfn.org. See the shutdown announcement for details.

2hQHxOKMkK Parlamentsdebatten in 3D?!

Andreas Blätte, Universität Duisburg-Essen
Juniorprofessur für Politikwissenschaft der Stiftung Zukunft NRW

Auf der Basis unseres PolMine-Plenarprotokollkorpus, das wir an der Uni Duisburg-Essen aufbereitet haben, kann ich Muster des parlamentarischen Sprachgebrauchs als dreidimensionales Netz zeigen. Bringt das etwas? Nicht unmittelbar. Es sieht zunächst schick aus. Allerdings ermöglicht das Plenarprotokollkorpus Recherchen im Volltext von Plenarprotokollen mit komplexen Suchabfragen. Wir können auch mit statistischen Verfahren der Korpus- und Computerlinguistik ("Text Mining") Muster im Text erkennen, die das bloße Auge nicht unmittelbar sieht.

Möglich wird dies durch die Aufbereitung von Plenarprotokollen als Korpus. "Korpus" bedeutet, dass wir eine Sammlung maschinell verarbeitbaren Textes schaffen. Ein wichtiges Merkmal des Korpus ist, dass nach flexiblen Kriterien (Zeitpunkt einer Debatte, Parteizugehörigkeit oder Funktion eines Sprechers etc.) Ausschnitte der gesamten Textmenge gebildet werden können, die man näher untersucht. Im PolMine-Projekt (vgl. www.polmine.de) haben wir alle Protokolle der Plenarsitzungen aller Landtage und des Bundestages seit dem 01.01.2000 aufbereitet. Insgesamt umfasst das Korpus mehr als 300 000 000 Wörter. Knapp 30 000 000 davon wurden im Landtag NRW gesprochen.

Als Politikwissenschaftler habe ich das Korpus für Analysen zur Sprache der Politik aufbereitet. Es sind für mich relevante Forschungsdaten. Allerdings glaube ich, dass unser Korpus auch für Bürger einen Mehrwert bietet. Es eröffnet unter anderem die Möglichkeit komplexer Recherchen im Volltext der Parlamentsdebatten. Welches Potential sehen Sie? Ich habe keine fertige Anwendung im Gepäck, aber ich würde gerne meine Ideen mit Ihnen teilen und mit Ihnen diskutieren.