Daten zu BVV-Sitzungen jetzt als Open Data verfügbar
Seit Juli diesen Jahres veröffentlichen die ersten Bezirke Daten aus ihren Bezirksverordnetenversammlungen (BVV) als Open Data über eine API. Was genau bedeutet das und warum werden bestimmte Daten auf diese Art und Weise veröffentlicht? Wir geben mit einem kleinen Datenanalyse-Projekt Einblick in mögliche Nutzungen.
Daten zu BVV-Sitzungen jetzt als Open Data verfügbar
Seit Juli diesen Jahres haben die ersten Bezirke angefangen, Daten aus ihren Bezirksverordnetenversammlungen (BVV) als Open Data zu veröffentlichen. Die ODIS war beratend tätig und hat bei der Veröffentlichung unterstützt. Potenzielle Datennutzer:innen haben jetzt Zugang zu einer Schatzkiste an maschinenlesbaren Daten rund um Ausschusssitzungen und Bezirksverordnete. Das besondere an dieser Datenveröffentlichung ist, dass die Daten nicht in einzelnen, statischen Dateien zu finden sind (zum Beispiel in CSV-Dateien), sondern direkt über eine öffentliche API-Schnittstelle verfügbar gemacht werden. Was genau bedeutet das und warum werden bestimmte Daten auf diese Art und Weise veröffentlicht?
Was ist eine API?
Eine API (Application Programming Interface) ist eine Schnittstelle – eine Art Verbindung – zwischen zwei Applikationen oder Programmen, über die Daten geteilt werden können. Der oder die Anbieter:in der API entscheidet, welche Daten über die API abrufbar sind. Eine API bedeutet also nicht, dass Nutzer:innen zwangsläufig uneingeschränkten Zugang zu einem System erhalten.
Im Kontext von Open Data erlauben APIs es den Nutzer:innen, direkt mit den Daten zu interagieren ohne den Datensatz zuerst im klassischen Sinne herunterzuladen. Viele APIs sind so konfiguriert, dass Endnutzer:innen ihre eigene Abfrage an die Datenbank schicken können, um einen gewünschten Ausschnitt aus den Daten zu bekommen (z.B. nur Einträge für einen bestimmten Zeitraum oder nur Einträge, die ein bestimmtes Schlagwort nutzen). Das kann besonders vorteilhaft sein, wenn die gesamte Datenmenge sehr groß ist – statt die komplette Datenbank herunterladen zu müssen, können nur gewünschte Daten abgefragt und heruntergeladen werden.
APIs sind über sogenannte Endpunkte zugänglich. Ein Endpunkt wird über eine URL abgerufen, genau wie bei einer normalen Webseite. Weil die Location der API im Netz sowie die Möglichkeiten für eine Interaktion mit der API (also welche Abfragen möglich sind) vom Anbieter oder der Anbieterin definiert werden, ist es wichtig, auch eine Dokumentation der API zu veröffentlichen. Ohne diese Dokumentation wird es für Endnutzer:innen schwierig, die Endpunkte zu finden und Daten abzufragen.
Für Datenabfragen sind in der Regel Programmierkenntnisse notwendig, eine API richtet sich daher eher an Nutzergruppen mit entsprechender Erfahrung, also z.B. Datenanalyst:innen oder Entwickler:innen. Von der Datenbereitstellung profitieren kann aber natürlich ein erweiterter Nutzerkreis. So können unter Verwendung einer API Apps, Dashboards und Ähnliches programmiert werden, die für den oder die Endnutzer:in interessante Informationen ansprechend präsentieren. Natürlich kann eine API auch verwendet werden, um Daten einmalig herunterzuladen, in einer statischen Datei abzuspeichern und weiterzuverarbeiten.
Warum ist eine Bereitstellung von offenen Daten über eine API vorteilhaft?
Es gibt verschiedene Szenarien, bei denen eine Datenbereitstellung mittels API besonders empfehlenswert ist. Zum einen kann es bei einer außerordentlich großen Menge an Daten problematisch für Endnutzer:innen werden, wenn nur eine einzige, sehr große Datei bereitgestellt wird. Mit großen Dateien umzugehen kann schwierig oder fast unmöglich sein, abhängig von der Rechnerleistung und davon, wie man mit den Daten arbeiten will. Besonders unpraktisch sind solche Dateien, wenn Endnutzer:innen sich eigentlich nur für einen Ausschnitt der Daten interessieren. In einem solchen Fall eignet sich eine API besonders zur Datenbereitstellung.
Auch für Daten, die sehr regelmäßig aktualisiert werden – wöchentlich, täglich oder noch häufiger –, ist eine API oft die praktischere Art der Datenveröffentlichung. Entwickler:innen können eine Anwendung programmieren, in der neue Daten automatisiert direkt aus der API abgerufen werden (und die regelmäßig prüft, ob aktuellere Daten vorliegen); so kann sichergestellt werden, dass die entwickelte Anwendung immer die aktuellsten Daten präsentiert.
Was ist die ALLRIS-Schnittstelle?
Die ALLRIS-Schnittstelle ist eine Schnittstelle zum Sitzungsmanagement- und Gremieninformationssystem der Bezirke. Die offene API liefert Daten über die historischen und aktuellen Aktivitäten der Bezirksverordnetenversammlungen. Jeder Bezirk hat eine eigene Schnittstelle für seine BVV (noch nicht alle Bezirke haben ihre Schnittstellen im Datenportal eingetragen). Die Schnittstelle bietet Daten zu diversen Themen, z.B. zu Personen, die in der parlamentarischen Arbeit tätig sind oder waren (hier geht es vor allem um Bezirksverordnete, aber auch um andere Personen, die Rollen in der BVV erfüllen), Sitzungen von etablierten Gruppen in der BVV (z.B. Fraktions- oder Ausschusssitzungen) oder Drucksachen, die aus der parlamentarischen Arbeit entstehen (z.B. Beschlüsse oder Anträge). Die API ist nach einem deutschlandweit gültigen Standard namens OParl strukturiert, der ausführlich im Internet dokumentiert ist.
Weil es sich hier um eine recht große Menge an Daten handelt – die Daten umfassen alle Aktivitäten der BVV für alle Wahlperioden seit 2000 –, die auch sehr regelmäßig aktualisiert werden (es werden als Teil der regulären Arbeit der BVV ja ständig neue Sitzungen organisiert und Drucksachen erstellt), ist die ALLRIS-Schnittstelle ein sehr gutes Beispiel für die Notwendigkeit einer API: Über die API können Nutzer:innen tagesaktuell Daten aus einer BVV abrufen und verarbeiten – und wer sich nur für Informationen über die aktuellen Abgeordneten in der BVV interessiert, kann diese Informationen gezielt abfragen, anstatt zuerst einen kompletten Datensatz für die BVV herunterladen zu müssen.
Was man mit den Daten machen kann
Um die große Vielfalt der durch die ALLRIS-API verfügbaren Daten greifbarer zu machen, haben wir drei kleine Visualisierungs- und Analyseprojekte aufbereitet, die Daten aus dem ALLRIS-System von Treptow-Köpenick nutzen.
Rollen und Personen
Der Datensatz bietet Informationen zu den verschiedenen Rollen in der parlamentarischen Arbeit der Bezirke. Es gibt in den Daten 26 verschiedene Rollen, unter anderem Ausschussmitglieder und (stellvertretende) Ausschussvorsitzende, Fraktionsmitglieder und (stellvertretende) Fraktionsvorsitzende sowie (stellvertretende) Bürgerdeputierte und (stellvertretende) Schriftführer:innen. Die meisten dieser Rollen werden von den Bezirksverordneten, also den von den Einwohner:innen des Bezirks gewählten Mitgliedern der BVV, ausgeführt. Die Bezirksverordneten bilden i.d.R. auf Parteien basierende Fraktionen, doch es gibt auch fraktionslose Verordnete. Die Mitglieder der BVV arbeiten gemeinsam in Ausschüssen zu verschiedenen Themen, z.B. im Ausschuss für Stadtentwicklung und Bauen oder im Ausschuss für Weiterbildung und Kultur. In diesen Ausschüssen können neben den Bezirksverordneten auch Bürgerdeputierte, die nicht als Mitglieder der BVV gelten, mitwirken.
Die meist vertretenen Rollen sind die des Ausschussmitglieds (34%) und des stellv. Ausschussmitglieds (17%). Fraktionsmitglieder und Bürgedeputierte machen jeweils 8% der Beteiligten aus. Über einen Zeitraum von 4 Wahlperioden (2001 bis 2021, Wahlperiode V bis VIII) waren insgesamt 202 verschiedene Personen in der parlamentarischen Arbeit des Bezirks Treptow-Köpenick tätig, davon 71 Frauen (35 %) und 131 Männer (65%). Von 2002 bis 2011 besetzten Frauen zwischen 39 % und 45 % aller Rollen, Anfang 2012 waren es nur noch 26 %. Die geschlechtsspezifische Aufteilung der Rollen im Laufe der Zeit ist in der nachstehenden Abbildung dargestellt, die die zunehmende Diskrepanz seit 2012 verdeutlicht.
Derselbe Datensatz ermöglicht einen Blick auf die durchschnittliche Anzahl der Rollen, die Männer und Frauen in der BVV im Laufe der Zeit innehaben. Die meisten in der parlamentarischen Arbeit des Bezirks tätigen Personen nehmen nämlich mehrere Rollen in verschiedenen Kontexten ein, zum Beispiel als Mitglied einer Fraktion und in verschiedenen Ausschüssen. Die nachstehende Abbildung zeigt die durchschnittliche Anzahl der Rollen, die Männer und Frauen zwischen 2001 und 2021 innehatten. Sie zeigt, dass Frauen von 2002 bis 2011 im Durchschnitt eine Rolle mehr innehatten als Männer, aber dass beide Geschlechter seitdem eine ähnliche Anzahl von Rollen innehaben (durchschnittlich 4,76 Positionen für Frauen und 4,6 Positionen für Männer).
Themen
Die Inhalte der einzelnen BVV-Sitzungen werden durch Tagesordnungspunkte abgebildet. Jeder Tagesordnungspunkt widmet sich einem bestimmten Thema, wozu in der Regel auch die Beratung bestimmter Drucksachen gehört. Bei den meisten öffentlichen Sitzungen stehen ca. 5 - 20 Themen auf der Tagesordnung, die Zahl kann aber auch deutlich nach oben abweichen. In dem von uns betrachteten Auswertungszeitraum von Ende 2000 bis September 2021 wurden insgesamt über 38.500 Tagesordnungspunkte in öffentlichen Sitzungen verzeichnet. Über die Häufigkeit einzelner Worte in den Titeln haben wir Themen herausgearbeitet, zu denen besonders häufig getagt wurde. Allgemeine (z.B. die, und) und BVV-spezifische Worte (z.B. Berlin, Begrüßung, Beschluss), die für die Analyse nicht relevant sind, sowie Namen, wurden entfernt. Die verbliebenen Worte wurden auf ihren Wortstamm reduziert (z.B. Strassen zu strass). Die Grafik zeigt die so aggregierten 50 häufigsten Begriffe. Obwohl der Kontext in dem die Begriffe stehen in dieser Darstellung verborgen bleibt, ist zu erkennen, dass stadt- und verkehrsplanerische Themen offenbar viel Raum einnehmen. Das zeigen Begriffe wie bebauungsplan, strass und radweg. Aber auch Bildungs- und Jugendthemen sind häufig vertreten (siehe z.B. schul, kita, kind).
Orte
Wie die oben gezeigte Auswertung der häufigsten Begriffe in den Tagesordnungspunkten zeigt, lassen sich auch Rückschlüsse über den räumlichen Bezug von Sitzungsthemen ziehen. So tauchen bestimmte Ortsteilnamen wie Altglienicke besonders häufig auf. Ebenfalls hervor sticht der Wortstamm strass als zweit häufigster Begriff. Viele Sitzungsthemen scheinen also mit dem Thema Straßenverkehr im allgemeinen oder mit speziellen Straßen im Zusammenhang zu stehen. In einer weiterführenden Analyse haben wir alle Straßennamen aus den Sitzungsthemen extrahiert und auf einer Karte dargestellt. Die jeweiligen Punkte wurden dafür immer zentral auf der Straße platziert, auch wenn im Tagespunkt eine weitere räumliche Eingrenzung genannt wurde, wie eine Hausnummer oder eine Angabe wie Fennstraße Ecke Michael-Brückner-Straße. Bei Klick auf einen Punkt werden die häufigsten in Zusammenhang stehenden Begriffe (also Wörter, die in den gleichen Tagesordungspunkten enthalten sind) gezeigt. Der am häufigsten auftretende Straßenname ist Baumschulenweg mit 146 Erwähnungen.
Dies sind nur ein paar Beispiele für Auswertungen die mit den Daten aus ALLRIS möglich sind. Hinter der Schnittstelle stecken noch viele weiter Informationen, die ausgelesen, weiterverarbeitet, neu kombiniert und weiterverarbeitet werden können. Es bleibt abzuwarten welche Anwendungen sich rund um die ALLRIS-API entwickeln werden. Mit der Veröffentlichung der Daten ist der erste Schritt zur erhöhten Nutzbarkeit jedenfalls getan.