Das Informationssystem ICE
ICE - das Kürzel ICE steht für Information, Controlling, Entscheidung - ist ein web-gestütztes Informationssystem für die Entscheidungsvorbereitung in Hochschulplanung und Hochschulpolitik. Es ist beabsichtigt ICE in Kürze als freie Software unter einer Open Source Lizenz (GPL) jedermann zur kostenlosen Nutzung zur Verfügung zu stellen. Im Backend besteht das System aus einem Data Warehouse, in dem Daten unterschiedlicher Strukturierung und sowohl Einzelfalldaten als auch Summendaten gespeichert und über den ICE-Applikationsserver recherchiert werden können. Herzstück der Auswertungsinstrumente ist die flexible Tabellengenerierung, mit deren Hilfe aus dem vorhandenen Datenbestand interaktiv beliebige Tabellen zusammen gestellt werden können. Darüber hinaus können die mit der flexiblen Tabellengenerierung erstellten Tabellen als sogenannte ICE-Standardtabellen abgespeichert werden, deren Inhalte nach dem Import neuer Datenbestände automatisch aktualisiert werden können.
Zur Entwicklungsgeschichte
Die in den 80er Jahren in Deutschland aufkommenden Diskussionen über den Schutz personenbezogener Daten führten zu einer stärkeren Sensibilität in der Bevölkerung bezüglich Datenschutzfragen und zu verschärften Datenschutzbestimmungen. Beides führte im Ergebnis zu verringerten Möglichkeiten statistischer Datenanalysen: In vielen Bereichen kann bei statistischen Analysen nur auf so genannte Summensätze zurückgegriffen werden. Mit dem Informationssystem ICE wird ein System zur Verfügung gestellt, mit dem ein Maximum an Informationen aus den prinzipiell beschränkten Summensätzen geholt werden kann. Gleichzeitig erlaubt das System - bei entsprechender Verfügbarkeit - auch die Auswertung von Einzelfalldaten.
Zu Beginn der 90er Jahre entstand das ICE als Auftragsarbeit für das deutsche Bundesbildungsministerium (BMBW), das sich später mit dem Forschungsministerium (BMFT) zusammenschloss. Nach der Umstellung des Betriebssystems des Ministeriums von Macintosh auf Microsoft Windows wurde Mitte der 90er Jahre eine Neuentwicklung notwendig. Es entstand ein Intranet-System auf Basis einer modernen Mehr-Schicht-Architektur, mit einer Datenbank am Backend und Java als zentraler Entwicklungsplattform. Damit wurde das System plattformunabhängig und mit einem Internet-Browser abrufbar.
Informationssysteme auf der Basis der von DZHW (Deutschen Zentrum für Hochschul- und Wissenschaftsforschung) im Auftrag des BMBF entwickelten ICE-Technologie werden derzeit in folgenden Institutionen eingesetzt:
- BMBF: Datenportal des BMBF
- Länder: ICEland - gemeinsames Informationssystem der Bildungsministerien der Länder
- DAAD: ICEwwo - Informationssystem für das Projekt Wissenschaft weltoffen
- MWK Niedersachsen: ICEnds - Informationssystem für den landesspezifischen Informationsbedarf des Landes Niedersachsen
Charakteristika des Systems im Überblick
Web-Anwendung. Der Zugriff auf eine ICE-Installation erfolgt über einen Java-fähigen Webbrowser (wie z. B. dem Open Source Browser Mozilla Firefox oder Microsofts Internet Explorer) über ein Netzwerk. Dies bedeutet, dass der Zugriff auf das System prinzipiell von jedem Rechner aus erfolgen kann, für den der ICE-Server im Intranet oder Internet freigeschaltet wurde. Der Zugriff auf das System (oder auf Teile des Systems) kann von einer erfolgreichen Authentifizierung abhängig gemacht werden. Bei Bedarf kann das System (oder Teile des Systems, z. B. Standardtabellensammlungen) auch so eingerichtet werden, dass ein Zugriff aus dem Internet möglich ist.
Plattformunabhängigkeit. Das System kann serverseitig sowohl unter Microsoft Windows als auch unter Linux installiert werden. Auf Seiten des Clients (des Benutzers) wird lediglich ein Java-fähiger Webbrowser benötigt. Solche sind kostenfrei für alle gängigen Plattformen (u. a. für MS Windows, MacOS, Linux) erhältlich. Die Plattformunabhängigkeit bezieht sich auch auf das verwendete relationale Datenbankmanagement-System: Es existieren Installationen unter Oracle, Informix, MySQL und PostgreSQL.
Flexibler Datenimport. Es können Daten mit beliebiger Strukturierung und Gliederungstiefe importiert werden. Auch thematisch ist das System flexibel erweiterbar. Es können neben Summensätzen auch umfangreiche Einzelfalldaten mit guter Performance ausgewertet werden. Ebenso ist eine gemeinsame Auswertung von Summen- und Einzelfalldaten möglich.
Flexible Datenauswertung. Der Flexibilität beim Import von Beständen steht eine ebenso große Flexibilität bei den Auswertungsmöglichkeiten gegenüber: Aus den im System verfügbaren Beständen können mit der so genannten "flexiblen Tabellengenerierung" beliebige Ausschnitte in Tabellen dargestellt werden. Auch bestandsübergreifende Auswertungen sind problemlos möglich: In einer Ergebnistabelle können Informationen aus mehreren Datenbeständen gemeinsam dargestellt werden.
Flexibler Datenexport. Die Benutzer können sich ihre Rechercheergebnisse in verschiedenen Formaten ausgeben lassen und exportieren: XML, (X)HTML, MS Excel, Gnumeric, FOP, PDF. Im Hintergrund erfolgt die Ausgabe mit dem auf Apache Cocoon basierenden ICE-Publishing-Framework. Das System ist XML-basiert. XML ist ein Standard zum Austausch von Daten und dient als universelle Schnittstelle zu Drittprogrammen (z. B. zu anderen Datenbanken, Tabellenkalkulationen, Grafikprogrammen, Geografischen Informationssystemen usf.) benutzt werden kann. Mit Hilfe von XSLT-Stylesheets werden die XML-Streams dann in die weiteren Zielfomate transformiert. Bei Bedarf können durch die Erstellung weiterer XSLT-Stylesheets auf einfache Weise weitere Formate erzeugt werden (z. B. LaTeX). Das Verfahren ermöglicht einfache Modifikationen des Layouts (Farben, Größe der Dokumente, verwendete Zeichensätze etc.) für alle Ausgaben einer ICE-Installation. Dies ist deshalb relativ einfach möglich, weil sämtliche Ausgaben jeweils bei Aufruf on-the-fly erstellt und die entsprechenden Informationen aus einer Datenbank geholt werden; es muss nicht auf vorgefertigte Dateien zugegriffen werden. Für das häufig verwendete PDF-Format existiert eine Benutzeroberfläche, mit der die Anwender selbst das Aussehen einzelner PDF-Dateien verändern können (z. B. Spalten- und Vorspaltenbreiten, Zeilenhöhe, Papierformat usw.).
Datenharmonisierung durch integrierte Schlüsselsystematik. Alle im System befindlichen Daten werden mit einem einheitlichen ICE-Schlüssel versehen. Das Schlüsselsystem wird zentral von der ICE-Projektgruppe gepflegt. Auf diese Weise wird sichergestellt, dass - so weit inhaltlich sinnvoll möglich - unterschiedliche Bestände, ggf. auch aus verschiedenen Quellen, gemeinsam ausgewertet werden können. Ggf. werden Auml;quivalenzregeln gebildet, die den Vergleich unterschiedlich verschlüsselter, aber inhaltlich vergleichbarer Ausprägungen möglich machen (Beispiel: Fächergruppen der Personal- gegenüber Fächergruppen der Studierendenstatisitik). Das System kennt auch schlüsselinterne Hierarchien und stellt dem Anwender dieses Wissen z. B. für Sortierfunktionen zur Verfügung (Das System "weiß", dass z. B. die Universität Hannover zum Bundesland Niedersachsen gehört und zur Hochschulart Universitäten).
ICE-Standardtabellen (mit integrierter automatischer Selbstaktualisierung). Alle mit der flexiblen Tabellengenerierung erzeugten Ergebnistabellen können als so genannte ICE-Standardtabellen in Standardtabellensammlungen abgespeichert werden. Diese Tabellensammlungen können im Intranet oder im Internet Dritten als Informationsquelle zur Verfügung gestellt werden und sind sowohl über eine hierarchische Verzeichnisstruktur, als auch über eine Schlagwortsuche recherchierbar. Der besondere Clou der ICE-Standardtabellen ist die integrierte automatische Selbstaktualisierung: Eine einmal generierte und als Standardtabelle abgespeicherte Auswertungstabelle kann per Knopfdruck automatisch um Daten ergänzt werden, die zu einem späteren Zeitpunkt in das System importiert wurden. Dabei kann zwischen verschiedenen Aktualisierungstypen gewählt werden (z. B. Zeitreihenergänzung, Zeitreihenverschiebung, Ersatz der gesamten Tabelle durch den aktuellsten verfügbaren Zeitpunkt). Mit dem ICE-Publishing-Framework können diese Standardtabellen in allen o. g. Formaten abgerufen werden.
Performanz/Hochverfügbarkeit. Um eine gute Performanz des Systems zu gewährleisten und um Hochverfügbarkeit zu erreichen ist es möglich, das ICE-System auf einem Rechner-Cluster zu installieren. Die Anfragen der Benutzer werden dann nicht von einem einzelnen Server, sondern von beliebig vielen Servern beantwortet.
Support/Hotline. Die ICE-Gruppe vom Deutschen Zentrum für Hochschul- und Wissenschaftsforschung berät und unterstützt in allen mit dem Informationssystem verbundenen Fragen (sowohl telefonisch als auch per E-Mail). Dies schließt technische Fragen (Netzwerkprobleme, Sicherheitseinstellungen) und Fragen der Bedienung der Software (des Browsers, der ICE-Anwendung) ebenso ein, wie fachliche/statistische Fragen (bezüglich der Daten und ihrer Auswertung, Schlüsselfragen u. ä.). Für Nutzer der von DZHW betriebenen ICE-Installationen ist dieser Service kostenlos.
Ständige Weiterentwicklung. Das ICE wird ständig weiterentwickelt. Erweiterungen und Optimierungen, die von der ICE-Gruppe für einen Auftraggeber erstellt wurden, werden zeitnah der Allgemeinheit zur Verfügung gestellt.
ICE als freie Software/Open Source. Es ist geplant den Quelltext aller ICE-Komponenten als freie Software unter einer Open Source Lizenz (GPL) der Allgemeinheit zur Verfügung zu stellen. Jedem soll es erlaubt sein, das ICE-System für jeden Zweck zu nutzen, zu studieren, zu verändern und in ursprünglicher bzw. geänderter Form weiter zu verbreiten.
Die GPL gewährt jedermann die folgenden vier Freiheiten als Bestandteile der Lizenz:
- Das Programm darf ohne jede Einschränkung für jeden Zweck genutzt werden. Kommerzielle Nutzung ist hierbei ausdrücklich eingeschlossen.
- Kopien des Programms dürfen kostenlos oder auch gegen Geld verteilt werden, wobei der kostenlose Zugang zum Quellcode ermöglicht werden muss. Dem Empfänger müssen dieselben Freiheiten gewährt werden wer z. B. eine Kopie gegen Geld empfängt, hat weiterhin das Recht, diese dann kommerziell oder auch kostenlos zu verbreiten. Lizenzgebühren sind nicht erlaubt. Niemand ist verpflichtet, Kopien zu verteilen, weder im Allgemeinen, noch an irgendeine bestimmte Person aber wenn er es tut, dann nur nach diesen Regeln.
- Die Arbeitsweise eines Programms darf studiert und den eigenen Bedürfnissen angepasst werden.
- Es dürfen auch die gemäß Freiheit 3 veränderten Versionen des Programms unter den Regeln von Freiheit 2 vertrieben werden, wobei dem Empfänger des Programms der Quellcode der veränderten Version verfügbar gemacht werden muss. Veränderte Versionen müssen nicht veröffentlicht werden; aber wenn sie veröffentlicht werden, dann darf dies nur unter den Regeln von Freiheit 2 geschehen.