SIDES
Sicheres Internetbasiertes DatenErfassungsSystem
für Publikations - und Lehrveranstaltungsbeschreibungsdaten an der TU Wien

Günter Enzi
Verein der Freunde des Österreichischen Lehrzielkatalogs

Der Akademische Senat hat in der Sitzung vom Mai 96 beschlossen, eine Infrastruktur für WorldWideWeb-basierte personenbezogene Informationsdienste wie

für wissenschaftliche Publikationen und Lehrveranstaltungsbeschreibungen durch den Verein der Freunde des Österreichischen Lehrzielkatalogs (LZK) realisieren zu lassen. Diese Infrastruktur dient der Unterstützung, Verbesserung und Weiterentwicklung bestehender Informations- systeme wie dem Lehrzielkatalog und dem Publikationsverzeichnis an der TU Wien, soll durch die offene und modulare Konzeption einfach für weitere Datenerfassungsaufgaben im Verwaltungsbereich verwendbar sein und leistet einen Beitrag zur Ausgestaltung einer universitären Informationsinfrastruktur.

Die derzeitige internetbasierte universitäre Informationsinfrastruktur an der TU Wien

Mit HISTU, dem Hypermedialen Informationssystem an der TU Wien, werden Informationen des Verwaltungsbereiches (TUWIS) als Hypertext im WWW verfügbar gemacht; derzeit werden das Vorlesungsverzeichnis und das Personalverzeichnis angeboten, wobei die Datenverteilung im WWW aus einer zentralen Datenbasis erfolgt. Das verwendete Datenmodell zur Beschreibung von Personen und des universitären Lehrbetriebes ist im wesentlichen durch gesetzliche Bestimmungen des Verwaltungsbereichs vorgegeben und muß nicht der differenzierten Beschreibung universitären Geschehens dienen.

Die Datenerfassung, die Aktualisierung und die Datenverarbeitung erfolgt im Rahmen der universitären Verwaltung, eine individuelle Erweiterung des Datenmodells ist nicht möglich.

Gleichfalls auf TUWIS - als Ausgangs- und - wird bei den White Pages der TU Wien, dem Directory-Service der TU Wien, als elektronischem Personal-, Instituts-, Telefon-, Email- und Homepageverzeichnis zurückgegriffen. Alle Personen, die in den White Pages der TU Wien erfaßt sind, haben dabei die Möglichkeit, online über eine WWW-basierte Eingabemaske selbst ihre Daten zu verändern.

In dieser Weise wird zum Beispiel das Email- und das Homepageverzeichnis gebildet.

Da X.500 eine weltweit, hierarchisch organisierte Verzeichnisstruktur darstellt, ist das Datenmodell in einem relativ starren Rahmen vorgegeben.

Ein weiterer Schwachpunkt des Directory-Services, wie es derzeit an der TU Wien betrieben wird, ist die fehlende Qualitätskontrolle für die dezentral erfaßten Daten und die möglicherweise unzureichende Sicherheit dieses Services. Der Sicherheitsaspekt hängt jedoch vom konkreten Verwendungszusammenhang ab.

Die einzelnen Institute und Personen an der TU Wien haben durch die einfachen Möglichkeiten der Verteilung von Informationen im WWW Institutsdarstellungen und Personenbeschreibungen dezentral veröffentlicht. Die verwendeten Datenmodelle sind unter den einzelnen Instituten jedoch nicht abgestimmt. Um die Erschließbarkeit der angebotenen Informationen zu erhöhen, ist die Einbindung in eine gesamte universitäre Informationsinfrastruktur wünschenswert. Dies ist derzeit nicht befriedigend gelöst. Der Versuch, diese Informationssysteme über sogenannte "Robots" im Volltext zu erfassen um dann zentral über eine Datenbasis suchbar anzubieten, hat sich ansatzweise bewährt. Allerdings setzt die Anwendung der Volltextsuche ein relativ genaues Wissen der Funktionsweise dieser "Informationbroker" voraus.

Die nun zu schaffende Infrastruktur setzt an Erfahrungen mit der Schaffung von Informationssystemen an der TU Wien an, berücksichtigt diese und versucht, Schwachstellen bestehender Systeme zu überwinden.

So können autorisierte Personen zentral verwaltete Daten - wie zum Beispiel in TUWIS vorgegeben - strukturiert erweitern und unstrukturierte dezentrale - wie sie von Instituten betrieben werden - in eine universitäre Informationsinfrastruktur einbeziehen. Dadurch wird der tatsächliche Prozeß des universitären Geschehens - z. B. der Verlauf einer Lehrveranstaltung - besser abbildbar und durch das Einbinden in eine einheitliche Datenstruktur einfacher zugänglich.

Das Projekt SIDES - ein Überblick

Der Verein der Freunde des Österreichischen Lehrzielkatalogs (LZK) wurde von der TU Wien beauftragt, eine sichere, offene, zentral verwaltbare Autorisierungsinfrastruktur für WWW-Anwendungen, eine dezentrale Online-Datenerfassungsumgebung für Lehrveranstaltungsbe- schreibungen und Publikationsdaten, eine zentrale relationale Datenbasis zum Speichern der erfaßten Daten, und die Möglichkeit der Verteilung der Daten im WWW und in gedruckter Form zu schaffen.

Mit SIDES können, ausgehend von TUWIS, detaillierte Lehrveranstaltungsbeschreibungen erfaßt werden. Das Datenmodell orientiert sich zum einen am Lehrzielkatalog und zum anderen an europäischen Standards wie dem ECTS-System. Für den Online-Bereich werden auch kurzfristig relevante Daten wie z.B. Prüfungstermine erfaßt.

Als wissenschaftliche Publikationen der Angehörigen der TU Wien werden Zeitschriftenartikel, Beiträge in Sammelwerken, Kongreßberichte, Patente, Bücher, Habilitationen, Dissertationen und Diplomarbeiten erhoben.

Die Daten werden über Java-Applets von autorisierten Personen, wie zum Beispiel Lehrveranstaltungsleitern der TU Wien, erfaßt. Die Anbindung an ein relationales Datenbanksystem wird über eine JDBC-Schnittstelle plattform- und herstellerunabhängig realisiert. Dieser gewählte Ansatz sichert eine hohe Flexibilität bei der Änderung des verwendeten Datenmodells und erlaubt damit auch eine rasche Adaptierung für weitere Erfassungsaufgaben wie sie zum Beispiel im Verwaltungsbereich anfallen.

Die Endredaktion und Qualitätskontrolle der dezentral erfaßten Lehrveranstaltungsdaten liegt beim LZK,  der Publikationsdaten bei der Bibliothek an der TU Wien. Diese Institutionen sind auch weiterhin für andere Datenerfassungsformen - z.B. schriftliche - zuständig.

Diese gesammelten, bereinigten und abgeglichenen Daten werden zum einen über das WWW suchbar, in Hypertextform und für andere Informationssysteme einbindbar öffentlich angeboten. Zum anderen werden die erfaßten Daten für den Druck aufbereitet.

Bei der Verwendung einer internetbasierten Computervernetzung ist der Datenaustausch zwischen dezentral erfassender Stelle (Client) und zentraler verwaltender Stelle (Server) auch von nicht autorisierten Personen abhörbar. Um hier einen höheren Schutz vor Mißbrauch zu bieten, werden im Rahmen von SIDES Daten durch den Einsatz des sogenannten Secure Socket Layers (SSL) verschlüsselt übertragen-

Die Autorisierungsinfrastruktur wird im wesentlichen aus einer zentral verwaltbaren rollenbasierten Zugriffskontrollliste gebildet. Dadurch können Personen oder Computeranwendungen über das WWW bestimmte Dienste in Anspruch nehmen. Die Authentifikation soll dabei entweder durch eine einfache Kombination aus einem eindeutigen Namen (Distinguished Name eines Directory-Services wie X.500) und einem Paßwort oder durch die Anwendung von digitalen Signaturen in Form einer sogenannten Public-Key-Infrastructure (PKI) erfolgen. Diese Autorisierungsinfrastruktur wird über Module durch einen WWW-Server ansprechbar und ist auch für Institute, die einen eigenen Server betreiben, nutzbar.

Um die Benutzerbedürfnisse im Gestaltungsprozeß in ausreichendem Maß zu berücksichtigen, wurde ein begleitendes Projektteam aus Vertretern der universitären Verwaltung, des EDV-Zentrums, der Bibliothek, des LZK und der Institute gebildet.

Mit der Projektdurchführung wurde im September 96 begonnen und die voraussichtliche Inbetriebnahme des Gesamtsystems ist zu Beginn des Sommersemesters 97.

Das Projekt SIDES im Detail

Die verwendeten Daten

Lehrveranstaltungsbeschreibungsdaten:

Referenz für die Beschreibung von Lehrveranstaltungen, wie sie in SIDES erfaßt werden, bildet das Verwaltungsinformationssystem der TU Wien - TUWIS. Diese Daten werden durch eine inhaltliche Beschreibung der Lehrveranstaltungen - wie derzeit durch den Lehrzielkatalog erfaßt - erweitert und an europäische Standards wie an das ECTS-System angepaßt.

Darüber hinaus werden für den Online-Bereich Daten mit kurzzeitig hohem Aktualitätsgrad, wie zum Beispiel prüfungsrelevante Daten, erfaßt.

Publikationsdaten:

Alle wissenschaftlichen Publikationen der TU Wien, wie Zeitschriftenartikel, Beiträge in Sammelwerken, Kongreßberichte, Patente, Bücher, Habilitationen, Dissertationen, Diplomarbeiten und sonstige Publikationen werden institutsweise erfaßt. Als Datenmodell für die Beschreibung der verschiedenen Publikationstypen wird BibTeX verwendet.

Bei Diplomarbeiten und Dissertationen werden biblio-graphische Daten aus BIBOS und die Daten zur Beschreibung des Institutes, an dem die Arbeit geschrieben wurde, und des jeweiligen Betreuers aus TUWIS übernommen. Die restlichen Publikationstypen sollen an den Instituten selbst erfaßt werden.

Autorisierungsdaten:

Alle für die angebotenen Dienste berechtigten Personen werden durch einen eindeutigen Namen gekennzeichnet. Dies erfolgt in derselben Weise wie bei den White Pages (X.500) der TU Wien.

In SIDES sind grundsätzlich jene Personen berechtigt, die über den Verwaltungsweg identifiziert, d.h. in TUWIS erfaßt sind. Als weiteres Authentifikationsmerkmal wird entweder das in den White Pages verwendete Paßwort oder bei der Verwendung von digitalen Signaturen der private und der von einer Zertifizierungsinstanz signierte öffentliche Schlüssel (X.509) verwendet.

Das Beschreiben der Rollen zum Ausüben bestimmter Rechte, wie sie in einer rollenbasierten Zugriffskontrolliste ("Role-base Access Control List") verwendet werden, kann zum Teil aus Verwaltungsinformationen abgeleitet werden. So ist die Rolle (Funktion) der Lehrveranstaltungsleiter in TUWIS verfügbar. Die Rechte der Rolle "Lehrveranstaltungsleiter" sind, eigene Lehrveranstaltungsbeschreibungen zu editieren und das eigene Paßwort zu ändern.

Eine andere Rolle ist der institutsbezogene "Autorisierungsadministrator". Diese Rolle könnte durch die EDV-Verantwortlichen des Institutes wahrgenommen werden. Die Rechte dieser Rolle sind das Setzen von Paßwörtern der Institutsmitarbeiter, das Weitergeben von bestimmten Rechten an Personen des Institutes und die Aufnahme von Personen in das Autorisierungssystem, die nicht durch TUWIS erfaßt sind.

Das Datenerfassungssystem

Die sichere, dezentrale, autorisierte Datenerfassung erfolgt über Java-fähige Webbrowser. Dabei werden die Systemplattformen Windows 3.1, Windows 95, Windows NT, MacOS, und verschiedene UNIX-Systeme unterstützt. Die Verwendung von Java-Applets zur Datenerfassung ermöglicht eine komfortable Ausgestaltung der Eingabemasken. Durch eine verbindungsorientierte Kommunikation mit dem Datenbank-Backend wird der Interaktionsgrad beim Abgleich und Korrektur der Daten durch schnelle Anwortzeiten erhöht, und die Anpassung der Anwendung an Änderungen des Datenmodells ist einfach möglich.

Die Erfassung der Publikationsdaten durch eine oder mehrere autorisierte Personen am Institut oder an der Bibliothek der TU Wien erfolgt in strukturierter Form und wird durch die verbindungsorientierte Kommunikation mit der Datenbank unmittelbar bei der Eingabe mit TUWIS-Daten abgeglichen und korrigiert.

Lehrveranstaltungbeschreibungsdaten werden in derselben Weise von Lehrveranstaltungsleitern, von einem oder mehreren autorisierten Personen am Institut oder vom LZK erfaßt.

Die zentrale Datenbasis

Die Publikationsdaten, die Lehrveranstaltungsbeschreibungsdaten, Daten aus TUWIS, Autorisierungsdaten, werden auf einem vom EDV-Zentrum der TU Wien betriebenen Rechner in einer relationalen Datenbank gehalten. Diese Daten werden mit den von der Universitätsdirektion erfaßten und gewarteten Daten zur Beschreibung von Instituten, Lehrveranstaltungen und Personen (TUWIS) abgeglichen, wobei die Daten der Direktion als Referenz verwendet werden.

Die Einbindung der Datenbasis - diese setzt auf kommerzielle Datenbanksysteme - in die Datenerfassungsinfrastruktur wird durch die Verwendung von JDBC-Schnittstellen weitgehend plattform- und herstellerunabhängig realisiert.

Die Datenverteilung im Print- und Online-Bereich

Die Publikations- und Lehrveranstaltungsbeschreibungsdaten werden für die Verteilung in gedruckter Form unter Verwendung von LaTeX automationsunterstützt aufbereitet. Dabei wird ein jährliches Verzeichnis aller wissenschaftlichen Publikationen der Angehörigen der TU Wien ebenso angeboten wie der Lehrzielkatalog in gedruckter Form und die Aufbereitung von Lehrveranstaltungsbeschreibungen für Institutsschaukästen.

Die Verteilung der Daten in elektronischer Form erfolgt über das WWW. Dabei werden die Daten in einem Hypertext abgebildet. In diesem Hypertext sind Informationseinheiten wie einzelne Lehrveranstaltungsbeschreibungen oder alle Publikationen einzelner Personen direkt ansprechbar. Darüber hinaus wird aus dem gebildeten Hypertext auf andere, wie zum Beispiel die von den Instituten betriebenen, Informationssysteme verwiesen. Zugang zu den Online-Daten wird über zielgruppenorientiertes Browsen und Suchen angeboten.

Um die computerbasierte Weiterverarbeitung der Daten zu unterstützen, werden z.B. die Publikationsdaten auch im BibTeX-Format verteilt.

Sicherheit im unsicheren Computernetz

Durch den Einsatz internetbasierter Technologie wie dem WWW ist der Datenaustausch zwischen dezentral erfassender und zentraler verwaltender Stelle im allgemeinen von nicht autorisierten Personen abhörbar. Um einen möglichen Mißbrauch durch unberechtigtes Abhören von schützenswerten Daten zu verhindern, wird im Rahmen dieses Projektes der Datenaustausch durch die Anwendung von asymmetrischen Kryptisierungsverfahren zur Verschlüsselung der Daten gesichert. Dazu wird der sogenannte Secure Socket Layer (SSL) verwendet

Autorisierungsinfrastruktur für personenbezogene Informationsdienste

Personenbezogene Informationsdienste benötigen eindeutige Merkmale zum Erkennen jener Personen, die für diese Dienste berechtigt (autorisiert) sind. Diese Merkmale sind im allgemeinen nur jenen Personen bekannt, die sich durch diese Merkmale authentifizieren, d.h. am System anmelden können. Der Betreiber der Dienste muß diese verwendeten Merkmale wieder eindeutig den Personen zuschreiben können. Solche Merkmale können z.B. eindeutiger Name der Person und ein Paßwort sein, aber auch eine digitale Unterschrift dieser Person. Damit der Betreiber der Informationsdienste sicher sein kann, daß jene Person, die sich mit diesen Merkmalen authentifiziert, auch wirklich die ist, die sie vorgibt zu sein, muß der Dienstanbieter die Person entweder selbst identifiziert und ihr dabei die Authentifikationsmerkmale übergeben haben oder aber eine andere vertrauenswürdige Stelle hat die Identifikation und Zuordnung der Merkmale zu dieser Person übernommen.

Im Rahmen dieses Projektes wird angenommen, daß alle in TUWIS erfaßten Personen über den Verwaltungsweg identifiziert und eindeutig beschrieben ("Distinguished Name") sind. Welche zusätzlichen Merkmale zur Authentifikation verwendet werden, hängt nicht zuletzt davon ab, welche konkreten Dienste angeboten werden. So ist die Verwendung des White Pages Paßwortes unsicherer als die Authentifikation durch digitale Signaturen unter Verwendung eines privaten Schlüssels auf einer Chipcard und einem dazu passenden öffentlichen Schlüssel, der durch eine "Certification Authority" signiert wurde. Wie die Autorisierungsinfrastruktur in SIDES ausgebildet wird, ist derzeit noch nicht entschieden.

Sind Personen in diesem System eindeutig erkannt, ist es noch notwendig zu klären, ob sie für einen bestimmten angeforderten Dienst auch die notwendigen Rechte besitzen. Dies wird im Rahmen dieses Projektes durch eine zentral verwaltbare rollenbasierte Zugriffskontrollliste realisiert, wobei sich einzelne Rechte direkt aus den Verwaltungsinformationen (TUWIS), wie z.B. Lehrveranstaltungsleiter, ableiten lassen.

Die gesamte Autorisierungsinfastruktur ist für Anwendungen des WWW, wie statische Zugriffe auf einzelne Seiten eines WWW-Servers oder Zugriffe auf CGI-Programme oder Zugriffe auf Java-Applets, verfügbar. Ansprechbar wird die Infrastruktur durch das Verwenden eines speziellen Moduls im jeweiligen WWW-Server. Dadurch wird es für verschiedene verteilte Informationssysteme möglich, verschiedenste Informationsdienste mit immer demselben Authentifikationsmerkmal zu verwenden. Zum Beispiel können damit Institute Prüfungsergebnisse für Studierende in der Weise im WWW anbieten, daß sich Studierende an allen Instituten immer auf dieselbe Art (z.B.: Matrikelnummer und White Pages Paßwort) authentifizieren.

Projektdurchführung

Mit der Projektdurchführung wurde der Verein der Freunde des Österreichischen Lehrzielkatalogs beauftragt. Das durchführende Projektteam besteht aus Enzi Günter, Eller Martin und Mayr Johannes.

Um die Benutzerbedürfnisse in den Gestaltungsprozeß in ausreichendem Maß integrieren zu können, wird dieses Projekt von Vertretern der betroffenen Organisationen wie der Universitätsdirektion, der Bibliothek, dem LZK, dem EDV-Zentrum und einem Vertreter der Institute begleitet.

Mit der Projektdurchführung wurde Anfang September 96 begonnen und die geplante Inbetriebnahme des Gesamtsystems ist zu Beginn des Sommersemesters 97.

Weiterführende Informationen

Lehrzielkatalog im Internet: http://www.lzk.ac.at/

Ausführliche Projektbeschreibung: http://www.lzk.ac.at/projekte/uui.html

Ansprechperson für dieses Projekt: Enzi Günter, enzi@iue.tuwien.ac.at

Anregungen, Wünsche und Kommentare zu diesem Projekt sind jederzeit willkommen.


Zum Inhaltsverzeichnis, Pipeline 21, Februar 1997