- DSpace (Programm)
-
DSpace ist eine freie Software zum Betrieb eines Dokumentenservers. Sie stellt Werkzeuge zur Erfassung, Speicherung und Weiterverbreitung von digitalen Ressourcen zur Verfügung und wird meist in Universitäten, Bibliotheken und Forschungseinrichtungen für ein „Institutional Repository“ eingesetzt. Dies geschieht oft mit Blick auf die Langzeitverfügbarkeit von digitalen Ressourcen, da DSpace in Anlehnung an das OAIS-Referenzmodell entwickelt wurde und somit architektonisch geeignet ist, Strategien zur Langzeitverfügbarkeit zu entwickeln. DSpace wird unter der BSD-Lizenz verbreitet.
Inhaltsverzeichnis
- 1 Geschichte
- 2 Entwicklung
- 3 Architektur
- 4 Technik
- 5 Funktionalität
- 6 Verbreitung
- 7 Weblinks
Geschichte
DSpace ist eine von der Mellon Foundation geförderte Gemeinschaftsentwicklung vom Massachusetts Institute of Technology (MIT) und den HP Labs, der Forschungsabteilung von Hewlett Packard. Die erste Version wurde im September 2002 veröffentlicht. Die letzte stabile Version 1.5.1 wurde am 10. September 2008 veröffentlicht.
Entwicklung
DSpace Federation ist die Einrichtung, welche die DSpace-(Weiter-)Entwicklung im Allgemeinen lenkt. Das gemeinschaftliche Entwicklungsmodell von DSpace ist dem der Apache Foundation ähnlich. Aus der Gruppe der Anwender rekrutieren sich die Entwickler, somit kann jeder, der den Entwicklungsrichtlinien folgt, zu DSpace beitragen. Es gibt eine Gruppe von Kernentwicklern und Committer. Diese können Änderungen am eigentlichen Quellcode vornehmen. Zudem hat jeder Anwender die Möglichkeit, seine Anregungen, Wünsche und konstruktive Kritik an DSpace zu äußern und so zur Weiterentwicklung beizutragen. Die DSpace Entwicklungs- und Anwendergemeinde tauscht sich über Newsgroups, ein eigenes Wiki und Anwendertreffen aus. Als Plattform für die gemeinschaftliche Entwicklung wird SourceForge verwendet.
Architektur
DSpace hat eine 3-Schichten-Architektur:
- Anwendungsschicht (Application Layer)
- die Anwendungsschicht umfasst die Komponenten, mit denen eine DSpace-Instanz mit der Außenwelt kommuniziert, zum Beispiel Webschnittstelle, OAI-PMH-Schnittstelle.
- Geschäftslogik (Business Logic Layer)
- diese Schicht verwaltet Inhalt, Benutzer und Gruppen, Rechte und Geschäftsgänge.
- Speicherung (Storage Layer)
- diese Schicht kümmert sich um die physikalische Speicherung von Metadaten und Inhalt.
Technik
Allgemein
DSpace ist in Java und JSP unter Verwendung des Java Servlet Framework geschrieben. Es verwendet eine relationale Datenbank und unterstützt zurzeit PostgreSQL und Oracle.
Systemvoraussetzungen
Die Angaben gelten noch für Version 1.4.2:
- Unix-Betriebssystem (Getestet auf HP-UX, AIX, Solaris)
- Java 1.4 (Standard SDK ist ausreichend)
- Apache Ant 1.6.2 oder höhere Version
- Datenbank: PostgreSQL 7.3 (oder höher), oder Oracle 9
- Servlet Container: Jakarta Tomcat 4.x/5.x oder ähnliches zum Beispiel Jetty oder Caucho Resin
Funktionalität
Datenmodell
Die Art, in der Daten in DSpace organisiert sind, spiegelt die Struktur einer Organisation wider. Die Einheiten sind:
- Bereiche (Communities)
- Teilbereiche (Subcommunities)
- Sammlungen (Collections)
- Dokumente (Items)
- Bündel (Bundles)
- ORIGINAL – enthält die ursprünglich eingereichten Dateien.
- THUMBNAILS – Vorschauminiaturen von eingereichten Bildern, zur Anzeige in Übersichten.
- TEXT – extrahierter Text aus den eingereichten Dateien
- LICENSE – Lizenzbestimmungen unter denen eine Ressource veröffentlicht wurde
- CC LICENSE – Creative-Commons-Lizenz, falls die Ressource unter solcher veröffentlicht wurde
- Metadaten
- Dateien
Bereiche und Teilbereiche sind Container für Teilbereiche und Sammlungen. Sammlungen sind Container für Dokumente. Ein Dokument setzt sich aus einem Metadatensatz und Dateien zusammen. Die Dateien werden in Bündeln organisiert. Nicht alle Bündel sind für den Benutzer sichtbar.
Metadaten
DSpace enthält zu jedem Dokument deskriptive, administrative und strukturelle Metainformationen. Die möglichen deskriptiven Metdatenelemente werden in einer Metadatenreferenzliste zusammengefasst. Zurzeit unterstützt DSpace das Dublin-Core-Schema als einziges Metadatenschema. Mit der Version 1.4 (zurzeit in der Alpha-Phase) wird es möglich sein, verschiedene Metadatenschemata einzubinden.
Benutzer und Gruppen
Benutzer
Benutzer werden in DSpace benötigt, wenn jemand eine besondere Rolle übernehmen will:
- Administration,
- Veröffentlichung von Dokumenten,
- Bearbeitung von Dokumenten im Rahmen des Geschäftsgangs,
- Supervision
und wenn man den Neuerscheinungsdienst benutzen will. Der Benutzer registriert sich mit seiner E-Mail-Adresse selbst und verwaltet auch seine Daten und sein Passwort. Der Systemadministrator kann in die Benutzerverwaltung eingreifen, Benutzer hinzufügen, löschen und bearbeiten, jedoch keine Passwörter vergeben.
Gruppen
Benutzer können zu Gruppen zusammengefasst werden. Diesen Gruppen können wie auch einzelnen Benutzern Rechte und Aufgaben zugewiesen werden. Als besondere Gruppen gibt es die Administratorengruppe und die Gruppe Anonymous. Per default ist jeder Benutzer, der sich nicht am System anmeldet, der Gruppe Anonymous zugeordnet. Gruppen können Benutzer und Gruppen enthalten.
Rechteverwaltung
DSpace Rechtesystem assoziiert Aktionen auf Objekte mit Benutzern und Gruppen. Objekte sind hierbei:
- Bereiche und Teilbereiche,
- Sammlungen,
- Dokumente,
- Bündel,
- einzelne Dateien.
Aktionen beziehen sich auf das Hinzufügen, Löschen, Bearbeiten und Lesen dieser Objekte. Durch diese Trennung ist es zum Beispiel möglich, dass die Metadaten zu einem Dokument für alle sichtbar sind, während die zum Dokument gehörigen Dateien nur einem eingeschränkten Benutzerkreis zur Verfügung stehen.
Akzession und Geschäftsgänge
Dokumente können per Stapelverarbeitung (Batch-Import) oder einzeln über das Webinterface eingespielt werden. Das Einspielen eines Dokumentes ist ein Prozess, in dem das Dokument automatisch, zum Beispiel durch das Hinzufügen von Metadaten wie Zeitstempeln, bearbeitet wird. Zudem können Dokumente einen Geschäftsgang, in dem bis zu drei Bearbeitungsschritte definiert werden, durchlaufen.
Dateiformate
Prinzipiell ist es möglich, alle Dateiformate auf DSpace zu veröffentlichen. Jede Datei wird mit einem Dateiformat assoziiert, jedes Dateiformat hat in DSpace einen Unterstützungsgrad. Die Dateiformate, welche in einer Instanz verwendet werden können, werden vom Systemadministrator in einer Dateiformatreferenzliste gepflegt, diese enthält:
- MIME Type,
- Bezeichnung,
- Beschreibung,
- Unterstützungsgrad,
- Kennzeichnung als intern,
- Extensionen, mit denen dieser Typ verbunden wird.
Somit kann man steuern, welche Dateiformate zugelassen werden. Dateiformate, die nicht in der Liste auftauchen oder dort enthalten, aber als intern gekennzeichnet sind, können nicht über das Webschnittstelle veröffentlicht werden. Zudem enthält die Referenzliste den Unterstützungsgrad, den die Einrichtung für das Format gewährleistet:
- Unterstützt
- das Format ist bekannt. Die betreibende Einrichtung ist zuversichtlich die Inhalte langfristig verfügbar machen zu können.
- Bekannt
- das Format ist bekannt. Die betreibende Einrichtung gewährleistet, dass die Dateien, so wie sie sind erhalten werden. Über die Langfristverfügbarkeit der enthaltenen Information kann keine Aussage getroffen werde. Es wird sich jedoch bemüht genügend Informationen über das Format zu erhalten, um den Unterstützungsgrad zu erhöhen und es langfristig verfügbar zu machen.
- Unbekannt
- das Format ist unbekannt. Die betreibende Einrichtung gewährleistet, dass die Dateien unverändert erhalten bleiben.
Persistente URLs – Das Handle-System
DSpace verwendet das CNRI-Handle-System, um seine Ressourcen (Bereiche, Teilbereiche, Sammlungen, Dokumente, Bündel und Dateien) mit persistenten Identifiern zu versehen. Jede DSpace-Instanz benötigt eine eigene Kennung (prefix) von CNRI.
Suchen und Browsen
Der Inhalt von DSpace wird dem Benutzer durch verschiedene Funktionalitäten erschlossen.
Suche
Zum Erzeugen von Indices und dem Durchsuchen selbiger benutzt DSpace die Suchmaschine Lucene. Dem Benutzer steht eine einfache Stichwortsuche und eine erweiterte Suche zur Verfügung. In der einfachen Suche werden die aus den Metadaten und den Volltexten extrahierten Textelemente durchsucht. In der erweiterten Suche hat der Benutzer die Möglichkeit nach bestimmten Elementen zu suchen und diese logisch zu verknüpfen.
Browsen
Als weiteren Einstieg kann der Benutzer im Bestand nach Titeln, Autoren und Datum browsen. Die Auflistung der Dokumente ist abhängig von der Hierarchieebene, in der sich der Benutzer befindet.
Neuerscheinungsinformationsdienst
Jeder in DSpace angemeldete Benutzer hat die Möglichkeit, sich über Neuerscheinungen in von ihm ausgewählten Sammlungen per E-Mail informieren zu lassen.
Sonstige Funktionalitäten
- OAI-PMH
- DSpace unterstützt das OAI-PMH-2.0-Protokoll.
- openURL
- DSpace unterstützt das openURL-Protokoll von SFX.
- Creative Commons
- DSpace unterstützt den Einsatz von Creative-Commons-Lizenzen
- Prüfsummen
- DSpace setzt Prüfsummen zur Sicherung der Authentizität der Dokumente ein
- Datenimport bzw. -export
- Daten können im Stapelverarbeitungsbetrieb im- und exportiert werden
- Storage Resource Broker (SRB)
- DSpace unterstützt den Einsatz von SRB zur Speicherung der Dateien
Verbreitung
DSpace findet immer mehr Verbreitung. Ursprünglich wurde es fast ausschließlich im englischsprachigen Raum eingesetzt. Im Zuge der Internationalisierung von DSpace nach i18n wurde es nicht-englischsprachigen Anwendern wesentlich leichter DSpace einzusetzen. Zurzeit gibt es über 255 Installationen in 42 Ländern mit etwa einer Million Dokumenten. (Daten Stand: 16. Juli 2007 nach DSpace Wiki)
Weblinks
Kategorien:- Repository
- Java-Programm
Wikimedia Foundation.