DSpace
DSpace er et open source program som brukes for å lage åpen aksess til repository for vitenskapelig publiserte digitalt innhold.
Universitetet i Bergen har flere DSpace installasjoner, den mest kjente er nok Bora.
DSpace er skrevet i java, og består av flere java-applikasjoner. Disse java applikasjonene kjører i en Tomcat webserver.
Mer om DSpace, ser referanser nederst.
DSpace i UiB sin RTS
DSpace er hovedkomponent i tilbydelsen av nettsider samt data-samlere uten nettside
Disse er:
- Bora : Bergen Open Research Archive
- Bora for HiB : Bora for Høyskolen i Bergen
- Eksamensarkivet : Arkiv for digital eksamensinnlevering fra Miside
- Frode : Overføring fra Cristin til UiB
- Digitalt : Spesialsamlinger ...se webside: https://digitalt.uib.no/
- Clarino
Begreper relatert til DSpace ved UiB
- Biomed Central->BORA
- Cristin
- Nora
- Sword
- OAI-PMH
- xmlui
- Dublin Core
Overføringer og integrasjoner
Det flyter en del data både til og fra flere av DSpace installasjone: (Fint om noen kan fylle på og evt. rette det som er feil under):
- Fra Frode til Bora (SWORD)
- Fra Eksark til Bora (SWORD)
- Fra Cristin til Frode
- Fra Miside til Bora (FIL SYNK)
- Fra Biomed Central til BORA (SWORD)
- Fungerer ikke etter oppgradering til 3.2
Hva skjer framover angående DSpace ved UiB?
- Oppgradering fra 1.8 til 3.2 i våren 2014 for Bora, Eksark
- Intern kompetanseoverføring i IT-avdelingen om DSpace drift
Systemeiere
- Universitetetsbiblioteket (UB): Bora, Bora for HiB, Frode, Digitalt, OJS
- UB, Tilvekstavdelingen, UB. : Clarino
- Studieadministrativ avdeling (SA): Eksark (Eksamensarkivet)
Driftsansvarlige
- IT avdelingen, UiB
Personer
- Helge Opedal
Hvem gjør hva i forhold til DSpace installasjonene
- Tilpasninger gjøres av systemeierne
- Oppgradering av DSpace gjøres av ITA
- Daglig drift gjøres av ITA
- Sørge for backup og sikkert drift: ITA
- 1. linje brukerstøtte gis av systemeierne
Url'er
Listen under trenger verifisering, flere kan komme.
Komponentene
Flere komponenter som installasjonene som regel består av er:
- Apache frontend med reverse-proxy mot Tomcat backend (modjk)
- SSL sertifikater i Apache
- Solr søke engine innebygget i DSpace
- Postgresql databaser
Tekniske detaljer om DSpace installasjonene ved UiB
Katalog for konfigurasjon:
/dspace/config
Innhold (items) lagres som filer under:
/dspace/assetstore
Config fil:
dspace.cfg
Moduler:
/dspace/config/modules/
Kode:
/opt/src/bora-X.X.X-src
Himasnekra scripts:
DSpace/redeploy.sh DSpace/reindex_bora.sh
Tekniske detaljer om DSpace installasjonene for Clarino
Her bruker vi en fork av dspace som er modifisert/hacket av Charles University i Praha, Tsjekkia.
Lindat dokumentasjon
Lindat Wiki Installasjons Veiledning
GIT for Clarino DSpace installasjonen
Mappe: /opt/clarino-1.8.2
git clone https://svn.ms.mff.cuni.cz/repository/ufal_dl git submodule init git submodule update
Feilsituasjoner i DSpace
Apache Solr søkemotoren kan krasje av og til. Da må en kjøre:
reindex.sh
Tomcat går av og til "sur". Prosedyre:
- Finn PID til tomcat, og kill denne. (Om ikke vanlig restart fungerer)
- Start Tomcat på nytt
- Vent en stund. Det kan ta opptil flere minutter
Tegnsett problematikk ved importfeil til Eksark
SA har rutiner på dette, og verktøy for å fikse
Tomcat Web-Applikasjonene
Eksempel for Bora tjenesten
/var/lib/tomcat6/webapps/bora
Integrasjoner / Overføringer
- Miside overfører data til Eksark. Detaljert informasjon om denne kan leses her: http://apidoc.app.uib.no/system/miside.eksark.html
- Eksark overfører modifiserte data igjen videre til Bora.
Cristin og Frode
Om Clarin
I uke 34, 2013, ble DSpace Clarin installert av Josef Mistuka her ved UiB på en Linux Redhat vmware boks. Punkter som ble gått gjennom:
Personer tilstede under denne installasjonen var:
Postgresql
Ved UiB brukes Postgresql for DSpace installasjoner.
Referanser
- http://en.wikipedia.org/wiki/DSpace
- http://www.dspace.org/
- https://wiki.duraspace.org/display/DSPACE/Home
Oppgradere tekstuthenting fra pdf
Fint om noen kan gjennomgå teksten under her, og sette det i en kontekst.
Last ned nye versjoner av biblioteker fra "The Legion of the Bouncy Castle" http://www.bouncycastle.org/. Dette er kryptobiblioteker som trengs for å behandle krypterte pdf-filer.
Last ned nye versjoner av pdfbibliotek og fontbehandlingsbibliotek fra Apache PDFBox http://pdfbox.apache.org/.
Last ned ny versjon av commons-logging fra Apache Commons http://commons.apache.org/logging/download_logging.cgi
Oppdater src/org/dspace/app/mediafilter/PDFFilter.java med ny sti til PDFBox klessene org.apache.pdfbox.*. Oppdater src/org/dspace/content/packager/PDFPackager.java med ny sti til PDFBox klessene org.apache.pdfbox.*.
Oppdatere tekstuthenting fra MS Word filer
Last ned nye bibliotek for...
