DSpace

From dok
Bør oppdateres. Denne artikkelen er markert fordi det er ønskelig at innholdet oppdateres. Enten bør innholdet forbedres og gjøres klarere. Det kan også være lenker som bør oppdateres. Vurder også om selve artikkelnavnet bør endres. Sider som ikke blir oppdatert kan senere bli markert for sletting. Om du er uenig, fjern {{Oppdater}} fra artikkelen og oppdater Summary, samt artikkelens innhold.

DSpace er et open source program som brukes for å lage åpen aksess til repository for vitenskapelig publiserte digitalt innhold.

Universitetet i Bergen har flere DSpace installasjoner, den mest kjente er nok Bora.

DSpace er skrevet i java, og består av flere java-applikasjoner. Disse java applikasjonene kjører i en Tomcat webserver.

Mer om DSpace, ser referanser nederst.

DSpace i UiB sin RTS

DSpace er hovedkomponent i tilbydelsen av nettsider samt data-samlere uten nettside

Disse er:

Begreper relatert til DSpace ved UiB

  • Biomed Central->BORA
  • Cristin
  • Nora
  • Sword
  • OAI-PMH
  • xmlui
  • Dublin Core

Overføringer og integrasjoner

Det flyter en del data både til og fra flere av DSpace installasjone: (Fint om noen kan fylle på og evt. rette det som er feil under):

  • Fra Frode til Bora (SWORD)
  • Fra Eksark til Bora (SWORD)
  • Fra Cristin til Frode
  • Fra Miside til Bora (FIL SYNK)
  • Fra Biomed Central til BORA (SWORD)
    • Fungerer ikke etter oppgradering til 3.2

Hva skjer framover angående DSpace ved UiB?

  • Oppgradering fra 1.8 til 3.2 i våren 2014 for Bora, Eksark
  • Intern kompetanseoverføring i IT-avdelingen om DSpace drift

Systemeiere

  • Universitetetsbiblioteket (UB): Bora, Bora for HiB, Frode, Digitalt, OJS
    • UB, Tilvekstavdelingen, UB. : Clarino
  • Studieadministrativ avdeling (SA): Eksark (Eksamensarkivet)

Driftsansvarlige

  • IT avdelingen, UiB

Personer

  • Helge Opedal

Hvem gjør hva i forhold til DSpace installasjonene

  • Tilpasninger gjøres av systemeierne
  • Oppgradering av DSpace gjøres av ITA
  • Daglig drift gjøres av ITA
  • Sørge for backup og sikkert drift: ITA
  • 1. linje brukerstøtte gis av systemeierne

Url'er

Listen under trenger verifisering, flere kan komme.

Komponentene

Flere komponenter som installasjonene som regel består av er:

  • Apache frontend med reverse-proxy mot Tomcat backend (modjk)
  • SSL sertifikater i Apache
  • Solr søke engine innebygget i DSpace
  • Postgresql databaser

Tekniske detaljer om DSpace installasjonene ved UiB

Katalog for konfigurasjon:

/dspace/config

Innhold (items) lagres som filer under:

/dspace/assetstore

Config fil:

dspace.cfg

Moduler:

/dspace/config/modules/

Kode:

/opt/src/bora-X.X.X-src

Himasnekra scripts:

DSpace/redeploy.sh
DSpace/reindex_bora.sh

Tekniske detaljer om DSpace installasjonene for Clarino

Her bruker vi en fork av dspace som er modifisert/hacket av Charles University i Praha, Tsjekkia.

Lindat dokumentasjon

Lindat Wiki Installasjons Veiledning

GIT for Clarino DSpace installasjonen

Mappe: /opt/clarino-1.8.2

git clone https://svn.ms.mff.cuni.cz/repository/ufal_dl
git submodule init
git submodule update

Feilsituasjoner i DSpace

Apache Solr søkemotoren kan krasje av og til. Da må en kjøre:

reindex.sh

Tomcat går av og til "sur". Prosedyre:

  1. Finn PID til tomcat, og kill denne. (Om ikke vanlig restart fungerer)
  2. Start Tomcat på nytt
  3. Vent en stund. Det kan ta opptil flere minutter

Tegnsett problematikk ved importfeil til Eksark

SA har rutiner på dette, og verktøy for å fikse

Tomcat Web-Applikasjonene

Eksempel for Bora tjenesten

/var/lib/tomcat6/webapps/bora

Integrasjoner / Overføringer

Cristin og Frode

  • Data overføres fra Cristin til Frode. Grunnen er at Cristin ikke lagrer data over lang tid.

Om Clarin

I uke 34, 2013, ble DSpace Clarin installert av Josef Mistuka her ved UiB på en Linux Redhat vmware boks. Punkter som ble gått gjennom:

Personer tilstede under denne installasjonen var:

Postgresql

Ved UiB brukes Postgresql for DSpace installasjoner.

Referanser

Oppgradere tekstuthenting fra pdf

Fint om noen kan gjennomgå teksten under her, og sette det i en kontekst.

Last ned nye versjoner av biblioteker fra "The Legion of the Bouncy Castle" http://www.bouncycastle.org/. Dette er kryptobiblioteker som trengs for å behandle krypterte pdf-filer.

Last ned nye versjoner av pdfbibliotek og fontbehandlingsbibliotek fra Apache PDFBox http://pdfbox.apache.org/.

Last ned ny versjon av commons-logging fra Apache Commons http://commons.apache.org/logging/download_logging.cgi

Oppdater src/org/dspace/app/mediafilter/PDFFilter.java med ny sti til PDFBox klessene org.apache.pdfbox.*. Oppdater src/org/dspace/content/packager/PDFPackager.java med ny sti til PDFBox klessene org.apache.pdfbox.*.

Oppdatere tekstuthenting fra MS Word filer

Last ned nye bibliotek for...

Kategori:Applikasjon Kategori:DSpace