DSpace: Difference between revisions

From dok
Endrer innholdet slik at den blir mer generell og ikke inneholder unødvendige detaljer
forbedring av innhold og tekst
Line 92: Line 92:
[https://svn.ms.mff.cuni.cz/redmine/projects/dspace-modifications/wiki/CompilationInstallation Installasjons Veiledning]  
[https://svn.ms.mff.cuni.cz/redmine/projects/dspace-modifications/wiki/CompilationInstallation Installasjons Veiledning]  


===GIT===
===GIT for Clarino DSpace installasjonen===
Mappe: /opt/clarino-1.8.2
Mappe: /opt/clarino-1.8.2
  git clone https://svn.ms.mff.cuni.cz/repository/ufal_dl
  git clone https://svn.ms.mff.cuni.cz/repository/ufal_dl
Line 98: Line 98:
  git submodule update
  git submodule update


==Feilsituasjoner==
==Feilsituasjoner i DSpace==
Solr kan krasje av og til. Da må en kjøre:
Apache Solr søkemotoren kan krasje av og til. Da må en kjøre:
  reindex_bora.sh
  reindex.sh
Tomcat går av og til "sur":
Tomcat går av og til "sur". Prosedyre:
- Finn PID til tomcat, og kill denne. (Om ikke vanlig restart fungerer)
# Finn PID til tomcat, og kill denne. (Om ikke vanlig restart fungerer)
- Start Tomcat på nytt
# Start Tomcat på nytt
- Vent en stund. Det kan ta opptil flere minutter
# Vent en stund. Det kan ta opptil flere minutter
 
Tegnsett problematikk ved importfeil til Eksark
Tegnsett problematikk ved importfeil til Eksark
  SA har rutiner på dette, og verktøy for å fikse
  SA har rutiner på dette, og verktøy for å fikse


==Applikasjonene==
==Tomcat Web-Applikasjonene==
Eksempel for Bora tjenesten
Eksempel for Bora tjenesten
  /var/lib/tomcat6/webapps/bora
  /var/lib/tomcat6/webapps/bora


==Integrasjoner==
==Integrasjoner==
===Eksamensarkivet og Miside===
===[[Eksamensarkivet]] og [[Miside]]===
* Miside "pusher" til Eksark. (Stikkord: XML fil, rsync, import jobb til arkivet via cron)
* Miside overfører data til Eksark. (Stikkord: XML fil, rsync, import jobb til arkivet via cron)
* Eksark "pusher" eventuelle data igjen videre til Bora.
* Eksark overfører modifiserte data igjen videre til [[Bora]].


===Cristin og Frode===
===Cristin og Frode===
* Data overføres fra [[Cristin]] til [[Frode]]. Grunnen er at Cristin lagrer ikke data (ikke over lang tid i alle fall).
* Data overføres fra [[Cristin]] til [[Frode]]. Grunnen er at Cristin ikke lagrer data over lang tid.


===Clarin===
===Om Clarin===
I uke 34 ble DSpace Clarin installert av Josef Mistuka her ved UiB. Lennar, Helge og Trond D fra ITA var tilstede.
I uke 34, 2013, ble DSpace Clarin installert av Josef Mistuka her ved UiB på en Linux Redhat vmware boks.
Punkter som ble gått gjennom:
Punkter som ble gått gjennom:
* https://svn.ms.mff.cuni.cz/redmine/projects/dspace-modifications/wiki/OurKnowHow
* https://svn.ms.mff.cuni.cz/redmine/projects/dspace-modifications/wiki/OurKnowHow


====Andre personer tilstede under Clarin DSpace installasjonen uke 34====
Personer tilstede under denne installasjonen var:
*Tilsvekstavdelingen: Øyvind Gjesdal
*
*UB: Tarje Lavik
*
*


==Postgresql==
==Postgresql==
På hver boks er det installert en Postgresql server. Versjon 9.1.
Ved UiB brukes Postgresql for DSpace installasjoner.


==Referanser==
==Referanser==
Line 138: Line 140:


==Oppgradere tekstuthenting fra pdf==
==Oppgradere tekstuthenting fra pdf==
''Fint om noen kan gjennomgå teksten under her, og sette det i en kontekst.''


Last ned nye versjoner av biblioteker fra "The Legion of the Bouncy Castle" http://www.bouncycastle.org/.  Dette er kryptobiblioteker som trengs for å behandle krypterte pdf-filer.
Last ned nye versjoner av biblioteker fra "The Legion of the Bouncy Castle" http://www.bouncycastle.org/.  Dette er kryptobiblioteker som trengs for å behandle krypterte pdf-filer.

Revision as of 21:10, 17 January 2014

DSpace er et open source program som brukes for å lage åpen aksess til repository for vitenskapelig publiserte digitalt innhold.

DSpace er skrevet i java, og består av flere java-applikasjoner. Disse java applikasjonene kjører i en Tomcat webserver.

Mer om DSpace, ser referanser nederst.

DSpace i UiB sin RTS

Tjenester som er basert på DSpace

I dag tilbyr UiB flere tjenester som benytter DSpace. Disse er:

Begreper relatert til DSpace ved UiB

  • Biomed Central->BORA
  • Cristin
  • Nora
  • Sword
  • OAI-PMH
  • xmlui
  • Dublin Core

Overføringer og integrasjoner

Det flyter en del data både til og fra flere av DSpace installasjone: (Fint om noen kan fylle på og evt. rette det som er feil under):

  • Fra Frode til Bora (SWORD)
  • Fra Eksark til Bora (SWORD)
  • Fra Cristin til Frode
  • Fra Miside til Bora (FIL SYNK)

Hva skjer framover angående DSpace ved UiB?

  • Oppgradering fra 1.8 til 3.2 i våren 2014 for Bora, Eksark
  • Intern kompetanseoverføring i IT-avdelingen om DSpace drift

Systemeiere

  • Universitetetsbiblioteket (UB): Bora, Bora for HiB, Frode, Digitalt, OJS
  • Tilvekstavdelingen, UB. : Clarino
  • Studieadministrativ avdeling (SA): Eksark (Eksamensarkivet)

Driftsansvarlige

  • IT avdelingen, UiB

Personer

  • Helge Opedal

Hvem gjør hva i forhold til DSpace installasjonene

  • Tilpasninger gjøres av systemeierne
  • Oppgradering av DSpace gjøres av ITA
  • Daglig drift gjøres av ITA
  • Sørge for backup og sikkert drift: ITA
  • 1. linje brukerstøtte gis av systemeierne

Url'er

Listen under trenger verifisering, flere kan komme.

Komponentene

Flere komponenter som installasjonene som regel består av er:

  • Apache frontend med reverse-proxy mot Tomcat backend (modjk)
  • SSL sertifikater i Apache
  • Solr søke engine innebygget i DSpace
  • Postgresql databaser

Tekniske detaljer om DSpace installasjonene ved UiB

Katalog for konfigurasjon:

/dspace/config

Innhold (items) lagres som filer under:

/dspace/assetstore

Config fil:

dspace.cfg

Moduler:

/dspace/config/modules/

Kode:

/opt/src/bora-X.X.X-src

Himasnekra scripts:

DSpace/redeploy.sh
DSpace/reindex_bora.sh

Tekniske detaljer om DSpace installasjonene for Clarino

Her bruker vi en fork av dspace som er modifisert/hacket av Charles University i Praha, Tsjekkia.

Lindat dokumentasjon

Lindat Wiki Installasjons Veiledning

GIT for Clarino DSpace installasjonen

Mappe: /opt/clarino-1.8.2

git clone https://svn.ms.mff.cuni.cz/repository/ufal_dl
git submodule init
git submodule update

Feilsituasjoner i DSpace

Apache Solr søkemotoren kan krasje av og til. Da må en kjøre:

reindex.sh

Tomcat går av og til "sur". Prosedyre:

  1. Finn PID til tomcat, og kill denne. (Om ikke vanlig restart fungerer)
  2. Start Tomcat på nytt
  3. Vent en stund. Det kan ta opptil flere minutter

Tegnsett problematikk ved importfeil til Eksark

SA har rutiner på dette, og verktøy for å fikse

Tomcat Web-Applikasjonene

Eksempel for Bora tjenesten

/var/lib/tomcat6/webapps/bora

Integrasjoner

  • Miside overfører data til Eksark. (Stikkord: XML fil, rsync, import jobb til arkivet via cron)
  • Eksark overfører modifiserte data igjen videre til Bora.

Cristin og Frode

  • Data overføres fra Cristin til Frode. Grunnen er at Cristin ikke lagrer data over lang tid.

Om Clarin

I uke 34, 2013, ble DSpace Clarin installert av Josef Mistuka her ved UiB på en Linux Redhat vmware boks. Punkter som ble gått gjennom:

Personer tilstede under denne installasjonen var:

Postgresql

Ved UiB brukes Postgresql for DSpace installasjoner.

Referanser

Oppgradere tekstuthenting fra pdf

Fint om noen kan gjennomgå teksten under her, og sette det i en kontekst.

Last ned nye versjoner av biblioteker fra "The Legion of the Bouncy Castle" http://www.bouncycastle.org/. Dette er kryptobiblioteker som trengs for å behandle krypterte pdf-filer.

Last ned nye versjoner av pdfbibliotek og fontbehandlingsbibliotek fra Apache PDFBox http://pdfbox.apache.org/.

Last ned ny versjon av commons-logging fra Apache Commons http://commons.apache.org/logging/download_logging.cgi

Oppdater src/org/dspace/app/mediafilter/PDFFilter.java med ny sti til PDFBox klessene org.apache.pdfbox.*. Oppdater src/org/dspace/content/packager/PDFPackager.java med ny sti til PDFBox klessene org.apache.pdfbox.*.

Oppdatere tekstuthenting fra MS Word filer

Last ned nye bibliotek for...

Kategori:Applikasjon