Team digital bevaring
I juni 2022 ble det etablert et eget team med ansvar for bevaring av Nasjonalbibliotekets digitale samling. Teamet håndterer alle typer digitalt materiale, uavhengig om materialet er digitalisert fra analoge kilder eller om det er født digitalt. Dette inkluderer medietyper som websider, tekstdokumenter, bilder, lyd og levende bilder.
Teamet har ansvar for å forvalte løsninger for langtidsbevaring av digitalt materiale, og jobber med inntak, kontroll, lagring, bevaring- og tilgjengeliggjøring av data. Data som langtidsbevares er typisk store filer av høy kvalitet (i motsetning til komprimerte tilgangsfiler).
Team Digital bevaring samarbeider tett med flere andre spesialiserte medieteam i institusjonen. I tillegg til mottak av digitalt materiale som omfattes av Pliktavleveringsloven, produserer Nasjonalbibliotek store mengder data gjennom digitalisering. Det digitaliseres både materiale fra egen samling og på vegne av ulike institusjoner i ABM-sektoren.
Teamet er medlem av Digital Preservation Coalition (DPC).
Organisasjon
Team digital bevaring består i dag av 8 medlemmer:








Teamet svarer til en eiergruppe bestående av:
- Direktør for IT (produkteier)
- Direktør for Kulturarvdigitalisering
- Seksjonsleder for Tilvekst og kunnskapsorganisering utvikling
- Seksjonsleder for IT-plattform
Nasjonalbibliotekets digitale samling i tall
- Over 2 milliarder filer
- Mer enn 100 forskjellige filformater
- 18 Petabyte med data (det er 18 000 Terabyte!) lagret i 3 kopier
- Den største enkeltfilen er på 2,5 Terabyte
- Gjennomsnittlig daglig tilvekst på over 6 Terabyte med nye data
Datavolum etter type
- Video og TV: 22%
- Film: 21%
- Aviser 19%
- Webarkiv: 16%
- Radio og lyd 12%
- Bøker 8%
- Bilder 2%
Teknologi som brukes i arbeidet med digital bevaring
- Apache Kafka for kommunikasjon mellom systemer
- Apache NiFi for å kjøre prosesser som validerer, flytter og pakker data
- MariaDB som databasemotor
- DROID og Siegfried for identifisering av filformater
- Grafana for statistikk og rapportering
- IBM High Performance Storage System (HPSS) som bit-repository
- CentOS Linux som serverplattform
- CommonsIP for pakking og validering av arkivpakker på E-ARK standard