Combined Shape Group 13 Combined Shape anbudstorget_logo Group 2 Group 6 Path 2 shutterstock_584449174 Shape

IT/Web og Support i Oslo

Formidlede anbud
  • 0
    Siste år
  • 0
    Siste 3 mnd
  • 0
    Aktive nå
Oslo
Avsluttet

Mikrofilmdigitalisering, inkludert OCR-behandling og strukturanalyse

Nasjonalbibliotekets mikrofilmsamling består av mer enn 70 000 mikrofilmruller. Hoveddelen av samlingen er 35 mm uperforert, svart/hvit mikrofilm. Mikrofilmene ble produsert i perioden 1950 - 2009. Tilstanden og kvaliteten vil variere noe, avhengig av når og hvor filmene ble produsert. i anbudet må leverandørene beskrive hvordan de kan digitalisere mikrofilm av variabel kvalitet. Det er spesielt viktig å få fram eventuelle begrensninger Nasjonalbiblioteket må ta med i beregningen når store deler av mikrofilmsamlingen skal digitaliseres.
En mikrofilmrull inneholder normalt mellom 500 og 1400 bilder, hvert av en enkelt avisside. Mikrofilmformatet er uperforert 35 mm film som normalt ikke er lengre enn 30 meter.
Oppdragsgiver estimerer at digitaliseringstjeneste vil omfatte ca. 2 mill. - 4 mill. Sider per år, avhengig av tilgjengelige budsjett.
Test digitalisering:
Leverandører som ønsker å levere anbud må sammen med anbudet levere eksempler på digitaliserte bilder i det kvalitetsnivået som dekkes av tilbudet. Eksempelbildene skal digitaliseres fra testmikrofilmer som Nasjonalbiblioteket leverer ut på forespørsel. Forespørsler om testmikrofilm skal gjøres til oppdragsgivers kontaktperson.
De digitale eksempelbildene skal reprodusere bildene av avissider på mikrofilmen så godt som mulig. De skal være korrekt eksponert, og ha et godt skarphetsnivå, for å sikre god lesbarhet.
Et tilfeldig utvalg av de digitaliserte bilde vil bli vurdert kvalitetsmessig, og vurderingen blir en del av anbudsevalueringen.
De digitaliserte avissidene skal også ocr-behandles. Avisene inneholder både latinske og gotiske fonter, og det kan også
være en kombinasjon av disse i samme avis, avhengig av når avisen er publisert. De fleste avisene er publisert på Norsk, i et av de to offisielle språkene «nynorsk» eller «bokmål». De eldste avisene fra før 1907 vil mest sannsynlig være på dansk.
ocr-behandlingen må holde et nivå på ord-nøyaktighet på minst 90 % for latiske fonter, og minst 80 % for gotiske fonter.
Metadata:
Det må finnes relevante metadata fra ocr-behandlingen. Disse skal minimum inneholde informasjon om:
- ocr-teknologien
- Grad av korrekthet for hver bokstav, hvert ord og hver side
- Koordinater til posisjonen til hvert ord på en side
Et tilfeldig utvalg av digitaliserte avissider vil bli vurdert kvalitetsmessig, og vurdering av kvaliteten på ocr-behandlingen vil være en del av anbudsevalueringen.
Anbud id:
613987
  • Sted:
    Oslo
  • Registrert:
    Fredag 18. Oktober 2019
Er du interessert i dette oppdraget?