Guidelines for Digital Newspaper Preservation Readiness 27 
Section 6. Packaging Digital Newspapers for Preservation
Section 6. Packaging Digital Newspapers for 
Preservation 
Rationale 
The previous sections of these Guidelines have been geared towards preparing digital news collections 
and content for packaging. Whether an institution is seeking to store digital news content locally or to 
exchange its digital newspapers with an external preservation service provider, properly packaging this 
content  provides  curators  with  the  necessary  information,  controls,  and  linkages  to  manage  digital 
newspapers over time, including through changes in storage media, while still maintaining the integrity 
of both the objects and collections. 
In formal OAIS terms, “packaging” is the process of establishing a Submission Information Package (SIP)
98
for deposit in a preservation repository. 
Packaging can be accomplished in multiple ways, including: 
  Using simple (text-based) documentation strategies; 
  By deploying unique identifiers (UIDs) coupled with Name Assigning Authorities and other local 
metadata and management tools; and/or 
  Via lossless packaging formats like TAR,
99
WARC,
100
or self-describing preservation specifications 
such as BagIt
101
(among other approaches). 
Using  lossless  packaging  formats  helps to hold  content  together  as it  is moved into  archival  storage, 
requested for routine audit purposes, and/or being sent to and from preservation partners over time. 
Each of these elements will be covered in the sub-sections ahead. 
Sound Practices 
98
See Reference: OAIS Packaging Concepts & Models later in this section for a definition. 
99
Linuxquestions.org, “Tar,” available at: http://wiki.linuxquestions.org/wiki/Tar
 
100
ibliothèque nationale de France, “The WAR  File Format (ISO 28500) - Information, Maintenance, Drafts,” 
available at: http://bibnum.bnf.fr/WARC/
101
Descriptions of the BagIt specification are available at: http://en.wikipedia.org/wiki/BagIt
; and 
http://tools.ietf.org/html/draft-kunze-bagit-10
The  Reference  Model  for  an  Open  Archival 
Information System (OAIS) defines the range of 
information  elements  that  assist  in  long-term 
preservation  and  access  as Preservation 
Description  Information (PDI).  The  Reference 
Model also describes three information package 
models:  
 Submission Information Packages (SIPs) 
 Archival Information Packages (AIPs) 
Convert pdf file to powerpoint presentation - Library application class:C# Create PDF from PowerPoint Library to convert pptx, ppt to PDF in C#.net, ASP.NET MVC, WinForms, WPF
Online C# Tutorial for Creating PDF from Microsoft PowerPoint Presentation
www.rasteredge.com
Convert pdf file to powerpoint presentation - Library application class:VB.NET Create PDF from PowerPoint Library to convert pptx, ppt to PDF in vb.net, ASP.NET MVC, WinForms, WPF
VB.NET Tutorial for Export PDF file from Microsoft Office PowerPoint
www.rasteredge.com
Guidelines for Digital Newspaper Preservation Readiness 28 
Section 6. Packaging Digital Newspapers for Preservation
 Dissemination Information Packages (DIPs)  
These models build upon each other and for the 
purposes  of  these  Guidelines,  they  are 
discussed  as being  highly  interrelated. See the 
References  below  for  more  information  about 
each of these package concepts and models. 
The  initial  packaging of  digital  newspapers  for 
long-term  preservation  (i.e.,  forming  a  SIP) 
should  take  into  account  1)  the  information 
necessary to ultimately produce an  AIP, and 2) 
any  and  all  information  that  is  essential  to 
restoring  the institution’s  digital news  content 
as DIPs in the event of  later loss or corruption 
(part of the goal achieved through PDI). 
The  work  involved  in  packaging  content  for 
preservation can vary widely across a spectrum 
of activity. At the highest end, institutions may 
specifically follow such  packaging  standards as 
those  put  forward  in  OAIS,  using  unique 
identifiers  with  various  metadata  or 
management  tools,  and  packaging  content  in 
lossless packaging formats to ensure long-term 
stability. These  OAIS  concepts and information 
models can be a “high-bar” standard to achieve. 
If an institution has the resources, creating such 
packages  for  digital  newspaper  collections will 
serve the institution well in the long-term. 
Curators  at  smaller  and/or  less  resourced 
institutions  can  package  digital  news  content 
effectively  using  practices  that  do  not  require 
comprehensive  understanding  of  all  the 
relevant  standards.  If  an  institution  has 
followed 
the 
lightweight 
practices 
recommended in previous sections (particularly 
inventorying  digital  news  content,  organizing, 
and packaging metadata) that institution will be 
ready to create sufficient “preservation ready” 
packages  to  fulfill  the  goal  of  long-term 
preservation.  More  on  this  under  Essential 
Readiness below. 
For  well-resourced  institutions,  packaging 
digital  newspapers  for  local  preservation  may 
include  designating  and  applying  a  unique 
identifier  (UID)  scheme  and  using  a  Name 
Assigning  Authority  for  digital  newspaper 
content. UIDs (which can differ from persistent 
URLs  and  do  not  always  rely  directly  on 
filenames)  are  algorithmically  assigned 
identifiers  that  are  unique  to  the  items  for 
which  they  are  created  (in  this  case  digital 
newspaper objects). Once stored and indexed in 
relation to the  objects, they can  help  curators 
to  locate,  access,  and  manage  digital 
newspaper  files  in  archival  storage 
environments.  In  addition,  UIDs  can  be 
leveraged  via  the  use  of  metadata  schemas 
such  as METS
102
and/or PREMIS
103
(see Section 
4. Metadata Packaging for Digital Preservation
in  conjunction  with  additional  scripting  to 
machine-automate 
many 
preservation 
management functions. Much  depends  on  the 
underlying  repository  software  systems  or 
configurations  and  how  they  are  designed  to 
facilitate  integrations  for UIDs.  It  is  not  within 
the  scope  of  this  document  to  address  any 
particular  underlying  systems  or  approaches. 
Curators should consult their repository system 
documentation or their repository architects to 
determine  support  for  UIDs.  Finally,  when  an 
institution  is  packaging  digital  newspapers  to 
exchange with an external preservation service 
102
Library of  ongress, “Metadata Encoding 
Transmission Standard (METS),” available at: 
http://www.loc.gov/standards/mets/
.  
103
Library of  ongress, “Preservation Metadata: 
Implementation Strategies (PREMIS),” available at: 
http://www.loc.gov/standards/premis/
Library application class:VB.NET PowerPoint: Use PowerPoint SDK to Create, Load and Save PPT
NET method and sample code in this part will teach you how to create a fully customized blank PowerPoint file by using the smart PowerPoint presentation control
www.rasteredge.com
Library application class:C# PDF Text Extract Library: extract text content from PDF file in
But sometimes, we need to extract or fetch text content from source PDF document file for word processing, presentation and desktop publishing applications.
www.rasteredge.com
Guidelines for Digital Newspaper Preservation Readiness 29 
Section 6. Packaging Digital Newspapers for Preservation
provider, it  is important to export  and  include 
any  such  existing  UIDs.  Note  that  if  these 
identifiers  have  been  central  to  a  repository 
infrastructure,  they  are  foundational  elements 
if/when  an  institution  needs  to  rebuild  and 
restore  collections  in  the  future  from  its 
preservation copies. 
Thinking  beyond  UIDs,  preservation  curators 
(both  local  and  external)  will  need  ways  to 
validate  the  integrity  (completeness  and 
correctness)  of  the  objects  that  they  receive, 
monitor,  and  manage.  To  that  end,  an 
authoritative  record  or  list  of  all  the  files  and 
their  checksums  should  be  included  in  the 
archival  package,  (see Section 1. Inventorying 
Digital  Newspapers and  Section  5.  Checksum 
Management  for  Digital  Newspapers). BagIt 
and  its  creation  of  per-file  inventories  (which 
include  file extensions) and checksums can  be 
one lightweight approach. 
Finally,  placing  digital  newspaper  objects  or 
collection units into lossless  archival  packaging 
formats  helps  to  maintain  their  integrity  over 
extended  periods  of  active  preservation 
management and storage media changes. This 
can  provide  multiple  stakeholders  with 
manageable  units  of  data  that  can  be  traced 
and  validated  both  across  and  between 
institutions. 
Tools 
There are a number of tools and resources that 
can  assist  an  institution  with  packaging  its 
digital  newspapers  for  long-term  preservation. 
Selecting  the  appropriate  tools  will  depend 
upon  the  level  of  resource  investment  an 
institution  can  make  -  from  creating  simple, 
well-documented  TAR  packages  to  deploying 
UIDs  (and  making  use  of  related  Name 
Assigning  Authorities)  and  producing  more 
complex  packages  (whether  TAR,  WARC,  or 
BagIt). 
Examples  of  UID  and  packaging  tools  are 
provided  below  with  brief  descriptions.  Usage 
of these tools is discussed below in the Essential 
and Optimal sections. 
Reference: OAIS Packaging Concepts & Models 
Preservation  Description  Information  (PDI): The  information  which  is  necessary  for  adequate 
preservation of the Content Information and which can be categorized as Provenance, Reference, Fixity, 
Context, and Access Rights Information. 
Submission Information Package (SIP): An Information Package that is delivered by the Producer to the 
OAIS  for  use  in  the  construction  or  update  of  one  or  more  AIPs  and/or  the  associated  Descriptive 
Information. 
Archival Information Package (AIP): An Information Package, consisting of the Content Information and 
the associated Preservation Description Information (PDI), which is preserved within an OAIS. 
Dissemination Information Package (DIP): An Information Package, derived from one or more AIPs, and 
sent by Archives to the Consumer in response to a request to the OAIS. 
Library application class:C# Create PDF from OpenOffice to convert odt, odp files to PDF in
Note: When you get the error "Could not load file or assembly 'RasterEdge.Imaging. Basic' or any How to Use C#.NET Demo Code to Convert ODT to PDF in C#.NET
www.rasteredge.com
Library application class:VB.NET PowerPoint: Sort and Reorder PowerPoint Slides by Using VB.
you can choose to show your PPT presentation in inverted clip art or screenshot to PowerPoint document slide & profession imaging controls, PDF document, image
www.rasteredge.com
Guidelines for Digital Newspaper Preservation Readiness 30 
Section 6. Packaging Digital Newspapers for Preservation
Unique  Identifier  (UID)  resources  that 
are popular  in  digital  libraries  and  archives 
include: 
  Handle System
104
  ARK
105
  NOID
106
The Handle System, for the purposes of creating 
local UIDs, provides local server side application 
support  for  maintaining  a  Name  Assigning 
Authority  (NAA),
107
and  creating  Name 
Assigning  Authority  Numbers  (NAAN)  for 
institutions  that  can  be  used  as  prefixes  for 
unique  identifiers.  Identifiers  in  the  Handle 
system can be any printable characters in UTF-8 
encoding  from  most  major  languages  written 
today.  ARKs,  or  Archival  Resource  Keys,  are 
unique  identifiers  that  can  be  created  and 
managed  by  tools  like  NOID,  or  Nice  Opaque 
Identifiers. 
In order to use these tools, an institution should 
first  register  with  a  federated Name  Assigning 
Authority like that maintained by the California 
Digital  Library  (CDL). Doing  so  will  provide  the 
institution with a NAAN prefix that it can use in 
conjunction  with  an  ARK  created  by  NOID  to 
104
Corporation for National Research Initiatives, 
“Handle System,” available at: 
http://www.handle.net/
105
alifornia Digital Library, “ARK (Archival Resource 
Key) Identifiers,” available at: 
https://wiki.ucop.edu/display/Curation/ARK
106
alifornia Digital Library, “NOID: Nice Opaque 
Identifier (Minter and Name Resolver)” available at: 
https://wiki.ucop.edu/display/Curation/NOID
107
For a list of current Name Assigning Authority 
Numbers see,  alifornia Digital Library, “Registered 
Name Assigning Authority Numbers,” available at: 
http://www.cdlib.org/services/uc3/naan_table.html
form  a  UID  for  a  collection  or  set  of  digital 
newspaper objects. This UID can then be stored 
with metadata and can be used to manage the 
collection  in  archival  storage.  METS  and/or 
PREMIS  can  be  especially  helpful  metadata 
tools  for  institutions  that  have  moved  to  the 
stage  of  creating  UIDs  for  their  digital 
newspapers (more on this below). 
Lossless archival packaging formats include: 
  TAR
108
  WARC
109
  METS
110
  PREMIS
111
  BagIt
112
TAR, which stands for Tape ARchive, is a lossless 
packaging format that works especially well for 
encapsulating  folders  of  files  and  maintaining 
file  system  metadata  about  the  objects  and 
structures  contained  therein.  There  are  a 
number  of  standard  and  open  source  utilities 
available  for  producing  and  unpacking  TAR 
packages.  TAR  packages  can  be  subsequently 
compressed, but compression is not advised for 
long-term storage and preservation. 
108
Linuxquestions.org, “Tar,” available at: 
http://wiki.linuxquestions.org/wiki/Tar
109
ibliothèque nationale de France, “The WAR  File 
Format (ISO 28500) - Information, Maintenance, 
Drafts,” available at: http://bibnum.bnf.fr/WARC/
110
Library of  ongress, “Metadata Encoding 
Transmission Standard (METS),” available at: 
http://www.loc.gov/standards/mets/
.  
111
Library of  ongress, “Preservation Metadata: 
Implementation Strategies (PREMIS),” available at: 
http://www.loc.gov/standards/premis/
Library application class:VB.NET PowerPoint: Merge and Split PowerPoint Document(s) with PPT
documents and save the created new file in the sample code in VB.NET to finish PowerPoint document splitting If you want to see more PDF processing functions
www.rasteredge.com
Library application class:VB.NET Create PDF from OpenOffice to convert odt, odp files to PDF
1odt.pdf"). How to VB.NET: Convert ODP to PDF. This code sample is able to convert ODP file to PDF document. ' odp convert
www.rasteredge.com
Guidelines for Digital Newspaper Preservation Readiness 31 
Sec
tion 6. Packaging Digital Newspapers for Preservation
WARC,  which  stands  for  Web  ARchive,  is  a 
lossless  packaging  format  typically  used  for 
encapsulating  harvested  websites.  It  improves 
upon an earlier ARC format by better describing 
the  web  resources  it  contains  and  enabling 
improved  harvesting,  sharing  and  access. 
Standard  web-crawling  software  such  as 
Heritrix can produce WARC packages. 
METS and PREMIS were previously described in 
the Section 4. Metadata Packaging for Digital 
Newspapers. These standards can be used to 
maintain  linkages  between  associated  digital 
newspaper  objects,  their  metadata,  and  any 
assigned  UIDs.  They  can  also  help  to  record 
preservation actions taken on archived objects. 
Finally,  BagIt  is  a  packaging  specification  that 
can be applied to a digital newspaper collection 
at any level in a collection hierarchy to produce 
an  inventory  and  checksums  for  that  content. 
BagIt  can  be  especially  helpful  for  auditing 
locally  preserved  content  or  verifying  the 
integrity of collection content when exchanged 
with an external preservation service  provider. 
As  mentioned  in Section 5. Checksum 
Management for Digital Newspapers, there are 
GUI-based  tools  like  Bagger
113
that  can  make 
the implementation of BagIt relatively painless. 
Readiness Spectrum 
Ultimately, what an institution packages is what 
that institution will get  back out of its  archival 
storage for restoration purposes. The packaged 
content  must  be  adequate  to  restore  objects 
112
Descriptions of the BagIt specification are 
available at: http://en.wikipedia.org/wiki/BagIt
and 
http://tools.ietf.org/html/draft-kunze-bagit-10
113
Library of Congress, “ agger,” available at: 
http://libraryofcongress.github.io/bagger/
and  collections  in  the  event  of  corruption  or 
loss.  All  of  the  previous  sections  in 
these Guidelines have  built  toward this  step  of 
packaging  with  explicit  attention  to 
recovery/reconstitution of collections. 
For smaller or under-resourced institutions, this 
packaging phase may be as simple as including 
written instructions for three scenarios: 1) how 
to  retrieve  a  single  file  or  subset  of  files  to 
restore  damaged  local  copies;  2)  how  a 
collection can be restored within or re-imported 
into its repository system/environment;  and 3) 
how  the  institution  should  go  about 
reproducing  derivative  access  copies  of  its 
collection  content  from  their  master  files  (if 
those  differ). Applying  simple  and  reliable 
archival  packaging  formats  such  as  BagIt  and 
TAR (uncompressed)  could  then  prove  helpful 
for  on-going  management  purposes  and 
assurances. 
For  institutions  with  greater  resources, efforts 
should be taken to achieve optimal Preservation 
Description  Information (PDI)  and  to  enrich 
Submission Information Packages (SIPs) with as 
much  information  as  possible  to  achieve  a 
sufficient Archival Information Package (AIP). If 
long-term preservation is being pursued locally, 
the  use  of  unique  identifiers  (UIDs)  should  be 
considered,  ideally  in  combination  with 
preservation  metadata  schemas  such  as  METS 
and/or  PREMIS.  Likewise,  deploying  reliable 
archival packaging formats such as BagIt and/or 
TAR,  and  more  complex  formats  such 
as WARC (which  is  particularly  useful  for 
website-based  born-digital  newspapers),  could 
prove helpful to future restoration activities. 
For  institutions  both  large  and  small  that  are 
partnering with external preservation providers, 
BagIt can  facilitate the  trustworthy transfer  of 
any  such  packaged  digital  newspaper 
Library application class:VB.NET PowerPoint: VB Codes to Create Linear and 2D Barcodes on
PowerPoint PDF 417 barcode library is a mature and Install and integrate our PowerPoint PLANET barcode creating to achieve PLANET barcode drawing on PPT file.
www.rasteredge.com
Library application class:How to C#: Overview of Using XDoc.Windows Viewer
Generally speaking, you can use this .NET document imaging SDK to load, markup, convert, print, scan image and document. Support File Types. PDF.
www.rasteredge.com
Guidelines for Digital Newspaper Preservation Readiness 32 
Section 6. Packaging Digital News
papers for Preservation
collections. BagIt ideally should be applied prior 
to any additional packaging using TAR or WARC. 
Use  of  BagIt  prior  to  packaging  with  TAR  is 
logical  because  it  enables  inventorying  of  the 
subsequent  TAR  contents  on  a  per-file  basis 
rather  than  inventorying  of  the  one  TAR  file 
itself. Use of BagIt before or after any packaging 
with  WARC  is  as  yet  largely  unexplored,  but 
follows from the same logic. 
Essential Readiness 
As  mentioned  in Section 2. Organizing Digital 
Newspapers for Preservation as well as above in 
this Section, institutions  with  less resources to 
put  behind  packaging  their  digital  newspapers 
according  to  high-bar  standards  should  aim to 
document  collection  structures  and  how these 
can and should be re-constituted in the event of 
loss  or  corruption.  In  addition  to  the 
documentation efforts recommended in Section 
1.  Inventorying  Digital  Newspapers  for 
Preservation, some additional factors to be 
considered  in  the  creation  of  such 
documentation include: 
  Document  where  and  on  what  media 
the  master  preservation  copies  for  any 
given collection currently reside at the local 
institution; 
  Document any preferred form of media 
or  means  for  receiving  back  preservation 
copies  for  the  sake  of  a  recovery  and 
restoration  (SFTP,
114
hard  drive,  CD,  DVD, 
etc.); 
  Document instructions on how to work 
with  the  above-mentioned  media  or 
114
A description of the SSH File Transfer Protocol 
(SFTP) and its differences with both SSH and FTP are 
available at: 
http://en.wikipedia.org/wiki/SSH_File_Transfer_Prot
ocol
mechanism to retrieve  preservation  copies 
from  a  local  preservation  system  or  an 
external preservation service provider; 
  Document  step-by-step instructions for 
how  to  restore  collections  from  their 
preservation copies (including how to make 
use of any previously developed inventories 
and/or assigned unique identifiers); and 
  Document guidance on how to produce 
derivative  access  copies  from  restored 
preservation  copies  (in  case  access  copies 
are lost or are not preserved) 
This  documentation  should  be  produced  and 
saved  in  an  open  and  non-proprietary  file 
format (e.g., Open Document Format,
115
PDF,
116
or even a simple TXT file). It can and should be 
stored  in  its  own  clearly  labeled  folder  or 
alongside  the  collection  folders  as  a  README 
with its own clearly labeled filename. 
Once  an  institution has documented  its digital 
newspaper  collections for packaging  purposes, 
the  institution  can  consider  encapsulating  its 
digital  newspaper  collections  in  a  lossless 
archival packaging format. 
The easiest and most reliable packaging format 
for less-resourced institutions to begin working 
with  is  TAR.
117
Packaging  digital  newspaper 
collections  as  TAR  files  can  facilitate  the 
management of digital newspaper collections as 
115
OASIS, “OpenDocument Format,” available at: 
http://www.opendocumentformat.org/
116
AIIM Standards Wiki, “PDF/A,” available at: 
http://pdf.editme.com/PDFA
117
There are several platform-specific third-party 
tools to create and unarchive TAR packages, all of 
which should be investigated over time for their 
level of upkeep and stability in correctly handling the 
format. 
Guidelines for Digital Newspaper Preservation Readiness 33 
Section 6. Packaging Digital Newspapers for Preservation
units of related data within an archival storage 
environment  and  across  migrations  of  storage 
media  over  time.  Institutions  creating  a  TAR 
package for digital newspapers should consider 
doing so at whatever level of aggregate is most 
representative of their intellectual organizations 
and  structures  -  be  that  at  a  title,  volume,  or 
issue  level.  They  should  also  clearly  label  the 
TAR  file  without  overwriting  its  extension. 
Consider  some  of  the  file-naming  conventions 
provided  in Section 2. Organizing Digital 
Newspapers for Preservation
Optimal Readiness 
Institutions  with  more  resources  can  take 
guidance  from  OAIS  concepts  such 
as Preservation Description Information (PDI) as 
they 
form 
Submission 
Information 
Packages (SIPs)  and  Archival  Information 
Packages (AIPs). These packages should include 
information such as: 
  Reference  Information that  can  assist 
the  retrieval  of  the  collection  from  within 
an  archival  storage  environment,  be  that 
local  or  an  external  preservation  service 
provider  (unique identifiers  can  be  helpful 
here); 
  Context  Information that  can  help  to 
explain  the  relationship  between  a  digital 
newspaper  collection  and  its  environment 
and  other  digital  newspaper  collections 
(METS can  be  helpful  for  defining  these 
relationships); 
  Provenance  Information that  can  help 
archival  managers  and  users  understand 
the chain  of stewardship for the collection 
and what sort of preservation actions have 
taken 
place 
over 
time 
(METS 
and PREMIS are increasingly being used  for 
recording such information); 
  Fixity  Information that  can  assist  with 
auditing a collection  and  its  digital  objects 
over the course of its archival management 
(BagIt is  one  simple  approach  to  creating 
and storing per-file fixity with a collection); 
and 
  Access  Rights that can help curators or 
external  preservation  service  providers 
understand  what  levels  of  access  and 
handling are permitted for the collection as 
it is managed over time (generic descriptive 
metadata  can  make  this  evident  and  can 
also be used within METS). 
As mentioned in Section 4. Metadata Packaging 
for Digital Newspapers, institutions with greater 
resources  should consider  implementing  METS 
and/or  PREMIS  for  their  digital  newspaper 
content  because  these  standards  explicitly 
retain  linkages  between  associated  digital 
newspaper  objects  and  their  metadata.  METS 
and  PREMIS  can  also  accommodate  and 
leverage  unique  identifiers  (UIDs)  and  operate 
as  XML schemas  that  help  with  automating 
various  archival  management  and  access 
processes  for  any  digital  objects  that  they 
describe and encapsulate. Making use of METS 
and/or  PREMIS  in  specification-conformant 
ways  is  an  ideal  way  to  package  digital 
newspaper collections. 
Unique identifiers (UIDs) should be a priority for 
institutions  using  METS  and/or  PREMIS.  UIDs 
require a Name Assigning Authority (NAA) that 
can  register  the  institution  and  mint  a  unique 
identifier.  As  mentioned  above,  one  of  the 
increasingly  popular  NAAs  is  the  one 
maintained  by  the  California  Digital  Library 
(CDL)  and  mirrored  at  the  National  Library  of 
Medicine  and  the  Bibliothèque  Nationale  de 
France. Each institution that registers is given a 
Name Assigning Authority Number (NAAN) that 
Guidelines for Digital Newspaper Preservation Readiness 34 
Section 6. Packaging Digital Newspapers for Preservation
it  can  use  as  a  prefix  for  the  identifier.   As 
mentioned 
earlier, 
Archival 
Resource 
Keys (ARKs) or Handles can be  used to produce 
UIDs  for  digital  newspaper  collections  or 
individual  digital  newspaper  objects. NOID,  or 
Nice  Opaque  Identifier,  is  a  service  that  can 
assist with minting unique ARKs or Handles that 
can  then  be  coupled  with  the  institution’s 
NAAN. 
Once an institution has assigned identifiers and 
associated metadata with its newspapers, it can 
encapsulate  news  data  by  applying BagIt and 
placing  the  collections  in  an  archival  format 
such  as  TAR  or  WARC.  BagIt  produces  a  full 
inventory  of  included  files  and  per-file 
checksums  that  assists  in  validating  content 
during exchanges and on-going audits. The best 
packaging model may differ across born-digital 
or  digitized  content  types.  For  example,  TAR 
works  very  well  for  packaging  well-organized 
and  hierarchical folders of digitized newspaper 
collections. WARC on the other hand is geared 
primarily  toward  packaging  website  oriented 
collections.
Guidelines for Digital Newspaper Preservation Readiness 35 
Section 7. Additional Considerations
Section 7. Additional Considerations 
7.1. Creation & Acquisition 
As mentioned in the Introduction, the Guidelines are designed to address digital newspaper preservation 
and  curation  -  not  creation  and  acquisition.  The  issues  involved  in  creating  and  acquiring  digital 
newspapers warrant their own “Guidelines” documentation (and indeed, there are many standards and 
guidelines  available  on  these  topics:  see  e.g.,  National  Digital  Newspaper  Program  Technical 
Guidelines
118
for  digitized  newspapers,  the  Federal  Agencies  Digitization  Guidelines,
119
and 
the International Internet Preservation Consortium Web Archiving
120
resources that lend themselves to 
born-digital newspapers,  to  name just a  few) -  however, there  are  components of digital newspaper 
preservation  and  curation  that  should  be  addressed  as  an  institution  initiates  digital  newspaper 
collections of any type. This Additional Considerations section, first and foremost, aims to  provide an 
overview of the creation and acquisitions concerns an institution should consider as part of its overall 
approach to digital news preservation. 
There are  a  number of  preservation-oriented  practices  that stewards of digital  news  collections  can 
begin to integrate and incorporate at the creation and acquisition phase. For example: 
  Curators  can  begin to  record  a full  set  of  inventory data  (see Section 1. Inventorying Digital 
Newspapers for Preservation) as digital newspaper content arrives via hard drives or FTP retrievals 
(or  other mechanisms)  from vendors, institutional digitization units,  or publishers and other  data 
providers; 
  Curators  and  their  technical staff  members  can coordinate to  analyze and record  file  format 
information at creation/acquisition through whatever form(s) best suits the institutional framework 
and its new collections: e.g., lightweight manual processes, automated workflows using open source 
tools, or some combination of both (see Section 3. Format Management for Digital Newspapers); 
  Curators  and  metadata  specialists  can  negotiate  with  digitization  vendors,  institutional 
digitization units, and data providers (including publishers) to provide the institution with the most 
complete, usable and conformant set of metadata elements and formats possible. This can help to 
ensure  integration  with  supported  schemas  and  metadata  workflows  (see Section 4. Metadata 
Packaging  for  Digital  Newspapers). The National Digital Newspaper Program’s Technical 
118
Library of  ongress, “The National Digital Newspaper Program (NDNP) Technical Guidelines for Applicants,” 
August 2012, available at: http://www.loc.gov/ndnp/guidelines/NDNP_201315TechNotes.pdf
119
Federal Agencies Digitization Guidelines Iniative, “Digitization Guidelines,” available at: 
http://www.digitizationguidelines.gov/
120
IIP , “Web Archiving,” available at: http://netpreserve.org/web-archiving/overview
Guidelines for Digital Newspaper Preservation Readiness 36 
Section 7. Additional Considerations
Guidelines
121
illustrate how specific metadata requirements were organized and made available for 
reference and implementation by digitization service providers; 
  Curators can request checksum information from digitization vendors, institutional digitization 
units, and any other data providers prior to their hand-off of news collections. These checksums can 
then be used to verify that the initial transfer, as well as any subsequent work performed on the 
content,  has  not  altered  the  original  objects  (see Section 5. Checksum Management for Digital 
Newspapers); 
  Curators  can  proactively  request  that  digitization  vendors,  institutional  digitization  units,  or 
publishers/born-digital  news  producers  create  and  store  newspaper  content  in  established 
structures  that  conform  to  the  institution’s  preferred  file  and  folder-naming  conventions  (see 
Section 2. Organization for Digital Newspapers); and 
  Finally, curators can request that those producing or providing the institution with born-digital 
newspaper content provide the explicit permissions needed by the institution in order to preserve 
the content over time (see Section 6. Packaging Digital Newspapers for Preservation and the section 
below on Preservation Partners and Permissions). 
7.2. Preservation Partners & Permissions 
The  intellectual  property  and  copyright  issues  inherent  to  news  content  can  present  significant 
preservation  challenges,  particularly  when  permissions  are  not  carefully  negotiated  and  recorded  as 
content is created or acquired. Understanding the implications of reproducing and/or providing access 
to newspaper content requires deeper legal knowledge than can be conveyed in these brief Guidelines. 
Most institutions working with digital news content have collections (digitized and/or born-digital) that 
are not in the public domain and for which there may be explicit access and/or reproduction restrictions. 
Institutions should seek out expert legal advice regarding any risks that might be involved in replicating 
digital news content for preservation purposes and/or broadening the chain of custody for these objects 
by working with external preservation vendors or preservation networks. 
With  (and  sometimes  without)  full  clearance  for  copyright  permissions  and  the  proper  partner 
agreements  in  place,  institutions  can  and  do  partner  with  one  another  and  with  external  service 
providers to preserve copies of their digital newspapers. The current U.S. Copyright Act
122
does not have 
explicit provisions in  place  to guide  the use of  reproduction as  a preservation  strategy for  published 
digital  works.  Currently,  it  permits  the  creation  and  management  of  three  copies  under  specific 
conditions  for  unpublished  works.  The  U.S.  Copyright  Act  was  implemented  in  an  analog  era,  and 
updating portions of it (especially Section 108) to address digital content has already been the subject of 
much debate. In 2008, the Section 108 Study Group
123
made a series of recommendations for reforming 
121
Library of  ongress, “The National Digital Newspaper Program (NDNP) Technical Guidelines for Applicants,” 
August 2012, available at: http://www.loc.gov/ndnp/guidelines/NDNP_201315TechNotes.pdf
122
US Government, “ opyright Law of the United States,” available at: http://www.copyright.gov/title17/
123
US Government, “Section 108 Study Group,” available at: http://www.section108.gov/
Documents you may be interested
Documents you may be interested