Guidelines for Digital Newspaper 
Preservation Readiness 
Katherine Skinner 
Matt Schultz 
2014 March 04 
Version 1.0
Convert pdf slides to powerpoint - application software tool:C# Create PDF from PowerPoint Library to convert pptx, ppt to PDF in C#.net, ASP.NET MVC, WinForms, WPF
Online C# Tutorial for Creating PDF from Microsoft PowerPoint Presentation
www.rasteredge.com
Convert pdf slides to powerpoint - application software tool:VB.NET Create PDF from PowerPoint Library to convert pptx, ppt to PDF in vb.net, ASP.NET MVC, WinForms, WPF
VB.NET Tutorial for Export PDF file from Microsoft Office PowerPoint
www.rasteredge.com
Guidelines for Digital Newspaper Preservation Readiness 
Table of Contents
Publication Notes: 
Title: Guidelines for Digital Newspaper Preservation Readiness 
Authors: Katherine Skinner, Matt Schultz 
Publisher: Educopia Institute, 1230 Peachtree Suite, Suite 1900, Atlanta, GA 30309. 
Copyright: 2014 
This publication is covered by the following Creative Commons License: 
Attribution-NonCommercial-NoDerivs 4.0 
You are free to copy, distribute, and display this work under the following conditions: 
Attribution - You must attribute the work in the 
manner specified by the author or licensor (but not 
in any way that suggests that they endorse you or 
your use of the work). Specifically, you must state 
that  the  work  was  originally  published  as  the 
Guidelines  for  Digital  Preservation  Newspaper 
Readiness, and you  must  attribute the  copyright 
holder as the Educopia Institute. 
Noncommercial - You may not use this work for 
commercial purposes. 
No  Derivative  Works  -  You  may  not  alter, 
transform, or build upon this work. 
Any of these conditions can be waived if you get permission from the copyright holder.  Your fair use 
and other rights are in no way affected by the above. 
The above is a human-readable summary of the full license, which is available at the following URL: 
http://creativecommons.org/licenses/by-nc-nd/4.0/
application software tool:C# PowerPoint - How to Process PowerPoint
slides sorting library can help you a lot. Extract Slides from PowerPoint in C#.NET. Use C# sample code to extract single or several
www.rasteredge.com
application software tool:VB.NET PowerPoint: Read, Edit and Process PPTX File
split PowerPoint file, change the order of PPTX sildes and extract one or more slides from PowerPoint How to convert PowerPoint to PDF, render PowerPoint to
www.rasteredge.com
Guidelines for Digital Newspaper Preservation Readiness 
Table of Contents
Table of Contents 
Introduction.................................................................................................................................................... i 
About the Guidelines .................................................................................................................................... iii 
Roadmap Checklist ....................................................................................................................................... xi 
Section 1. Inventorying Digital Newspapers for Preservation ....................................................................... 1 
Section 2. Organizing Digital Newspapers for Preservation ......................................................................... 5 
Section 3. Format Management for Digital Newspapers ........................................................................... 10 
Section 4. Metadata Packaging for Digital Newspapers ............................................................................ 17 
Section 5. Checksum Management for Digital Newspapers ....................................................................... 23 
Section 6. Packaging Digital Newspapers for Preservation ........................................................................ 27 
Section 7. Additional Considerations .......................................................................................................... 35 
References ................................................................................................................................................... 41 
application software tool:VB.NET PowerPoint: Process & Manipulate PPT (.pptx) Slide(s)
add image to slide, extract slides and merge library SDK, this VB.NET PowerPoint processing control powerful & profession imaging controls, PDF document, image
www.rasteredge.com
application software tool:VB.NET PowerPoint: Sort and Reorder PowerPoint Slides by Using VB.
clip art or screenshot to PowerPoint document slide large amount of robust PPT slides/pages editing powerful & profession imaging controls, PDF document, image
www.rasteredge.com
Guidelines for Digital Newspaper Preservation Readiness i 
Introduction
Introduction 
Digital newspapers and preservation. Mention this topic to a roomful of curators, and in our experience, 
the conversation will move in a few predictable directions. 
Most  of  the  curators  will  share  that  they  (or  their  institutions)  manage  some  number  of  digital 
newspaper collections - mostly digitized, either in-house or by vendors. A few will share that they also 
manage born-digital content, either acquired from publishers directly or harvested via the Web. 
Someone inevitably will point to the excellent set of standards in the field, particularly for digitization 
efforts. 
And then…most curators will share stories of their own legacy collections, which conform only in small 
part or not at all to those standards. They will share tales of wildly variable silos of content that have 
been created under different management and/or varied grant-funded endeavors. These idiosyncratic 
and ad-hoc “collections” of digital news are inconsistent in their file types, structures, metadata, and 
storage locations. And their curators worry a lot about how to preserve these collections for future 
generations. 
If you ask this hypothetical roomful of curators why they haven’t readied this content for preservation, 
most (if not all) will cite the same major barrier: resources. They have limited resources to expend on 
remediation activities, and the specifications and standards they might ideally deploy are simply too 
great an investment to consider. 
The Educopia Institute and its affiliated digital preservation program, the MetaArchive Cooperative, 
have heard (and hosted) these kinds of  conversations for several years.  In 2009 and  2010, we ran 
surveys to verify and document the needs we were hearing. And then, with generous funding from the 
National Endowment for the Humanities and in partnership with a range of experts from Chronopolis 
and the libraries of University of North Texas, Penn State, Virginia Tech, University of Utah, Georgia 
Tech, and Boston College, we started to explore ways to lower the barrier to entry for managing digital 
newspapers for the long term. 
These Guidelines are an effort to distill preservation-readiness steps into incremental processes that an 
institution of  almost  any  size  or type  can deploy  to  begin  maturing  its  digital newspaper  content 
management practices. 
We wish to thank the project team and its Advisory Board, including Mary Molinaro, Sue Kellerman, Liz 
Bishoff,  and  Frederick  Zarndt,  for  the  editorial  feedback  they  provided  at  multiple  stages  of  our 
development of these Guidelines. We also wish to thank those that weighed in during an open review 
period we hosted for these documents in 2013 - we were glad to learn from your experiences, and we 
incorporated your suggestions into this final version. Finally, we wish to thank Nick Krabbenhoeft, who 
helped us immensely with editing and refining these documents. 
application software tool:VB.NET PowerPoint: Use PowerPoint SDK to Create, Load and Save PPT
Besides, users also can get the precise PowerPoint slides count as soon as the PowerPoint document has been loaded by using the page number getting method.
www.rasteredge.com
application software tool:VB.NET PowerPoint: Extract & Collect PPT Slide(s) Using VB Sample
want to combine these extracted slides into a please read this VB.NET PowerPoint slide processing powerful & profession imaging controls, PDF document, image
www.rasteredge.com
Guidelines for Digital Newspaper Preservation Readiness ii 
Introduction
Any oversights and omissions herein are entirely our own, and we’ll point out the most grave: the 
Guidelines only deal with digital newspapers at this point, not broadcast or other forms of digital news. 
AV preservation brings in a host of additional factors and considerations. We hope to later expand the 
Guidelines (or to encourage someone else to do so…) to include the broader spectrum of “digital news,” 
but we are beginning with what we know well and can document most thoroughly: digital newspapers. 
The Guidelines are herein at Version 1.0 and we hope to contribute to future versions that can track the 
community’s progress with practices and technologies. 
We hope to hear from you! 
Katherine Skinner and Matt Schultz
application software tool:VB.NET PowerPoint: Merge and Split PowerPoint Document(s) with PPT
of the split PPT document will contain slides/pages 1-4 code in VB.NET to finish PowerPoint document splitting If you want to see more PDF processing functions
www.rasteredge.com
application software tool:VB.NET PowerPoint: Complete PowerPoint Document Conversion in VB.
It contains PowerPoint documentation features and all PPT slides. Control to render and convert target PowerPoint or document formats, such as PDF, BMP, TIFF
www.rasteredge.com
Guidelines for Digital Newspaper Preservation Readiness iii 
About
the Guidelines
About the Guidelines 
The  Guidelines  for  Digital  Newspaper 
Preservation Readiness address a specific set of 
preservation  challenges  faced  by  libraries, 
archives,  historical  societies,  and  other 
organizations that curate substantial collections 
of  digital  newspaper  content.  The  digital 
newspaper  collections  managed  by  these 
memory  organizations  often  have  been 
established over several decades of digitization 
and  born-digital  acquisition  efforts.  As  such, 
they tend  to  encompass a  wide  range of file 
types, structures, and metadata schemas. With 
limited staffing, time,  and  infrastructure, how 
can institutions prepare such diverse collections 
for preservation? 
Consider just a few example scenarios: 
  A state  historical  society  has  digitized 
hundreds of newspaper  pages  through its 
participation  in  programs  such  as  the 
United States Newspaper Program (USNP) 
and  the  National  Digital  Newspaper 
Program  (NDNP).  With  significant  federal 
funding,  these  public  domain  newspapers 
have 
been 
catalogued, 
digitized, 
transcribed,  and  modeled  according  to 
evolving  best  practices  in  metadata, 
imaging,  optical  character  recognition 
(OCR),  and  other  standards  and 
technologies.  Due  to  these  changing 
standards  and  technologies,  the  historical 
society  now  must  maintain  legacy 
collections that were digitized according to 
different “best practices”. As such, it must 
determine  how  best  to  streamline  these 
diverse collections into a set of content that 
can be managed over time. 
  An  academic  research  library  has 
acquired the digital back content of a local 
commercial news publisher, including daily 
articles that were published on the Web in 
the mid-1990s using early versions of HTML. 
The library aims to serve this content out to 
various  communities  over  time,  which 
necessitates attention to  copyright  issues, 
server/operating  system  infrastructure 
changes,  maintaining  thousands  of  file 
linkages,  and  ongoing questions  regarding 
how  different  browsers  will  render  this 
information as such technologies and their 
underlying standards evolve. 
  A state library has started to collect a 
local publisher’s print-ready files and Web 
content - including social media feeds. The 
library  must  work  out  agreements  and 
processes  for  how  best  to  acquire 
authoritative  and  complete  content  from 
the  publisher  on  a  routine  basis.  It  also 
must  make  decisions  regarding  migration 
and  normalization  to ensure the  longevity 
of  the  content  and  to  facilitate  its 
integration with the state library’s extensive 
digitized newspaper holdings. 
Digital  newspaper  collections  are  a  key 
historical record of human activities. Given the 
preservation challenges posed by this valuable 
and unique set of scholarly assets, curators are 
asking  the  question  “How  can  we  effectively 
and efficiently prepare our digitized and born-
digital newspaper collections for preservation?” 
These  Guidelines  are  intended  to  inform 
curators  and  collection  managers  at  libraries, 
archives,  historical  societies,  and  other  such 
memory  organizations  about  various  practical 
application software tool:VB.NET PowerPoint: Convert & Render PPT into PDF Document
Using this VB.NET PowerPoint to PDF converting demo code below, you can easily convert all slides of source PowerPoint document into a multi-page PDF file.
www.rasteredge.com
application software tool:VB.NET PowerPoint: Add Image to PowerPoint Document Slide/Page
insert or delete any certain PowerPoint slide without methods to reorder current PPT slides in both powerful & profession imaging controls, PDF document, tiff
www.rasteredge.com
Guidelines for Digital Newspaper Preservation Readiness iv 
About the Guidelines
readiness  activities  that  they  can  take.  They 
provide  links  to  technical  resources  that 
curators  can  either  implement  themselves  or 
work with their technical staff to implement (for 
more, see How to Use the Guidelines below). 
What is “Digital Preservation”? 
It is important to understand at the outset what 
we  mean  when  we  use  the  term  “digital 
preservation.”  Digital  preservation  is widely 
understood as the “series of managed activities 
necessary to ensure continued access to digital 
materials  for  as  long  as  necessary.”
1
An 
operative  term  in  this  definition  is “managed 
activities.”  Institutions  seeking  to  preserve 
digital  materials  must  understand  that 
preservation  requires  planning,  care,  and 
coordination over time. The definition does not 
seek to quantify the purpose, scope, or duration 
of preservation - only marking it “for as long as 
necessary.” Which is to say, institutions usually 
do not have a mandate to preserve everything 
forever.  Digital  preservation  is  instead  an 
ongoing  process  that  can  be  undertaken 
pragmatically and incrementally. 
Understanding Standards for Digital 
Newspapers 
Digital  preservation  standards  and  practices 
grow annually in number and complexity. As a 
result, it is hard to know where to start, or how 
to define workflows that will last a reasonable 
length of time. 
An institution that seeks to preserve its digital 
newspapers may turn  to  various authoritative 
sources  to  get  its  bearings.  It  might  turn  to 
1
Digital Preservation  oalition, “Introduction – 
Definitions and  oncepts,” available at: 
http://www.dpconline.org/advice/preservationhand
book/introduction/definitions-and-concepts
the Library  of  Congress
2
or  the  newspaper 
sections and working groups of various library 
and  archival professional associations such as 
the Center  for  Research  Libraries  Global 
Resources  Network  (CRL  GRN),
3
the American 
Library  Association  (ALA),
4
the Society  of 
American Archivists (SAA),
5
or the International 
Federation  of  Library  Associations  (IFLA).
6
It 
might also turn to various professional listservs 
such as newslib,
7
digi-pres,
8
code4lib,
9
or digital-
curation.
10
Along  the way, an institution  almost certainly 
will gain familiarity with the standards known as 
2
Library of Congress, “Digital Preservation,” 
available at: http://www.digitalpreservation.gov/
3
Center for Research Libraries Global Resources 
Network, “Global Resources Program,” available at: 
http://www.crl.edu/grn
.  
4
Association for Library Collections & Technical 
Services, “Newspaper IG,” available at: 
http://www.ala.org/alcts/mgrps/ig/ats-dgnews
.  
5
Society of American Archivists, “Homepage,” 
available at: http://www2.archivists.org/
 
6
International Federation of Library Associations, 
“Newspapers Section,” available at: 
http://www.ifla.org/newspapers
 
7
Newslib, “Homepage,” available at: 
http://www.ibiblio.org/slanews/NewsLib/newsliblyri
s.html
.  
8
American Library Association, “digipres- Digital 
Preservation,” available at: 
http://lists.ala.org/sympa/info/digipres
 
9
ode4Lib, “Homepage,” available at: 
http://www.lsoft.com/scripts/wl.exe?SL1=CODE4LIB
&H=LISTSERV.ND.EDU
.  
10
Google Groups, “Digital  uration-Google Groups,” 
available at: 
https://groups.google.com/forum/#!forum/digital-
curation
.  
Guidelines for Digital Newspaper Preservation Readiness v 
About the Guidelines
the Reference  Model  for  an  Open  Archival 
Information  System (OAIS),
11
and ISO:16363 
Audit  and  certification  of  trustworthy  digital 
repositories.
12
Both  of  these  standards  have 
been  instrumental  in  formulating  the  general 
concepts  and  terminology  necessary  to 
implement a digital archive. They also help to 
outline the organizational and technical aspects 
that auditors and stakeholders should be able 
to evaluate. These standards aim less to suggest 
particular implementations than to set forth the 
full  range  of  requirements  needed  to 
accomplish  preservation  in  a  responsible 
fashion. 
An  institution  likely  will  also  encounter  the 
National 
Digital 
Newspaper 
Program 
(NDNP) Technical Guidelines.
13
Released first in 
2007  and  updated  for  each  phase  of  NDNP, 
these  specifications  address  scanning 
resolutions and establish standard, high-quality 
file formats for digitization (e.g., TIFF 6.0). They 
also provide quality requirements  for uniform 
metadata  (e.g.,  CONSER-derived),  encoding 
levels (METS-ALTO), and derivative file formats 
(e.g., JPEG2000 and PDF w/Hidden  Text).  Each 
11
Consultative Committee for Space Data Systems, 
CCSDS 650.0-M-2: Reference Model for an Open 
Archival Information System (OAIS): Magenta Book, 
June 2012, available at: 
http://public.ccsds.org/publications/archive/650x0m
2.pdf
.  
12
SDS, “ISO 16363:2012 Audit and certification of 
trustworthy digital repositories – Magenta  ook,” 
available at: 
http://public.ccsds.org/publications/archive/652x0m
1.pdf
.  
13
Library of Congress, “The National Digital 
Newspaper Program (NDNP) Technical Guidelines for 
Applicants,” August 2012, available at: 
http://www.loc.gov/ndnp/guidelines/NDNP_201315
TechNotes.pdf
 
of  these  technical  requirements  is  in  keeping 
with  current,  accepted  high  standards  for 
image-based  archival-quality  digitization  and 
prepares  the  collections  for  long-term 
preservation. 
An  institution  will  also  grapple  with  various 
recommendations  regarding  preservation 
metadata standards and schemas. In particular, 
two  standards  -  the Metadata  Encoding 
Transmission 
Standard 
(METS)
14
and 
Preservation 
Metadata: 
Implementation 
Strategies (PREMIS)
15
 have been designed as 
robust strategies for encapsulating the widest 
possible  range  of  preservation-oriented 
information  about  digital  objects  and 
collections. The goal  of  these  standards  is to 
help  institutions  provide  better  lifecycle 
management for digital objects. 
Each  of  these  standards  documents 
comprehensive  strategies  for  accomplishing 
some  part  of  the  complex  task  of  preserving 
digital content. However, these comprehensive 
standards  can  seem  formidable,  even  to 
experienced  preservationists.  Upon  gaining 
familiarity  with  the  standards  literature,  an 
institution might worry that it  would need to 
completely  re-think or reverse  its practices  to 
begin preserving its content. 
If an institution can engage  in an incremental 
process  that  allows  it  to  begin  preserving 
content now, while slowly and steadily building 
toward  an  optimal  level  of  preservation 
14
Library of  ongress, “Metadata Encoding 
Transmission Standard (METS),” available at: 
http://www.loc.gov/standards/mets/
15
Library of  ongress, “Preservation Metadata: 
Implementation Strategies (PREMIS),” available at: 
http://www.loc.gov/standards/premis/
.  
Guidelines for Digital Newspaper Preservation Readiness vi 
About the Guidelines
readiness,  it  will  be  more  likely  to  begin 
participating  in  preservation  activities.  Once 
institutions begin preserving content, they also 
will begin building  the requisite expertise and 
knowledge  in  this  area  to  prepare  new 
collections  and  normalize  legacy  collections 
according to optimal standards. 
A Preservation Spectrum - Essential 
to Optimal 
These  Guidelines  for  Digital  Newspaper 
Preservation  Readiness  aim  to  explicitly 
differentiate between the essential and optimal 
in  preservation  readiness  activities  and 
document  the  incremental  steps  that 
institutions  may  take  to  move  from  the 
essential  to  the  optimal level of  preservation 
readiness for their digital newspapers. 
By essential we mean: 
  practices  that  are  reasonable  to 
accomplish given a limited set of resources 
and expertise; and 
  practices  that  are  non-negotiable 
because to neglect them would be to ignore 
preservation. 
By optimal we mean: 
  practices that are reasonable to expect 
given  an  ample  set  of  resources  and 
expertise; and 
  practices  that  can  ensure  the  most 
reliable long-term preservation. 
The Need for a Preservation 
Spectrum 
Digital  newspapers  span  a  diversity of  forms. 
There  are  newspapers  that  consist  of  page 
images in digital microfilm format, newspapers 
that have  been digitally  scanned  from analog 
microfilm  and  from  print  (at  various  image 
resolutions), encoded text derived from these 
scanned images  (optical  character  recognition 
or OCR), and of course born-digital newspapers 
-  often  e-prints  and  web-related  text,  image, 
and multimedia files. 
Because  digital  newspaper  files  are  created 
under such a wide range of circumstances, from 
grant-funded  projects  to  ad  hoc  scanning 
initiatives,  they  also  tend  to  be  stored  on  a 
variety of media. In a given library or archive, 
digital newspaper files might be found on CDs, 
portable hard-drives, tape back-up systems, and 
various flavors of disk arrays. 
Finally,  a  range  of  institutional  types  curate 
digital  newspaper  collections.  These  run  the 
gamut  from  public  libraries  to  historical 
societies,  museums  to  academic libraries,  and 
state libraries to vendor groups. Each of these 
memory stewards has slightly different contexts 
within which it acquires, creates, and manages 
digital newspaper content,  and depending on 
its wherewithal and good fortune (or the lack 
thereof), each has more or fewer resources to 
put behind preserving its assets. 
All of this underscores the drivers for producing 
the Guidelines: namely that all institutions can 
do something  to  prepare their collections  for 
long-term use, and that there can be no one-
size-fits-all  approach  to  preserving  digital 
newspapers.  Institutions  need  to  be  able  to 
tackle  the  challenges  involved  in  preserving 
digital  newspapers  in  modular  increments. 
Though they need to be able to understand the 
entire series  of “managed activities”  as inter-
related stepping stones, they also need to be 
empowered 
to 
produce 
staged 
implementations  based  on  their  current  and 
future capacities. 
Guidelines for Digital Newspaper Preservation Readiness vii 
About the Guidelines
Reference: Digital Preservation Standards 
The  following  standards  are  relevant  to  preserving  digital  newspapers  and  for  guiding  digital 
preservation practices more generally: 
The National Digital Newspaper Program (NDNP) Technical Guidelines
16
describe the specific technical 
requirements for inclusion of digital content in Chronicling America (NEH/Library of Congress). They aim 
to support the “best  practices”  of today’s understanding of  digital  preservation  needs for  digitized 
newspapers. 
The Reference Model for an Open Archival Information System (OAIS) was developed under the auspices 
of the Consultative Committee for Space Data Systems (CCSDS) and first approved as an ISO standard in 
2003 (ISO 14721:2003). It is now superseded by ISO 14721:2012.
17
The Reference Model addresses a full 
range  of  archival  information  preservation  functions  including  ingest,  archival  storage,  data 
management, access, and dissemination. 
ISO  16363:2012 Audit  and  certification  of  trustworthy digital  repositories
18
defines  a recommended 
practice for assessing the trustworthiness of digital repositories. It builds off of Trustworthy Repositories 
Audit & Certification: Criteria & Checklist Version 1.0, 2007.
19
The Metadata  Encoding  &  Transmission  Standard (METS)
20
is  a  standard  for  encoding  descriptive, 
administrative, and structural metadata regarding objects within a digital library. 
The Preservation  Metadata  Implementation  Strategies (PREMIS)
21
data dictionary  is the  international 
standard  for  metadata  to  support  the  preservation  of  digital  objects  and  ensure  their  long-term 
usability. 
16
Library of  ongress, “The National Digital Newspaper Program (NDNP) Technical Guidelines for Applicants,” 
August 2012, available at: http://www.loc.gov/ndnp/guidelines/NDNP_201315TechNotes.pdf
.  
17
Consultative Committee for Space Data Systems, CCSDS 650.0-M-2: Reference Model for an Open Archival 
Information System (OAIS): Magenta Book, June 2012, available at: 
http://public.ccsds.org/publications/archive/650x0m2.pdf
.  
18
SDS, “ISO 16363:2012 Audit and certification of trustworthy digital repositories – Magenta  ook,” available at: 
http://public.ccsds.org/publications/archive/652x0m1.pdf
.  
19
enter for Research Libraries, “Trustworthy Repositories Audit &  ertification:  riteria &  hecklist,” February 
2007, available at: http://www.crl.edu/sites/default/files/attachments/pages/trac_0.pdf
  
20
Library of  ongress, “Metadata Encoding Transmission Standard (METS),” available at: 
http://www.loc.gov/standards/mets/
.  
21
Library of  ongress, “Preservation Metadata: Implementation Strategies (PREMIS),” available at: 
http://www.loc.gov/standards/premis/
.  
Documents you may be interested
Documents you may be interested