open pdf in word c# : How to delete text in a pdf acrobat software control dll winforms web page asp.net web forms IPN%2056.indd.def0-part381

Digitization 
and Preservation 
of Newspaper Collections
In t e r n a t i o n a l
Pr e s e r v a t i o n
Ne w s
A Newsletter of the IFLA Core Activity
on Preservation and Conservation
N
o
. 56
May 2012
I F L A
I F L A
P A C
P A C
How to delete text in a pdf acrobat - delete, remove text from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# developers to use mature APIs to delete and remove text content from PDF document
erase text in pdf document; delete text from pdf acrobat
How to delete text in a pdf acrobat - VB.NET PDF delete text library: delete, remove text from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET Programming Guide to Delete Text from PDF File
how to delete text from pdf document; how to delete text in pdf preview
2
I
n
t
e
r
n
a
t
i
o
n
a
l
P
r
e
s
e
r
v
a
t
i
o
n
N
e
w
s
N
o
.
5
6
M
a
y
2
0
1
2
INTERNATIONAL PRESERVATION
No 56 
NEWS
May 2012
I
S
S
N
0
8
9
0
-
4
9
6
0
I
n
t
e
r
n
a
t
i
o
n
a
l
P
r
e
s
e
r
v
a
t
i
o
n
N
e
w
s
i
s
a
p
u
b
l
i
c
a
t
i
o
n
o
f
t
h
e
I
n
t
e
r
n
a
t
i
o
n
a
l
F
e
d
e
r
a
t
i
o
n
o
f
L
i
b
r
a
r
y
A
s
s
o
c
i
a
t
i
o
n
s
a
n
d
I
n
s
t
i
t
u
t
i
o
n
s
(
I
F
L
A
)
C
o
r
e
A
c
t
i
v
i
t
y
o
n
P
r
e
s
e
r
v
a
t
i
o
n
a
n
d
C
o
n
s
e
r
v
a
t
i
o
n
(
P
A
C
)
t
h
a
t
r
e
p
o
r
t
s
o
n
t
h
e
p
r
e
s
e
r
v
a
t
i
o
n
a
c
t
i
v
i
t
i
e
s
a
n
d
e
v
e
n
t
s
t
h
a
t
s
u
p
p
o
r
t
e
f
f
o
r
t
s
t
o
p
r
e
s
e
r
v
e
m
a
t
e
r
i
a
l
s
i
n
t
h
e
w
o
r
l
d
s
l
i
b
r
a
r
i
e
s
a
n
d
a
r
c
h
i
v
e
s
.
I
F
L
A
-
P
A
C
B
i
b
l
i
o
t
h
è
q
u
e
n
a
t
i
o
n
a
l
e
d
e
F
r
a
n
c
e
Q
u
a
i
F
r
a
n
ç
o
i
s
-
M
a
u
r
i
a
c
7
5
7
0
6
P
a
r
i
s
c
e
d
e
x
1
3
F
r
a
n
c
e
D
i
r
e
c
t
o
r
:
C
h
r
i
s
t
i
a
n
e
B
a
r
y
l
a
T
e
l
:
+
+
3
3
(
0
)
1
5
3
7
9
5
9
7
0
F
a
x
:
+
+
3
3
(
0
)
1
5
3
7
9
5
9
8
0
E
-
m
a
i
l
:
c
h
r
i
s
t
i
a
n
e
.
b
a
r
y
l
a
@
b
n
f
.
f
r
E
d
i
t
o
r
/
T
r
a
n
s
l
a
t
o
r
F
l
o
r
e
I
z
a
r
t
T
e
l
:
+
+
3
3
(
0
)
1
5
3
7
9
5
9
7
1
E
-
m
a
i
l
:
o
r
e
.
i
z
a
r
t
@
b
n
f
.
f
r
S
p
a
n
i
s
h
T
r
a
n
s
l
a
t
o
r
:
S
o
l
a
n
g
e
H
e
r
n
a
n
d
e
z
L
a
y
o
u
t
a
n
d
p
r
i
n
t
i
n
g
:
S
T
I
P
A
,
M
o
n
t
r
e
u
i
l
P
A
C
N
e
w
s
l
e
t
t
e
r
i
s
p
u
b
l
i
s
h
e
d
f
r
e
e
o
f
c
h
a
r
g
e
t
h
r
e
e
t
i
m
e
s
a
y
e
a
r
.
O
r
d
e
r
s
,
a
d
d
r
e
s
s
c
h
a
n
g
e
s
a
n
d
a
l
l
o
t
h
e
r
i
n
q
u
i
r
i
e
s
s
h
o
u
l
d
b
e
s
e
n
t
t
o
t
h
e
R
e
g
i
o
n
a
l
C
e
n
t
r
e
t
h
a
t
c
o
v
e
r
s
y
o
u
r
a
r
e
a
.
S
e
e
m
a
p
o
n
l
a
s
t
p
a
g
e
.
I
P
N
i
s
a
v
a
i
l
a
b
l
e
o
n
l
i
n
e
a
t
:
w
w
w
.
i
a
.
o
r
g
/
e
n
/
p
u
b
l
i
c
a
t
i
o
n
s
/
3
2
I
F
L
A
-
P
A
C
M
a
i
l
i
n
g
L
i
s
t
a
t
:
h
t
t
p
:
/
/
i
n
f
o
s
e
r
v
.
i
n
i
s
t
.
f
r
/
w
w
s
y
m
p
a
.
f
c
g
i
/
i
n
f
o
/
p
a
c
-
l
i
s
t
A
n
y
r
e
q
u
e
s
t
f
o
r
d
i
s
t
r
i
b
u
t
i
o
n
s
h
o
u
l
d
b
e
a
d
d
r
e
s
s
e
d
t
o
:
o
r
e
.
i
z
a
r
t
@
b
n
f
.
f
r
F
r
o
n
t
c
o
v
e
r
:
2
1
-
1
-
1
4
,
C
h
a
m
o
n
i
x
:
c
o
u
p
l
e
d
e
s
k
i
e
u
r
s
,
l
h
o
m
m
e
l
i
s
a
n
t
u
n
n
u
m
é
r
o
d
u
J
o
u
r
n
a
l
.
A
g
e
n
c
e
R
o
l
.
1
9
1
4
.
B
i
b
l
i
o
t
h
è
q
u
e
n
a
t
i
o
n
a
l
e
d
e
F
r
a
n
c
e
,
d
p
t
E
s
t
a
m
p
e
s
e
t
p
h
o
t
o
g
r
a
p
h
i
e
,
E
S
T
E
I
-
1
3
(
3
3
0
)
.
I
S
O
9
7
0
6
©
2
0
1
2
b
y
I
F
L
A
Digitization and Preservation 
of Newspaper Collections 
6
Old Wine in New Bottles: Historic Newspapers Online 
Edmund King
10
Digitization of Corriere della Sera Historical Archives
Walter Colombo
13
Sustainability in the United States 
National Digital Newspaper Program
Deborah Thomas and Mark Sweeney
22
Saving Our Past into the Future: 
the Preservation and Digitisation 
of Old Newspapers at Shanghai Library 
Chen Xuyan
29
The National Library of South Africa and the Digitization 
of the Early Years of the Black Press
Douwe Drijfhout
Chronicles of Preservation
32
Training Program for Handling and Preservation of Microfi lms 
and Photographs in Libraries and Archives 
Provided by the National Diet Library
Shigehito Hisanaga
36  Events and Training
.NET PDF Document Viewing, Annotation, Conversion & Processing
Redact text content, images, whole pages from PDF file. Annotate & Comment. Edit, update, delete PDF annotations from PDF file. Print.
how to edit and delete text in pdf file; how to delete text from a pdf reader
C# PDF Converter Library SDK to convert PDF to other file formats
Allow users to convert PDF to Text (TXT) file. can manipulate & convert standard PDF documents in other external third-party dependencies like Adobe Acrobat.
how to erase pdf text; how to delete text from pdf with acrobat
3
I
n
t
e
r
n
a
t
i
o
n
a
l
P
r
e
s
e
r
v
a
t
i
o
n
N
e
w
s
N
o
.
5
6
M
a
y
2
0
1
2
Editorial
In April 2012 the Bibliothèque na-
tionale  de France  hosted in P aris 
the  annual IFLA  Newspaper  Sec-
tion Conference entitled: Newspaper 
Digitization  and Preservation New 
prospects. Stakeholders, Practices, Users 
and Business Models. More than 200 
people attended the event which in-
dicates that the theme was on every-
one’s mind. 
Given that PAC was one of the or-
ganizers, one full day was r eserved 
for preservation subjects (from paper 
conservation to digital preservation).
Proceedings of the conference will be 
published online
1
however we have 
decided to dedicate this IPN to sev-
eral topics linked to the preservation and digitization of newspaper collections. Despite the fact that the articles con-
tained in this issue are essentially looking at newspapers, the refl ections and proposals outlined herein are applicable 
to other printed collections. My fi rst meeting with the IFLA Newspaper Section standing committee (Salt Lake City, 
2006) showed me a fundamental truth: given the complexity of digitizing press collections and the sheer number of 
pages involved, to succeed in this endeavour will be to solve most of the problems associated with the digitization 
of books. In this issue you will not fi nd all the solutions but we would like to present an international selection of 
approaches concerning preservation and digitization: access and economics are touched on within this framework.
Two classic programs are presented: a large public library (Shanghai) and a major European publisher (Corriere della 
Sera). The Library of Congress network is discussed by Deborah Thomas and Mark Sweeney. The general topic is 
introduced by Edmund King, former Head of Newspaper Collections at the British Library. I would like to take this 
opportunity to thank Ed for his invaluable contribution to the British Library Newspaper Collections and to the 
IFLA Newspaper Section, where he was Secretary.
I trust you will fi nd the issue interesting and enjoyable.
IPN 57 (August 2012) will be dedicated to mass storage and preservation.
Christiane Baryla
IFLA-PAC Director
1. www.ifl a.org/en/node/5932
Les marcheuses de la faim lisant un journal communiste. 
Planet News. 1932. BnF, dpt Estampes et photographie, EI-13(2972).
C# powerpoint - PowerPoint Conversion & Rendering in C#.NET
documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. PowerPoint to PDF Conversion.
delete text pdf acrobat; delete text from pdf file
C# Word - Word Conversion in C#.NET
Word documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Word to PDF Conversion.
erase pdf text; delete text pdf
4
I
n
t
e
r
n
a
t
i
o
n
a
l
P
r
e
s
e
r
v
a
t
i
o
n
N
e
w
s
N
o
.
5
6
M
a
y
2
0
1
2
L’Auto : les rotatives du journal sportif. Agence Rol.
1914. BnF, Département Estampes et photographie, EST EI-13 (351).
Éditorial
Du 11 au 13 avril 2012, la B iblio-
thèque nationale de France a accueil-
li à Paris la conférence internatio-
nale de la section Journaux de l’IFLA, 
dédiée cette année à la Numérisation 
et à la Conservation des collections de 
Presse. Plus de 200 personnes ont 
assisté à cet événement, pr euve de 
l’intérêt suscité par ce thème.
Le programme PAC était l’un des 
organisateurs et une journée fut con-
sacrée à la conservation.
Les communications et les  power-
point de la conférence sont publiés 
en ligne
1
. En parallèle, nous avons 
choisi de consacrer ce numéro d’IPN 
à la préservation et la numérisation 
des collections de journaux. Bien que les articles qui vous sont ici proposés traitent essentiellement de la presse, 
les analyses et les propositions présentées sont applicables à d’autres collections. Ce que m’avait appris, en 2006, la 
première réunion du comité permanent de la section Journaux de l’IFLA à laquelle j’ai assisté, c’est qu’étant donné la 
complexité et la spécifi cité de la numérisation de la presse et l’énorme volume de pages concerné, réussir dans cette 
entreprise reviendrait à régler la plupart des problèmes liés à la numérisation des livres. 
Ce numéro ne propose pas un catalogue de toutes les solutions existantes mais une sélection d’approches internatio-
nales: les questions d’accès et celles des modèles économiques seront également abordées dans ce cadre.
Deux grands programmes classiques sont présentés: celui d’une grande bibliothèque publique (Shanghai) et aussi 
celui d’un groupe de presse européen majeur (le Corriere della Sera). Suit la présentation du programme de numérisa-
tion partagée à la Bibliothèque du Congrès par Deborah Thomas et Mark Sweeney. 
Ce dossier est introduit par Edmund King, jusqu’à très récemment Directeur des collections de Journaux à la Bristish 
Library. Je souhaite profi ter de cet éditorial pour remercier Ed de la contribution qu’il a apportée à la British Library 
d’abord et aussi à la section Journaux de l’IFLA, dont il fut le secrétaire enthousiaste et effi cace.
J’espère que le thème de ce numéro vous intéressera. IPN 57 reprendra en l’élargissant le thème de la session PAC à 
la conférence générale IFLA d’Helsinki : Magasins et Conservation.
Christiane Baryla
Directeur d’IFLA-PAC
1. www.ifl a.org/en/node/5932
VB.NET PDF: How to Create Watermark on PDF Document within
create a watermark that consists of text or image (such And with our PDF Watermark Creator, users need no external application plugin, like Adobe Acrobat.
remove text watermark from pdf online; how to delete text in a pdf acrobat
C# Windows Viewer - Image and Document Conversion & Rendering in
standard image and document in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Convert to PDF.
how to copy text out of a pdf; delete text pdf files
5
I
n
t
e
r
n
a
t
i
o
n
a
l
P
r
e
s
e
r
v
a
t
i
o
n
N
e
w
s
N
o
.
5
6
M
a
y
2
0
1
2
Old Wine in New Bottles: Historic Newspapers Online 
by Edmund King, Former Head of Newspaper Collections, British Library, UK
Introduction 
We have witnessed an extraordinary phenomenon in the last 
ten years. This is the incr r edibly rapid scanning of millions of 
printed documents and their availability via databases for us-
ers all over the world. The sheer number and variety of what 
is now offered is probably beyond the comprehension of any 
one individual. There is simply an incredible amount of infor-
mation relating to older printed texts online. What is striking 
about this worldwide process of newspaper back run digitisa-
tion is the re-assertion of the need to present the whole text 
of newspapers, as originally published, to online users. So, we 
have old wine (the original newspapers), now placed into new 
bottles (the online environment). Of course, the big difference 
for users now is that many of the scanned newspaper texts 
have been converted via optical character recognition, so that 
text searching may be done by users. This has been stated by 
many others to be transformative for research, and I believe this 
still to be the case. Researchers now have the ability to search 
rapidly and purposefully to compare newspaper reports, opin-
ion and evidence remotely on a computer. There is far less need 
for researchers to travel to the library of the archive that holds 
the original texts. 
There is the need to respect the integrity of the original as origi-
nally created and published. We need to remind new audiences 
of how and why newspapers have been published over time; 
the social and historical context of their publication. And also 
continue to encourage the viewing of newspaper articles and 
snippets in context of the whole page or the whole issue, as 
originally published. The original entity is the issue. So this is 
the “old wine”.
The transformation in researchers’ ability to compare and to 
interpret newspaper texts, via online sour r ces is itself a huge 
change. This can be done without too much diffi culty online 
now, after some 10 years of worldwide effort in scanning and 
post-processing of old newspaper pages. I shall be of f fering a 
few case studies later in this paper. The diffi culty now is dealing 
with digital excess, and working out pr r ecisely what we want 
to fi nd from within the large quantities of results that emanate 
from a wide search, as part of a directed, thought out research 
event or item. 
The examples being described next are mostly the means to an 
end, rather than the end of itself. 
It is worth emphasising that the examples that follow are only 
drawn from sources or organisations that have enabled fr r ee 
public access to older newspaper texts. For this paper
, this 
meant using newspapers made available by some national li-
braries: The Library of Congress
1
, The National Library of Aus-
tralia
2
, the Bibliothèque nationale de France
3
. Google News-
1. Chronicling America: http://chroniclingamerica.loc.gov/
2. Trove. Digitised newspapers and more. http://trove.nla.gov.au/newspaper
3. Bibliothèque nationale de France: http://www.bnf.fr/fr/collections_et_
services/presse/s.presse_numerisee.html?fi rst_Art=non
papers archive is also available fr r ee
4
. There are considerable 
resources available from commercial companies also for histori-
cal newspaper research online, for example ProQuest Historical 
Newspapers
5
; Gale 19
th
Century newspapers
6
; Readex historical 
newspapers
7
; Newsarchive
8
.
It is the original texts that ar r e being presented and studying 
them in context remains as important as ever. The study of how 
and why information is presented on each printed page in the 
way that editors originally decided, is only just starting. Also, 
there is the possibility of comparison of newspapers with other 
original sources, of books, of prints, of maps, of photographs, 
of drawings, of paintings – all of this detailed work has barely 
begun. It is also a truism that some of the r r esults could never 
have been secured by traditional reading of each newspaper 
page, looking for relevant information. Some of the results now 
resulting from online searches can only happen because of the 
whole scale indexing of older newspaper texts. The mass of 
texts available shows that information about events or people 
is only available in newspapers, often local ones in the country 
of origin. The means to search online and the relative ease with 
which researchers can accomplish this, are now realities. 
A few of worked examples show how much the telegraph 
and cables linking countries, with consequent developments 
in communications, infl uenced reports printed in newspapers, 
especially from the 1850s onwards.
American Civil War – Loss of the Sultana
In the vastness of the American Civil War, occupying as it did 
three and a half years over a huge area of the United States, 
one incident will suffi ce to illustrate the potency of online 
searching. The loss of the steamboat, the Sultana in 1865 reso-
nated across America. The SS Sultana was a Mississippi River 
steamboat paddle wheeler whose destruction in an explosion 
on April 27, 1865 was possibly the greatestmaritime disaster  
in United States history. An estimated 1,800 of the Sultana’s 
2,400 passengers were killed when three of the ship’s four boil-
ers exploded and the Sultana sank near Memphis, Tennessee.
9
Most of those on board were exchanged prisoners of war on 
their way home after privation and suffering from one to twen-
ty-three months in Cahaba and Andersonville prisons. 
4. Google newspapers: http://news.google.com/newspapers
5. Proquest Historical Newspapers: http://www.proquest.co.uk/en-UK/cata-
logs/databases/detail/pq-hist-news.shtml
6. Gale Cengage. 19th century US newspapers. http://mlr.com/DigitalCol-
lections/products/usnewspapers/
7. Readex. America’s historical newspapers: http://www.newsbank.com/
readex/?content=96 ; African American newspapers: http://www.readex.
com/readex/product.cfm?product=308
8. Newsarchive:
http://www.newspaperarchive.com/defaultv11.aspx
9. Text from http://en.wikipedia.org/wiki/SS_Sultana
C# Excel - Excel Conversion & Rendering in C#.NET
Excel documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Excel to PDF Conversion.
how to delete text in pdf converter; remove text from pdf preview
VB.NET PowerPoint: VB Code to Draw and Create Annotation on PPT
other documents are compatible, including PDF, TIFF, MS free hand, free hand line, rectangle, text, hotspot, hotspot more plug-ins needed like Acrobat or Adobe
how to erase text in pdf online; acrobat delete text in pdf
6
I
n
t
e
r
n
a
t
i
o
n
a
l
P
r
e
s
e
r
v
a
t
i
o
n
N
e
w
s
N
o
.
5
6
M
a
y
2
0
1
2
The UK press picked up the story; no less than 73 articles ap-
peared in UK London and Regional newspapers in the month of 
May 1865
10
. Of these, three appeared as early as the 11 May, 
when the Sheffi eld Independent reproduced a telegram sent to 
The Times. More details were available after another week, by 
the 18 May 1865. The account drawn from the Memphis Bul-
letin and printed in the Fife Herald, gives readers much more 
information about the nature of the incident, of the number of 
victims, and mention of how the rescue was conducted. 
Looking at the Chronicling America titles, we have a brief head-
line in the Nashville Daily Times, of the 29 April 1865 which sim-
ply prints two headlines: “Steamer Sultana Bur r ned. Great Loss 
of Life.” (Such is the juxtaposition of dif ferent subjects within 
newspapers, we have this announcement in the midst of many  
commercial advertisements.) Newspapers in Australia picked up 
on the story as well. The NLA website has two newspapers which 
printed the story by July 1865. Gippsland Times (Victoria) carried 
the story in its issue of Sat 22 July 1865. The Empire (Sydney) 
printed the story on Wednesday 26 July 1865, p. 2. Perhaps one 
of the fi rst analyses that a researcher can carry out is the differ-
ences between each of these r r eports; and also to identify the  
common source of the information, and what the original source 
printed in the fi rst instance of reporting the story. 
10. Figures taken from the British Newspaper Archive. http://www.british-
newspaperarchive.co.uk/ (Searched 21.12.2011)
The Siege of Paris during 
the Franco-Prussian War
My second case explores the use of maps. Newspapers printed 
many maps during the 19
th
century. The Siege of Paris during 
the Franco-Prussian war attracted much newspaper coverage. 
As the Prussian armies moved into the interior of France, it be-
came clear that Paris would need to defend itself. The Prus-
sian army invested Paris between the 15-19 September 1870. 
The Leavenworth Weekly Times printed a map of the fortifi ca-
tions of Paris in its edition of 29 September 1870
11
. This is very 
detailed and is accompanied by a large article describing the 
layout in details. As we view it today , the centre looks over-
inked, but the roads of the periphery are well delineated. On 
Saturday 29 October 1870, page 24, the Australian Town and 
Country Journal (NSW) printed “The Fortifi cations of Paris”
12
This is more of an overview of the area around the city, with the 
fortifi cations themselves shown only in outline. In the UK, the 
Western Times published this map of Paris and its fortifi cations 
on the 3 January 1871
13
. This is a carefully crafted map, with 
many locations named and the road system clearly outlined. 
Perhaps of particular interest to the researcher are the differ-
ences in presentation resulting from editorial choice at the 
time, this may have been linked to the limitations of what could 
actually be engraved for mass reproduction in each particular 
newspaper. 
11. The Leavenworth Weekly Times, September 29, 1870. http://chroniclin-
gamerica.loc.gov/lccn/sn84027691/1870-09-29/ed-1/seq-1/;words=Paris+
PARIS+FORTIFICATIONS+fortifi cations?date1=1870&rows=20&searchType
=basic&state=&date2=1871&proxtext=paris+fortifi cations&y=18&x=9&da
teFilterType=yearRange&index=2
12. Saturday October 29, 1870, page 24, The Australian Town and Coun-
try Journal (NSW) printed The Fortifi cations of Paris. http://trove.nla.gov.au/
ndp/del/article/70462750?searchTerm=paris 
for tcifiations&searchLimits=
l-decade=187|||l-year=1870|||l-monthInYear=October%7CmonthInYear%
3A10 (Searched 21.12.2011)
13. Plan of Paris and its Fortifi cations. The Western Times. Tuesday Janu-
ary 3, 1871, page 7. http://www.britishnewspaperarchive.co.uk/ (Searched 
21.12.2011)
1. Sheffi eld Independent, Thursday May 11, 1865, page 2 – “the Sultana 
exploded on 27 April 1865”.
2. The Nashville Daily Union, April 29, 1865.
3. The Leavenworth Weekly Times, September 29, 1870.
7
I
n
t
e
r
n
a
t
i
o
n
a
l
P
r
e
s
e
r
v
a
t
i
o
n
N
e
w
s
N
o
.
5
6
M
a
y
2
0
1
2
Riot in Chicago in 1895
Another example is the closur r e of the steel works r esulting 
from a demand for higher wages and consequent riot, that oc-
curred in Chicago in 1895. The Washington Times reported the 
event on May 8, 1895; the Standard of London reported the 
event on the 10 May 1895.
The Dreyfus Affair
In France, the Dreyfus affair was an international event in the 
1890s and early 1900s. Emile Zola’s letter to the President of 
the French Republic, a dramatic accusation, was the front page 
banner headline in L’Aurore of 13 January 1898 (no.87)
14
. On 
the same day, the UK regional daily, the North-Eastern Gazette 
ran the story with the headline: “M. Zola and the Drefus Case.” 
The fi rst sentence reads: “M. Zola, in the pr r omised letter on 
the Dreyfus Case, published in Paris today, says the affair is a 
stain and a blot on the President’s term of offi ce.” Only a day 
later, the 14 January, The Huddersfi eld Daily Chronicle runs the 
story with the bye-line: “Allegations against French generals”. 
14. L’Aurore front page, January 13, 1898 – Zola – J’Accuse. http://gallica.
bnf.fr/ark:/12148/bpt6k701453s (Searched 21.12.2011)
A search of the Chronicling America website under the term 
“Dreyfus Zola” (for all of the United States) yields 181 r r esults 
for further scrutiny. This is a striking example of the kind of ex-
cess that researchers now face. Only three days later after the 
publication of Zola’s letter in L’Aurore, The Washington Times 
of the 16 January 1898 offers the headline: “Is All France In-
sane?” with the bye-line: “Unreasoning passion controls the 
Dreyfus Agitation”. The Kansas City Journal of 18 January 1898 
offers its readers a report of the events in Paris. The Standard 
of London the 19 January 1989 runs the story about how the 
Cabinet Council of France might take out a libel case against 
Zola; it also mentions the rioting that continues to take place. 
Australian newspapers reported extensively on the affair, with 
a search of the words: “Zola Dreyfus” yielding 2,023 results for 
further scrutiny. A refi nement of the search to article printed in 
January 1898 gives 118 results. The South Australian Register, 
Saturday 15 January 1898, carried the story on page 5. Interest-
ingly, links are being made to other resources available on the 
web as you can see from the left hand side of this screen shot. 
Commentary in Spanish newspapers was also extensive as we 
can see here in La Lectura Dominica lof 27 February 1898
15
15. La  Lectura dominica,l  27/02/1898. http://hemerotecadigital.bne.
es/datos1/numeros/internet/Madrid/Lectura%20domini-
cal,%20La/1898/189802/18980227/18980227_00000.
pdf?#search=%22zola%22 (Searched 21.12.2011)
4. The Fortifi cations of Paris. Australian Town and Country Journal (NSW: 
1870 - 1907), Saturday October 29, 1870, p. 24.
5. The Washington Times
May 8, 1895.
6. L’Aurore, January 13, 1898 (no.87).
7. Search of the Chronicling America website.
8
I
n
t
e
r
n
a
t
i
o
n
a
l
P
r
e
s
e
r
v
a
t
i
o
n
N
e
w
s
N
o
.
5
6
M
a
y
2
0
1
2
As we can glimpse, the coverage of this sort of event was very 
great, so early refi nement of online searches will yield fewer 
results, this enabling thinking more relevant to the needs of the 
researcher. 
Conclusions
The work of deepening and intensifying the numbers of older 
newspapers online will continue. Within ten more years, we 
can expect to see much larger quantities of newspapers avail-
able online, from many more countries. There will be a more 
pressing need for our community of librarians and archivists to 
aggregate this information about all of them and to ensure that 
these listings remain available to all. At the same time, improve-
ments to optical character recognition will be made, making 
researcher satisfaction all the greater. How to combine publicly 
available databases with those only available via charging will 
remain an area for further discussion. Here, it has to be said 
that the price of entry to view commercially available databases 
will continue to lower over time, so this may not prove a barrier 
to use that it is perceived to be today. 
The end of research enquiries will be anything that the r e-
searcher wants it to be, for example: 
–  Newspapers can be primary or secondary sour r ces of in-
formation
–  the pure enjoyment of fi nding fascinating information
–  newspaper articles found which focus upon a particular 
historical subject, or person, or political movement
–  articles found which show the number of reports about a 
particular incident
–  articles found which offer information and commentary 
upon social conditions (e.g. disease, or housing)
–  articles found which permit the analysis of language itself 
in different countries, when describing the same event. 
To deal with the problem of sifting large masses of informa-
tion, text mining techniques are being developed
16
. Semantic 
analysis for linguistics is now pr r esent
17
. Both areas of activity 
will attract adherents, and many will spend much time focusing 
16. Text Mining: http://en.wikipedia.org/wiki/Text_mining
17. Semantic analysis (linguistics): http://en.wikipedia.org/wiki/Semantic_
analysis_(linguistics)
upon the means of attaining a summation of information using 
computers. The results of such work may or not may be suc-
cessful, and may or may not lead to useful research within the 
arts and humanities. At this time, I prefer to place trust in the 
diligence of the human mind and spirit (rather than in comput-
er programs), in the ability of the mind to grasp the mass and 
complexity that results from massive amounts of information. 
Distillation of large quantities of textual information will be 
done by individuals or by teams of researchers, who combine 
knowledge of languages with knowledge of history, of litera-
ture, and of any other subject, to achieve readable summaries 
about a person, a subject or about events, fr r om which we all 
benefi t. This ability to synthesise and summarise will continue 
to benefi t us all. The availability of vast amounts of texts (in 
this case for older newspapers) makes the journey more daunt-
ing, but hopefully more rewarding for those who undertake the 
challenge of research. 
The last word on all of this – there isn’t one!
8. The Washington Times
,
January 16, 1898.
9. The South Australian Register
Saturday January 15, 1898.
9
I
n
t
e
r
n
a
t
i
o
n
a
l
P
r
e
s
e
r
v
a
t
i
o
n
N
e
w
s
N
o
.
5
6
M
a
y
2
0
1
2
Digitization of Corriere della Sera Historical Archives
by Walter Colombo, DACS (Digitalizzazione Archivio Corriere della Sera) Project Manager, Italy
A Brief History of Corriere della Sera
The Corriere della Sera was fi rst published in Milan, in 1876. 
The newspaper had four pages and was delivered in the after-
noon. It had a circulation of 15.000 copies. In 1883, a second 
afternoon edition was added; in 1890 a new morning edition 
was published, and fi nally, in 1903, Corriere became a four edi-
tion newspaper, two morning and two afternoon editions. The 
number of the pages was still four. In 1920 the circulation was 
raised up to 600.000 copies. In 1905 the pages doubled, and 
the eight page foliation changed again only in the fi fties, when 
it got to sixteen. The number of pages then gr ew constant-
ly, and was almost fi fty in 1992. From 1867 to 1992 almost 
two millions of pages were printed. On 1945, April 25
th
, the 
liberation day in Italy, Corriere della Sera stopped publication. 
After one month pages were printed again, but the name of 
the newspaper changed to Corriere d’Informazione. Finally, on 
1946 may 7
th
, the name Corriere della Sera was printed again, 
and Corriere d’Informazione became the afternoon edition(s) 
of Corriere della Sera, until the end of 1981. Since then only 
Corriere della Sera was printed, with all its editions. Today Cor-
riere is delivered with a circulation of about 480.000 copies, 
and has, besides local editions, fi fteen regional editions too.
The Documentation Center – 
Consultation and Preservation
In 1910 Luigi Albertini, Director of Corriere della Sera, decided 
that an internal library could be built to provide journalists of 
basic information tools. Casimiro Wronowski, a young copy ed-
itor, was chosen to build it. He started creating a collection of 
clipped articles, about people and facts. Since 1901 an index, 
year based, of the pages of Corriere della Sera had been cre-
ated, containing subjects, names, places.  
The Corriere Archive, due mostly to the annual index, has al-
ways had a double worthiness and destination: on one hand 
it was and is a consultation ar r chive, with all the usual str r ess 
coming along with the frequent handling of volumes, on the 
other it obviously should be preserved, and so more than one 
copy of the volumes had been pr r oduced. In 1974, a process 
started of creation of a microfi lm archive, to become the main 
consultation archive
The Microfi lm Archive
We must, in order to understand the way the microfi lm archive 
was created, look at:
a) The edition structure of the pages
b) The need of internal use of the microfi lm
c) The eventual external use of the microfi lm
The Corriere, in the early years, as previously mentioned, had 
just one edition, and got to four editions after 27 years. Unfor-
tunately, of the fi rst ten years we could not save all the different 
editions, and so all the year collections ar r e bound in volumes 
that are not distinguished by edition, and contain all the edi-
tions we saved. Starting from 1888, volumes are identifi ed by 
1. The Corriere della Sera
head offi ce.
2. 1926 Index.
10
I
n
t
e
r
n
a
t
i
o
n
a
l
P
r
e
s
e
r
v
a
t
i
o
n
N
e
w
s
N
o
.
5
6
M
a
y
2
0
1
2
editions, where A and B are the fi rst and second morning edi-
tions, and C and D (from 1903) are the fi rst and second after-
noon editions (photo 3). We must notice that, obviously, there 
are pages that do not change when the edition changes. The 
last page, for instance, that usually is an ad page, is the same in 
all the four editions. The cultural pages, too, and some others 
do not change very often. In defi ning the micr lomfi creation 
process, it was decided that:
1. The editions had to be the main organizational criteria.
2.  Pages that did not change fr r om one edition to another 
had to be kept only once.
There was the need to choose the main edition, among the 
four, the one that had  to be consulted in case of standar d 
searches, when there was no need in choosing one specifi c edi-
tion, or when a microfi lm had to be delivered to external orga-
nizations, as libraries.
Two other issues were defi ned:
3.  Keep the two morning editions and the two after r noon 
editions totally parted, as if belonging to two dif ferent 
newspapers.
4. Treat the second morning edition (B) as the main edition.
This set, three families of microfi lm were created:
•  The fi rst containing the second morning edition (B), with all 
the printed pages, and eventual supplement pages. This is 
called the B Microfi lm.
•  The second containing only the pages printed in the fi rst 
morning edition and changed in the second morning edition. 
This is called the A Microfi lm.
•  The third containing all the pages of the first afternoon edition 
(C) and the pages that in the D editions had been changed 
(in this case a specifi c page can be found twice, from C and D 
editions). This is called the C+D Microfi lm.
The B microfi lm is the main collection, and is used in inter r nal 
standard searches and external deliveries; A and C+D Micr r o-
fi lms are used only for specifi c needs.
This three family set does not change when, after 1945 April 
25
th
, the Corriere d’Informazione takes the place of Corriere 
della Sera.
The Creation of Fondazione Corriere della Sera
In 2001, in order to save and give new value to the histori-
cal and cultural treasure ofC orriere, above all the historical 
archives, the Fondazione del Corriere della Sera was created. 
This archive is maybe one of the most relevant archives in Italy, 
because of the wide time period that it covers, and quality and 
quantity of the several kinds of documents: correspondences 
between main personalities of political and cultural life in Italy, 
photographic archives, all the pages of Corriere. Moreover, fol-
lowing the ideal vocation of Corriere, the Foundation, always 
promoting meetings, debates and exhibitions, has become one 
of the main cultural issues in Milano, and in Italy too.
The Dacs Project
In 2009, promoted by Fondazione, the Dacs pr r oject started, 
with the help of ICT department of RCS Mediagr oup. Dacs 
means Digitalizzazione Archivio del orriere della Sera. The 
main objectives of the project are:
• Original paper pages conservation.
• Give more access to the pages.
•  Increase the readership of Corriere while creating new busi-
ness opportunities.
In the fi rst phase of Dacs a panel with many vendors is estab-
lished. The objective, besides the need of select a short list of 
vendors, was to better understand technical and logical issues 
of the project. In details, we wanted to know:
•  If the scanning source had to be the microfi lm or the original 
paper pages.
•  The data structures needed to describe and manage all the 
objects of the project and their information. The importance 
of adopting some market standards.
•  The maximum number of errors we could accept in the article 
texts, after the ocr process and post process, from a cost-
benefi t analysis point of view.
•  The need of a complete workfl ow management engine in 
Dacs process management.
We decided that microfi lm could be the better scanning source. 
You’ll see below some details.
A Mets, Alto, Nitf xml structure, established market standards, 
was adopted to manage edition, page and article issues.
About text recognizing, we decided to establish a post ocr cor-
rection process, based on an integration between automatic 
and manual activities, the automatic correction process being 
managed by a semantic text engine.
We decided to adopt a complete workfl ow management sys-
tem, to integrate and manage all the Dacs processes.
In 2010 a main contractor was chosen, and the Dacs pr oject 
started its producing activities.
A central issue, in choosing microfi lm as scanning source, was 
the decision of keeping, while structuring the digital ar chive, 
the same organization adopted for the microfi lm archive. The 
3. Volumes identifi ed by editions: A and B for the fi rst and second morning 
editions; C and D for the fi rst and second afternoon editions.
Documents you may be interested
Documents you may be interested