c# parse pdf data : Batch pdf metadata SDK control API .net web page wpf sharepoint yalefinal0-part916

YEA: The Yale Electronic Archive 
One Year of Progress 
Report on the Digital Preservation Planning Project 
A collaboration between 
Yale University Library and Elsevier Science 
Funded by the Andrew W. Mellon Foundation 
New Haven, CT 
February 2002 
Librarianship is a curious profession in which we select materials we don't know will be wanted, which we 
can only imperfectly assess, against criteria which cannot be precisely defined, for people we've usually 
never met and if anything important happens as a result we shall probably never know, often because the 
user doesn't realize it himself. — Charlton quoted by Revill in presentation by Peter Brophy, Manchester 
Metropolitan University, 4th Northumbria Conference, August 2001  
Table of Contents 
The Project Team  
Acknowledgments  
Executive Summary  
Part I — Background, Approaches, Assumptions 
Challenges for Long-Term Electronic Archiving  
Background for the Planning Project  
Approaches and Assumptions  
Part II — Lines of Inquiry 
Trigger Events  
Some Economic Considerations  
Contract Between the Publisher and the Archive  
Archival Uses of Electronic Scientific Journals  
The Metadata Inquiry  
Elsevier Science's Technical Systems and Processes  
Creation of a Prototype Digital Archive  
Digital Library Infrastructure at Yale  
Endnotes 
Part III — Appendices
Batch pdf metadata - add, remove, update PDF metadata in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# Developers to Read, Add, Edit, Update and Delete PDF Metadata
pdf remove metadata; pdf metadata editor
Batch pdf metadata - VB.NET PDF metadata library: add, remove, update PDF metadata in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Enable VB.NET Users to Read, Write, Edit, Delete and Update PDF Document Metadata
adding metadata to pdf; change pdf metadata creation date
The Project Team
(Project members began in January 2001 and are continuing with the project unless 
otherwise indicated) 
Yale University Library 
Scott Bennett, University Librarian (Principal Investigator, January – July 2001) 
Paul Conway, Director of Preservation (Project Manager, January – June 2001) 
David Gewirtz, Senior Systems Manager, Yale ITS (Project Technical Director) 
Fred Martz, Director of Library Systems (Project Technical Advisor) 
Ann Okerson, Associate University Librarian (Co-Principal Investigator, January – July 
2001; Principal Investigator July 2001 –) 
Kimberly Parker, Electronic Publishing & Collections Librarian (Metadata Investigator) 
Richard Szary, Director of University Manuscripts & Archives (Investigator for Archival 
Uses) 
Additional advice and support from: 
Matthew Beacom, Catalog Librarian for Networked Information, Yale Library 
Jean-Claude Guédon, Professor of Comparative Literature and History of Sciences, 
Université de Montreal 
James Shetler, Asst. Head of Acquisitions, Yale Library 
Rodney Stenlake, Esq., Independent Legal Consultant 
Stephen Yearl, Digital Systems Archivist, Yale Library 
Elsevier Science 
Karen Hunter, Senior Vice President for Strategy 
Geoffrey Adams, Director of IT Solutions 
Emeka Akaezuwa, Associate Director, Information Technology Implementation 
Additional advice and support from: 
Haroon Chohan, Elsevier Science, IT Consultant 
Paul Mostert, Senior Production IT Manager, Hybrid/Local Solutions, ScienceDirect, 
Elsevier Amsterdam 
Acknowledgments 
Particular thanks go to the following: 
Scott Bennett, for his thoughtful and elegant framing of the issues from the outset to the 
midpoint of the Project and for always keeping our team on target and on time. From the 
point of his retirement as of July 31, 2001, we have sincerely missed his dedication and 
contributions to digital preservation, in which he believed passionately. 
VB.NET Create PDF from Excel Library to convert xlsx, xls to PDF
C#.NET search text in PDF, C#.NET edit PDF bookmark, C#.NET edit PDF metadata, C#.NET Professional .NET PDF converter component for batch conversion.
endnote pdf metadata; remove pdf metadata online
VB.NET PDF Convert to Jpeg SDK: Convert PDF to JPEG images in vb.
PDF pages, C#.NET search text in PDF, C#.NET edit PDF bookmark, C#.NET edit PDF metadata, C#.NET NET components to batch convert adobe PDF files to
add metadata to pdf file; remove metadata from pdf file
The Andrew W. Mellon Foundation, for a tangible demonstration of faith, both in the 
scholarly community's ability to tackle and begin to solve the vital issues associated with 
long-term digital preservation, and in the ability of the Yale Library to be one of the 
players helping to find solutions. Particularly we thank Don Waters of the Foundation for 
his deep commitment to electronic archiving and preservation and for his help to us. 
Our team counterparts at Elsevier Science, for proving to be true partners, giving 
unstintingly their commitment, time, and thoughtfulness to our joint effort. They have 
shared fully information, data, and technology expertise. We have learned that our two 
entities, working together, are much stronger than the sum of our parts. 
Yale Information Technology Services, for donating far more of David Gewirtz's time 
than we had any right to expect and for offering their enthusiastic support and advice. 
Other Mellon planning projects and their staffs, for giving us help and insights along the 
way. 
Finally, I personally wish to thank each of our team members, because everyone, out of 
commitment to the long-term mission of libraries, excitement about digital information 
technologies and their potential, the thrill of learning, and genuine respect for each other's 
contributions, did more than their share and contributed to a strong planning phase. 
Ann Okerson, Principal Investigator 
VB.NET PDF Convert to Tiff SDK: Convert PDF to tiff images in vb.
NET control to batch convert PDF documents to Tiff format in Visual Basic. Qualified Tiff files are exported with high resolution in VB.NET.
remove pdf metadata; adding metadata to pdf files
VB.NET PDF Convert to Word SDK: Convert PDF to Word library in vb.
project. Professional .NET library supports batch conversion in VB.NET. .NET control to export Word from multiple PDF files in VB.
online pdf metadata viewer; view pdf metadata
Executive Summary 
Networked  information  technology  offers  immense  new  possibilities  in  collecting, 
managing, and accessing unimaginable quantities of information. But the media in which 
such information lives are remarkably more ephemeral and fragile than even traditional 
print media. For such information to have a place in scientific and academic discourse, 
there must be assurance of long-term preservation of data in a form that can be accessed 
by users with the kind of assurance they now bring to print materials preserved in 
libraries. The Yale-Elsevier planning project undertook to study the challenges and 
opportunities for such preservation posed by a large collection of commercially published 
scientific journals. 
Despite the natural interdependence between libraries and publishers, skepticism remains 
in both communities about the potential for successful library/publisher collaborations, 
especially in the electronic archiving arena. The e-archiving planning effort between the 
Yale  University Library  and  Elsevier Science  funded by  the  Andrew  W.  Mellon 
Foundation has resulted in substantial gains in bridging the traditional divide between 
these two groups and has paved the way for continuing collaboration. The goals of our 
effort were to understand better the scope and scale of digital journal preservation and to 
reach a position in which it was possible to identify practical next steps in some degree of 
detail and with a high level of confidence. We believe we have achieved these goals. 
From the outset, the Yale-Elsevier team recognized and respected the important and 
fundamental differences in our respective missions. Any successful and robust e-archive 
must be built on an infrastructure created specifically to respond to preservation needs 
and that can only be done with a clear understanding of those missions. Managing library 
preservation  responsibilities  for  electronic  content  while  protecting  a  publisher's 
commercial interests is thus no small task. We have begun with a mutually-beneficial 
learning process. Work during the Mellon planning year gave us a better understanding of 
the commercial life cycle of electronic journals, of the ways in which journal production 
will impact the success of an e-archive, and of the motives that each party brings to the 
process and the benefits that each party expects. 
From the start, the exploration was based on the premise of separating content from 
functionality. Embedded here is the belief that users of the e-archive are not bench 
scientists for whom ease of use of the most current scientific information is critical. We 
envision potential users of the e-archive to be focused primarily on the content. They 
must  be  confident  that  it  remains  true  to  what  was  published  and  is  not 
influenced/affected by changes in technology  that undoubtedly affect functionality. 
Minimally acceptable standards of access can be defined without mirroring all features of 
a publisher's evolving interface. 
VB.NET PDF File Merge Library: Merge, append PDF files in vb.net
Batch merge PDF documents in Visual Basic .NET class program. Merge two or several separate PDF files together and into one PDF document in VB.NET.
read pdf metadata java; pdf xmp metadata editor
C# PDF Convert to Tiff SDK: Convert PDF to tiff images in C#.net
Studio .NET project. Powerful .NET control to batch convert PDF documents to tiff format in Visual C# .NET program. Free library are
read pdf metadata; metadata in pdf documents
Our determinations include the following: 
Migration of data offers a more realistic strategy than emulation of obsolete 
systems;  
Preservation metadata differs from that required for production systems and adds 
real value to the content;  
No preservation program is an island, hence success will depend on adherence to 
broadly accepted standards and best practices;  
A reasonable preservation process is one that identifies clearly the "trigger events" 
that would require consultation of the archive and plans accordingly.  
We have made effective use of the information learned by library peers in their efforts 
and in turn have shared the results of our work. Ultimately, the future of electronic 
archives depends fundamentally on a network of cooperating archives, built on well-
conceived and broadly-adopted standards. 
Nevertheless, the relationship between publisher and archiver is fundamental. We have 
begun work on a model license that draws on Yale's extensive experience in developing 
and  modeling  successful  license  agreements.  Such  an  agreement  will  shape  the 
publisher/archive relationship in ways that control costs, increase effectiveness, and give 
the archive a place in the economic and intellectual life cycle of the journals preserved. 
The Yale-Elsevier team has demonstrated that working collaboratively, we can now 
begin to build a small prototype archive using emerging standards and available software. 
This prototype has the potential to become the cornerstone of an e-journal archive 
environment that provides full backup, preservation, refreshing, and migration functions. 
We have demonstrated that the prototype — offering content from many or all of the 
more than 1,200 Elsevier Science journals — can and will function reliably. We are 
guardedly optimistic about the economic prospects for such archives, but can only test 
that optimism against a large-scale prototype. 
For this archive to become a reality, we must play a continuing lead role in the 
development and application of standards; help shape and support the notion of a network 
of cooperating archives; explore further the potential archival uses; and understand and 
model the economic and sustainability implications. 
The following report provides in some detail the results of the Mellon planning year. We 
believe it demonstrates the deep commitment of the Yale University Library and Elsevier 
Science to the success of this kind of collaboration, the urgency with which such 
investigations must be pursued, and the value that can be found in thus assuring the 
responsible preservation of critical scientific discourse. 
C# PDF Convert to Word SDK: Convert PDF to Word library in C#.net
Powerful components for batch converting PDF documents in C#.NET program. Convert PDF to multiple MS Word formats such as .doc and .docx.
rename pdf files from metadata; pdf metadata editor online
C# PDF File Merge Library: Merge, append PDF files in C#.net, ASP.
NET components for batch combining PDF documents in C#.NET class. Powerful library dlls for mering PDF in both C#.NET WinForms and ASP.NET WebForms.
pdf xmp metadata viewer; edit multiple pdf metadata
Part I: Background, Approaches, Assumptions 
Challenges for Long-Term Electronic Archiving 
The Big Issues 
The tension that underlies digital preservation issues is the fundamental human tension 
between mutability and immortality. The ancient Platonic philosophers thought that 
divine nature was unchanging and immortal and human nature was changeable and 
mortal. They were right about the human nature at least. 
Human products in the normal course of affairs share the fates of their makers. If they are 
not eradicated, they are changed in ways that run beyond the imagination of their makers. 
Stewart Brand's How Buildings Learn[1] has lessons for all those who imagine they are 
involved  in  the  preservation  of  cultural  artifacts,  not  just  people  concerned  with 
buildings. 
But a very limited class of things has managed a special kind of fate. The invention of 
writing and the development of cultural practices associated with it has created a unique 
kind of survival. It is rarely the case that the original artifact of writing itself survives any 
substantial length of time, and when it does, that artifact itself is rarely the object of much 
active reading. Most of us have read the "Declaration of Independence" but few do so 
while standing in front of the signed original in the National Archives. 
Written  texts  have  emerged  as  man-made  artifacts with  a  peculiar  kind  of  near-
immortality. Copied and recopied, transforming physically from one generation to the 
next, they remain still somehow the same, functionally identical to what has gone before. 
A modern edition of Plato is utterly unlike in every physical dimension the thing that 
Plato wrote and yet functions for most readers as a sufficient surrogate for the original 
artifact. For more modern authors, where the distance between original artifact and 
present surrogate is shorter, the functional utility of the latter is even greater. 
That extraordinary cultural fact creates extraordinary expectations. The idea that when we 
move to  a next generation  of  technologies  we  will be able to carry forward the 
expectations and practices of the last generation blithely and effortlessly is probably 
widely shared — and deeply misleading. The shift from organic forms of information 
storage (from papyrus to animal skin to paper) back to inorganic ones (returning, in 
silicon, to the same material on which the ancients carved words meant to last forever and 
in fact, lasting mainly only a few decades or centuries) is part of a larger shift of cultural 
practices that puts the long-term survival of the text newly at risk. 
Some of the principal factors that put our expectations in a digital age at risk include: 
1.  The ephemeral nature of the specific digital materials we use — ephemeral both 
in that storage materials (e.g., disks, tapes) are fragile and of unknown but surely 
very limited lifespan, and in that storage technologies (e.g., computers, operating 
systems, software) change rapidly and thus create reading environments hostile to 
older materials. 
2.  The dependence of the reader on technologies in order to view content. It is 
impossible  to use digital  materials  without  hardware  and software systems 
compatible with the task. All the software that a traditional book requires can be 
pre-loaded  into  a human  brain  (e.g., familiarity  with  format  and  structural 
conventions, knowledge of languages and scripts) and the brain and eyes have the 
ability  to  compensate  routinely for  errors  in  format  and  presentation  (e.g., 
typographical errors).  The combined effect of those facts makes it impossible for 
digital materials to survive usefully without continuing human attention and 
modification. A digital text cannot be left unattended for a few hundred years, or 
even a few years, and still be readable. 
3.  The print medium is relatively standard among disciplines and even countries. A 
physicist in Finland and a poet in Portugal expect their cultural materials to be 
stored in media that are essentially interchangeable. A digital environment allows 
for multiple kinds of digital objects and encourages different groups to pursue 
different goals and standards, thus multiplying the kinds of objects (and kinds of 
hardware  and  software  supporting  different  kinds  of  things)  that  various 
disciplines can produce and expect to be preserved. 
4.  Rapidity of change is a feature of digital information technology. That rapidity 
means  that  any  steps  contemplated  to  seek  stability  and  permanence  are 
themselves at risk of obsolescing before they can be properly adopted. 
5.  The intellectual property regimes under which we operate encourage privatization 
of various kinds, including restricted access to information as well as the creation 
of  proprietary  systems  designed  to  encrypt  and  hide  information  from 
unauthorized users until that information no longer has commercial value, at 
which point the owner of the property may forget and neglect it. 
6.  The quantity of works  created in digital form threatens to overwhelm  our 
traditional practices for management. 
7.  The  aggregation  of  factors  so  far  outlined  threatens  to  impose  costs  for 
management that at this moment we cannot estimate with even an order of 
magnitude accuracy. Thus we do not have a way of knowing just how much we 
can hope to do to achieve our goals and where some tradeoffs may be required. 
8.  Finally, the ephemeral nature of the media of recording and transmission imposes 
a particular sense of urgency on our considerations. Time is not on our side. 
Against all of these entropic tendencies lies the powerful force of expectation. Our 
deepest cultural practices and expectations have to such an extent naturalized ideas of 
preservation, permanence, and broad accessibility that even the most resistant software 
manufacturers  and  anxious  owners  of  intellectual  property  will  normally  respond 
positively, at least in principle, to concerns of preservation. That is a great advantage and 
the foundation on which this project is built. 
Social and Organizational Challenges 
The reader is the elusive center of our attention, but not many readers attend conferences 
on digital preservation. We find ourselves instead working among authors, publishers, 
and libraries, with occasional intervention from benevolent and interested foundations 
and other institutional agencies. The motives and goals of these different players are 
roughly aligned, but subtly different. 
Authors: Authors require in the first instance that their work be made widely known and, 
for scholarly and scientific information, made known in a form that carries with it the 
authorization of something like peer review. Raw mass dissemination is not sufficient. 
Authors require in the second instance that what they write be available to interested 
users for the  useful life of the information. This period varies from discipline  to 
discipline. Authors require in the third instance that their work be accessible for a very 
long time. This goal is the hardest to achieve and the least effectively pursued, but it 
nevertheless gives the author community a real interest in preservation. However, the first 
and second areas of concern are more vital and will lead authors to submit work for 
publication through channels that offer those services first. In practice, this means that the 
second motive — desire to see material remain in use for some substantial period of time 
— is the strongest authorial intent on which a project such as ours can draw. It will drive 
authors towards reputable and long-standing publishing operations and away from the 
local, the ephemeral, and the purely experimental. 
It should be noted that at a recent digital preservation meeting,[2] certain authors 
affirmed volubly their right to be forgotten, i.e., at the least to have their content not 
included in digital archives or to be able to remove it from those archives. Curiously, 
even as we worry about creating long-term, formal electronic archives that are guaranteed 
to last, we note that the electronic environment shows quite a multiplier effect: once a 
work  is  available on  the  Web,  chances  are it  can  be relatively easily copied  or 
downloaded and shared with correspondents or lists (a matter that worries some rights 
owners  immensely  even  though  those  re-sends  are  rarely  of  more  than  a  single 
bibliographical object such as an article). This means that once an author has published 
something, the chances of his or her right to be forgotten are as slim as they were in days 
of modern printing — or even slimmer. Think, if you will, whether "special collections," 
as we have defined them in the print/fixed-format era, have a meaning in the digital 
environment and, if so, what might that meaning be? The focus may be not on the 
materials collected so much as on the expertise and commitment to collect and continue 
to collect materials at particular centers of excellence, especially where the ongoing task 
of collection is complex, exacting, difficult, and/or particularly unremunerative. 
Publishers: Publishers require in the first instance that they recruit and retain authors 
who will produce material of reliable and widely-recognized value. Hence, publishers 
and authors share a strong common interest in peer review and similar systems whose 
functioning is quite independent of any question of survival and preservation. Publishers 
are as well — perhaps even more — motivated by their paying customers, e.g., the 
libraries in this case, who can influence the strategic direction of the publisher no less 
directly. Consequently, publishers require in the second instance that the material they 
publish be of continuing value in a specific way. That is, publishers of the type we are 
concerned with here publish serials and depend for their revenue and the intellectual 
continuity of their operations on a continuous flow of material of comparable kind and 
quality. The demand for such material is itself conditioned on that continuity, and the 
availability of previous issues is itself a mark and instrument of that continuity. The 
publisher, therefore, understands that readers want the latest material but also material 
that is not only the latest; the scientific journal is thus crucially different from a 
newspaper.  Publishers  also  have  more  insubstantial  motivations  about  continuing 
reputation and may have themselves long histories of distinguished work. But as with 
authors, it is the second of the motives outlined here — where self-interest intersects the 
interest of others — that will most reliably encourage publishers to participate in 
preservation strategies. 
Libraries: Libraries require in the first instance that users find in their collections the 
materials most urgently needed for their professional and academic work. This need leads 
them to pay high prices for current information, even when they could get a better price 
by waiting (e.g., buying new hard cover books rather than waiting for soft cover or 
remainder prices, or continuing to purchase electronic newspaper subscriptions rather 
than depend on content aggregators such as Lexis-Nexis, which they may also be 
purchasing). They require in the second instance that they build collections that usefully 
reflect the state and quality of scientific, scholarly, and cultural discourse in their chosen 
areas of coverage. 
Research library collections may be built largely independently of day-to-day use, but 
libraries expect certain kinds of use over a long period of time. Where information may 
be published to meet a particular information need, these libraries will retain that 
information in order to meet their other mission of collecting a cultural heritage for future 
generations. Yale has been pursuing that project for 300 years. With traditional media, 
libraries, museums, archives, and other cultural institutions have pursued that project in 
various  independent  and  cooperative  ways.  It  is  reasonable  to  expect  that  such 
cooperation among traditional players and new players will only continue and grow more 
powerful when the objects of preservation are digital. 
All of the above tantalizing complications of long-term electronic archiving drew us into 
this planning project and continued to be themes throughout the year-long planning 
process. 
Background for the Planning Project 
Yale Library as a Player 
The Yale Library has, for close to three decades, been cognizant of and aggressive about 
providing access to the numerous emerging forms of scholarly and popular publications 
appearing in "new" electronic formats, in particular those delivered via the Internet and 
increasingly through a Web interface. Initially, indexing and abstracting services and 
other "reference"  type  works found their way into  electronic  formats  and  rapidly 
displaced their former print instantiations. By 1996, full-text content from serious and 
substantive  players  such  as  Academic  Press  (AP)  and  JSTOR  were  entering  the 
marketplace, and libraries — and their readers — became quickly captivated by the 
utility, effectiveness, efficiency, and convenience of academic content freed from its 
traditional fixed formats. By the summer of 2000, Yale Library, like most of its peer 
institutions, was spending over $1 million annually on these new publication forms, 
offering  several  hundred  reference  databases  and  thousands  of  full-text  electronic 
journals to its readers. Expenditures for electronic content and access paid to outside 
providers last academic year alone totaled nearly $1.8 million. In addition, we spend 
increasing sums both on the creation of digital content and on the tools to manage digital 
content internally — e.g., a growing digitized image collection, a fledgling collection of 
university electronic records, digital finding aids for analog materials in our collections, 
and our online library management system, which includes but is not limited to the public 
access catalog. 
The electronic resources that Yale makes available to readers, both on its own and in 
conjunction with its partners in the NorthEast Research Libraries consortium (NERL), 
quickly become heavily used and wildly popular — and increasingly duplicative, in terms 
of effort and price, with a number of print reference works, journals, and books. The Yale 
Library,  with  its  significant  resources,  300  years  of  collections,  and  long-term 
commitment to acquiring and preserving collections not only for its own but also for a 
global body of readers, has acted cautiously and prudently in retaining print texts not only 
for immediate use but also for long-time ownership and access. It has treated its growing, 
largely licensed (and thus un-owned) electronic collections, moreover, as a boon for 
reader  productivity  enhancement  and  convenience, even to  the  point  of  acquiring 
materials that seem to duplicate content but offer different functionality. 
Nonetheless, it is clear that the Library (and this is true of all libraries) cannot endlessly 
continue on such a dual pathway, for several compelling reasons: 1) the growing level of 
print and electronic duplication is very costly in staff resources and to collections 
budgets; 2) increasingly, readers, at least in certain fields such as sciences, technology, 
and medicine (STM), as well as certain social sciences, strongly prefer the electronic 
format and the use of print in those areas is rapidly diminishing; and 3) traditional library 
stacks are costly to build or renovate. All libraries face what NERL members have 
dubbed the "Carol Fleishauer"[3] problem: "We have to subscribe to the electronic 
resources for many good reasons, but we cannot drop print — where we might wish to — 
Documents you may be interested
Documents you may be interested