how to disable save option in pdf using c# : Edit pdf metadata online software Library dll windows .net winforms web forms Succeed_600555_WP4_D4.1_RecommendationsOnFormatsAndStandards_v1.12-part108

Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 22/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
Delivery files 
PDF with text layer 
Metadata formats 
Descriptive 
MARC, MODS, Dublin Core 
Structural 
METS 
Administrative 
MIX, PREMIS 
Other formats 
OCR output 
ALTO 
Linguistic 
resources 
Tools packaging 
Other 
Master files should be stored in TIFF format, version 6.0, uncompressed. The images 
should be digitized in greyscale using 8-bit color depth. It is recommended have the 
maximum possible resolution, which means 300-400 dpi depending on the physical 
dimensions of the original. TIFF tags should include selected descriptive and technical 
metadata. All the master files should be also provided in JPEG2000 format, so that it 
can be accessed via dedicated user interface over the web based on JPEG2000 wavelet 
compression (zooming, segments). Each JPEG2000 needs to have XMP metadata, 6 
decomposition levels and 25 quality levels with compression rate 8:1. JPEG2000 files are 
supposed to be derivatives from the TIFF files. 
Delivery files should be provided in PDF format with hidden text, making it therefore a 
searchable document. PDF should include XMP metadata and it is recommended to 
conform to the PDF/A specification. Each page of such a PDF should be in JPEG format 
with 150dpi resolution (also greyscale).  
Descriptive metadata are required to be provided in MARC21 communication formant 
using UTF-8 encoding. It should be provided prior to the upload of digital asset. In the 
digital asset itself the metadata should be provided in METS format, which contains 
metadata in the following formats: Dublin Core, MIX, MODS, PREMIS. Additionally 
there are specific metadata elements for NDPD programme, such as identifiers in scope 
of the Library of Congress as not all items have ISSN assigned. 
OCR output should be recorded using ALTO version 2.0 or newer. 
2.14  Images for web delivery – standards, image capture standards, metadata for 
images created by the National Library  of Australia 
The following image capture standards are used by the National Library in digitization 
of its collection material. A range of derivatives are produced for Web delivery of the 
National Library‟s digitized collection material. The National Library of Australia is 
progressively making information about its digitized collection materials available using 
the Open Archives Initiative (OAI) protocol for metadata harvesting. This service 
provides access to metadata describing the Library's digital collections, which is held in 
Edit pdf metadata online - add, remove, update PDF metadata in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# Developers to Read, Add, Edit, Update and Delete PDF Metadata
pdf metadata reader; analyze pdf metadata
Edit pdf metadata online - VB.NET PDF metadata library: add, remove, update PDF metadata in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Enable VB.NET Users to Read, Write, Edit, Delete and Update PDF Document Metadata
batch update pdf metadata; batch edit pdf metadata
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 23/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
the Digital Collections Manager (DCM) database. The documentation was created in 
June 2004. Summary is presented in the Table 14. 
Table 14 Summary of National Library of Australia practices 
File Formats 
Master files 
TIFF 
Delivery files 
JPEG, PDF, MrSID 
Metadata formats 
Descriptive 
Structural 
Administrative 
Other formats 
OCR output 
Linguistic 
resources 
Tools packaging 
Other 
Master Files should have tonal resolution of 24 bits per pixel and 300 ppi spatial 
resolution for larger than A4, 600 ppi between A5 and A4 format, 1200 ppi between A7 
and A6, and 2000 ppi under A7 format.  
Thumbnail copies of derivative files are compressed with 72 ppi and with dimension of 
150 pixels. View copy (JPEG) is created with Image Alchemy software with 72 ppi and 
longest dimension of 600 pixels for pictures and 760 pixels for manuscripts, maps and 
music. View copy (multi-page PDF) is created for print publications scanned for Copies 
Direct orders. These images are compressed with 72 dpi and longest dimension 1000 
pixels. Examination copy (JPEG) for printed music and cartographic materials from 
TIFF master using Image Alchemy software with 72 ppi of resolution and with longest 
dimension 1000 pixels. Print copy (PDF) for printed music from JPEG examination 
copies using Image Alchemy software. These files are compressed with 72 dpi resolution 
and  with  longest  dimension  1000  pixels.  Interactive  copies  (MrSID)  are created 
primarily for cartographic material from TIFF master using MrSID software. These files 
are compressed with 300 ppi resolution and with longest dimension as per the TIFF 
master (varies according to the original physical item). 
2.15  University of Virginia  Library  – community  digitization  guidelines 
The document offers guidance and minimum recommendation in line with UV Library‟s 
current  practice.  The  guidelines  are  divided  into  two  main  topics:  Digitization 
requirements and Metadata. The document was created in March, 6th 2006, but it 
claims that it is a continually evolving document. The summary is shown in the Table 15. 
Table 15 Summary of University of Virginia Library community digitization guidelines 
File Formats 
Master files 
TIFF, JPEG2000 
VB.NET PDF- View PDF Online with VB.NET HTML5 PDF Viewer
C#.NET edit PDF bookmark, C#.NET edit PDF metadata, C#.NET edit PDF digital signatures, C#.NET edit PDF sticky note read barcodes from PDF, C#.NET OCR scan PDF.
edit multiple pdf metadata; metadata in pdf documents
How to C#: Modify Image Metadata (tag)
C#.NET edit PDF bookmark, C#.NET edit PDF metadata, C#.NET edit PDF digital signatures, C#.NET edit PDF sticky note read barcodes from PDF, C#.NET OCR scan PDF.
remove metadata from pdf acrobat; pdf metadata online
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 24/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
Delivery files 
PDF with text layer 
Metadata formats 
Descriptive 
MARC, MODS, Dublin Core 
Structural 
METS 
Administrative 
MIX, PREMIS 
Other formats 
OCR output 
ALTO 
Linguistic 
resources 
Tools packaging 
Other 
Master files should be stored in TIFF format, uncompressed with a resolution between 
300 and 600 ppi and 8-bit (grayscale) 24-bit (color) depth, depending if they are text 
pages of a book or illustrations, slides or oversize items. 
For access copies to the master files, the documents should be digitized in TIFF 
uncompressed, but for the text pages of a book that should have a CCITT Group 4 Fax 
compression, and with a resolution between 300 and 400 ppi, depending on the type of 
original. Delivery files should be provided in JPEG format with a resolution between 120 
px and 3000 px on the longest side, depending if its purpose is thumbnail, screen-sized or 
maximum, automatically compressed (select High or level 10). 
Electronic texts should be captured in XML, XHTML, ASCII text or PDF, depending on 
the purpose. The standard used in XML is TEI P4. The same formats will be used in 
deliverables. 
Other formats, as summarized in the table above, are regarding video, audio, numeric 
and spatial data. 
The document doesn‟t give any recommendation on metadata format, just the content 
they must include. This content is divided into required fields, recommended fields and 
optional fields.  
2.16  Image Specifications and Functional  Requirements for Citation  Capture 
(PubMed Central Back Issue Scanning Project) 
This section summarizes the specification of digitization parameters of the PubMed 
Central Back Issue Scanning Project by the National Library of Medicine. Table 16 
summarizes recommended formats and deliverables indicated in the guidelines. The 
summary is focused on digitization parameters for textual documents. The document 
was created in May 2007. 
VB.NET PDF Library SDK to view, edit, convert, process PDF file
PDF Metadata Edit. Offer professional PDF document metadata editing APIs, using which VB.NET developers can redact, delete, view and save PDF metadata.
read pdf metadata online; pdf xmp metadata
C# HTML5 PDF Viewer SDK to create PDF document from other file
C#.NET edit PDF bookmark, C#.NET edit PDF metadata, C#.NET edit PDF digital signatures, C#.NET edit PDF sticky note read barcodes from PDF, C#.NET OCR scan PDF.
modify pdf metadata; bulk edit pdf metadata
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 25/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
Table 16 Summary of technical digitisation parameters for PubMed Central Back Issue 
Scanning Project 
File Formats 
Master files 
TIFF 
Delivery files 
TIFF, PDF 
Metadata formats 
Descriptive 
XML 
Structural 
Administrative 
Other formats 
OCR output 
ASCII 
Linguistic 
resources 
Tools packaging 
Other 
The guidelines provide detailed instructions on an article based digitization workflow for 
the National Library of Medicine. 
Digitized material is to be delivered organized at article (not page) level. The document 
therefore includes an extensive set of instructions on folder/file naming scheme and 
treatment of pages that have content belonging to more than one article. 
In terms of image digitization, 2 different image types are identified: plain text pages 
which are to be delivered as 600 dpi bitonal TIFF as whole page scans and color or 
greyscale illustrations which are to be delivered as 300 dpi, 24 bit color or 8 bit greyscale 
TIFF, cropped to the size of the illustration. 
Also to be delivered are article level PDF files containing the bitonal scans of the article 
pages as well as the OCR result as hidden text (for searching purposes). Finally, 
unedited OCR results using Prime OCR are to be delivered as plain text ASCII files for 
each article (not page). 
In terms of metadata, a collection of files is also to be generated and delivered according 
to the digitization workflow described. An XML tagged article level citation is to be 
created (DTD for this file is supplied within the specification document). 
Index files per media disk delivered and a file mapping inventory linking volume and 
issue numbers with the paths of generated files are also to de generated. The format for 
both these files is also described within the specification document. 
2.17  Picture Queensland Image Digitisation Manual 2007 
This document summarizes the specification of digitization parameters of the Image 
Digitization  Manual  by  the  State  Library  of  Queensland.  Table  17  summarizes 
recommended formats and deliverable indicated in the guidelines. The summary is 
C# TIFF: TIFF Metadata Editor, How to Write & Read TIFF Metadata
Tiff ›› C# Tiff: Edit Tiff Metadata. C# TIFF - Edit TIFF Metadata in C#.NET. Allow Users to Read and Edit Metadata Stored in Tiff Image in C#.NET Application.
adding metadata to pdf; view pdf metadata
VB.NET PDF - Create PDF Online with VB.NET HTML5 PDF Viewer
C#.NET edit PDF bookmark, C#.NET edit PDF metadata, C#.NET edit PDF digital signatures, C#.NET edit PDF sticky note read barcodes from PDF, C#.NET OCR scan PDF.
change pdf metadata; view pdf metadata in explorer
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 26/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
focused on digitization parameters. The document is providing guidelines for photograph 
digitization. The document was published in 2007. 
Table 17 Summary of Picture Queensland Image Digitisation Manual 2007 
File Formats 
Master files 
TIFF 
Delivery files 
TIFF, JPEG 
Metadata formats 
Descriptive 
Dublin Core 
Structural 
Administrative 
Other formats 
OCR output 
ASCII 
Linguistic 
resources 
Tools packaging 
Other 
The guidelines provide instruction and a step-by-step guide for photograph digitization 
for the State Library of Queensland.  There is detailed explanation of planning a 
digitization process, although most of the guidelines provided are relevant only to 
photographic material. 
As far as the digitization is concerned, the guidelines distinguish between two different 
types of photographs: black-and-white and color. For black-and-white originals, an 8-bit 
greyscale TIFF image is captured and for color originals a 24-bit color TIFF image is 
recommended. In either case, a minimum size (in pixels) is advised - 6,000 pixels for 
black-and white photographs and 4,000 pixels for color. This is achieved by altering the 
scanning resolution so that the resulting image satisfied the minimum size is pixels. 
Tables are provided for easier selection of scanning resolution based on the size (in 
inches) of the original. 
Following the scanning, a number of manual image editing steps are described. These 
consist of simple rotation and cropping operations, but also include adjusting color levels, 
smoothening, resizing and finally adding noise (a 1% uniform noise filter is applied in 
order to "smoothen out sharp spikes in the levels histogram"). 
At the end of this manual process images are saved as TIFF and if required (it is not 
specified as a compulsory step), JPEG for access copies. 
Finally, indexing metadata are entered per scanned image. The metadata is stored using 
Dublin core elements schema and there is a list of 15 fields that can be used to index 
each image (covering descriptive and administrative information. 
C# HTML5 PDF Viewer SDK to view, annotate, create and convert PDF
More details are given on this page. C#.NET: Edit PDF Password in ASP.NET. Users are able to set a password to PDF online directly in ASPX webpage.
extract pdf metadata; pdf metadata editor
C# PDF Sticky Note Library: add, delete, update PDF note in C#.net
Allow users to add comments online in ASPX webpage. Able to change font size in PDF comment box. Able to save and print sticky notes in PDF file.
pdf metadata; add metadata to pdf file
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 27/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
2.18  Summary  of existing recommendations 
This section provides an overview of 17 items related to practices and recommendations 
implemented around the world. From the general perspective it is visible that current 
practices and recommendations do not cover topics related to the whole digitization 
workflow. For example only 11 items out of 17 have indicated OCR output formats and 
linguistic resources. Also tools packaging have not been mentioned at all.  
The charts in this section present the percentage of recommendations/practices that 
indicate particular format as an option for use. Labels on the data columns indicate the 
number of recommendations mentioning particular format. 
Figure 1 presents statistics for the master files formats. Over 94% of items described in 
this section suggest usage of TIFF format for master files. It goes along with the common 
understanding (in the digitization community) of the TIFF format as “de facto” standard. 
The  second  most  common  format  indicated  in  the  analyzed  recommendations is 
JPEG2000. Although the format is quite complicated and still does not have wide 
adaptations, several institutions across the globe use JPEG2000 as an archival master 
file. PNG is indicated by less than 30% and usually it is understood as a format, which is 
not commonly used, therefore not the best option to be used. Because most of the 
practices or recommendations focus on still images, DNG format and others mentioned 
in the described items are not visible in the summary. Nevertheless it is important to 
mention that in case of photography DNG format may be considered, while in case of 
textual content XML-based formats are mostly indicated (e.g. TEI). 
Figure 1 Summary for master file formats 
The most important delivery format for all items in the analysis is JPEG (see Figure 2). 
It was indicated by more than 80% of items and is understood as a very good option for 
all types of delivery files, including presentation version and thumbnails. The other 
delivery formats mentioned by more than 25% of items include PDF, JPEG2000, GIF and 
16 
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
TIFF
JPEG2000
PNG
DNG
Other
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 28/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
PNG. For PDF the application is mostly in the context of textual content, while in case of 
JPEG2000, GIF and PNG it is still images. TIFF format has been indicated as a delivery 
format in approx. 20% of cases, but because of its characteristics (e.g. browser support, 
compression scheme), it is rather not a good option to consider in this context. From the 
general perspective it seems to be most reasonable to use JPEG, PNG and GIF for still 
images and PDF for textual images. JPEG2000 seems to be a good alternative in the 
context of emerging formats. This is because it is able to provide both delivery file and 
master file in a single JPEG2000 file. In case of GIF it is important to remember its 
limitations (e.g. maximum of 256 colors per image) and usual use cases (animation and 
sharp-edged line art). PNG can serve both master files and delivery files, but as opposed to 
JPEG2000, it needs conversion to delivery format  and therefore existence of two 
different files with different characteristics (e.g. resolution). PNG have issues with older 
web browsers and it is used mostly with lossless compression scheme, therefore usually 
gives larger files than JPEG. Because of several advantages of PNG over GIF it seems to 
be more reasonable to use PNG for still images rather than GIF. The advantages include 
number of colors or transparency options. 
Figure 2 Summary for delivery file formats 
For  the  purpose  of  analysis  three  types of metadata formats  have been defined 
(according  to  the  NISO  standard
14
).  These include descriptive metadata formats, 
structural metadata formats and administrative metadata formats. In case of descriptive 
metadata formats the recommendations and practices are mostly focused on XML 
formats, including Dublin Core and MODS. More than 40% of the items indicated MARC 
format. See 
Figure 3
for details.
14
http://www.niso.org/publications/press/UnderstandingMetadata.pdf   
14 
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
JPEG
PDF
JPEG2000
GIF
PNG
TIFF
Other
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 29/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
Figure 3 Summary for descriptive metadata formats 
In case of structural metadata formats the most common selection is METS (pointed by 
almost 60% of items), and it is in fact the only one pointed by more than 10% of analyzed 
recommendations and practices (see Figure 4).  
Figure 4 Summary for structural metadata formats 
In case of administrative metadata the most popular standards and formats are related 
to technical and preservation metadata and include PREMIS as well as NISO Z39-87. 
MIX, which is an XML implementation of the NISO Z39-87 dictionary, is also a common 
selection in this context. Altogether MIX and NISO Z39-87 reach more than 45% of 
indications, while PREMIS reaches more than 40% (see Figure 5). 
12 
0,00%
10,00%
20,00%
30,00%
40,00%
50,00%
60,00%
70,00%
80,00%
Dublin Core
MODS
MARC
Other
10 
0,00%
10,00%
20,00%
30,00%
40,00%
50,00%
60,00%
70,00%
80,00%
90,00%
100,00%
METS
Other
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 30/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
Figure 5 Summary for administrative metadata formats 
For the OCR results representation most indications are related to ALTO format (almost 
30%). The other common indications include ASCII format, Unicode and TEI. Because 
the  ASCII  and  Unicode  formats  are  quite  popular  (together  more  than  35%  of 
indications), it is worthwhile of taking advantage of the UTF-8 encoding (of the Unicode 
character set), which is compatible with ASCII and Unicode at the same time. In the 
context of OCR results we need to remember that only 11 of the analyzed items indicated 
a format, the rest (6 items) do not tackle the issue of OCR results representation at all 
(see Figure 6). 
Figure 6 Summary for OCR formats 
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
PREMIS
MIX
METS
NISO Z39.87
Other
0,00%
10,00%
20,00%
30,00%
40,00%
50,00%
60,00%
70,00%
80,00%
90,00%
100,00%
ALTO
TEI
ASCII
Unicode
Other
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 31/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
3.  RELATED WORK – ONGOING AND EMERGING ACTIVITIES 
This chapter presents ongoing and emerging technologies and formats that are used by 
various consortia, projects and initiatives in order to enhance  digitization-related 
activities. The chapter covers semantic technologies, OCR and linguistic resources, 
relevant ERICs
15
as well as tools packaging issues. 
3.1 Semantic technologies 
It is already common understanding that semantic technologies play an important role 
in digitization-related activities. Various projects and initiatives (re)designs their data, 
so that it is possible to expose them with semantic technologies. The idea of Linked Open 
Data (LOD) has been especially investigated in this area. The following subsections 
provide an overview of the applications and usages of LOD in the cultural heritage 
context and digitization. 
Digitised Manuscripts To Europeana 
Introduction 
Digitized Manuscripts To Europeana (DM2E) is an EU-funded Europeana satellite 
project. Its primary aims are to enable as many content providers as possible to get their 
data into Europeana and to stimulate the creation of new tools and services for reuse of 
Europeana Data in the Digital Humanities. Being coordinated by Humboldt-Universität 
zu Berlin, the duration of the project is three years from 2012 to 2015. 
The DM2E model is a specialization of the Europeana Data Model
16
(EDM) for the 
domain  of  handwritten  manuscripts.  The  EDM  has  been  developed  within  the 
Europeana v1.0 project as an RDF-based data model for describing rich metadata 
records for Europeana, the European digital library. It can handle huge metadata record 
collections represented by heterogeneous metadata standards that must be accessible via 
the same platform. The EDM covers Cultural Heritage Objects (CHOs) that are collected 
and delivered to Europeana by diverse cultural heritage institutions. The model is as 
generic as possible and can be specialized for domain-specific descriptions like it is the 
case in DM2E.  
In May the project finished the first operational version of its DM2E model (v1.0), a 
specialization  of  the  EDM  for  handwritten  manuscripts.  The  ontology  has  been 
developed within work package 2 with a lot of input from others in the project. 
Especially results of extensive mapping workshops with the data providers of DM2E 
were integrated into the model. Metadata of diverse formats like TEI, EAD and MARC21 
was analyzed and used to create new classes and properties that specialize the current 
EDM. 
15
ERIC stands for European Resarch Infrastructure Consortium 
16
http://pro.europeana.eu/edm-documentation   
Documents you may be interested
Documents you may be interested