mvc view pdf : Convert pdf to word for editing text software application project winforms html windows UWP mwg_guidance2-part1968

Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 21 
Figure 2 - Metadata defined in more than one format 
It is evident that there are only a few properties defined in more than one metadata format. Actually 
only four are available in Exif, IPTC-IIM and XMP (Copyright, Description, Creator and Date/Time). 
To ensure interoperability between existing and upcoming hardware and software solutions, the 
following sections give you an overview of how to handle the different metadata properties in the 
context of the actor/role definitions. 
But before going there, the next chapter will provide some more background information on the 
specific relationship between the metadata formats to better understand the overall picture. 
Convert pdf to word for editing text - software application project:C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net, ASP.NET MVC, WinForms, WPF application
C# PDF to Text (TXT) Converting Library to Convert PDF to Text
www.rasteredge.com
Convert pdf to word for editing text - software application project:VB.NET PDF Convert to Text SDK: Convert PDF to txt files in vb.net, ASP.NET MVC, WinForms, WPF application
VB.NET Guide and Sample Codes to Convert PDF to Text in .NET Project
www.rasteredge.com
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 22 
4.2.2.1 Exif and IPTC-IIM in the context of XMP 
The following diagram presents a different perspective on metadata usage: 
Figure 3 - Usage scenarios of Exif, IIM and XMP 
Beside the fact that some native Exif and IPTC-IIM properties are mapped to corresponding XMP 
properties, some popular applications that pre-date this guidance also replicate a large number of 
other Exif properties into the XMP. To better understand the different use cases, the following two 
chapters will put these properties into the context of this document. 
Exif within XMP 
The most recent (as of mid-2010) XMP specification describes the usage of Exif/TIFF properties within 
XMP itself. Both Exif (http://ns.adobe.com/exif/1.0/) and TIFF (http://ns.adobe.com/tiff/1.0/) 
namespaces have been defined so that corresponding Exif properties can be stored. This is 
particularly useful if Exif properties need to be stored but the file format does not support native Exif 
(e.g. PNG).  
In the case of file formats that do support Exif however, the current XMP specification describes 
mechanisms to reconcile data between the native Exif values and the mapped Exif properties in XMP 
(see “TIFF and Exif digests” under section “Reconciling metadata properties” in the XMP specification). 
However, this document changes this earlier XMP guidance and recommends that Exif and Tiff device 
properties only be mapped into XMP in the case the file format does not support Exif natively. For 
more details, please see section “Handling Exif and XMP” below. 
software application project:C# HTML5 PDF Viewer SDK to view, annotate, create and convert PDF
multiple file formats or export PDF to Word, Tiff and RasterEdge provide HTML5 PDF Viewer and Editor to help C# users to view, annotate, convert and edit
www.rasteredge.com
software application project:VB.NET PDF Convert to Word SDK: Convert PDF to Word library in vb.
Why do we need to convert PDF to Word file in VB.NET class PDF to Word conversion lies in the fact that compared to PDF document format, Word file is
www.rasteredge.com
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 23 
IPTC within XMP 
In contrast to the earlier IPTC-IIM specification, the most recent IPTC Core specification allows storing 
IPTC properties as XMP. Most of the properties are mapped to existing standard namespaces but for 
those where this was not possible, a new namespace “http://iptc.org/std/Iptc4xmpCore/1.0/xmlns/” has 
been introduced. The IPTC group encourages people to move from IPTC-IIM to its newer IPTC Core / 
IPTC Extension standard. 
With that said, this document focuses on the interoperability between existing applications and is 
mainly concerned with the reconciliation between the earlier IPTC-IIM standard and XMP, 
concentrating on the areas discussed in this document. There is no “reconciliation between XMP and 
IPTC Core” - everything is in XMP. 
4.2.3 Metadata reconciliation guidance 
The process of handling metadata values from the various metadata formats is basically divided into 
three different scenarios which will be discussed in the following chapters: 
Read/Write Exif and XMP metadata 
Read/Write IPTC-IIM and XMP metadata 
Read/Write Exif, IPTC-IIM and XMP metadata 
4.2.3.1 Handling Exif and XMP 
This chapter discusses reconciliation guidance between Exif and XMP: 
Reading Exif and XMP 
Only a few properties are actually mapped between Exif and XMP and are therefore relevant for 
reconciliation. These are: 
Date/Time 
Description 
Copyright 
Creator 
Since only a few properties are mapped between Exif and XMP, they are dealt with on a property-by-
property basis. Unlike IPTC-IIM, as seen later, there is no advantage in using a checksum value to 
detect changes to the Exif. Especially for consumer use, there is generally no loss of fidelity when 
preferring Exif over XMP.  
software application project:VB.NET PDF: Basic SDK Concept of XDoc.PDF
VB.NET programmers can convert Word, Excel, PowerPoint Tiff, Jpeg Conversely, conversion from PDF to Word (.docx) and paste, cut, rotate, and save PDF page(s
www.rasteredge.com
software application project:How to C#: Basic SDK Concept of XDoc.PDF for .NET
C# programmers can convert Word, Excel, PowerPoint Tiff, Jpeg, Bmp Conversely, conversion from PDF to Word (.docx) and paste, cut, rotate, and save PDF page(s
www.rasteredge.com
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 24 
Here is a detailed look: 
Figure 4 - Read guidance Exif/TIFF 
If either Exif or XMP is available (1 & 2) reading metadata is straightforward.  
Note: Today, there are two scenarios where Exif metadata is being mapped into XMP: 
Exif native properties mapped to respective XMP properties (e.g. Exif Copyright 
XMP (dc:rights)) 
Exif and TIFF device properties duplicated into specific “exif:” or “tiff:” namespaces 
(e.g. Exif ApertureValue 
XMP (exif:ApertureValue)) 
In particular, for scenario (1), this means Exif and Tiff device properties SHOULD be read directly from 
the respective “exif:” and “tiff:” XMP namespaces. This is the case when the file does not natively 
support Exif. 
The scenario “Read both XMP and Exif but prefer Exif” (3) is the most interesting one: In general, a 
Consumer SHOULD prefer the values from Exif. As we'll see in more detail below, Exif can be 
preferred when reading because it does not have encoding or length limitations with respect to XMP. 
The policy for Changers ensures that newer applications write consistent values; preferring Exif when 
reading supports older applications. 
It is, however, important to carefully read and follow the individual property mappings described in 
section “5. Metadata Guidelines” of this document. For example, the XMP (dc:description) value 
supports multiple languages, the corresponding Exif maps to a specific one of these.  
software application project:C# TIFF: TIFF Editor SDK to Read & Manipulate TIFF File Using C#.
Convert Tiff file to bmp, gif, png, jpeg, and scanned PDF with high fidelity in C#. 2. Render text to text, PDF, or Word file. Tiff Metadata Editing in C#.
www.rasteredge.com
software application project:VB.NET PDF Library SDK to view, edit, convert, process PDF file
Able to render and convert PDF document to/from to integrate and perform PDF text extraction feature in offers robust APIs for editing PDF document hyperlink
www.rasteredge.com
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 25 
The following diagram explains how to read Exif and XMP on a per property level in more detail: 
Figure 5 - Reconciling properties for Exif and XMP 
For broader compatibility with non-compliant Creators and Changers, a Consumer SHOULD verify 
whether Exif text values are valid UTF-8. If not, a Consumer MAY assume the value is in a “local 
encoding” and convert it to UTF-8 as described under “Text encodings in read and write scenarios” 
below. 
Writing Exif and XMP 
In the context of the actor definitions, the following rules describe the guidance on how to write XMP 
and/or Exif: 
Creator 
XMP metadata MAY be created if a property can be written in both locations otherwise 
it MUST be created (which is true for file formats where Exif is not defined). 
If no XMP is written, Exif metadata MUST be created. 
Changer 
Exif and XMP metadata SHOULD be consumed according the reconciliation guidance 
described earlier (see “Reading Exif and XMP” above). 
When the file format supports both Exif and XMP, a Changer SHOULD update both 
forms of a value. If only one form is updated, an existing value in the other form MUST 
be removed. 
In the case the file format does support Exif natively, Exif and TIFF device properties 
(e.g. XResolution, YResolution, WhitePoint, etc.) SHOULD NOT be duplicated in the 
XMP exif: and tiff: namespaces. 
Exif metadata is formatted as a TIFF stream, even in JPEG files. TIFF streams have 
an explicit indication of being big endian or little endian. A Changer SHOULD 
preserve the existing byte-order. 
software application project:VB.NET PDF Converter Library SDK to convert PDF to other file
MS Word 2003, 2007 and above versions are supported For how to convert PDF to HTML document in VB.NET application, a simple and easy VB Conversion of PDF to Text.
www.rasteredge.com
software application project:VB.NET PDF File Merge Library: Merge, append PDF files in vb.net
Merge Microsoft Office Word, Excel and PowerPoint data to PDF form. mature library SDK which adds powerful Portable Document Format (PDF) editing solutions and
www.rasteredge.com
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 26 
Exif string values SHOULD be written as UTF-8. However, clients MAY write ASCII to 
allow broader interoperability
2
A checksum value for Exif/TIFF SHOULD NOT be written into the XMP. 
If no existing data is in the file, the Creator guidance SHOULD be followed. 
4.2.3.2 Handling IPTC-IIM and XMP 
This chapter discusses reconciliation guidance between IPTC-IIM and XMP: 
Reading IPTC-IIM and XMP 
The use of IPTC-IIM is significant in professional workflows, and is also present in some consumer 
oriented tools. Although this document only directly addresses a few IPTC-IIM fields, there are several 
dozen in professional use. The IPTC-IIM values have length limitations and often character encoding 
issues that can make a conversion from XMP to IPTC-IIM be lossy. 
For efficiency, and to avoid certain character encoding problems, a checksum (or digest) is used to 
detect overall changes to the IPTC-IIM values by non-compliant Changers - specifically those 
unaware of XMP. This checksum detects that something has changed in the IPTC-IIM block as a 
whole, but not specifically what has changed. Further checks are then required to detect individual 
property changes. 
The checksum value is an MD5 hash of the entire IPTC-IIM block, and is stored as a 16 byte binary 
value in Photoshop Image Resource (PSIR) 1061 (see “Writing IPTC-IIM and XMP” for more details). 
The checksum MUST be computed and stored when a Creator or Changer writes XMP and IPTC-IIM 
simultaneously. A Consumer MUST use the checksum as described below when reading XMP and 
IPTC-IIM. 
2
It is understood that writing UTF-8 in Exif is formally in violation of the Exif specification, which requires 7-bit 
ASCII in most cases. Some devices (cameras and printers) will not be able to display non-ASCII characters. 
software application project:C# PDF url edit Library: insert, remove PDF links in C#.net, ASP.
Free online C# class source code for editing PDF hyperlink in Visual Studio .NET Keep Microsoft Office Word, Excel and PowerPoint links in PDF document.
www.rasteredge.com
software application project:VB.NET TIFF: Read, Edit & Process TIFF with VB.NET Image Document
Windows and mobile viewers establishing; text & graphics Started with VB.NET TIFF Editing, VB.NET powerful & profession imaging controls, PDF document, image to
www.rasteredge.com
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 27 
Now let's have a look at the Consumer guidance on how to read IPTC-IIM related metadata first: 
Figure 6 - Read guidance IPTC-IIM 
In the case when either IPTC-IIM or XMP is available the read scenario is trivial (1 & 2).  
However, scenarios (3) and (4) are more complex and require further explanation: 
In scenario (3) either the checksum exists but matches the IPTC-IIM block or the checksum does not 
exist. In either case the following rules apply: 
Any existing XMP value is assumed to be more relevant and SHOULD be preferred. 
If an XMP value is missing then the IPTC-IIM value SHOULD be used.  
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 28 
The following diagram explains how to read IPTC-IIM and XMP on a per property level in this 
scenario: 
Figure 7 – Reconciling properties for IPTC-IIM and XMP 
Finally, scenario (4) occurs when a non-compliant (XMP-unaware) Changer has exclusively modified 
the IPTC-IIM block. In this case a Consumer SHOULD check each property to decide if the IPTC-IIM 
or XMP value is used. This approach prevents loss of information in unchanged values due to 
truncation or character encoding. To do the check, the XMP value is used to create a predicted IPTC-
IIM value, taking value truncation and character encoding into account. If the predicted and actual 
IPTC-IIM values match, then the XMP value is used. Otherwise the IPTC-IIM value is used. 
Consumer MUST honor the encoding information provided by any IPTC-IIM Coded Character Set 
1:90 DataSet that specifies UTF-8 - it SHOULD honor other 1:90 encodings. If this is not present, a 
Consumer MAY assume the value is in a “local encoding” and convert it to UTF-8 as described under 
“Text encodings in read and write scenarios”. 
Writing IPTC-IIM and XMP 
The following rules describe the guidance on how to write XMP and/or IPTC-IIM: 
Creator 
SHOULD NOT create IPTC-IIM unless backward compatibility with non-compliant 
Consumers that don't read XMP is a requirement – otherwise SHOULD write XMP.  
If IPTC-IIM and XMP are both written, a Creator MUST create the checksum value as 
described earlier. 
Changer 
XMP and IPTC-IIM SHOULD be consumed according the reconciliation guidance 
described above. 
If IPTC-IIM is already in the file, a Changer SHOULD write data back to the file in both 
XMP and IPTC-IIM – otherwise only XMP SHOULD be written. 
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 29 
IPTC-IIM SHOULD be written using the Coded Character Set (1:90) as UTF-8 (see 
“Section 1.6 Coded Character Set” in the IIM specification). 
If the IPTC-IIM has not been written in UTF-8 before, a robust Changer SHOULD 
convert all properties to UTF-8 and write the corresponding identifier for UTF-8 to the 
1:90 DataSet. 
If IPTC-IIM and XMP are both present, whether changed or not, a Changer MUST 
create or update the checksum value as described earlier. 
If no existing metadata is in the file, the Creator guidance SHOULD be followed. 
IPTC-IIM checksum 
In the example of IPTC-IIM, the checksum MUST be calculated over the entire IIM block after values 
have been converted from XMP. The checksum itself MUST be stored in the Photoshop Image 
Resource (PSIR) 1061 resource as a 16-byte binary value representing the MD5 hash over the whole 
IIM block. 
Example: 
PSIR (1061) = 0ED63323337C50BF1E3BA76F6BB2122F 
4.2.3.3 Handling Exif/TIFF, IPTC-IIM and XMP metadata 
This chapter discusses reconciliation guidance between Exif, IPTC-IIM and XMP: 
There are four properties that are defined in all metadata formats being discussed. Because the 
reconciliation guidance is specific to each property, please see section “Metadata Guidelines” later in 
this document for more details. If there is a conflict between Exif and IPTC-IIM, a Consumer SHOULD 
prefer Exif in the case the IPTC-IIM checksum matches or does not exist and SHOULD prefer IPTC-
IIM in the case the checksum does not match. A string property that is comprised of only spaces or 
only nul characters MUST be treated as non-existent. 
Upon writing Exif metadata, a Changer MUST update all formats that were originally present in the file. 
If not all of the formats were originally present, a Changer MAY choose to write the complete set. 
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 30 
4.2.3.4 More complex reconciliation in popular image formats 
Finding and interpreting the metadata embedded in JPEG, TIFF, and PSD files is complicated by the 
fact that all three file formats contain the same kinds of metadata (XMP, Exif/TIFF, and IPTC-IIM), but 
store it slightly differently. 
For example, all of the kinds of metadata can be contained in Photoshop Image Resources (PSIRs), 
and all three file formats (JPEG, TIFF, and PSD) can contain PSIRs. However, the specific contents of 
the PSIRs are different when contained in different image file formats. Each type of metadata is stored 
inside the PSIR for some file formats, and separately for others. 
However, the recursive embedding of metadata formats is more a theoretical possibility, so this 
document will simplify this process by identifying the three most relevant places to find Exif, IPTC-IIM 
and XMP (highlighted below). 
Here are illustrations of the various image file formats: 
JPEG file format 
Figure 8 - JPEG file format 
XMP SHOULD be read from the XMP APP1 section, IPTC-IIM SHOULD be read from the image 
resource block in Photoshop APP13 (1028) and finally Exif SHOULD be read from the Exif APP1 
section. All other occurrences SHOULD be ignored. Please note that the APP markers SHOULD be 
written according to the Exif specification. In particular, Exif APP1 MUST follow immediately after SOI. 
If this is not the case, current camera models may not show Exif metadata correctly. 
Documents you may be interested
Documents you may be interested