mvc view pdf : Convert pdf to txt software application cloud windows winforms html class mwg_guidance1-part1967

Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 11 
2.1 About the Metadata Working Group 
Based on a 2006 proposal by Microsoft, the Metadata Working Group (MWG) organization was 
created in 2007 by 5 founding members: Apple, Adobe, Canon, Microsoft and Nokia. Sony joined this 
initiative in 2008.  
The goals are: 
Preservation and seamless interoperability of digital image metadata.  
Interoperability and availability of metadata to all applications, devices, and services. 
Enabling emerging metadata-based workflows.  
The organization is based on a formal legal framework and royalty free intellectual property policy that 
allows member companies and other industry leaders to collaborate on a solution to the above 
problems. The efforts of the MWG are organized into initiatives. The continuation of MWG’s first 
initiative (covered in this document) addresses issues of digital imaging metadata for typical 
consumers. Future initiatives might deal with metadata for professional photography, audio and video 
metadata, etc. 
2.2 Scoping the work 
Consumer sharing of still images has exploded with the maturing of Internet services for the storage, 
manipulation and sharing of pictures. However, the majority of standards related to still images are 
oriented towards documenting the creation of an image or towards professional usage and 
management of images (e.g. in print media). Little provision is made for the consumer who simply 
wants to share images with friends, manage their snapshots, or be creative with their photos. The 
intention of this document is to use and extend existing standards to address the key organizational 
metadata questions that most consumers have: 
Who is involved with this image? (who took it, who owns it, who’s in it?) 
What is interesting about this image? 
Where is this image from? 
When was this image created or modified? 
The goal of this document is to provide best practices for solving interoperability issues in the 
consumer space.  
When we look at the “four Ws” (who, what, where, when), it is clear that this data can range from 
highly precise (e.g. GPS latitude/longitude) to extremely vague or context-dependent (e.g. “In my back 
yard”). This document does not try to solve the difficult semantic issues around this problem; rather, it 
tries to ensure that semantically equivalent metadata is identified across standards, and if it exists, 
that best practice is followed to use semantically well-defined properties for that metadata. The key 
notions of “reconciliation” and “rationalization” for the consumer space define the scope of this initial 
work. 
Convert pdf to txt - software application cloud:C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net, ASP.NET MVC, WinForms, WPF application
C# PDF to Text (TXT) Converting Library to Convert PDF to Text
www.rasteredge.com
Convert pdf to txt - software application cloud:VB.NET PDF Convert to Text SDK: Convert PDF to txt files in vb.net, ASP.NET MVC, WinForms, WPF application
VB.NET Guide and Sample Codes to Convert PDF to Text in .NET Project
www.rasteredge.com
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 12 
2.3 Digital imaging metadata initiative 
The scope of this effort is focused on the metadata of still images, with particular attention given to 
consumer workflows. While the guidance has been augmented to include some important new 
consumer use cases, the effort remains centered upon solving a specific set of problems, outlined 
below: 
Issues addressed in this document 
Interoperability and preservation of metadata between processes (devices, 
applications, platforms and services), file formats and metadata standards. 
Overlapping fields between existing standards and schemata. 
Need for guidance on emerging consumer metadata. 
These issues have been addressed by the creation of: 
A usage and data model based on common consumer use cases. 
Actor definitions of the roles each device or application plays when interacting with 
metadata. 
Best practices regarding how, when and where metadata should be changed in 
popular consumer still image file formats using existing industry metadata standards. 
Rationalization of common and important consumer metadata fields between existing 
standards. 
New schemata for emerging metadata that are not currently addressed in digital asset 
workflows. 
Specific non-goals for this document 
To define new metadata structures, storage formats, or standards where appropriate 
alternatives already exist. 
software application cloud:Online Convert PDF to Text file. Best free online PDF txt
library from RasterEdge PDF document conversion SDK provides reliable and effective .NET solution for Visual C# developers to convert PDF document to editable
www.rasteredge.com
software application cloud:VB.NET Create PDF from Text to convert txt files to PDF in vb.net
Batch convert editable & searchable PDF document from TXT formats in VB.NET class. ' txt convert to pdf Dim txt As BaseDocument = New RasterEdge.XDoc.Converter
www.rasteredge.com
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 13 
2.4 Relationship to standards organizations 
There are a number of established standards, such as Exif and IPTC, which are widely used by the 
digital photography industry. This effort is not intended to replace existing industry standards, but 
rather to build on them by providing resources to improve interoperability and metadata preservation 
between them. This is based on significant understanding of the industry (customers, scenarios, 
technologies) and experience in building the products that capture, process, store, share and transmit 
digital photographs.  
This document, “Guidelines For Handling Image Metadata”, is designed to help guide developers by 
providing best practices on how to create, read and modify metadata within digital images. It’s also 
designed to motivate the owners of metadata standards and formats to think about preservation, 
interoperability, and compatibility in general terms. 
software application cloud:C# Create PDF from Text to convert txt files to PDF in C#.net, ASP
Now you can convert text file to PDF document using Sample code for text to PDF converting in C# DocumentConverter.ToDocument(@"C:\input.txt", @"C:\output.pdf
www.rasteredge.com
software application cloud:VB.NET PDF - Convert PDF with VB.NET WPF PDF Viewer
2. To TIFF. Export PDF to TIFF file format. 3. To TXT. Export and convert PDF to TXT file. 4. To Image. Convert PDF to image formats, such as PNG, JPG, BMP and
www.rasteredge.com
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 14 
2.5 Definition of terms 
Digest 
A checksum value to help identify changes between the metadata formats 
Dublin Core 
A metadata element set. It includes all DCMI terms (i.e. refinements, 
encoding schemes and controlled vocabulary terms) intended to facilitate 
discovery of resources. 
Exif 
“Exchangeable image file format” – a standard for image file formats, 
jointly managed by Japan Electronics and Information Technology 
industries Association (JEITA) and Camera and Imaging Products 
Association (CIPA) 
IPTC 
“International Press Telecommunications Council” – creator and maintainer 
of metadata standards 
IPTC-IIM   
“Information Interchange Model” – IPTC multimedia metadata standard 
IPTC Core 
IPTC photo metadata standard based on XMP 
IPTC Extension 
Extended IPTC photo metadata standard based on XMP 
JPEG 
A file format, widely used in image and photography workflows 
MWG 
“Metadata Working Group” – Industry consortium responsible for this 
document 
PSD 
The native Adobe Photoshop file format 
RDF 
The “Resource Description Framework (RDF)”, described by the W3C as a 
“framework for representing information in the Web”, has become a 
general model for representing metadata  
TIFF 
The “Tagged Image File Format (TIFF)” is a file format to store images as 
well as photography. 
Unicode   
Unicode is an industry standard to consistently represent characters and 
text within modern software and hardware systems  
UTF-8 
UTF-8 is a byte-oriented encoding form of Unicode 
URI 
Universal Resource Identifier 
XMP 
“Extensible Metadata Platform” – multimedia metadata standard 
introduced by Adobe 
software application cloud:C# WPF PDF Viewer SDK to convert and export PDF document to other
2. To TIFF. Export PDF to TIFF file format. 3. To TXT. Export and convert PDF to TXT file. 4. To Image. Convert PDF to image formats, such as PNG, JPG, BMP and
www.rasteredge.com
software application cloud:C# PDF Converter Library SDK to convert PDF to other file formats
Allow users to convert PDF to Text (TXT) file. It's easy to be integrated into your C# program and convert PDF to .txt file with original PDF layout.
www.rasteredge.com
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 15 
3. USAGE AND DATA MODEL 
For a better understanding of the proposed guidance in this document, this chapter introduces the 
notion of different actors that play specific roles in metadata processing. These definitions will be used 
throughout the document to discuss the rules on how to handle metadata across the different formats. 
3.1 Actor definition 
In the actor model, the flow of an image file is represented as a series of states between multiple 
applications (actors). It starts with the Creator actor, going through Changer actors and ending at the 
Consumer actor. In this model, all actors are essentially black boxes in which the processing actions, 
specific to each actor, are neither known nor considered important from the model’s point of view. 
However, the state of the metadata in the image file is communicated between each phase. 
Figure 1 - Actor state diagram 
An application is defined to be compliant if it reads and writes metadata in accordance with this 
document. There may also be non-compliant applications modifying metadata between two actors. It 
is not always possible to detect such modifications, so any compliant application must also accept 
non-compliant metadata. 
This document presents the rules on how to handle a small set of selected metadata fields in a 
compliant manner. The roles which are defined in this document are covered for two main reasons: 
firstly, to attempt to clarify the purpose of the selected fields, and secondly, to show how to apply 
similar metadata handling to fields not covered here. An application can function in different roles at 
different times but every time it touches metadata, it does so only in one of these roles. 
3.1.1 Creator 
Creator application creates the first instances of metadata in a new (image) file. It is usually (though 
not necessarily) the same application that creates the image data, e.g. an image processing 
application, a digital camera or a cell phone. One common aspect of a Creator application is that 
there is no old metadata to preserve.  
Creator must meet these criteria: 
It MUST have full knowledge of all metadata it is creating. 
It MUST always create standard compliant metadata in at least one form, as specified 
in this document. 
software application cloud:VB.NET PDF - WPF PDF Viewer for VB.NET Program
PDF control. Users can export and convert PDF to Word, Tiff, TXT and various of image file formats. Print PDF in WPF PDF Viewer.
www.rasteredge.com
software application cloud:C# PDF - Extract Text from Scanned PDF Using OCR SDK
NET convert PDF to text, C#.NET convert PDF to images C:\input.pdf"); BasePage page = pdf.GetPage(0 ocrPage.Recognize(); ocrPage.SaveTo(MIMEType.TXT, @"C:\output
www.rasteredge.com
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 16 
Another scenario is an image editing application that creates a new file after consuming information 
from an existing one. In general, producing a new file from an existing one can be treated as a role of 
Changer since metadata is not created but instead repurposed. Therefore please refer to the 
Changer definition below for more guidance. 
3.1.2 Changer 
Changer application first reads metadata from an image file and then writes new or modified 
metadata back to a file.  
The rules for an application in the Changer role are: 
Deletion of metadata MUST only be done with specific intent. 
It SHOULD obey rules for Consumer applications when reading metadata. 
It SHOULD keep all forms of metadata it modifies in sync with one another. 
The first rule pertains to the preservation of metadata. Descriptive metadata, information added by a 
user, must only be deleted by explicit user intent. Non-descriptive metadata may however be deleted 
with explicit intent. It should only be modified or deleted if it is known to be inaccurate or problematic. 
The second rule follows from the observation that the Changer application is also a Consumer 
application, so it should also observe all Consumer application rules. 
Finally, the third rule states that whenever the Changer application writes new metadata fields to the 
file, it should keep different forms existing in the file, e.g. Exif, IPTC-IIM and XMP, in sync with one 
another. The first rule and third rule also apply to a changer that wishes to not write all forms of a 
metadata item. Writing one form and deleting other forms is a legitimate intentional deletion, done to 
avoid unsynchronized forms in the file. 
3.1.3 Consumer 
Consumer application only reads metadata from the image file. It may use metadata for display 
purposes, searching, content organization, etc. but it never modifies the metadata in the file itself.  
General rules for Consumer application are: 
It MUST reconcile between different forms of metadata in the image. 
It MUST use metadata according to the semantics defined for each field. 
The first rule says that a Consumer application must process metadata according to policies defined 
in this document and then only the reconciled data is used further before it is presented to the end-
user. This may involve, for example, resolving possibly conflicting information between Exif, IPTC-IIM 
and XMP versions of a metadata field existing in the image file. 
The second rule says that applications must understand the semantics of desired metadata fields and 
use them appropriately. For example, in order to reconcile different forms of metadata, the application 
must know the semantics of the metadata in question. 
In summary, the Consumer application treats image files as read-only so the state of the metadata 
remains unchanged. 
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 17 
Tools designed to display technical details about the format and content of the file’s metadata, but not 
intended to primarily express metadata semantic meaning, are not required to be compliant 
Consumer applications. 
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 18 
4. METADATA MANAGEMENT 
Metadata is an essential part of image and photography based workflows. Cameras capture device 
metadata while taking pictures. Operating systems and other software subsequently read metadata to 
build up catalogs and offer effective search capabilities. In addition to this, the user is able to enhance 
this workflow with their own metadata that may be stored either inside the file or within caching or 
database systems. 
In the context of consumer image-based workflows, the existence of different metadata standards 
leads to interoperability issues when using various devices, operating systems and software tools. 
Although the majority of metadata properties are unique, there are a number of properties which 
overlap across several metadata standards and cause interoperability issues as a consequence. 
The goal of this section is to identify those overlapping properties and provide guidance on how to 
handle them correctly across the different metadata formats. 
After a brief overview of existing metadata standards, this chapter introduces the most common 
metadata properties in the context of consumer workflows. To ensure best interoperability across 
software and hardware systems, a general reconciliation mechanism is then discussed. Finally, the 
chapter will close with a detailed analysis of each focus area and discuss specific technical issues and 
obstacles. 
4.1 Existing metadata standards  
This section gives an overview of the existing metadata formats. As described in the introduction, this 
document will focus on photography workflows in the context of the consumer, so the choice of 
discussed metadata formats covers Exif, IPTC-IIM and XMP. 
Exif - Exchangeable image file format  
The Exif standard has been jointly managed by the Japan Electronics and Information Technology 
industries Association (JEITA
1
) and Camera and Imaging Products Association (CIPA). In particular, 
the Exif image interchange format defines a set of TIFF tags that describe photographic images, and 
is widely used by digital cameras. Exif metadata can be found in TIFF, JPEG, and PSD files. 
DCF - Design rule for Camera File system 
As digital still cameras (DSC) have grown enormously in popularity, there is a growing need for the 
direct exchange of images between cameras and other equipment, allowing pictures taken on one 
camera to be viewed on another, or to be sent to a printer. The DCF specification is intended to 
simplify the interchange of files between digital still cameras and other equipment. To this end, it 
specifies rules for recording, reading and handling image files and other related files used by DSC and 
other equipment. Among other things, DCF defines a subset of Exif where some properties are 
optional in Exif but required in DCF. 
http://www.jeita.or.jp  
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 19 
IPTC – International Press Telecommunication Council   
IPTC, based in London, UK, is a consortium of the world's major news agencies, news publishers and 
news industry vendors. It develops and maintains technical standards for improved news exchange 
that are used by virtually every major news organization in the world. 
In 1979, the first IPTC standard was text-only and defined to protect the interest of the 
telecommunications industry. 
http://www.iptc.org 
Later, in 1991, a new standard, the “Information Interchange Model” (IIM), was created. IIM is an 
envelope format for transmitting news text documents and photos, and it defines the so-called “IPTC 
headers” which now exist in many photo files, having been inserted by Adobe Photoshop and similar 
software. 
http://www.iptc.org/IIM  
After Adobe had introduced XMP in 2001, the IPTC Core and IPTC Extension standards have adopted 
XMP as the successor to the IIM-based “IPTC header” used to describe millions of professional digital 
images. 
http://www.iptc.org/photometadata 
XMP - Adobe's Extensible Metadata Platform 
XMP is a labeling technology that allows you to embed metadata into a file itself. With XMP, desktop 
applications and back-end publishing systems gain a common method for capturing, sharing, and 
leveraging this valuable metadata - opening the door for more efficient job processing, workflow 
automation, rights management and many other potential improvements. XMP standardizes the 
definition, creation and processing of extensible metadata.  
XMP defines a metadata model that can be used with any defined set of metadata items. XMP also 
defines particular schemata for basic properties useful for recording the history of a resource as it is 
processed; from being photographed, scanned, or authored as text, through photo editing steps (such 
as cropping or color adjustment), to assembly into a final image. XMP allows each software program 
or device along the way to add its own information to a digital resource, which can then be retained in 
the final digital file. 
XMP is serialized in XML and stored using a subset of the W3C Resource Description Framework 
(RDF). Therefore, customers can easily define their own custom properties and namespaces to 
embed arbitrary information into the file. 
http://www.adobe.com/products/xmp 
Guidelines For Handling Image Metadata 
Metadata Working Group 
__________________________________________________________________________
__________________________________________________________________________ 
www.metadataworkinggroup.org 
Page 20 
4.2 Metadata formats within image files 
There are three metadata formats widely used in the industry: 
Exif 
IPTC-IIM 
XMP 
Within this section, guidance for reconciling and writing metadata across these metadata formats is 
discussed. Refer to the respective specification for details on reading, writing, or modifying metadata 
in each format. 
4.2.1 Handling a single metadata format 
In the simplest scenario, a given metadata property is only defined in a single metadata format. This is, 
for example, true for the rating property - this value should always be read and written into the 
corresponding XMP (xmp:Rating) field. No further reconciliation is necessary. Also, there are a variety 
of properties defined in Exif (device properties) or in IPTC-IIM (workflow properties) that are unique to 
the container and won't be reconciled amongst the other formats. 
4.2.2 Handling multiple metadata formats 
Dealing with more than one metadata format makes it challenging to determine the correct behavior 
for handling the particular property values. The main difficulty is the evolution of metadata 
representations and standards where older applications are not aware of newer practices. This can 
happen within a standard, such as the introduction of Unicode storage for IPTC-IIM. It can also 
happen across standards, such as with the introduction of XMP. Inconsistent implementations across 
software tools, encoding requirements, as well as size limitations on metadata properties cause 
additional challenges. 
The properties described earlier have been identified as the most relevant in the consumer workflows 
today. However, they also serve another purpose in this document. Nearly all of them are defined in 
more than one metadata format, so they are good candidates for helping to understand the 
reconciliation issues between the various formats. In other words, if the problems for these properties 
are well understood, all other metadata properties can be handled accordingly. 
Here is a simplified view of metadata for which guidance is being provided: 
Documents you may be interested
Documents you may be interested