how to view pdf in c# : Extract jpg pdf control application system azure web page asp.net console css-media-type-print0-part1314

Portable Document Format
Adobe PDF icon
Filename
extension
.pdf
Internet
media type
application/pdf application/x-pdf application/x-bzpdf
application/x-gzpdf
Type code 'PDF ' (including a single space)
Uniform
Type
Identifier
com.adobe.pdf
Magic
number
%PDF
Developed
by
Adobe Systems
Initial
release
1993
Latest
release
1.7
Extended
to
PDF/A, PDF/E, PDF/UA, PDF/VT, PDF/X
Standard(s) ISO 32000
Website
Adobe PDF Reference Archives
(http://www.adobe.com/devnet/pdf/pdf_reference_archive.html)
Portable Document Format
From Wikipedia, the free encyclopedia
(Redirected from Pdf)
Portable Document
Format (PDF) is a file
format used to represent
documents in a manner
independent of application
software, hardware, and
operating systems.
[1]
Each
PDF file encapsulates a
complete description of a
fixed-layout flat document,
including the text, fonts,
graphics, and other
information needed to
display it. In 1991, Adobe
Systems co-founder John
Warnock outlined a system
called "Camelot"
[2]
that
evolved into PDF.
While Adobe Systems
made the PDF
specification available free
of charge in 1993, PDF
remained a proprietary
format, controlled by
Adobe, until it was officially
released as an open
standard on July 1, 2008,
and published by the
International Organization
for Standardization as ISO
32000-1:2008.
[3][4]
In
2008, Adobe published a
Public Patent License to
ISO 32000-1 granting
royalty-free rights for all patents owned by Adobe that are necessary to make, use, sell and distribute
PDF compliant implementations.
[5]
Contents
1 History
1.1 Adobe's PDF specifications
1.1.1 Adobe's versions
1.2 Standardization
1.2.1 Specialized subsets of PDF
1.2.2 Full function PDF
1.2.2.1 PDF 1.7
Extract jpg pdf - Select, copy, paste PDF images in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document
extract image from pdf java; some pdf image extractor
Extract jpg pdf - VB.NET PDF Image Extract Library: Select, copy, paste PDF images in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document
extract images from pdf files without using copy and paste; some pdf image extractor
1.2.2.2 PDF 2.0
1.2.3 ISO TC 171 SC 2 WG 8
2 Technical foundations
2.1 PostScript
3 Technical overview
3.1 File structure
3.2 Imaging model
3.2.1 Vector graphics
3.2.2 Raster images
3.2.3 Text
3.2.3.1 Fonts
3.2.3.2 Standard Type 1 Fonts (Standard 14 Fonts)
3.2.3.3 Encodings
3.2.4 Transparency
3.3 Interactive elements
3.3.1 AcroForms
3.3.1.1 Forms Data Format (FDF)
3.3.1.2 XML Forms Data Format (XFDF)
3.3.2 Adobe XML Forms Architecture (XFA)
3.4 Logical structure and accessibility
3.5 Security and signatures
3.5.1 Usage rights
3.6 File attachments
3.7 Metadata
3.8 Subsets
4 Future
4.1 Mars
4.2 CSS3 and EPUB
5 Technical issues
5.1 Accessibility
5.2 Viruses and exploits
5.3 Usage restrictions and monitoring
5.4 Default display settings
6 Content
7 Implementations
8 Editing
9 Annotation
10 Other applications and functionalities
11 See also
12 References
13 Further reading
14 External links
History
PDF was developed in the early 1990s as a way to share documents, including text formatting and
inline images, among computer users of disparate platforms who may not have access to mutually-
compatible application software.
[6]
It was among a number of competing formats such as DjVu (still
developing), Envoy, Common Ground Digital Paper, Farallon Replica and even Adobe's own
PostScript format (.ps). In those early years before the rise of the World Wide Web and HTML
documents, PDF was popular mainly in desktop publishing workflows.
PDF's adoption in the early days of the format's history was slow.
[7]
Adobe Acrobat, Adobe's suite for
reading and creating PDF files, was not freely available; early versions of PDF had no support for
C# PDF Convert to Jpeg SDK: Convert PDF to JPEG images in C#.net
NET library to batch convert PDF files to jpg image files. High Turn multiple pages PDF into single jpg files respectively online. Support
extract image from pdf file; extract pictures pdf
VB.NET PDF Convert to Jpeg SDK: Convert PDF to JPEG images in vb.
PDF to images, C#.NET PDF file & pages edit, C#.NET PDF pages extract, copy, paste, C# NET components to batch convert adobe PDF files to jpg image files.
extract text from pdf image; how to extract images from pdf files
external hyperlinks, reducing its usefulness on the Internet; the larger size of a PDF document
compared to plain text required longer download times over the slower modems common at the time;
and rendering PDF files was slow on the less powerful machines of the day.
From version 2.0 onwards Adobe distributed its Acrobat Reader (now Adobe Reader) program free
of charge,
[8]
and continued supporting the original PDF, which eventually became the de facto
standard for printable documents on the web (a standard web document).
In 2008 Adobe Systems' PDF Reference 1.7 became ISO 32000:1:2008. Thereafter, further
development of PDF (including PDF 2.0) is conducted by ISO's TC 171 SC 2 WG 8 with the
participation of Adobe Systems' and other subject matter experts.
Adobe's PDF specifications
Adobe changed the PDF specification a few times and continues to develop new specifications with
new versions of Adobe Acrobat. There have been nine versions of PDF with corresponding Acrobat
releases:
[9]
1993 – PDF 1.0 / Acrobat 1.0
1994 – PDF 1.1 / Acrobat 2.0
1996 – PDF 1.2 / Acrobat 3.0
2000 – PDF 1.3 / Acrobat 4.0
2001 – PDF 1.4 / Acrobat 5.0
2003 – PDF 1.5 / Acrobat 6.0
2005 – PDF 1.6 / Acrobat 7.0
2006 – PDF 1.7 / Acrobat 8.0
2006 – PDF 1.7 / Acrobat 8.2
2008 – PDF 1.7, Adobe Extension Level 3 / Acrobat 9.0
2009 – PDF 1.7, Adobe Extension Level 5 / Acrobat 9.1
The ISO standard ISO 32000-1:2008 and Adobe PDF 1.7 are technically consistent.
[10]
Adobe
declared that it is not producing a PDF 1.8 Reference. Future versions of the PDF Specification will
be produced by ISO technical committees. However, Adobe published documents specifying what
extended features for PDF, beyond ISO 32000-1 (PDF 1.7), are supported in its newly released
products. This makes use of the extensibility features of PDF as documented in ISO 32000-1 in Annex
E.
The specifications for PDF are backward inclusive. The PDF 1.7 specification includes all of the
functionality previously documented in the Adobe PDF Specifications for versions 1.0 through 1.6.
Where Adobe removed certain features of PDF from their standard, they are not contained in ISO
32000-1
[3]
either.
PDF documents conforming to ISO 32000-1 carry the PDF version number 1.7. Documents
containing Adobe extended features still carry the PDF base version number 1.7 but also contain an
indication of which extension was followed during document creation.
[11]
Adobe's versions
C# Image Convert: How to Convert Adobe PDF to Jpeg, Png, Bmp, &
String inputFilePath = @"C:\input.pdf"; String outputFilePath = @"C:\output.jpg"; // Convert PDF to jpg. C# sample code for PDF to jpg image conversion.
extract images from pdf files; extract images from pdf file
C# Image Convert: How to Convert Tiff Image to Jpeg, Png, Bmp, &
RasterEdge.XDoc.PDF.dll. String inputFilePath = @"C:\input.tif"; String outputFilePath = @"C:\output.jpg"; // Convert tiff to jpg.
pdf image extractor online; extract image from pdf online
Version
Edition
[3]
Year of
publication
New features
Acrobat
Reader
version
support
1.0
First
1993
Carousel
1.1
First,
revised
1996
Passwords, encryption (MD5, RC4 40bit), device-
independent color, threads and links
[12]
2.0
1.2
First,
revised
1996
Interactive page elements (radio buttons, checkboxes
&c); interactive, fill-in forms (AcroForm); Forms Data
Format (FDF) for interactive form data that can be
imported, exported, transmitted and received from the
Web; mouse events; external movie reproduction;
external or embedded sound reproduction; zlib/deflate
compression of text or binary data; Unicode; advanced
color features and image proxying
[12]
3.0
1.3
Second
2000
Digital signatures; ICC and DeviceN color spaces;
JavaScript actions; embedded file streams of any type
(e.g. used for attachments); new annotation types; new
features of the Adobe PostScript Language Level 3
imaging model; masked images; alternate
representations for images; smooth shading;
enhanced page numbering; Web capture — a facility
for capturing information from World Wide Web and
converting it to PDF; representation of logical structure
independently of graphical structure; additional support
for CIDFonts; data structures for mapping strings and
numbers to PDF objects; information for prepress
production workflows support; new functions for several
function object types that represent parameterized
classes of functions
[13][14]
4.0
1.4
Third
2001
JBIG2; transparency; RC4 encryption key lengths
greater than 40 bits (40–128 bits); enhancements to
interactive forms and Forms Data Format (FDF), XML
form submissions, embedded FDF files, Unicode
specification of field export values, remote
collaboration and digital signatures in FDF files;
accessibility to disabled users; metadata streams
using XML — Extensible Metadata Platform (XMP);
tagged PDF; inclusion of printer’s marks; display and
preview of production-related page boundaries; new
predefined CMaps; alternate presentations; importing
content from one PDF document into another;
EmbeddedFiles entry in the PDF document’s name
dictionary — a standard location for the embedded
data;
[14][15]
OCR text layer
[citation needed]
5.0
JPEG 2000; enhanced support for embedding and
playback of multimedia; object streams; cross
reference streams; XML Forms Data Format (XFDF)
for interactive form submission (replaced the XML
format in PDF 1.4); support for forms, rich text
elements and attributes based on Adobe’s XML Forms
Architecture (XFA) 2.02; public-key security handlers
using PKCS#7 (introduced in PDF 1.3 but not
C# Create PDF from images Library to convert Jpeg, png images to
Batch convert PDF documents from multiple image formats, including Jpg, Png, Bmp, Gif, Tiff, Bitmap, .NET Graphics, and REImage.
extract photos from pdf; extract image from pdf in
VB.NET PDF - Convert PDF with VB.NET WPF PDF Viewer
read PDF, VB.NET convert PDF to text, VB.NET extract PDF pages, VB PDF to image file formats with high quality, support converting PDF to PNG, JPG, BMP and
extract images from pdf online; extract image from pdf using
1.5
Fourth
2003
documented in the Reference until 1.5), public-key
encryption, permissions — usage rights (UR)
signatures (does not require document encryption),
PKCS#7 with SHA-1, RSA up to 4096-bits; security
handler can use its own encryption and decryption
algorithms; document sections selectively viewed or
hidden by authors or readers — for items such as CAD
drawings, layered artwork, maps, and multi-language
documents; Alternate Presentations — the only type is
slideshow — invoked by means of JavaScript actions
(Adobe Reader supports only SVG 1.0);
[14][16][17]
support for MS Windows 98 dropped.
6.0
1.6
Fifth
2004
3D artwork, e.g. support for Universal 3D file format;
OpenType font embedding; support for XFA 2.2 rich
text elements and attributes; AES encryption; PKCS#7
with SHA256, DSA up to 4096-bits; NChannel color
spaces; additional support for embedded file
attachments, including cross-document linking to and
from embedded files; enhancements and clarifications
to digital signatures related to usage rights and
modification detection and prevention signatures
[14]
7.0
1.7
(ISO
32000-
1:2008
[3][11]
)
Sixth (ISO
first)
2006
Increased presentation of 3D artwork; XFA 2.4 rich text
elements and attributes; multiple file attachments
(portable collections); document requirements for a
PDF consumer application; new string types:
PDFDocEncoded string, ASCII string, byte string;
PKCS#7 with SHA384, SHA512 and RIPEMD160
8
1.7
Extension
Level 3
2008
256-bit AES encryption; incorporation of XFA
Datasets into a file conforming PDF/A-2; improved
attachment of Flash applications, video (including
Flash video with H.264), audio, and other multimedia,
two-way scripting bridge between Flash and
conforming applications; XFA 2.5 and 2.6 rich text
conventions
9
1.7
Extension
Level 5
2009
XFA 3.0
9.1
1.7
Extension
Level
8
[18]
2011
Specification not published as of May 2011.
[11]
AES-
256 different password handling than in Extension
Level 3.
[19][20]
X (10)
Standardization
Specialized subsets of PDF
The following specialized subsets of PDF specification has been standardized as ISO standards (or
are in standardization process):
[3][21][22][23]
PDF/X (since 2001 - series of ISO 15929 and ISO 15930 standards) - a.k.a. "PDF for
Exchange" - for the Graphic technology - Prepress digital data exchange - (working in ISO
Technical committee 130), based on PDF 1.3, PDF 1.4 and later also PDF 1.6
PDF/A (since 2005 - series of ISO 19005 standards) - a.k.a. "PDF for Archive" - Document
C# WPF PDF Viewer SDK to convert and export PDF document to other
C#.NET PDF file & pages edit, C#.NET PDF pages extract, copy, paste PDF to image file formats with high quality, support converting PDF to PNG, JPG, BMP and
extract image from pdf java; extract jpg pdf
VB.NET Create PDF from images Library to convert Jpeg, png images
Support create PDF from multiple image formats in VB.NET, including Jpg, Png, Bmp, Gif, Tiff, Bitmap, .NET Graphics, and REImage.
how to extract images from pdf in acrobat; extract vector image from pdf
management - Electronic document file format for long-term preservation (working in ISO
Technical committee 171), based on PDF 1.4 and later also ISO 32000-1 - PDF 1.7
PDF/E (since 2008 - ISO 24517) - a.k.a. "PDF for Engineering" - Document management -
Engineering document format using PDF (working in ISO Technical committee 171), based on
PDF 1.6
PDF/VT (since 2010 - ISO 16612-2) - a.k.a. "PDF for exchange of variable data and
transactional (VT) printing" - Graphic technology - Variable data exchange (working in ISO
Technical committee 130), based on PDF 1.6 as restricted by PDF/X-4 and PDF/X-5
[24]
PDF/UA (since 2012 - ISO 14289-1) - a.k.a. "PDF for Universal Access" - Document
management applications - Electronic document file format enhancement for accessibility
(working in ISO Technical committee 171), based on ISO 32000-1 - PDF 1.7
There is also the PDF/H, a.k.a. PDF Healthcare, a best practices guide (BPG), supplemented by an
Implementation Guide (IG), published in 2008. PDF Healthcare is not a standard or proposed
standard, but only a guide for use with existing standards and other technologies. It is supported by the
standards development organizations ASTM and AIIM. PDF/H BPG is based on PDF 1.6.
[25][26][27]
Full function PDF
PDF 1.7
The final revised documentation for PDF 1.7 was approved by ISO Technical Committee 171 in
January 2008 and published as ISO 32000-1:2008 on July 1, 2008 and titled Document
management—Portable document format—Part 1: PDF 1.7.
ISO 32000-1:2008 is the first ISO standard for full function PDF. The previous ISO PDF standards
(PDF/A, PDF/X, etc.) are intended for more specialized uses. ISO 32000-1 includes all of the
functionality previously documented in the Adobe PDF Specifications for versions 1.0 through 1.6.
Adobe removed certain features of PDF from previous versions; these features are not contained in
PDF 1.7 either.
[3]
The ISO 32000-1 document was prepared by Adobe Systems Incorporated based upon PDF
Reference, sixth edition, Adobe Portable Document Format version 1.7, November 2006. It was
reviewed, edited and adopted under a special fast-track procedure, by ISO Technical Committee
171 (ISO/TC 171), Document management application, Subcommittee SC 2, Application issues, in
parallel with its approval by the ISO member bodies.
According to the ISO PDF standard abstract:
[28]
ISO 32000-1:2008 specifies a digital form for representing electronic documents to
enable users to exchange and view electronic documents independent of the
environment they were created in or the environment they are viewed or printed in. It is
intended for the developer of software that creates PDF files (conforming writers),
software that reads existing PDF files and interprets their contents for display and
interaction (conforming readers) and PDF products that read and/or write PDF files for a
variety of other purposes (conforming products).
PDF 2.0
A new version of PDF standard is under development under the name ISO/DIS 32000-2 - Document
management—Portable document format—Part 2: PDF 2.0 (as of September 2012).
[29]
PDF 2.0
was accepted by ISO as a new proposal in 2009 (ISO/NP 32000-2). The TC 171 SC 2 WG 8
Committee working on ISO 32000-2 (PDF 2.0) is continuing to actively develop the document;
processing hundreds of technical and editorial comments and operating eight ad hoc committees
comprising numerous interested parties, including Adobe Systems. To provide more time to develop
the document the original ISO project was cancelled in 2012 and a New Project item was
started.
[citation needed]
Adobe has submitted the Adobe Extension Level 5 and Adobe Extension Level 3 specifications to
ISO for inclusion into the ISO 32000-2 specification, but only some of their features have been
accepted.
PDF 2.0 will reference Adobe's XML Forms Architecture 3.1. In 2011 the ISO Committee urged
Adobe Systems to submit the XFA Specification, XML Forms Architecture (XFA), to ISO for
standardization and requested Adobe Systems to stabilize the XFA specification. The ISO
Committee expressed its concerns about the stability of the XFA specification.
[30]
ISO TC 171 SC 2 WG 8
Formed in 2008 to curate the PDF Reference as an ISO Standard, Working Group 8 typically meets
twice a year, with members from ten or more countries attending in each instance. Meetings of the
ISO Committee for ISO 32000 are open to accredited Subject Matter Experts. Interested parties
should contact their respective ISO Member Body for information about joining ISO 32000.
Current Project Leadership: Cherie Ekholm, Microsoft & Duff Johnson, Independent Consultant
(http://www.duff-johnson.com), Project Co-Leaders
Past Project Leadership: 2008-2011: James King, PhD, Adobe Systems
Secretary: Betsy Fanning, AIIM
Technical foundations
Anyone may create applications that can read and write PDF files without having to pay royalties to
Adobe Systems; Adobe holds patents to PDF, but licenses them for royalty-free use in developing
software complying with its PDF specification.
[31]
The PDF combines three technologies:
A subset of the PostScript page description programming language, for generating the layout
and graphics.
A font-embedding/replacement system to allow fonts to travel with the documents.
A structured storage system to bundle these elements and any associated content into a single
file, with data compression where appropriate.
PostScript
PostScript is a page description language run in an interpreter to generate an image, a process
requiring many resources. It can handle not just graphics, but standard features of programming
languages such as 
if
and 
loop
commands. PDF is largely based on PostScript but simplified to
remove flow control features like these, while graphics commands such as 
lineto
remain.
Often, the PostScript-like PDF code is generated from a source PostScript file. The graphics
commands that are output by the PostScript code are collected and tokenized; any files, graphics, or
fonts to which the document refers also are collected; then, everything is compressed to a single file.
Therefore, the entire PostScript world (fonts, layout, measurements) remains intact.
As a document format, PDF has several advantages over PostScript:
PDF contains tokenized and interpreted results of the PostScript source code, for direct
correspondence between changes to items in the PDF page description and changes to the
resulting page appearance.
PDF (from version 1.4) supports true graphic transparency; PostScript does not.
PostScript is an interpreted programming language with an implicit global state, so instructions
accompanying the description of one page can affect the appearance of any following page.
Therefore, all preceding pages in a PostScript document must be processed to determine the
correct appearance of a given page, whereas each page in a PDF document is unaffected by
the others. As a result, PDF viewers allow the user to quickly jump to the final pages of a long
document, whereas a Postscript viewer needs to process all pages sequentially before being
able to display the destination page (unless the optional PostScript Document Structuring
Conventions have been carefully complied with).
Technical overview
File structure
A PDF file consists primarily of objects, of which there are eight types:
[32]
Boolean values, representing true or false
Numbers
Strings
Names
Arrays, ordered collections of objects
Dictionaries, collections of objects indexed by Names
Streams, usually containing large amounts of data
The null object
Objects may be either direct (embedded in another object) or indirect. Indirect objects are numbered
with an object number and a generation number. An index table called the xref table gives the byte
offset of each indirect object from the start of the file.
[33]
This design allows for efficient random
access to the objects in the file, and also allows for small changes to be made without rewriting the
entire file (incremental update). Beginning with PDF version 1.5, indirect objects may also be located
in special streams known as object streams. This technique reduces the size of files that have large
numbers of small indirect objects and is especially useful for Tagged PDF.
There are two layouts to the PDF files—non-linear (not "optimized") and linear ("optimized"). Non-
linear PDF files consume less disk space than their linear counterparts, though they are slower to
access because portions of the data required to assemble pages of the document are scattered
throughout the PDF file. Linear PDF files (also called "optimized" or "web optimized" PDF files) are
constructed in a manner that enables them to be read in a Web browser plugin without waiting for the
entire file to download, since they are written to disk in a linear (as in page order) fashion.
[11]
PDF
files may be optimized using Adobe Acrobat software or QPDF.
Imaging model
The basic design of how graphics are represented in PDF is very similar to that of PostScript, except
for the use of transparency, which was added in PDF 1.4.
PDF graphics use a device independent Cartesian coordinate system to describe the surface of a
page. A PDF page description can use a matrix to scale, rotate, or skew graphical elements. A key
concept in PDF is that of the graphics state, which is a collection of graphical parameters that may be
changed, saved, and restored by a page description. PDF has (as of version 1.6) 24 graphics state
properties, of which some of the most important are:
The current transformation matrix (CTM), which determines the coordinate system
The clipping path
The color space
The alpha constant, which is a key component of transparency
Vector graphics
Vector graphics in PDF, as in PostScript, are constructed with paths. Paths are usually composed of
lines and cubic Bézier curves, but can also be constructed from the outlines of text. Unlike PostScript,
PDF does not allow a single path to mix text outlines with lines and curves. Paths can be stroked,
filled, or used for clipping. Strokes and fills can use any color set in the graphics state, including
patterns.
PDF supports several types of patterns. The simplest is the tiling pattern in which a piece of artwork is
specified to be drawn repeatedly. This may be a colored tiling pattern, with the colors specified in the
pattern object, or an uncolored tiling pattern, which defers color specification to the time the pattern is
drawn. Beginning with PDF 1.3 there is also a shading pattern, which draws continuously varying
colors. There are seven types of shading pattern of which the simplest are the axial shade (Type 2)
and radial shade (Type 3).
Raster images
Raster images in PDF (called Image XObjects) are represented by dictionaries with an associated
stream. The dictionary describes properties of the image, and the stream contains the image data.
(Less commonly, a raster image may be embedded directly in a page description as an inline
image.) Images are typically filtered for compression purposes. Image filters supported in PDF
include the general purpose filters
ASCII85Decode a filter used to put the stream into 7-bit ASCII
ASCIIHexDecode similar to ASCII85Decode but less compact
FlateDecode a commonly used filter based on the zlib/deflate algorithm (a.k.a. gzip, but not zip)
defined in RFC 1950 and RFC 1951; introduced in PDF 1.2; it can use one of two groups of
predictor functions for more compact zlib/deflate compression: Predictor 2 from the TIFF 6.0
specification and predictors (filters) from the PNG specification (RFC 2083)
LZWDecode a filter based on LZW Compression; it can use one of two groups of predictor
functions for more compact LZW compression: Predictor 2 from the TIFF 6.0 specification and
predictors (filters) from the PNG specification
RunLengthDecode a simple compression method for streams with repetitive data using the
Run-length encoding algorithm and the image-specific filters
DCTDecode a lossy filter based on the JPEG standard
CCITTFaxDecode a lossless bi-level (black/white) filter based on the Group 3 or Group 4
CCITT (ITU-T) fax compression standard defined in ITU-T T.4 and T.6
JBIG2Decode a lossy or lossless bi-level (black/white) filter based on the JBIG2 standard,
introduced in PDF 1.4
JPXDecode a lossy or lossless filter based on the JPEG 2000 standard, introduced in PDF 1.5
Normally all image content in a PDF is embedded in the file. But PDF allows image data to be stored
in external files by the use of external streams or Alternate Images. Standardized subsets of PDF,
including PDF/A and PDF/X, prohibit these features.
Text
Text in PDF is represented by text elements in page content streams. A text element specifies that
characters should be drawn at certain positions. The characters are specified using the encoding of a
selected font resource.
Fonts
A font object in PDF is a description of a digital typeface. It may either describe the characteristics of
a typeface, or it may include an embedded font file. The latter case is called an embedded font while
the former is called an unembedded font. The font files that may be embedded are based on widely
used standard digital font formats: Type 1 (and its compressed variant CFF), TrueType, and
(beginning with PDF 1.6) OpenType. Additionally PDF supports the Type 3 variant in which the
components of the font are described by PDF graphic operators.
Standard Type 1 Fonts (Standard 14 Fonts)
Fourteen typefaces—known as the standard 14 fonts—have a special significance in PDF
documents:
Times (v3) (in regular, italic, bold, and bold italic)
Courier (in regular, oblique, bold and bold oblique)
Helvetica (v3) (in regular, oblique, bold and bold oblique)
Symbol
Zapf Dingbats
These fonts are sometimes called the base fourteen fonts.
[34]
These fonts, or suitable substitute fonts
with the same metrics, must always be available in all PDF readers and so need not be embedded in
a PDF.
[35]
PDF viewers must know about the metrics of these fonts. Other fonts may be substituted if
they are not embedded in a PDF.
Encodings
Within text strings, characters are shown using character codes (integers) that map to glyphs in the
current font using an encoding. There are a number of predefined encodings, including WinAnsi,
MacRoman, and a large number of encodings for East Asian languages, and a font can have its own
built-in encoding. (Although the WinAnsi and MacRoman encodings are derived from the historical
properties of the Windows and Macintosh operating systems, fonts using these encodings work
equally well on any platform.) PDF can specify a predefined encoding to use, the font's built-in
encoding or provide a lookup table of differences to a predefined or built-in encoding (not
recommended with TrueType fonts).
[36]
The encoding mechanisms in PDF were designed for Type 1
fonts, and the rules for applying them to TrueType fonts are complex.
For large fonts or fonts with non-standard glyphs, the special encodings Identity-H (for horizontal
writing) and Identity-V (for vertical) are used. With such fonts it is necessary to provide a ToUnicode
table if semantic information about the characters is to be preserved.
Transparency
The original imaging model of PDF was, like PostScript's, opaque: each object drawn on the page
completely replaced anything previously marked in the same location. In PDF 1.4 the imaging model
was extended to allow transparency. When transparency is used, new objects interact with previously
marked objects to produce blending effects. The addition of transparency to PDF was done by means
of new extensions that were designed to be ignored in products written to the PDF 1.3 and earlier
specifications. As a result, files that use a small amount of transparency might view acceptably in older
viewers, but files making extensive use of transparency could be viewed incorrectly in an older viewer
Documents you may be interested
Documents you may be interested