mvc 5 display pdf in view : Extract jpg pdf Library application component asp.net html azure mvc ENCODING0-part1839

© 1998-1999 by Stephen Rindsberg
1
Cross-Platform
Font-Encoding Problems
in
Acrobat PDF Files
And assorted other stuff
By Steve Rindsberg
with much help, many valuable suggestions and gentle but persistent prodding from
Arnis Gubins, Aandi Inston, Thomas Phinney and Kathleen Tinkel
on Compuserve’s AdobeApps and DTPForum forums. Thanks, folks.
Extract jpg pdf - Select, copy, paste PDF images in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document
extract image from pdf java; extract image from pdf c#
Extract jpg pdf - VB.NET PDF Image Extract Library: Select, copy, paste PDF images in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document
pdf image extractor c#; extract image from pdf in
© 1998-1999 by Stephen Rindsberg
2
Contents
Cross-Platform Font-Encoding Problems in Acrobat PDF Files.............................................................................................................................1
Contents...................................................................................................................................................................................................................2
What this is all about...............................................................................................................................................................................................3
The problem.............................................................................................................................................................................................................4
Why does it do that?................................................................................................................................................................................................5
Then came Windows...............................................................................................................................................................................................6
Here’s what we end up with.....................................................................................................................................................................................7
Here’s why it happens ..............................................................................................................................................................................................8
It's supposed to work but ….................................................................................................... ..............................................................................10
There you are WHERE?........................................................................................................................................................................................11
OK. Now I know where I am. Where's the exit, please? .......................................................................................................................................12
You use a PC but want to spare Mac users this abuse? .........................................................................................................................................13
About the included files.........................................................................................................................................................................................14
What do I do with this embarrassment of riches?..................................................................................................................................................17
Who is this "Rindsberg"?.......................................................................................................................................................................................18
C# PDF Convert to Jpeg SDK: Convert PDF to JPEG images in C#.net
NET library to batch convert PDF files to jpg image files. High Turn multiple pages PDF into single jpg files respectively online. Support
extract image from pdf; extract pictures pdf
VB.NET PDF Convert to Jpeg SDK: Convert PDF to JPEG images in vb.
PDF to images, C#.NET PDF file & pages edit, C#.NET PDF pages extract, copy, paste, C# NET components to batch convert adobe PDF files to jpg image files.
how to extract pictures from pdf files; how to extract images from pdf in acrobat
© 1998-1999 by Stephen Rindsberg
3
What this is all about
This all got started when I was researching an article about moving files from PC to Mac.
Part of the article describes what happens to the "high-ascii" characters (all the oddball/symbol/foreign
characters you don’t find on your everyday keyboard) as they move from one platform to the other.
The article series appeared in The Corel Draw Journal, published by The Cobb Group, now part of
Ziff Davis.  Back issues may be available, in case you’re interested.
Later, the subject of cross-platform font encoding arose in the Acrobat section of the AdobeApps
forum on Compuserve. It seemed like a natural extension of the work I’d already done so I looked into
it a bit further.  Most of what follows is a result of that and discussions with the Acrobat forum
regulars, particularly Arnis Gubins, Thomas Phinney and Aandi Inston.  Without their help and
suggestions, none of what follows would ever have gotten sorted out (to the extent that it has).
I don’t claim to be an expert at any of this; I’m just passing along the results of the homework I’ve
done. If you find errors or omissions, I’ll gladly take the blame for them, so long as you’ll take the time
to point them out to me. Fair enough?
Mac users will note that this has a markedly "create it on the PC and move it to the Mac" flavor.
Guilty as charged. That’s what I mostly do, so that’s what most interested me. The logic, if not all the
specifics, works similarly in the other direction as well, though.
C# Image Convert: How to Convert Adobe PDF to Jpeg, Png, Bmp, &
String inputFilePath = @"C:\input.pdf"; String outputFilePath = @"C:\output.jpg"; // Convert PDF to jpg. C# sample code for PDF to jpg image conversion.
pdf image extractor online; extract photo from pdf
C# Image Convert: How to Convert Tiff Image to Jpeg, Png, Bmp, &
RasterEdge.XDoc.PDF.dll. String inputFilePath = @"C:\input.tif"; String outputFilePath = @"C:\output.jpg"; // Convert tiff to jpg.
extract photos pdf; extract image from pdf online
© 1998-1999 by Stephen Rindsberg
4
The problem
PDF users find that some characters get changed when you open PC-created PDFs on the Mac, even
though this isn’t supposed to happen, according to Adobe.  In fact, if all goes according to plan, it
doesn’t happen;  PDF does an extraordinary job of preserving PC encoding on the Mac.
But as with so many other well-laid plans, things that go bump in the night can derail the train, to
mixmaster a metaphor or three.
Suppose you have a PC document that contains high-ascii characters, French language text with
accents, for example. The accented characters will often get converted to something else when you
open the same document on a Mac. The same is true going from Mac to PC.
The better cross-platform apps do what they can to correct these mismatches, and generally they do a
good job, but some characters may still go astray or disappear altogether.
C# Create PDF from images Library to convert Jpeg, png images to
Batch convert PDF documents from multiple image formats, including Jpg, Png, Bmp, Gif, Tiff, Bitmap, .NET Graphics, and REImage.
extract image from pdf c#; extract photos from pdf
VB.NET PDF - Convert PDF with VB.NET WPF PDF Viewer
read PDF, VB.NET convert PDF to text, VB.NET extract PDF pages, VB PDF to image file formats with high quality, support converting PDF to PNG, JPG, BMP and
extract image from pdf file; how to extract images from pdf files
© 1998-1999 by Stephen Rindsberg
5
Why does it do that?
Computers don’t actually deal with characters. They work strictly with numbers.
To display text, computers use one of several conventions that assigns (or "maps") numbers to specific
characters. This mapping is called "character encoding" and enables the computer to display an "A"
when presented with a text string containing the number 65 and so on.
While we refer to these numbers in decimal or hexadecimal notation for human-readable convenience,
the computer actually works with binary numbers, collections of on/off bits. Historically, many
computer systems used 7-bit character sets. Since the highest number that can be expressed in seven
binary bits is 128, these systems could only deal with 128 characters. One method of mapping these
128 possible numbers to characters came into common use early in compu-history and has become
standardized as the ASCII character set. (ASCII = American Standard Code for Information
Interchange.)
DOS-based PCs used 8-bit numbers to represent characters, allowing for 256 different characters .
Since early PCs had no graphics capabilities, the PC’s designers used the newly added character
positions for graphics and line-drawing characters.
The Mac came along a few years later. It also used an 8-bit character set, but since it was more than
adequately supplied with graphics capabilities, there was no need to waste limited character slots on
graphics-drawing characters. Its designers were free to stock the upper 128 (high-ascii) characters
with extra punctuation marks and nearly any accented/special characters needed for roman alphabet
based languages.
C# WPF PDF Viewer SDK to convert and export PDF document to other
C#.NET PDF file & pages edit, C#.NET PDF pages extract, copy, paste PDF to image file formats with high quality, support converting PDF to PNG, JPG, BMP and
some pdf image extract; extract vector image from pdf
VB.NET Create PDF from images Library to convert Jpeg, png images
Support create PDF from multiple image formats in VB.NET, including Jpg, Png, Bmp, Gif, Tiff, Bitmap, .NET Graphics, and REImage.
extract images from pdf online; how to extract text from pdf image file
© 1998-1999 by Stephen Rindsberg
6
Then came Windows.
I’ll leave it to Mr. Gates to explain why he decided to toss out a perfectly workable Mac character-
encoding wheel and invent a new (incompatible) one. Windows uses a character set similar to the
Mac’s but encodes it almost entirely differently once we leave the familiar ASCII characters.
Both systems use accented vowels, for instance, but they’re represented by different numbers. In fact,
only five high-ascii characters share the same encoding between platforms.
The diagram on the next page shows one example of the chaos that can result.  I used Corel Draw to
create a drawing that includes all the high-ascii characters in Windows encoding, saved it as an
Illustrator file, then opened it in Illustrator on the Mac.
The results aren’t the fault of bad programming on anybody’s part.  Draw (correctly) asks for character
number 0174, and expects that the system it’s running on will supply a registered trademark symbol.
Illustrator on the Mac hands the same 0174 character to the Mac system and gets back the character
you start that famous Fable guy’s name with.
The fault, dear Brutus, is in the system.  Or the difference between the two systems.
© 1998-1999 by Stephen Rindsberg
7
Here’s what we end up with
Œ
ª
´
¾
È
Ò
Ü
æ
ð
¡
«
µ
¿
É
Ó
Ý
ç
ñ
˜
¢
¬
À
Ê
Ô
Þ
è
ò
£
·
Á
Ë
Õ
ß
é
ó
š
¤
®
¸
Â
Ì
Ö
à
ê
ô
¥
¯
¹
Ã
Í
×
á
ë
õ
œ
¦
°
º
Ä
Î
Ø
â
ì
ö
012
0
013
014
015
016
017
018
019
020
021
022
023
ú
024
025
1
ƒ
û
2
ü
3
ý
4
þ
5
ÿ
6
ˆ
7
§
±
»
Å
Ï
Ù
ã
í
÷
8
Š
¨
²
¼
Æ
Ð
Ú
ä
î
ø
9
Ÿ
©
³
½
Ç
Ñ
Û
å
ï
ù
Different, Mac vs.PC
Not used on Mac
Not used in Windows
Same on Mac and PC
As created in Draw
As imported by Mac Illustrator
© 1998-1999 by Stephen Rindsberg
9
Beats me, but those clever folks at Adobe have it sorted out and working very nicely in the PDF
format and the companion Reader software for both PC and Mac. Left to its own devices, Adobe
makes it work.
And it’s at this point that I first thank you for your patience in bearing with me so far and turn
(finally!) to the meat of the matter:  Why doesn’t it always work?
Documents you may be interested
Documents you may be interested