itextsharp c# view pdf : How to extract images from pdf files application Library utility azure .net asp.net visual studio Document%20Conversion0-part1447

Page 1 of 24
General Guidelines for Electronic Permitting and Document Conversion 
Last Revised - Monday, May 12, 2003 
Utah Division of Oil, Gas and Mining 
Contents 
Introduction.....................................................................................................................2
Electronic Document Standards......................................................................................3
Formatting Documents for Utility and Ease of Use..........................................................5
Document Organization for Submittal..............................................................................6
Printing PDF Documents from Word Processors..........................................................10
Document Conversion Using Adobe Acrobat................................................................11
Converting Paper Documents to PDF...........................................................................16
Scanned Images and Estimating File Size....................................................................21
Image Resolution..........................................................................................................23
How to extract images from pdf files - Select, copy, paste PDF images in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document
extract image from pdf in; extract image from pdf java
How to extract images from pdf files - VB.NET PDF Image Extract Library: Select, copy, paste PDF images in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document
extract image from pdf online; extract pictures pdf
Page 2 of 24
Introduction 
This paper presents suggestions for preparing and submitting documents in an 
electronic format.  Methodologies and software applications used for document 
preparation and conversion are numerous and can vary widely in cost, hardware 
requirements, and operating systems that may be available to you.  Suggestions made 
in this paper are based on experience with the hardware and software that the Division 
of Oil, Gas and Mining are currently using.  These suggestions should not be 
considered as an endorsement for any particular hardware, operating system or 
software application. 
VB.NET PDF Text Extract Library: extract text content from PDF
Extract highlighted text out of PDF document. Image text extraction control provides text extraction from PDF images and image files.
extract photo from pdf; extract images from pdf file
C# PDF Text Extract Library: extract text content from PDF file in
Ability to extract highlighted text out of PDF document. Image text extraction control provides text extraction from PDF images and image files.
how to extract a picture from a pdf; extract images from pdf online
Page 3 of 24
Electronic Document Standards 
While the Acrobat Portable Document File (PDF) format is not perfect, it is rapidly 
becoming the most accepted format for electronic document conversion and storage.  
The Division will accept Adobe PDF files as an electronic submittal standard for permit 
applications, changes and other permit-related information. 
There are several pending questions regarding how to submit documents in electronic 
format while meeting regulatory requirements.  Examples of such documents include 
signed permits, affidavits, and design certifications.  In cases where a photocopy of a 
document meets such requirements, a digital image of the document in the form of a 
PDF file is considered similar to such a photocopy and will be accepted.  In cases 
where an original signed document must be provided, the original signed paper 
document must be provided and kept on file at the Division.  Hopefully, as electronic 
permitting and documentation evolve, methods for providing electronic signatures and 
authentication will be incorporated into the process. 
Currently, the Division will require that a minimum of one copy of each submittal be 
provided in paper form.  All additional copies of the submittal can be provided in 
electronic format. 
Having information provided in PDF format provides the opportunity to submit the 
information in a manner that is reproducible in a line-for-line, page-for-page manner 
regardless of the computer, operating system or the printer that is being used to 
reproduce the pages in the document.  PDF has the advantage accomplishing this.  
Even word processing documents format and paginate differently depending on the 
computer being used, software version, and the printer being selected.  The concept 
here is to have an “electronic photocopy” of the document that can always be printed to 
represent the original document.   
In addition to providing documents in PDF format, it is also recommended that copies of 
the documents in their ‘native’ format also be provided.  This can assist in completion of 
VB.NET PDF File Merge Library: Merge, append PDF files in vb.net
Merge two or several separate PDF files together and into Able to integrate VB.NET PDF Merging control to Components to combine various scanned images to PDF
extract pictures pdf; extract image from pdf using
C# PDF Convert to Jpeg SDK: Convert PDF to JPEG images in C#.net
may customize the names of all converted JPEG image files in .NET Following demo code will show how to convert all PDF pages to Jpeg images with C# .NET.
pdf image text extractor; extract image from pdf in
Page 4 of 24
the review process by allowing the Division to utilize such files in the preparation of 
review and findings documents.  This is especially true with maps, spreadsheets, and 
other specialized programs where the data from that application may be directly 
incorporated into review and findings documents.   A map provided as a PDF file does 
not afford the opportunity to verify acreages, or to copy layers from that drawing into a 
map generated by the Division while an AutoCAD version of that same drawing would. 
Due to the variation and nature of word processors and conversion of documents into 
PDF form, it is strongly recommended that documents be converted into the PDF format 
and then printed from the PDF file
.   This will provide a means for reproducing printed 
copies of the documents without the possibility of repagination, reformatting or other 
problems that may have changed the document in converting it from a word processing 
document to a PDF file.  The same theory applies to all other applications in which PDF 
files are to be generated for submittal. 
C# PDF Convert to HTML SDK: Convert PDF to html files in C#.net
Embed converted HTML files in HTML page or iframe. Use JS (jquery) to control PDF page navigation. Export PDF images to HTML images.
extract jpg from pdf; extract images from pdf acrobat
VB.NET PDF Convert to HTML SDK: Convert PDF to html files in vb.
Embed converted html files in html page or iframe. Export PDF form data to html form in .NET WinForms and ASP.NET. Turn PDF images to HTML images in VB.NET.
extract pdf pages to jpg; online pdf image extractor
Page 5 of 24
Formatting Documents for Utility and Ease of Use 
Because a mining and reclamation plan is a large and complex document, developing a 
strategy for its creation is essential.  Avoid making extremely long documents or 
complex documents with numerous font changes, embedded tables or images, or 
having a page numbering scheme that requires regenerating the entire plan each time a 
change is made to the plan. 
Keep the text simple.  Create tables, exhibits, etc. as separate documents.  Reference 
the tables and exhibits within the body of the text and then place them physically at the 
end of text document.  Example: Chapter 1 would consist of the main text document, 
followed by the tables, then the exhibits, then the maps, etc. 
Create a Table of Contents for the entire plan in standard outline form, and, after the 
last page of the Table of Contents, add title and separator pages for each item to be 
incorporated into the plan.  Each separator page should contain the title of the following 
document, the file name of the document to be inserted behind the separator page and 
the document date.  The Table of Contents and the separator pages can then be printed 
on colored paper.  The rest of the documents can then be printed on plain paper and 
inserted between the separator pages thus keeping the entire plan in order. 
C# PDF File Merge Library: Merge, append PDF files in C#.net, ASP.
Combine scanned images to PDF, such as tiff, jpg, png, gif, bmp XDoc.PDF) is designed to help .NET developers combine PDF document files created by
pdf image extractor c#; extract image from pdf acrobat
VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.
VB.NET: Extract All Images from PDF Document. This is an example that you can use it to extract all images from PDF document. ' Get page 3 from the document.
how to extract images from pdf files; pdf extract images
Page 6 of 24
Document Organization for Submittal 
Maintaining a chronology of information submitted to the Division for review can play a 
critical role in ensuring that such information in complete and current.  One of the 
easiest methods to accomplish this is to utilize a root directory for each submittal based 
on the date that the information is provided.  Beneath the document date directory, the 
submittal can be further divided into subdirectories for organizational purposes. 
File naming conventions should be kept simple and file extensions must conform to the 
default extensions that are used as the default for the software application.  Do not 
change or rename file extensions as they may render the file unreadable or unusable.    
Here is a list of some of the more common file extensions for reference: 
.aif .aiff Audio file 
.arj File archiving 
.au Audio file 
.avi Video file 
.bat Batch file 
.bmp Windows bitmap graphics format 
.doc Microsoft Word or WordPerfect document format 
.dot Microsoft Word template format 
.dwg AutoCAD Drawing File 
.exe Executable file 
.gif Graphical Interchange Format (best for line drawings, 
few colors) 
.gz, .gzip Compression format 
.hqx Macintosh BinHex compression format 
.htm, .html HyperText Markup Language 
.ins Inspiration 
.jpg or .jpeg Joint Photographic Experts Group (works well 
with photographs and artwork) 
.js JavaScript 
.lha File compression format 
.midi Audio file 
.mov QuickTime movie 
.mp3 Audio file 
.mpg, .mpeg Audio and video formats 
.pdf Portable Document Format 
.pict Graphics format for pictures on Macintosh 
.pl Perl Script 
.ppt PowerPoint presentation 
.ps PostScript file 
.ra, .ram Real Audio formats 
.rtf Rich Text Format (keeps some formatting) 
.sgml Standard Generalizable Markup Language 
.shw Core Presentation 
.sit Stuffed file 
.stk HyperStudio stack 
.tif, .tiff Graphics file 
.txt, .text ASCII or Simple Text format (no formatting) 
.vrml Virtual Reality Markup Language 
.wav Audio file 
.wpd WordPerfect Document 
.zip PkZip compression format
When files are to be provided in different formats, each file should have the same name 
and should have the appropriate extension for that application.  Example:  
C# PDF File Split Library: Split, seperate PDF into multiple files
Also able to combine generated split PDF document files with other PDF files to form a new PDF file. Split PDF Document into Multiple PDF Files in C#.
extract color image from pdf in c#; extract images from pdf
Page 7 of 24
“Chapter01.doc” would be the Microsoft Word version and “Chapter01.pdf” would be the 
Adobe Acrobat Portable Document Format of the same information. 
When choosing filenames, use only alphanumeric characters (A thru Z, a thru z, and 0 
thru 9).  Do not use spaces in filenames (use “MyFile.doc” not “My File.doc”), and do not 
use math or other iconic symbols in the file name (don’t use #, @, -, +, ~, %, etc.).  
Blank spaces and other symbols in file names can create problems in opening and 
linking documents, and in copying or backing up files and should be avoided.  It is also 
a good idea to use leading zeroes when using a numbering scheme to keep the 
documents in normal order when viewing or listing documents by name:  
Without leading zeroes:    
With leading zeroes: 
Chapter1.doc 
Chapter01.doc 
Chapter11.doc 
Chapter02.doc 
Chpater12.doc 
Chapter03.doc 
Chapter2.doc 
Chapter04.doc 
Chapter21.doc 
… 
Chapter3.doc 
Chapter11.doc 
Chapter4.doc 
Chapter12.doc 
At a minimum, each file should have a PDF file and optionally, it’s corresponding ‘native’ 
file.  In the event that an explanation for information found on the disk is necessary, a 
“readme.txt” file can be used to provide such information.  A “readme.txt” file can also 
be added under each subdirectory when necessary to further explain special 
considerations with files in that particular section.  An example of this would be if a 
specific version of AutoCAD were used to make the .dwg files and if a special plotter 
configuration file (.pc3) would need to be used to print the drawing colors correctly.  
Likewise, special fonts or graphics may be necessary to reproduce a document and 
they could be provided with special instructions in the “readme.txt” file. 
Page 8 of 24
When making subdirectories, include a “Redline” directory to locate the proposed 
redline-strikeout versions of documents when necessary.  Other directories should 
contain “final” versions of the documents so that upon approval, clean copies of the 
documents are not needed. 
By providing a complete and final version of the entire plan on each submittal, 
information does not become separated in the plan nor does the reviewer need to worry 
about having the most current information for review.  Having the information submitted 
with a root document date directory allows for ease in referring to prior submittals and 
comparing earlier versions of the plan to be compared as part of the review procedure.  
Also, keeping a complete master of the entire permit document under a single 
document date directory makes updating and revising the plan more straightforward.  
When a change to the plan is contemplated, the entire directory and subdirectory can 
be copied to a new documents date directory where all the changes and updates can be 
made within that new directory without fear of writing over the original copy of the 
previously approved plan.  
If more that one proposed change to the plan is in process, the document date directory 
for each proposed change can be maintained with submittal. 
Page 9 of 24
A typical directory and file structure for part of an electronic submittal would be 
something like this: 
\03162003\   <<Document date directory in MMDDYYYY format>> 
Readme.txt  
CoverLetter.doc 
CoverLetter.pdf 
Contents.doc 
Contents.pdf 
FormC1.doc 
FormC1.pdf 
FormC2.doc 
FormC2.pdf … 
\Chapters\ 
Chapter01.doc 
Chapter01.pdf 
Chapter02.doc 
Chapter02.pdf 
Chapter03.doc 
Chapter03.pdf … 
\Exhibits\ 
Exhibit01A.pdf 
Exhibit01A.xls 
Exhibit01B.pdf 
Exhibit01B.jpg 
Exhibit02A.pdf 
Exhibit02A.doc … 
\Appendicies\ 
Appendix01.doc 
Appendix01.pdf 
Appendix02.pdf 
Appenidx03.pdf … 
\Maps\ 
readme.txt 
Map01A.dwg 
Map01A.pdf 
Map01A.pc3 
Map02A.dwg 
Map02A.pdf … 
\Tables\ 
Table1A.xls 
Table1A.pdf 
Table3A.pdf … 
\Redline\ 
Chapter2Redline.doc 
Chapter2Redline.pdf … 
Page 10 of 24
Printing PDF Documents from Word Processors 
In recent years, the Portable Document Format has provided nearly all computer users 
a medium that allows anyone to break free of the confines of proprietary file formats and 
operating systems. Despite its popularity, universality, and ease of use, PDF finds itself 
at odds with word processors much more often than it should, or needs to. 
It's important to realize that computer hardware and software come with built-in 
limitations, and the sooner you learn to design your workflows to accommodate these 
limitations, the sooner you'll be able to produce professional PDF documents from your 
word processor files.  
The ideal would be to have your word processor write PDF directly, and hopefully this 
will be a possibility before too long. But as the situation presently stands, most, if not all, 
word processors must use an indirect method to produce PDF. There are many tools 
available, such as Ghostscript, and a variety of scripts and standalone converters in 
addition to the tools and methods available with Adobe Acrobat. 
Just as you shouldn't design a one-page business letter the same way you would 
design a 300-page book, you also shouldn't design a file designated for PDF output the 
same way you would design standard office documents intended to be printed with 
desktop printers. 
It's not up to PDF to determine where a page should end or where a line of text should 
wrap. That is the job of the person designing a document with a word processor, plain 
and simple. Those in the DTP business have learned this hard lesson long ago, and it 
applies to everyone who wants to produce PDF files. 
Documents you may be interested
Documents you may be interested