c# pdf library mit license : Get pdf metadata Library application component .net html winforms mvc Wiley%20Publishing%20-%20Adobe%20Acrobat%206%20PDF%20For%20Dummies%20%5B2003%5D28-part626

If you’re working with a lot of text in a PDF document, you can configure the
Hand tool in Acrobat 6 to automatically function as the Select Text tool when
you hover it over text in a PDF document. Choose Edit➪Preferences or press
Ctrl+K (Ô+K on Mac) to open the Preferences dialog box. Click General in the
list box on the left to display the General Preferences options, and then select
the Enable Text Selection for the Hand tool check box. You can enter values
(measured in picas) in the Text Selection Margin Size and Column Selection
Margin Size text boxes to specify how much white space around text or
columns to allow before the Hand tool transforms into the Text Selection
tool and vice versa.
Figure 12-3:
Using the
Select Text
tool to
select only
the second
column of
text in a PDF
document.
267
Chapter 12: Extracting Text and Graphics from PDF Files
Looking up a word
The Select Text tool in Acrobat 6 comes with a
look-up feature that is very handy (especially if
you’re  blessed  with  broadband  always-on
Internet  access).  When  you  select  a  single
word in a PDF document with the Select Text
tool and then right-click to open the context
menu, you find the Look Up “selected word”
command. Choose this command to go online to
Dictionary.com and instantly look up the defini-
tion of your selected word on that Web site. Of
course, if you’ve only got dial-up access to the
Web,  it’s  probably  quicker  to  use  the  old-
fashioned  method  — grab your  ol’  copy  of
Webster’s and look the word up yourself.
Get pdf metadata - add, remove, update PDF metadata in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# Developers to Read, Add, Edit, Update and Delete PDF Metadata
google search pdf metadata; bulk edit pdf metadata
Get pdf metadata - VB.NET PDF metadata library: add, remove, update PDF metadata in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Enable VB.NET Users to Read, Write, Edit, Delete and Update PDF Document Metadata
view pdf metadata in explorer; analyze pdf metadata
Selecting tables and formatted text
The second text tool on the Basic toolbar is called the Select Table tool,
and as its name implies, you use this tool when you want to copy text set in a
table or to copy text along with its formatting (including font, font size, text
color, alignment, line spacing, and indents when saving in an RTF — Rich Text
Format — file format). To use the Select Table tool, you use its cross-hair
mouse pointer to draw a bounding box around a table or lines of text that
you want to select. As soon as you release the mouse button, Acrobat
encloses the selected text or table in a heavy blue outline.
The Select Table tool can make table selections based on a PDF document’s
underlying document structure tags. To find out if you’re working with a tagged
PDF document, right-click the page with the Select Table tool to see if the Select
Table Uses Document Tags command is activated (the PDF file is tagged) or
grayed-out (the PDF file in untagged) on the context menu. Acrobat automati-
cally selects this command when you open a tagged PDF document. If you’re
working with a tagged PDF document, you can simply click with the Select
Table tool to select a table or lines of text formatted as a table. For more on
document structure tags, see Chapter 1. To see how PDFMaker 6.0 creates
tagged PDF documents from Microsoft Office programs, take a look at
Chapter 5.
When Acrobat identifies a text selection as a table, it maintains the structure of
the table by preserving the layout of the data in rows and columns of cells. If
you then save the table data in the RTF file format for use in a word-processed
document, the table maintains this layout in the new document. If you save the
table data in the CSV (Comma Separated Values) text file format, which is the
default format selected by Acrobat, the program maintains the table struc-
ture by separating the data items with commas and hard returns. This cre-
ates what is often called a comma delimited text file that most database and
spreadsheet programs can convert easily into their own native file formats.
Saving a table or formatted text in a new file
Unlike when you select text with the Select Text tool, after you highlight a
table or blocks of text with the Select Table tool, you can not only copy it to
the Clipboard but also save the selection into a new file format. To do this,
you right-click (Control+click on the Mac) the text or table selection and then
click Save Selected Table As on the context menu to open the Acrobat Save
As dialog box, where you specify the folder, filename, and type of file format
in which to save the selection.
Select the Rich Text Format when you want to open the table or formatted text
in a word processor such as Microsoft Word. Stay with the Comma Separated
Values (*.csv) default file format when you’re saving a table of data and you
want to be able to import that data into a spreadsheet program (such as
Microsoft Excel) or a database program (such as FileMaker Pro).
268
Part III: Reviewing, Editing, and Securing PDFs 
C# TIFF: TIFF Metadata Editor, How to Write & Read TIFF Metadata
TIFFDocument doc = new TIFFDocument(@"c:\demo1.tif"); // Get Xmp metadata for string. TagCollection collection = doc.GetTagCollection(0); // Get Exif metadata.
pdf metadata viewer online; rename pdf files from metadata
VB.NET PDF Annotate Library: Draw, edit PDF annotation, markups in
' Get PDF document. Dim fileInpath As String = "" Dim doc As PDFDocument = New PDFDocument(fileInpath) ' Get all annotations. ' Get PDF document.
get pdf metadata; edit pdf metadata online
Copying PDF tables into word processors and spreadsheets
The Select Table tool makes it a joy to copy tables from PDF files into word-
processed documents or spreadsheets. Figures 12-4 and 12-5 illustrate what
happens when you drag a table selected with the Select Table tool into a new
Word document (Figure 12-4) and into a blank worksheet in a new Excel work-
book (Figure 12-5).
As you can see in Figure 12-4, Microsoft Word automatically recognizes and
preserves the table structure by creating a new Word table. Even more impor-
tantly, Word has maintained the number formatting as well (indicated by the
dollar signs, commas, percent signs, and parentheses for the negative
values).
In Figure 12-5, you see that Excel also has no problem recognizing and cor-
rectly interpreting the layout and formatting of the table data. It immediately
inserted the incoming table data into the correct worksheet cells, while main-
taining the correct cell formatting. (By the way, in case you aren’t yet an
Excel user, if you see #### symbols in the new worksheet, these symbols
merely indicate that the column isn’t wide enough to display the values in
that cell — these are not error indicators and are easily disposed of by
widening the column.)
Figure 12-4:
Dragging 
a table
selected
with the
Select Table
tool to a
new Word
document.
269
Chapter 12: Extracting Text and Graphics from PDF Files
C# PDF Annotate Library: Draw, edit PDF annotation, markups in C#.
Get PDF document. String fileInpath = @""; PDFDocument doc = new PDFDocument(fileInpath); // Get all annotations. Get PDF document.
edit pdf metadata acrobat; embed metadata in pdf
How to C#: Modify Image Metadata (tag)
VB.NET How-to, VB.NET PDF, VB.NET Word, VB.NET Excel How to C#: Modify Image Metadata (tag). With XImage.Raster, you can get the image tags and modify them rapidly
endnote pdf metadata; remove metadata from pdf acrobat
Acrobat 6 offers an even easier way to get selected table data into a spread-
sheet program. (This method assumes that you already have a CSV-compliant
spreadsheet program like Microsoft Excel installed on your computer.) Select
a table in a PDF document with the Select Table tool, right-click to open the
context menu, and choose Open Table in Spreadsheet. Your CSV-compliant
spreadsheet program (and all of them are these days) opens a document with
your table data imported into the spreadsheet. You can then edit and save
your table data in that program’s document format.
Selecting and Copying Graphic Images
You use the Select Image tool, located at the bottom of the Selection toolbar
menu on the Basic toolbar, to select individual graphic images for copying.
When you choose the Select Image tool, the mouse pointer becomes a cross-
hair that you use to draw a bounding box around the graphic. After you’ve
enclosed the entire graphic (and you don’t have to worry if your marquee is a
little larger than the image borders), you can copy the graphic to a new docu-
ment open in another program either by copying it to the Clipboard (Edit➪
Copy) or by dragging it to a new document window. Note that if your PDF
document is tagged, you can simply click an image with the Select Image tool
to select a graphic object.
Figure 12-5:
Dragging a
table
selected
with the
Select Table
tool into a
new Excel
workbook.
270
Part III: Reviewing, Editing, and Securing PDFs 
VB.NET PDF: Get Started with PDF Library
rotate PDF pages, C#.NET search text in PDF, C#.NET edit PDF bookmark, C#.NET edit PDF metadata, C#.NET VB.NET PDF: Get Started with .NET PDF Library Using VB.
pdf metadata editor; pdf remove metadata
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
Scan image to PDF, tiff and various image formats. Get image information, such as its location, zonal information, metadata, and so on.
modify pdf metadata; pdf xmp metadata
Keep in mind that when you copy images to the Clipboard, Acrobat uses the
graphics resolution of your monitor and that set for the Clipboard by your
computer’s operating system, rather than the resolution of the images as
saved in the PDF document (which could well be a lot higher than either of
the two). Also, be aware that all images you copy into the Clipboard are auto-
matically converted onto the Clipboard as pixels, even if they are saved as
vector (or line) graphics in the PDF file.
Exporting Images in Various
Graphics Formats
To save all the graphic images in the current PDF document, choose
Advanced➪Export All Images. The Export All Images As dialog box appears,
enabling you to save the images in one of four different file formats that you
select from the Save As Type drop-down list:
JPEG (Joint Photographic Experts Group): Choose this file format for
true color compressed images.
PNG (Portable Network Graphics): Choose this file format for com-
pressed bitmap images.
TIFF (Tagged Image File Format):Choose this file format for com-
pressed bitmap images using both text and graphics. (TIFF is usually the
format used to store the paper pages you scan.)
JPEG2000 (Joint Photographic Experts Group): Choose this file format,
a newer version of JPEG that utilizes state of the art wavelet compres-
sion, for even truer color compressed images.
After you select a graphics file format from the Save As Type drop-down list,
select the drive and folder where you want the images saved. As soon as you
click the Save button, the program goes through the current document and
saves all the images in separate graphics files in the selected folder in the
designated graphics file format.
Acrobat names these new graphics files by adding sequential numbers (start-
ing with 0001) to the filename of the original PDF document (and tacking on
the filename extensions .jpg for JPEG, .png for PNG, .tif for TIFF, and .jpf
for JPEG2000 files in Windows). You can rename these numerical files with
descriptive, more meaningful filenames either in Windows or the Mac OS or
after opening them in an image editing program, such Adobe Photoshop 7.0.
271
Chapter 12: Extracting Text and Graphics from PDF Files
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
Capture image from whole PDF based on special characteristics. Get image information, such as its location, zonal information, metadata, and so on.
pdf metadata reader; pdf metadata
C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
You can easily get pages from a PDF file, and then use these pages to create and output a new PDF file. Pages order will be retained.
view pdf metadata; read pdf metadata
If you want to save a single image as its own individual file, select the image
with the Select Image tool, right-click, and choose Save Image As on its con-
text menu. In the Save Image As dialog box that appears, choose a location
for your new image file on the Save In drop-down list, enter a name for the file
in the File Name text box and click Save. Because you can only select either
bitmap (.bmp) or JPEG (.jpg) as a file type in the Save As Type drop-down
list of this dialog box, use this method to quickly create an image file that you
can open, edit, and save in a number of different image file formats in your
favorite image editing program.
Saving Entire PDF Files 
in a New File Format
Copying and pasting and dragging and dropping are fine as long as you need to
work with only portions of text in the PDF document. In those situations where
you need to repurpose all the text in a PDF file, you simply use the File➪Save As
command. In the Save As dialog box that appears, select the appropriate file
format in the Save as Type drop-down list, and then click the Save button.
Saving PDF files as text files
When saving PDF files as text files for use with text editors and word process-
ing software, you have a choice between saving the PDF document in a Plain
Text or an RTF. Select Plain Text when your only concern is getting the raw
text into a more editable format. Select the RTF format whenever you want to
preserve not only the document text but also as much formatting as possible.
Always select the RTF file type when saving the text of PDF documents that
you intend to edit with Microsoft Word.
Keep in mind that although RTF attempts to preserve much formatting from
the PDF document, it is far from flawless, and in most cases you will end up
having to do extensive reformatting in the resulting Word document. On those
occasions, perhaps you can content yourself with the fact that you didn’t have
to retype any of the text. Of course, if your PDF document is tagged, as would
be the case for any PDF created using PDFMaker 6.0, all document formatting
will be preserved when you import the PDF text into a word processor. See
Chapter 5 for more on creating tagged PDF documents in Microsoft Office
programs.
272
Part III: Reviewing, Editing, and Securing PDFs 
C# PDF insert text Library: insert text into PDF content in C#.net
String inputFilePath = Program.RootPath + "\\" 1.pdf"; PDFDocument doc = new PDFDocument(inputFilePath); // get a text manager from the document object
pdf keywords metadata; online pdf metadata viewer
Saving PDF files as HTML files
Acrobat 6 now enables you to save your PDF files in the HTML (HyperText
Markup Language) file format, in essence turning them into Web pages. In
Acrobat 5, you needed to download and install an Acrobat plug-in to have
this functionality. Right out of the box, Acrobat 6 lets you choose between
saving your PDF document in various versions of the HTML file format and in
the newer XML (Extensible Markup Language) file format, which is used by
many Web sites to improve Web page layout and interactivity. To save a PDF
document in a Web format, choose File➪Save As, and in the Save As dialog
box, click the Save As Type drop-down list to select an HTML or XML file
format to convert your PDF document to, enter a name for your new file in
the File Name text box, choose a drive and folder location for your saved file
in the Save In drop-down list, and click the Save button.
273
Chapter 12: Extracting Text and Graphics from PDF Files
274
Part III: Reviewing, Editing, and Securing PDFs 
C
h
a
p
t
e
r
1
3
C
a
t
a
l
o
g
i
n
g
a
n
d
D
i
s
t
r
i
b
u
t
i
n
g
P
D
F
F
i
l
e
s
In This Chapter
Preparing your PDF document collection
Modifying the Catalog Preferences
Creating the indexes for a PDF document collection
Searching the PDF files in a document collection
Circulating your PDF document collections
A
s you continue on your journey toward the goal of a truly paperless
office, your collections of PDF files will undoubtedly grow exponentially.
To keep on top of this burgeoning mountain of electronic information, you can
start cataloging your PDF documents by organizing them into discrete collec-
tions and creating indexes that make the collection fast and easy to search.
Catalogs provide a perfect way to archive the PDF files that are no longer in
current use but contain valuable information that you may need to find and
reuse at anytime in the future.
In this chapter, you discover the ins and outs of creating, maintaining, and
searching PDF document collections. In addition, you pick up some pointers
on how to package and distribute your collections for archiving or for general
use on your network.
Cataloging 101
Cataloging your PDF files entails two basic steps: organizing your PDF files
into a document collection ready for indexing, and then building the index.
The indexes that you build for your collection are what make it possible to
search for information across all the PDF files it contains and are also respon-
sible for speeding up the search significantly.
Creating the PDF document collection
The keys to creating a successful PDF document collection are organizing the
files and preparing them for indexing. To organize the files, you copy or move
them all into a single folder. (You can organize files into subfolders within this
folder, if necessary.) Before copying or moving the files into the collection
folder, make sure that you’re using only final versions of the PDF documents,
which contain all necessary bookmarks, links, and form fields, and for which
you’ve completed editorial review and made the final touch-up edits as well.
In preparing the files for indexing, you should make sure that you’ve added
the title, subject, author, and keywords metadata for each PDF document,
and in the case of documents that require a user password to open, you must
remove the password, because Acrobat 6 cannot catalog PDF files that are
password-protected.
Checking and editing the metadata
To check a PDF document’s metadata and, if necessary, add this information,
take these steps:
1. Launch Acrobat 6 and then open the PDF file whose metadata you
want to check.
2. Choose File➪Document Properties or press Ctrl+D (ÔÔ+D on the Mac);
in the Document Properties dialog box, click Description in the list box.
The Description options for the file appear, as shown in Figure 13-1.
276
Part III: Reviewing, Editing, and Securing PDFs 
Optimizing PDF files for indexing
When creating a collection you want to make
searchable across a network, especially in a
cross-platform environment (that is, one that
networks both Windows and Mac machines) or
a network with older DOS Windows machines
(pre-Windows XP), you should consider renam-
ing the files using the so-called eight-dot-three
file naming convention  (no more than  eight
characters  for  the  main  filename  with  no
spaces, a period, and a three-character file-
name extension). Also, make sure that all PDF
files in the collection use the .pdf filename
extension (necessary on the Windows  plat-
form). Finally, you can optimize indexing and
speed up searches by splitting long documents
up into smaller files, each of which contains a
chapter or major section.
Documents you may be interested
Documents you may be interested