H623 
Data Import/Export 
Techniques with Acrobat 5.0
Kas Thomas 
Documentation Manager 
eBusiness Integration Products Division 
SilverStream Software, Inc. 
<kthomas@silverstream.com>
Copyright 2002 by Kas Thomas. All rights reserved.
Copyright 2002 by Kas Thomas. All rights reserved.
Pdf select text - search text inside PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn how to search text in PDF document and obtain text content and location information
find and replace text in pdf file; can't select text in pdf file
Pdf select text - VB.NET PDF Text Search Library: search text inside PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn How to Search Text in PDF Document and Obtain Text Content and Location Information in VB.NET application
pdf make text searchable; search text in pdf using java
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
C#: Select All Images from One PDF Page. C# programming sample for extracting all images from a specific PDF page. C#: Select An Image from PDF Page by Position.
pdf text search; search text in multiple pdf
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
VB.NET : Select An Image from PDF Page by Position. Sample for extracting an image from a specific position on PDF in VB.NET program.
pdf select text; select text in pdf reader
What This Course is NOT
About 
Graphic Design  
Acrobat Menu Commands 
PDF for Prepress  
Distiller, PDFMaker, or pdfmarks 
Acrobat plug-in development with C/C++ 
Interapplication communication (VBScript, AppleScript) 
What This Course IS
About: 
New Acrobat techniques of potential importance  
in an enterprise-computing and/or Web environment  
Programmatic manipulation of PDF document structure 
Data import/export via Acrobat  
Realtime PDF report generation 
Acrobat Database Connectivity (ADBC) 
Copyright 2002 by Kas Thomas. All rights reserved.
1
VB.NET PDF Text Redact Library: select, redact text content from
VB.NET PDF - Redact PDF Text. Help Users to Redact PDF Text to Protect PDF Document in VB.NET. Overview. Redact PDF Text using VB.NET. Add necessary references:
search pdf files for text programmatically; search multiple pdf files for text
C# PDF Text Redact Library: select, redact text content from PDF
C#.NET PDF SDK - Redact PDF Text in C#.NET. C# Demo Code for Redacting PDF Text to Protect Your PDF Document in C#.NET Project. Best
searching pdf files for text; find text in pdf image
Acrobat Functionality FAQ 
* If you know how!
Can you: 
Acrobat 
4.0
Acrobat 
5.0
Reader 
5.0
Communicate 
with browser?
No
No
No
Use DOM 
Methods?
No
No
No
Call Java 
classes?
No
No
No
Send e-mail 
from PDF?
Yes
Yes
No
Save form 
data?
Yes
Yes
No
Import form 
data?
Yes
Yes
Yes
Import 
annotations?
Yes
Yes
No
Read text data?
No
Yes*
No
Write to non-
PDF/FDF files?
No
Yes
No
Do SQL queries 
thru ODBC?
No
Yes
No
Use external .js 
libraries?
Yes
Yes
Yes
Allow access 
to, or otherwise 
use the 
capabilities of, 
Acrobat on a 
server
No
No
N/A 
Copyright 2002 by Kas Thomas. All rights reserved.
2
C# HTML5 PDF Viewer SDK to view PDF document online in C#.NET
Tools Tab. Item. Name. Description. 1. Select tool. Select text and image on PDF document. 2. Hand tool. Pan around the document. Go To Tab. Item. Name. Description
cannot select text in pdf; how to search text in pdf document
VB.NET PDF- View PDF Online with VB.NET HTML5 PDF Viewer
Tools Tab. Item. Name. Description. 1. Select tool. Select text and image on PDF document. 2. Hand tool. Pan around the document. Go To Tab. Item. Name. Description
pdf find text; pdf search and replace text
Why Can't I Run Acrobat on a Server?
• 
Because Adobe wants you to buy its upcoming server 
products. 
• 
Because Adobe wants to continue selling copies of 
Acrobat so that the company can stay in business. 
• 
Bottom line: Acrobat functionality is too valuable to 
give away free. 
What Kinds of PDF-Related Things Do People Want to 
Do on a Server? 
Document merging (content aggregation) 
Auto-generation of custom PDF content 
CGI processing (form handling) 
Data extraction, analysis, transformation 
Conversion between formats (PDF, HTML, XML, etc.) 
Online collaboration 
Copyright 2002 by Kas Thomas. All rights reserved.
3
VB.NET PDF - View PDF with WPF PDF Viewer for VB.NET
Tools Tab. Item. Name. Description. Ⅰ. Hand. Pan around the PDF document. Ⅱ. Select. Select text and image to copy and paste using Ctrl+C and Ctrl+V.
text searchable pdf file; how to select all text in pdf
C# WPF PDF Viewer SDK to view PDF document in C#.NET
Tools Tab. Item. Name. Description. Ⅰ. Hand. Pan around the PDF document. Ⅱ. Select. Select text and image to copy and paste using Ctrl+C and Ctrl+V.
how to select text in pdf and copy; find text in pdf files
What Kinds of Things Don't People Understand? 
Document merging: The easy solution here is X/FDF. Many 
free tools available; underlying technology is not hard to understand. 
Innovative solutions are waiting to be discovered/exploited. 
Auto-generation of custom PDF content: Potentially difficult, 
depending on mission requirements. Significant investment in third-
party tools and/or in-house development may be required. 
CGI processing (form handling): No-brainer, for the most part. 
Standard HTML form-handling techniques apply. 
Data extraction, analysis, transformation: If you're tasked 
with parsing raw PDF, you're in for a rough time. PDF remains a 
difficult, complex format. The good news: Some excellent third-
party libraries exist for manipulating low-level PDF objects. 
Conversion between formats (PDF, HTML, XML, etc.) Can 
require an investment in third-party solutions. XFDF means PDF 
form data can live in the XML world, opening up transformation of 
PDF form data via tools that support XPath, XSLT, DOM methods, 
and other X-technologies. 
NOTE: The best opportunity for a full bridge between PDF and XML 
may be SVG (Scalable Vector Graphics).  
Online collaboration requires a full copy of Acrobat but is 
ready now and easy to use. 
Copyright 2002 by Kas Thomas. All rights reserved.
4
C# WPF PDF Viewer SDK to annotate PDF document in C#.NET
Line color. Select the line color when drawing annotations on PDF document. Default create. Click to select drawing annotation with default properties. Text box.
convert a scanned pdf to searchable text; how to select text in pdf reader
VB.NET PDF - Annotate PDF with WPF PDF Viewer for VB.NET
Line color. Select the line color when drawing annotations on PDF document. Default create. Click to select drawing annotation with default properties. Text box.
select text in pdf; pdf editor with search and replace text
Signs that You Are Becoming a PDF Bag Lady  
You are thinking that your problems are best solved with 
a Reader plug-in.  
Development and distribution of Reader plug-ins is almost never 
the answer to anything. If what you have in mind is a truly killer 
feature for Reader, Adobe probably won’t allow it.  
NOTE: The Acrobat SDK is for Acrobat plug-in development, not 
Reader plug-in development. 
You want to keep users from printing or copying 
particular PDF documents 
Files can always be copied. Screen images can always be 
dumped to a printer. What, exactly, did you have in mind? 
You want to write data to your user’s disk and/or do 
sneaky things behind the user’s back.  
There are sound security reasons behind Adobe’s decision to 
disallow certain kinds of operations (with Reader, in particular). If 
what you want to do isn’t allowed by the API, there is likely a good 
reason for it. What you want to do probably isn’t rational
Copyright 2002 by Kas Thomas. All rights reserved.
5
Document Manipulation 
Acrobat 5.0 allows you to open and close PDF docs programmatically, 
even in Reader
The 
openDoc()
method belongs to the App object. 
The 
closeDoc()
method belongs to the Doc object. 
No AcroJS method can search your file system, recurse directories, nor 
call batch files. You have to tell Acrobat where to find your file(s), explicitly. 
var theFile = "/C/PROGRAM FILES/ADOBE/" +  
"ACROBAT 5.0/Help/AcroJS.pdf"; 
var docHandle = app.openDoc( theFile ); 
In order to manage multiple open PDF documents programmatically, you 
must have Doc-object references to all documents. 
Acrobat 5.0 gives you an array of open documents in the 
app.activeDocs
array. 
Use caution! When a document goes out of scope, your handle to it is no 
longer safe. Therefore, look up Doc object references just-in-time. 
Copyright 2002 by Kas Thomas. All rights reserved.
6
PROBLEM: You want to know if a document called "CodeRunner.pdf" is 
open so you can bring it to the front. 
SOLUTION: Create a utility function that, given a file name (or portion 
thereof), will look up the file's object reference. 
// Utility to get Doc ref from filename: 
function getHandle( docName )  
var docs = app.activeDocs; 
for (var i = 0; i < docs.length; i++) 
if (docs[i].path.match( docName ) ) 
return docs[i]; 
return null; 
// See if CodeRunner.pdf is open: 
var doc = getHandle("CodeRunner.pdf"); 
// if so, bring it to front: 
if (doc != null) 
doc.bringToFront(); 
NOTE: The .match() method lets you use either a string arg or a RegExp 
object. This is a much more powerful tactic than using the String object's 
indexOf() method. 
Copyright 2002 by Kas Thomas. All rights reserved.
7
Page Manipulations 
Acrobat 5.0 offers several new page manipulation methods: 
deletePages()  
extractPages() 
insertPages() 
movePage() 
replacePages()
These methods are (obviously) parented off the Doc object. 
They do not work in Reader. 
Their intended purpose is self-evident in each case.  
EXAMPLE: 
// move page 13 to page 20 
try { 
this.movePage(13, 20); 
}  
catch(e) {  
app.alert("Doh! " + e); 
Ask yourself why this might throw an exception. 
(HINT: What if the doc is write-
protected against modifications?)
Copyright 2002 by Kas Thomas. All rights reserved.
8
Documents you may be interested
Documents you may be interested