Step 8: From the File Menu, choose Print Preview. 
The document will look similar to the picture shown above in Print Preview view. 
71 
Pdf print error no pages selected - Split, seperate PDF into multiple files in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Explain How to Split PDF Document in Visual C#.NET Application
break pdf into multiple files; break pdf into pages
Pdf print error no pages selected - VB.NET PDF File Split Library: Split, seperate PDF into multiple files in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET PDF Document Splitter Control to Disassemble PDF Document
combine pages of pdf documents into one; pdf file specification
Step 9: Zoom into the document by pushing the Zoom button with the mouse to get a better view of the  
data. 
Step 10: Select the Setup button.  The Page Setup window will appear as shown above.   
72 
C# HTML5 PDF Viewer SDK deployment on IIS in .NET
to the place where you store XDoc.PDF.HTML5 Viewer configure IIS to run and 500.19 error occurs, then 2. The site configured in IIS has no sufficient authority
break apart pdf; break up pdf file
VB.NET PDF - VB.NET HTML5 PDF Viewer Deployment on IIS
to the place where you store XDoc.PDF.HTML5 Viewer configure IIS to run and 500.19 error occurs, then 2. The site configured in IIS has no sufficient authority
pdf split and merge; can't select text in pdf file
Step 11: Choose Landscape Orientation leaving all other options as shown above. 
Step 12:  Select the Sheet tab in the Page Setup window and select as Print options Gridlines and Black and  
white.  Then press OK.  The figure above illustrates. 
73 
The document will now look similar to the picture shown above in Print Preview view. 
Step 13: Select the Page Break Preview button.  The view will change to the one shown above. 
74 
Step 14: Place your mouse pointer directly onto the blue lining at the far right and drag it over until all the  
data is enclosed into the page break view as shown above. 
Step 15: Go to the toolbar and change the view back to Normal View by selecting View -> Normal.  All  
empty rows may be deleted, if preferred by  selecting a row by clicking on one of the numbers on  
the left side of the document.  The row will be highlighted.  Right click and select Delete.  
75 
Multiple rows may be deleted at one time by holding down the CTRL key and selecting each row then right 
click over one of the numbers highlighted in blue while continuing to hold down the CTRL key then select 
Delete. 
The document will now look similar to the picture shown above in Normal view. 
76 
Step 16: For verification purposes, go to Print Preview to view how the document and data will look if  
printed. 
The final Excel document in Print Preview view. 
77 
The original PDF document viewed with Adobe Acrobat Reader®.
Note: The user should compare the significant data captured in both formats for further conversion  
verification. 
5. Error Messages 
5.1. Error 1 
System Error Message - Problem with the directory setup: Check to verify that the directory  
tree is setup correctly with the valid pathnames and PDF documents. 
5.2. Error 2 
System Error Message - Cannot get a list of files: Check to see if the directory exists. 
5.3. Error 3 
System Error Message - This error will give the specific error message pertaining to the  
problem that exists: Check to see if the document is valid and that  
there were no interruptions in processing.  User may need to  
recompile and re-run P2X. 
5.4. Error 4 
Program Error Message - Problem with VBSetup in the P2X program.  Program uses the  
directory list to identify which document is being processed: Check  
document formatting at time of error.  Confirm that the user is using  
valid PDF documents. 
6. Further Assistance 
For help or further assistance, email: mailto:lpenny_2002@yahoo.com
78 
VITA 
LaToyia DeVonne Penny 
Candidate for the Degree of 
Master of Science 
Thesis: DESIGN & IMPLEMENTATION OF A PDF TO EXCEL CONVERSION 
TOOL (P2X) 
Major Field: Computer Science 
Biographical: 
Personal Data:  
Born in Tulsa, Oklahoma, On August 19, 1976, the daughter of  
Donna and Ollie Penny. 
Education: 
Bachelor of Science degrees in Computer Science and Mathematics  
from Langston University, Langston, Oklahoma in May 1999. Completed the 
requirements for the Master of Science degree with a major in Computer  
Science at Oklahoma State University in December, 2008. 
Experience:  
Raised as an Air Force brat in Minnesota, Colorado, California,  
Virginia, Oklahoma City, Oklahoma, and Tulsa, Oklahoma; employed on the  
production line at BAMA Pies in Tulsa, Oklahoma during summers; employed by  
Langston University, Department of Mathematics and Department of Business as  
an undergraduate teacher's assistant; employed by United States Department of  
Energy during the summer of 1997 and 1999; employed by Oklahoma State  
University, Department of Computer Science 1999 to 2004 as a graduate RA, TA,  
and Instructor; employed by U.S. Department of Defense, 552 ACNS/SCOD  
Tinker Air Force Base, OKC, Oklahoma since 2004 as an I.T. Specialist. 
Professional Memberships:  
Delta Sigma Theta Sorority, Incorporated.  
ADVISER’S APPROVAL:   Dr. K. M. George 
Name: LaToyia DeVonne Penny                                        Date of Degree: July, 2009 
Institution: Oklahoma State University 
Location: Stillwater, Oklahoma 
Title of Study: DESIGN AND IMPLEMENTATION OF A PDF TO EXCEL 
CONVERSION TOOL (P2X) 
Pages in Study: 78  
Candidate for the Degree of Master of Science 
Major Field: Computer Science 
Scope and Method of Study:  
The scope of this study is limited to focus on an implementation of a conversion tool  
(P2X); developed to automatically convert large batches of PDF tabular data (PDF tables)  
to spreadsheet format (MS Excel).  We begin by introducing the PDF specification  
standards on table structure.  A scenario example of the problem and a description of the  
conversion tool (P2X) architecture.  Specific details of the algorithms and applications  
used during the PDF to plain text format (PTF) conversion process follows.  A brief  
overview of the reformatting process and a formalization of the table tags that we  
identified using regular expressions will be introduced.  Lastly, a description of the GUI,  
its images, and functionality will be discussed in the User Interface section. 
Findings and Conclusions:   
We have implemented a working conversion tool to show the conversion of PDF tabular 
data to MS Excel spreadsheets can be simple by use of a graphical user interface with 
user interaction.  This system was produced using the high-level programming languages 
Java and Visual Basic 6.0.  These implementations are presented.  A user's manual has 
been incorporated to validate the use of the system and reduce user error.  More visuals 
of the P2X tool to further assist the user with the problems presented throughout this 
research. Although P2X proved to be a successful conversion approach, it was discovered 
at the end of the final testing phase that the final output of the text data stored in the 
Excel spreadsheet file will need minimal manual editing by the user to dispose of 
unwanted non-breaking space and to suit the individual user’s storage preferences.  These 
preferences are expected to vary on a case-by-case basis. 
Documents you may be interested
Documents you may be interested