asp net pdf viewer control c# : Break pdf into multiple files SDK control service wpf azure asp.net dnn Penny_okstate_0664M_100050-part1653

DESIGN & IMPLEMENTATION OF A PDF TO  
EXCEL CONVERSION TOOL (P2X) 
By 
LATOYIA DEVONNE PENNY 
Dual Bachelor of Science in 
Mathematics and Computer Science 
Langston University 
Langston, Oklahoma 
1999 
Submitted to the Faculty of the 
Graduate College of the 
Oklahoma State University 
in partial fulfillment of  
the requirements for  
the Degree of  
MASTER OF SCIENCE 
July, 2009 
Break pdf into multiple files - Split, seperate PDF into multiple files in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Explain How to Split PDF Document in Visual C#.NET Application
break pdf password online; acrobat split pdf
Break pdf into multiple files - VB.NET PDF File Split Library: Split, seperate PDF into multiple files in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET PDF Document Splitter Control to Disassemble PDF Document
pdf rotate single page; break pdf into pages
DESIGN AND IMPLEMENTATION OF A PDF TO 
EXCEL CONVERSION TOOL (P2X) 
Thesis Approved: 
Dr. K. M. George 
Thesis Adviser 
Dr. N. Park 
Dr. G. Hedrick 
Dr. A. Gordon Emslie 
Dean of the Graduate College 
C# PDF Page Insert Library: insert pages into PDF file in C#.net
Offer PDF page break inserting function. the ability to inserting a new PDF page into existing PDF processing functions, such as how to merge PDF document files
split pdf into multiple files; break apart pdf pages
VB.NET PDF Page Insert Library: insert pages into PDF file in vb.
Able to add and insert one or multiple pages to existing adobe Offer PDF page break inserting function. DLLs for Adding Page into PDF Document in VB.NET Class.
pdf no pages selected to print; break a pdf file
ACKNOWLEDGMENTS 
I would like to extend my sincere appreciation to my graduate advisor, Dr. K.M. 
George for his constructive research guidance, intellectual advice, and support.  My 
appreciation also extends to my other committee members Dr. Hedrick and Dr. Park 
whose assistance and guidance has been indescribable.  I would like to thank Dr. George 
and the staff of the Department of Computer Science at OSU, Stillwater for providing me 
with this research opportunity and their generous financial support.  Moreover, I wish to 
thank the OC-ALC/ENET and 552 CSS/SCT and SCZ organizations at Tinker Air Force 
Base, and the Information Technology Department at OSU/OKC for giving me the 
opportunity to advance in my career, for the learning experiences, and for financial 
support.   
I would also like to express my sincere gratitude to those who provided suggestions, 
assistance, and advice while inspiring me throughout my research: Uncle Eddy and Aunt 
Vi, Grandma Ruth, Aunt Leota (Deceased), Kenneth Simmons, Leander Johnson, Liz 
Ruckwied, Carol Drink, Major John K. Pringle, James Harned, and my father Ollie. 
iii
I would like to give my special appreciation and dedication to my siblings LaTonja, LaTrishia, 
Justin, David, my babies Jada, Javen, and Jlonna, and my heart, Quenita, for her unbiased 
suggestions, her strong encouragement in times of difficulty, and support that only she could 
articulate.  Thank you to my loving mother, Donna Marie, for her undying love, support, 
encouragement, and for being a major influence throughout my life.  True love is unconditional. 
Lastly, I would like to thank God my father in heaven from whom all blessings flow.  Without 
Him, none of this would have been possible. 
iv
TABLE OF CONTENTS 
Chapter                                                Page           
I. INTRODUCTION.........................................9 
Problem Statement................................10 
Purpose of Study.................................11 
Objectives of the Study..........................11 
Scope and Limitations............................12 
II. REVIEW OF THE LITERATURE............................13 
Adobe PDF to HTML Converter......................13 
PDFtoText©.......................................14 
Manual Conversion Method.........................15 
The Influence of Herman Hollerith................16 
Commercial Software..............................16 
Convert Doc......................................18 
On-Demand PDF to HTML............................19 
XML and XFDL.....................................20 
III. METHODOLOGY.........................................22 
Overview.........................................22  
PDF Specification................................22  
P2X Architecture.................................24  
PDF to PTF Conversion............................26 
PDFtoText© Description..........................27  
Usage Parameters and Options...................27 
PDF Document Layout Issues.....................29 
The Reformatting Process.........................31 
Table Tags.......................................33  
Graphical User Interface.........................37  
Run P2X.........................................37  
P2X GUI Description.............................39 
IV. CONCLUSION..........................................40  
Discussion of Conversion.........................40  
Future Work......................................41  
V. 
BIBLIOGRAPHIC REFERENCES............................43  
VI. APPENDICES..........................................46 
APPENDIX A--P2X JAVA  
PROGRAM CODE........................46 
APPENDIX B--CDTMOD1-5-04 
VB CODE.............................61 
APPENDIX C--EXCELCONVERT  
VB CODE.............................65 
APPENDIX D--P2X USER'S  
MANUAL..............................70  
vi 
LIST OF FIGURES 
Figure                                                 Page           
1. P2X GUI Architecture.................................24 
2. Usage Parameters Entered Using  
Derek B. Noonburg's PDFtoText©  
App to Convert PDF Docs to Text...................25 
3. P2X GUI Description..................................38 
4. P2X Process Flow Chart...............................63 
5. Parent Directories of Stored PDF Files...............65 
6. Example of Initially Stored  
Agriculture PDF Files Before Running  
P2X................................................65 
7. Change the Directory to the Location  
of the P2X Program.................................65 
8. Progress Bar.........................................66 
9. User Friendly Pop-Up Screens to Reassure  
Document Progress..................................66 
10. Form 1...............................................66 
LIST OF TABLES 
Table                                                  Page            
I. Commonly Used Document Format  
Types and Their Organizations.....................20
II. PDFtoText Optional Entries  
and Their Descriptions............................26 
vii 
Nomenclature/Definition of Terms 
3PP  
three phase process 
AAR  
Adobe Acrobat Reader® 
AFF  
American Fact Finder 
Batch     
a large amount of files 
CD 
MS DOS change directory command 
C.S.  
computer science 
Delimiters 
characters inserted to delimit columns in  
tables of valid PDF documents 
Java  
Sun Microsystems® java object-oriented  
programming language 
Mod1  
module 1 application  
Mod2  
module 2 application  
MS Excel  
Microsoft® Excel software application 
Out1  
output file 1 
PDF  
portable document format 
PTF  
plain text file 
RMA  
records management application 
VB6  
Microsoft® Visual Basic 6.0 
viii 
CHAPTER I 
INTRODUCTION 
The need to make major advances in the area of data 
conversion processes has been expressed by various 
organizations [8].  In this day and time, the use of Adobe 
Acrobat's© portable document format (PDF) is a popular 
choice amongst most for the distribution of significant 
publications and documents.  The popularity and ubiquity of 
PDF, causes the ability to retain significant data quick, 
relatively inexpensive, and without complexity to become 
attractive commodities for organizations in reaching 
greater flexibility and predicting higher standards for 
data utilization [5]. 
By the use of document conversion, organizations and 
ordinary users alike will have the ability to capture the 
PDF data and transform it to a more suitable format to 
achieve their ultimate goals.  While other document formats 
are available, and will be discussed, converting the PDF 
documents has an advantage because it allows the user to 
modify significant data.  However, this process can be 
considerately tedious and time consuming when done 
manually.  This in-turn has an adverse effect on the amount 
of money spent to complete the task. 
In the following chapter Review of Literature; we will 
briefly discuss conversion programs that have previously 
been done on various document formats and processes.  In 
Chapter III, Methodology, the problem that has been 
researched is described and problems that the study 
resolves are presented.  Finally, the thesis concludes with 
the results of the research and future works are exposed. 
Problem Statement 
Currently, researchers express the need to make major 
advances in methodology and applications in the area of 
data conversion processes [16].  Organizations produce data 
for publication and use by other government agencies, 
individuals, and private sector organizations, alike.  Much 
of the data is then processed and used for the individuals 
or organizations personal publications.  Problems persist 
for customers when the need for processing large amounts of 
the published data into manageable formats in an effort to 
Documents you may be interested
Documents you may be interested