1
COMP4905 Honor Project 
Web-based File Upload and Download 
System 
Author: Yongmei Liu 
Student number: 100292721 
Supervisor: Dr. Tony White 
Pdf fillable form - C# PDF Form Data fill-in Library: auto fill-in PDF form data in C#.net, ASP.NET, MVC, WinForms, WPF
Online C# Tutorial to Automatically Fill in Field Data to PDF
create fillable forms in pdf; convert pdf to pdf form fillable
Pdf fillable form - VB.NET PDF Form Data fill-in library: auto fill-in PDF form data in vb.net, ASP.NET, MVC, WinForms, WPF
VB.NET PDF Form Data fill-in library: auto fill-in PDF form data in vb.net, ASP.NET, MVC, WinForms, WPF
convert pdf fillable form to word; create a fillable pdf form online
2
Abstract 
This project gives solutions of how to upload documents to the webserver as well as 
how to perform a fast search using Lucene search engine. The user needs to be 
authenticated to be able to use the service. The search can be done by using the 
document’s contents as well as keywords and category assigned when it was uploaded. 
The supported file formats are: html, PDF, rtf, doc, xml and txt. The web container 
used in the project is Tomcat. 
C# PDF Field Edit Library: insert, delete, update pdf form field
A professional PDF form creator supports to create fillable PDF form in C#.NET. An advanced PDF form maker allows users to create editable PDF form in C#.NET.
convert pdf fillable forms; create fillable form from pdf
VB.NET Create PDF from PowerPoint Library to convert pptx, ppt to
Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process. Convert multiple pages PowerPoint to fillable and editable PDF documents.
create a pdf form to fill out and save; pdf form fill
3
Acknowledgement 
I would like to thank  my supervisor, Dr. Tony White and my friend: Mr. Kevin 
Yamamoto for their guidance, help and support during my project. 
VB.NET Create PDF from Word Library to convert docx, doc to PDF in
Link: Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process. Convert multiple pages Word to fillable and editable PDF documents.
convert word form to fillable pdf form; form pdf fillable
VB.NET Create PDF from Excel Library to convert xlsx, xls to PDF
Link: Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process. Create fillable and editable PDF documents from Excel in Visual
convert pdf fillable form; best pdf form filler
4
Table of Contents 
COMP4905 Honor Project................................................................................................................1
Web-based File Upload and Download System................................................................................1
Abstract.............................................................................................................................................2
Acknowledgement ............................................................................................................................3
Table of Contents..............................................................................................................................4
Introduction.......................................................................................................................................5
Design Decision................................................................................................................................7
Developing Environment and Tools..................................................................................................8
Developing Platform.....................................................................................................................8
Environment overview..................................................................................................................9
APIs............................................................................................................................................10
Developing Application Tools.....................................................................................................11
Implementation...............................................................................................................................12
File upload..................................................................................................................................13
Document indexing.....................................................................................................................14
Document search.........................................................................................................................17
Run time environment setup and deployment.................................................................................19
User guide.......................................................................................................................................20
User authentication .....................................................................................................................20
File upload and indexing.............................................................................................................20
Document Search and Download................................................................................................20
Test scenarios..................................................................................................................................22
Reference........................................................................................................................................24
Glossary..........................................................................................................................................25
Appendix.........................................................................................................................................26
File list........................................................................................................................................26
C# Create PDF from PowerPoint Library to convert pptx, ppt to PDF
Convert multiple pages PowerPoint to fillable and editable PDF documents. Easy to create searchable and scanned PDF files from PowerPoint.
create fill pdf form; adding signature to pdf form
C# Create PDF from Excel Library to convert xlsx, xls to PDF in C#
Create fillable and editable PDF documents from Excel in both .NET WinForms and ASP.NET. Create searchable and scanned PDF files from Excel.
pdf signature field; create pdf fillable form
5
Introduction 
The purpose of the project is to build a web site that allows students to submit papers 
to  a central  repository.  The  Users  must  provide  keywords to  describe  the  paper 
submitted,  along  with  a  small  number  of  categories.  The  papers  received  are 
automatically indexed and inserted into a database. The web site provides three types 
of interfaces:   
1)  User login/register interface: Users need to be authenticated to be able to access 
the service. 
2)    “Upload”  (build index) interface: Users  are allowed to  provide keywords to 
describe the paper submitted. The paper received will be automatically indexed 
and inserted into a database.   
3)    “Search” interface: Users can retrieve papers from the database. Lucene is used 
to index the files in the database. 
Papers submitted in PDF, DOC, RTF, text, HTML and XML formats are supported in 
both interfaces. Lucene is used to index the files in the database. Only authenticated 
users are able to submit papers to the database. Accessible through a web browser and 
based on a thin client, the Central Repository provides a single environment to store 
the  papers  submitted  by  users.  Lucene  also  is  used  as  the  core  of  any  search 
functionality. 
This  report  covers  the  Design  Decisions,  Developing  Environment  and  Tools, 
Implementation, Run Time Environment Setup and Deployment, and User Guide. 
C# Create PDF from Word Library to convert docx, doc to PDF in C#.
Convert multiple pages Word to fillable and editable PDF documents in both .NET WinForms and ASP.NET. Convert both DOC and DOCX formats to PDF files.
pdf fill form; acrobat fill in pdf forms
C# Create PDF Library SDK to convert PDF from other file formats
Create fillable PDF document with fields. Load PDF from existing documents and image in SQL server. Load PDF from stream programmatically.
allow users to attach to pdf form; convert an existing form into a fillable pdf form
6
Figure 1 charts the process. 
Figure 1 The flow chart
Database 
User login 
Authenticate 
Upload 
Search 
Index 1 
Index 2 
Index 3 
…… 
File1 
File2 
File3 
Webserver 
Fail 
Pass
C# Create PDF from OpenOffice to convert odt, odp files to PDF in
An advanced .NET control to change ODT, ODS, ODP forms to fillable PDF formats in Visual C# .NET. Online source code for C#.NET class.
change font size pdf fillable form; convert pdf to form fill
VB.NET Create PDF from OpenOffice to convert odt, odp files to PDF
Link: Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process. Turn ODT, ODS, ODP forms into fillable PDF formats.
convert pdf to form fillable; change font size in pdf fillable form
7
Design Decision 
1.  Tomcat was chosen to be web server container because it is open source, easy to 
install (embedded in JWSDP) and easy to use.  It works on most all  popular 
operating system and independent of platform.   
2.  In order to achieve the ease for change, a file: “configuration.jsp” being created to 
specify the paths. 
3.  Lucene was selected as it is fast indexing, independent index database platform 
that adapts from one platform to another. Lucene also integrates directly with the 
Web application. Lucene works with any kind of plain text data. 
4.  Upload Bean is a Java component that allows the uploading of files. This bean 
can be integrated in any JSP/Servlets application.   The application is available as 
shareware as a low cost solution. 
5.  “DOC” is the most popular document format. In this project, we provide the 
solution for “DOC” format indexing. POI (an API is for converting word format 
to  .txt  format)  was  selected  as  it  supports  Microsoft's  OLE  2  Compound 
Document format. Also it will support Java Excel solution as well as Java Word 
solution. 
8
Developing Environment and Tools   
This project is developed using Java WSDP1.2 with Apache Tomcat 4.1.2 container 
under Windows  environment.  The  following  Open  Source  APIs are also  used  to 
implement the required functionalities:   
UploadBean1.5 – File upload Java Bean 
Lucene 1.3 – Document keywords index and search 
PDFBox – Convert PDF document to text format for index building 
POI - Convert MS Word document to text format for index building 
Javax.swing.text.rtf – Convert rtf document to text format for index building 
Developing Platform 
Eclipse is used to develop Java, JSP, and Servlet. 
Eclipse is an open platform for tool integration built by an open community of tool 
providers. Operating under an open source paradigm, with a common public license 
that provides royalty free source code and worldwide redistribution rights, the eclipse 
platform  provides tool developers  with  ultimate  flexibility  and  control  over their 
software technology. 
Lomboz plug-in is added mainly for Servlet development on top of Eclipse as well as 
compressing all the executable files and libraries in this project. 
Lomboz is an open-source plug-in for Eclipse Development Platform. Lomboz for 
9
Eclipse essentially enables Java developers to build, test and deploy using J2EE based 
100% Java Application Servers. Lomboz integrates various J2EE component and web 
application development tasks with Eclipse and some of the most popular application 
servers. 
Environment overview 
Operating System: Windows 2000/XP 
JDK 1.4 with runtime environment (JRE) 
JWSDP  1-2  -  The  Java  Web  Services  Developer  Pack  (Java  WSDP)  is  a  free 
integrated toolkit that allows Java developers to build and test XML applications, Web 
services,  and  Web  applications  with  the  latest  Web  services  technologies  and 
standards implementations. It has Apache Tomcat built-in. 
Apache Tomcat 4.1.2 implements the Servlet and JavaServer Pages specifications 
from Java Software, and includes many additional features that make it a useful 
platform for developing and deploying web applications and web services.  
10
APIs 
Lucent  gets  involved  in  most  part  of  the  project.  It  is  a  high-performance, 
full-featured text search engine library written entirely in Java. It is a technology 
suitable  for  nearly  any  application  that  requires  full-text  search,  especially 
cross-platform.   
Upload Bean provides a simple API to read and store uploaded files sent from a 
browser.  It  is  a  "technical"  component  that  could  be  integrated  in  any 
JAVA/JSP/Servlets application.    
PDFBox is a Java API providing conversion from PDF format to text.  
POI is a Java API used to convert word type file to text. The POI project consists of 
APIs for manipulating various file formats based upon Microsoft's OLE 2 Compound 
Document format using pure Java. In short, you can read and write MS Excel files 
using Java. Soon, you'll be able to read and write Word files using Java. POI is your 
Java Excel solution as well as your Java Word solution.   
Javax.swing.text.rtf is a Java API used to convert rtf document to text format for 
index building. 
Documents you may be interested
Documents you may be interested