pdf reader library c# : How to delete text from pdf application SDK utility azure wpf web page visual studio NewFormat-AB-LuraTech-PDF-Compressor-Enterprise-Quick-Start-Guide-v7.4-2015-12-211-part948

PDF Compressor Enterprise – Getting Started Guide  
www.luratech.com 
info@luratech.com 
Setting up Job Entries: 11 
  Extra Extensions List serves to supply a list of additional file extensions to 
process. This entry is only enabled, when Born Digital Conversion is installed. 
The individual extensions entered must be separated by blank spaces. 
4.  The Rasterize PDF Input setting offers different modes for handling PDF input documents: 
a.  Automatic is the default setting. In this mode PDF Compressor will automatically 
determine in which cases to convert typeset or vector contents of PDF input files into 
raster graphics. It will try to avoid such conversions, but will resort to them as a 
fallback option for documents that cannot be  converted otherwise. 
b.  Always  – this  mode  will convert  all  pages of  all PDF input documents  to  raster 
graphics  before  compressing  or  converting  them.  For  PDF  input  this  mode  is 
equivalent to the former MRC Compression mode. 
c.  With the Never setting the PDF Compressor will not try to rasterize any non-raster 
input. In this way you avoid unintentional conversion of typeset or vector content 
into raster graphics. On the other hand, this may result in failure to convert certain 
kinds of PDF input files to PDF/A. 
Please note that with the Automatic or Never setting chosen, raster graphics already present in 
the input documents may still  be resampled or compressed, if  Color image optimization  or 
Bitonal image optimization are selected on the Compression tab. (Such graphics may e.g. be 
scanned pages or large images inside a PDF document.) 
Configuring Data Output 
The Output tab lets you configure PDF output options including the exact version of PDF to 
generate and the location where generated PDF files are placed.  
How to delete text from pdf - delete, remove text from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# developers to use mature APIs to delete and remove text content from PDF document
acrobat delete text in pdf; how to delete text from pdf reader
How to delete text from pdf - VB.NET PDF delete text library: delete, remove text from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET Programming Guide to Delete Text from PDF File
delete text pdf acrobat; erase text from pdf file
PDF Compressor Enterprise – Getting Started Guide  
www.luratech.com 
info@luratech.com 
Setting up Job Entries: 12 
1.  Select Place output next to input file, and the generated PDF file will be placed into the same 
directory as the input file. 
Select Place output in directory and specify a folder by use of the browse button   to put 
the output somewhere else
6
.  
2.  Overwrite existing lets you select the behavior of PDF Compressor when it attempts to write 
an output file that is already present at the respective location: Either the output file will not 
be written (and you will find an error message in the log file) or the existing file will be 
overwritten. 
3.  Select Delete empty folders if you want to clean up the output directory sub tree. This option 
is only available if you select Include subfolders for the input processing.  
4.  The option PDF Output Format lets you choose the exact version of PDF to create. 
LuraTech PDF Compressor can create PDF documents conforming with different versions of 
the PDF standard or different so-called conformance levels of PDF/A. These formats and their 
differences are briefly explained here. 
The general recommended default is PDF/A-2u. 
6
The text edit window for the output folder accepts file drag & drop: Just drag & drop a folder from the 
tiŶdoǁs™ Edžplorer iŶto this ǁiŶdoǁ͘ 
VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
›› VB.NET PDF: Delete PDF Page. VB.NET PDF - How to Delete PDF Document Page in VB.NET. Visual Basic Sample Codes to Delete PDF Document Page in VB.NET Class.
delete text from pdf acrobat; online pdf editor to delete text
C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
Page: Delete Existing PDF Pages. |. Home ›› XDoc.PDF ›› C# PDF: Delete PDF Page. C#.NET PDF Library - Delete PDF Document Page in C#.NET.
delete text from pdf file; delete text from pdf preview
PDF Compressor Enterprise – Getting Started Guide  
www.luratech.com 
info@luratech.com 
Setting up Job Entries: 13 
a.  Adobe™ Reader™ 5.0 (PDF 1.4) 
The decomposition of images into different layers and masks is supported in a usable 
way  since  Adobe™  Reader™  5.0  (PDF  1.4).  PDF  documents  produced  by  PDF 
Compressor require a viewer to support at least PDF 1.4 to be displayed properly. 
b.  Adobe™ Reader™ 6.0 (PDF 1.5)  
Adobe™ Reader™ 6.0 (PDF 1.5) is able to handle JPEG 2000 image compression. If 
you choose this format, foreground and text color images of MRC compressed pages 
will be stored in JPEG 2000/Part1 format. This results in better image quality and 
smaller  file sizes. But files created in this format require a viewer to support at least 
PDF 1.5 to be properly displayed. 
c.  Adobe™ Reader™ 7.0 (PDF 1.6) 
The Adobe™ Reader™ 7.0 compatibility mode uses the  same PDF features as for 
Adobe™ Reader™ 6.0 with the only exception that larger page sizes are supported. 
With Adobe™ Reader™ 6.0 compatibility the page size is limited to 200 by 200 inches. 
With Adobe™ Reader™ 7.0 compatibility there is no such limit. 
d.  PDF/A-1a (ISO 19005-1) 
Same as PDF/A-1b, but with automatically inserted rudimentary tagging information 
to conform to basic requirements of PDF/A-1a. 
e.  PDF/A-1b (ISO 19005-1) 
This is the basic compliance level of the original PDF/A document standard for long-
term preservation. It is  based on PDF 1.5 with further restrictions  regarding e.g. 
metadata, encryption and transparency. 
f.  PDF/A-2b (ISO 19005-2) 
PDF/A-2 is a revision of the original PDF/A-1 standard, allowing for some additional 
types of content, such as images compressed using JPEG2000 and other PDF/A files 
embedded as attachments. 
g.  PDF/A-2u (ISO 19005-2) 
This is the general recommended default. The format is the same as PDF/A-2b with 
the additional advantage that all text within the PDF must have a consistent Unicode 
mapping. 
h.  PDF/A-3b (ISO 19005-1) 
The PDF/A-3 standard is equivalent to PDF/A-2 with the only difference that it allows 
files of arbitrary type to be embedded as attachment to the PDF/A-3 documents. 
i.  PDF/A-3u (ISO 19005-1) 
Corresponds to PDF/A-3b, again with the additional requirement for text within the 
PDF to have a consistent Unicode mapping. 
5.  Output Splitting can be activated in two ways: 
a.  Split output PDF files into chunks of <number> pages lets you limit the number of 
pages output to a single PDF document. Instead of writing huge PDF documents with 
VB.NET PDF Text Extract Library: extract text content from PDF
PDF ›› VB.NET PDF: Extract PDF Text. VB.NET PDF - Extract Text from PDF Using VB. How to Extract Text from PDF with VB.NET Sample Codes in .NET Application.
pdf editor online delete text; delete text pdf preview
C# PDF Text Extract Library: extract text content from PDF file in
XDoc.PDF ›› C# PDF: Extract PDF Text. C# PDF - Extract Text from PDF in C#.NET. Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File.
pdf editor delete text; how to delete text from pdf
PDF Compressor Enterprise – Getting Started Guide  
www.luratech.com 
info@luratech.com 
Setting up Job Entries: 14 
many pages, a series of output files can be created, each with the specified number 
of pages. 
b.  Split  output  PDF  files  when  new  barcode  is  detected  is  only  available  when the 
barcode detection is turned on at the OCR tab. If enabled, this function splits the 
output into multiple documents, whenever a new barcode is detected on a page. 
(The next document begins with the first page that contains a new barcode.) 
2.  Output File Renaming can be used to customize the naming of PDF output files. The file name 
template is used to form the output file names. If Output Splitting is enabled you need to 
enter escape sequences to distinguish the output names of the different chunks. A typical 
example for page number based splitting is %F_%P-%L, were %F is substituted by the input 
file name, %P by the first page number within the chunk, and %L by the last page number. 
Press the help button   next to the entry for details and more examples. 
Configuring Post-Processing 
The Post-Processing tab lets you configure additional actions to be performed on input files once 
they have been processed. 
1.  Rename input files renames input files according to the given File name template. The help 
button   will display such a list within the PDF Compressor application. 
C# PDF insert text Library: insert text into PDF content in C#.net
Text to PDF. C#.NET PDF SDK - Insert Text to PDF Document in C#.NET. Providing C# Demo Code for Adding and Inserting Text to PDF File Page with .NET PDF Library.
how to delete text in pdf converter; delete text pdf file
C# PDF Text Search Library: search text inside PDF file in C#.net
Text: Search Text in PDF. C# Guide about How to Search Text in PDF Document and Obtain Text Content and Location Information with .NET PDF Control.
acrobat remove text from pdf; how to delete text from a pdf
PDF Compressor Enterprise – Getting Started Guide  
www.luratech.com 
info@luratech.com 
Setting up Job Entries: 15 
2.  The next two sections define the action on an input file either if the processing of the file was 
successful (a PDF document could be created), or if it failed (no PDF output). If the job has 
been aborted by the user before the processing of an input file has been finished, the input 
file will not be moved or deleted in any case (as a user abort is not considered a failure). 
For successfully processed input files there are three options: 
a.  Keep input file: The file is just left at its location, but may be renamed according to 
the Rename input files setting. 
b.  Delete input file: After the PDF file is generated, the input file is deleted. Files used as 
input for embedding as file, bookmarks, metadata or hidden text are also deleted in 
case the option General input directory and name modifier (%F) are used. Be careful 
with this option! If you note later, that the output PDF does not fit your needs, e.g. 
you need another quality, than you have lost your original data. 
c.  Move input file to a folder: Use the  browse button 
to select the destination 
directory where all successfully processed input files should go to
7
. In case the input 
directory is scanned recursively, a corresponding directory sub tree will be generated 
to hold the moved input files. Files used as input for embedding as file, bookmarks, 
metadata or hidden text are also moved in case the option General input directory 
and a name modifier (%F) are used.    
  Delete empty folders: This option is only available if you select Move input file 
and Include subfolders for the input processing. It will clean up the directory sub 
tree  of  the  moved  input files once  a job  has  been finished (or a hot  folder 
becomes idle). 
3.  For failed input files there are two options: 
a.  Keep input file: The file is just left at its location (no action on input file). 
b.  Move input file to a folder: Use the  browse button 
to select the destination 
directory where all failed input files should go to
7
. If the input directory is scanned 
recursively, a corresponding directory sub tree will be generated to hold the moved 
input files. Files used as input for embedding as file, bookmarks, metadata or hidden 
text are also moved in case the option General input directory and a name modifier 
(%F) are used. 
  Delete empty folders: This option is only available if you select Move input file 
and Include subfolders for the input processing. It will clean up the directory sub 
tree  of  the  moved  input files once  a job  has  been finished (or a  hot  folder 
becomes idle).  
Configuring OCR and Barcode Recognition 
The OCR tab contains options for configuring the optional OCR – i.e. text recognition from raster 
input documents – and barcode recognition. 
7
The text edit window for the move folder accepts file drag & drop: Just drag & drop a folder from the 
tiŶdoǁs™ Edžplorer iŶto this ǁiŶdoǁ͘ 
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
C#.NET PDF SDK - Convert PDF to Text in C#.NET. Integrate following RasterEdge C#.NET text to PDF converter SDK dlls into your C#.NET project assemblies;
how to edit and delete text in pdf file; how to delete text in pdf acrobat
C# PDF metadata Library: add, remove, update PDF metadata in C#.
Allow C# Developers to Read, Add, Edit, Update and Delete PDF Metadata in .NET Project. Remove and delete metadata from PDF file.
erase text from pdf; how to remove text watermark from pdf
PDF Compressor Enterprise – Getting Started Guide  
www.luratech.com 
info@luratech.com 
Setting up Job Entries: 16 
1.  The  Mode  section  lets  you  control the  tradeoff between  OCR  recognition  accuracy  and 
speed. 
a.  Most accurate is the mode which gives the highest accuracy in character recognition. 
It should be used when the input image quality or resolution is low, and recognition 
time is not that critical. 
b.  Balanced is an intermediate mode between most accurate and fast mode. 
c.  Fast provides 2 – 2.5 times faster recognition speed at the cost of a moderately 
increased error rate (1.5 – 2 times more errors). On good print quality texts, the OCR 
engine makes an average of 1 – 2 errors per page, and such moderate increase in 
error rate can be tolerated in most cases. 
2.  Select the OCR recognition languages from the list. Text recognition will be more accurate if 
you select  exactly  those  languages  that  appear in  your  documents. More  languages  are 
available upon request (please send email to info@luratech.com
). 
3.  You may choose Additional Output Formats to export the OCR results in various formats in 
addition to the PDF output. 
a.  Plain Text exports OCR results as unformatted text (ANSI code page). File extension is 
*.txt. No auxiliary files. 
PDF Compressor Enterprise – Getting Started Guide  
www.luratech.com 
info@luratech.com 
Setting up Job Entries: 17 
b.  CSV exports OCR results as comma separated values in plain text (ANSI code page). 
This mainly makes sense when the input document contains tables that should be 
imported into some other application. File extension is *.csv. No auxiliary files. 
c.  Rich Text Format exports OCR results in Microsoft™ RTF format (to be opened with 
Microsoft™ Word™). File extension is *.rtf. No auxiliary files. 
d.  HTML  exports  OCR  results  in  HTML  format.  File  extension  is  *.htm.  Embedded 
images are stored as auxiliary files with naming convention <output-name>-<image-
number>.jpg. 
e.  MS Excel exports OCR results in Microsoft™ Excel™ format. File extension is *.xls. No 
auxiliary files. 
f.  MS  PowerPoint  exports  OCR  results  in  Microsoft™  PowerPoint™  format.  File 
extension is *.ppt. An auxiliary directory <output-name>_files is created. It contains 
various files used by the PowerPoint document. 
g.  ALTO exports OCR results in the open XML standard ALTO (Analyzed Layout and Text 
Object). 
h.  XML exports OCR results in XML format. File extension is *.xml. The XML style can be 
chosen from the list next to the XML option.  
i.  Full – all possible XML attributes will be written (large XML files) 
ii.  Simplified – some optional attributes will be suppressed (smaller XML files) 
iii.  Word-level  –  detailed  character  related  information  is  suppressed.  The 
recognized text is set as direct content of the formatting element. Resulting 
XML  files are very small (much smaller than  simplified),  they  are  human 
readable and easier to post process. 
iv.  Line-level plain  – similar  to  word-level, but without any formatting  infor-
mation. 
v.  ABBYY – corresponds to the default XML format written by the FineReader 
Engine. Contents are written as lines of text surrounded by additional XML 
formatting tags. 
vi.  ABBYY  extended  –  corresponds  to  the  full  range  of  paragraph,  line  and 
character attributes and formatting information available in the ABBYY XML 
format, but without word or character recognition variants. 
4.  Enable Deskewing if you want the OCR engine to deskew (align) your pages.  
5.  Auto-detect page orientation rotates the page images in steps of 90 degrees to ensure that 
the text is correctly oriented. This is a useful feature when pages have been scanned with 
wrong orientation, but it only works for raster input documents or PDFs which have been 
rasterized. 
Configuring File and Data Embedding 
The  Embedding tab of  the  Properties dialog  lets you  configure  options for  several  types of 
embedding files or supplementary data into your PDF output files. 
PDF Compressor Enterprise – Getting Started Guide  
www.luratech.com 
info@luratech.com 
Setting up Job Entries: 18 
The three buttons under Data Embedding serve to configure the embedding three different 
kinds of supplementary data in your PDF output files. 
All three kinds of data – XMP metadata, PDF bookmarks and XML OCR results – are read from 
files containing XML of a corresponding dialect. The XML encoding must be UTF-8. 
The File Embedding group of the Embedding tab lets you configure options for adding files as 
attachments to your PDF output files.  
1.  Select Embed input file to embed the original source file(s) into your output PDFs. 
2.  Clicking on File Embedding Options brings up the following dialog with more configuration 
settings. 
The Header Options and Footer Options buttons let you configure additional text that is added 
to each output PDF page. This ĐaŶ ďe used to add laďels, e͘g͘ ͞Draft͟, page Ŷuŵďers, date aŶd 
time of the conversion, and other information. The given text can be customized concerning 
font, font face, color size and position. 
The Watermark Options button displays a dialog which lets you add an additional image (e.g. a 
company logo) to each of the output pages. The position, size, scaling and transparency can be 
specified for the image to add. 
PDF Compressor Enterprise – Getting Started Guide  
www.luratech.com 
info@luratech.com 
Setting up Job Entries: 19 
Configuring Document Compression 
The Compression tab lets you configure the options for the image compression. These include 
the overall quality setting, adoption to special input document types and other options. 
1.  Quality: A higher quality value results in higher PDF image quality, but PDF file sizes will 
increase. A lower quality value corresponds to higher image compression ratios and thus to 
smaller file sizes. 
2.  Document  Class:  You  can  use  different  classes  to  optimize  the  compression  results  for 
specific input document types: 
a.  MRC Standard should be used for all purpose input documents. This is the default 
setting.  
b.  MRC Check should be used to obtain better quality if the input document contains a 
lot of fine structures like lines, thin graphical drawings, etc. 
c.  Photo turns off the segmentation into layers. Everything is put into the background 
image layer. This should be only used if your input is of image type: no or only few 
text and/or graphics. 
PDF Compressor Enterprise – Getting Started Guide  
www.luratech.com 
info@luratech.com 
Setting up Job Entries: 20 
d.  B/W (black & white) turns off image color. Your documents are stored in black and 
white color, as if they had been transmitted by a b/w fax machine. 
3.  PDF Optimization: Optimization is done by recoding bitonal and/or color images with more 
efficient compression algorithms. Such optimization will be performed, unless you set the 
Rasterize PDF Input setting to Always (compare Configuring Input Data, p. 8). 
a.  Enable  Bitonal  image  optimization  to  apply  recoding  of  bitonal  images  using 
advanced JBIG2 compression.  
b.  Enable Color image optimization to apply recoding of color images found within the 
PDF document. The color images will be analyzed and, depending on their size and 
resolution, be replaced by an MRC Đoŵpressed ǀersioŶ (JPE' Ϯ000, if Reader™ ϲ͘0 or 
7.0 or PDF/A-2 or PDF/A-3 compatibility has been chosen). The compression options 
described above apply here, too. 
4.  Mask Codec: You can choose between JBIG2 and Fax G4 compression for the text mask. Fax 
G4  uses  lossless  image  compression,  whereas  JBIG2  can  be  used  for  lossless  and  lossy 
compression.  
Importing and Exporting Job settings 
The settings of all entries within a job list can be exported to a file or restored from a file by use 
of the menus: 
File 
Export job list 
File 
Import job list 
File 
Append job list (imports a job list by appending its entries to the current list) 
This can be used for backup purposes. Append job list can be used to merge multiple jobs lists 
into a single list. 
Settings of a single job can be exported by right-clicking on the job entry and selecting Export 
Job… from the context menu.  
Documents you may be interested
Documents you may be interested