pdf reader library c# : How to delete text from pdf document control SDK platform web page winforms windows web browser NewFormat-AB-LuraTech-PDF-Compressor-Enterprise-User-Manual-v7.4-2016-01-192-part951

PDF Compresor Enterprise – Manual  
Setting up Job Entries: 21 
PDF Input Options 
The PDF Input tab of the Advanced Input Options dialog lets you configure options that are 
relevant for opening PDF input files. 
1.  The Document  Open  Password is  used to open password  protected PDF  files.  The given 
password is stored within PDF Compressor in an encrypted way. Note that this encryption 
does not meet the highest security demands. The given password is ignored, when the input 
PDF file is not password protected. 
2.  In addition to  a password needed to open the PDF document, it can be  protected by a 
Change Permissions Password. This password is used whenever the PDF access permissions 
need to be changed.  
3.  PDF input  rasterization options  are available  unless Rasterize PDF  Input has been  set to 
a.  The Interpolate images switch influences the rasterization of PDF input files. PDF 
input files may contain embedded images that need to be scaled for rasterization. 
Interpolate images should be turned on to obtain best image quality. However if an 
input PDF file contains only bitonal image content, and this PDF is rasterized to the 
saŵe resolutioŶ as the eŵďedded iŵages͛ resolutioŶ, the iŵage iŶterpolatioŶ ĐaŶ ďe 
turned off to speed up an OCR process. 
b.  Default PDF Page Size lets you select a page size that is used only if the input file is a 
PDF file that is missing its page size information, but has to be rasterized. Normally 
How to delete text from pdf document - delete, remove text from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# developers to use mature APIs to delete and remove text content from PDF document
delete text pdf acrobat professional; remove text watermark from pdf online
How to delete text from pdf document - VB.NET PDF delete text library: delete, remove text from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET Programming Guide to Delete Text from PDF File
remove text from pdf online; delete text pdf
PDF Compresor Enterprise – Manual  
Setting up Job Entries: 22 
all pages of a PDF file carry page size information. However some applications create 
ill-formed PDF files without page size information. This option has been added to 
deal with such malformed PDF files. 
Select user defiŶed… at the very end of the list to enter a user defined page size by 
specifying the width and the height of a page.  
c.  Selecting the Alternative rasterization method can be useful when input PDF files 
contain  very  large  pages  which  lead  to  out-of-memory  errors.  The  alternative 
rasterization method consumes significantly less memory but is slower. 
4.  The option Restrict PDF Conversion - Use only PDF Optimization for converting PDF input files 
is only enabled when the Born Digital Module is installed. If selected it serves to suppress the 
attempt to use Born Digital Conversion functionality when converting PDF input files. Instead 
these files are only processed using PDF Optimization features. 
Note: This option primarily serves to guarantee backward compatibility with jobs set up with 
pre-7.0 versions of PDF Compressor, which used the PDF Optimization mode for converting 
PDF input. In general it is preferable to use the conversion provided by the Born Digital 
Input Filter Options 
On the Input Filter tab of the Advanced Input Options dialog you can configure options that 
exclude certain input files from being processed by PDF Compressor. 
VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
VB.NET PDF - How to Delete PDF Document Page in VB.NET. Visual Basic Sample Codes to Delete PDF Document Page in VB.NET Class. Free
how to delete text from pdf with acrobat; how to erase text in pdf file
C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
C#.NET PDF Library - Delete PDF Document Page in C#.NET. Provide C# Users in C#.NET. How to delete a single page from a PDF document.
deleting text from a pdf; how to copy text out of a pdf
PDF Compresor Enterprise – Manual  
Setting up Job Entries: 23 
1.  The Bypass PDF files sŵaller thaŶ … kB option serves to skip the processing of input files 
smaller than the given file size. This can e.g. be used to suppress the processing of already 
compressed PDF files. 
2.  The Metadata Filter options allow you to skip processing of PDF input files depending on the 
PDF metadata. Skipped files will not be processed to output files. Instead they are passed 
directly to input file post-processing (see Configuring Post-Processing, p. 38) 
a.  Depending on the selection skipping is done either for PDF files that match the filter 
criteria or for PDF input files that do not match. 
b.  The filter criterion is matched in case the Metadata key to check is found in the PDF 
Metadata and its value matches the Search text below. 
c.  Depending on the Option Match whole value the Search text is either compared to 
the complete value or searched as part of the metadata value. 
d.  Skipped input files can be copied to a directory by enabling Copy skipped files to 
Office Input Options 
On the Office Input tab you can configure options for the Born Digital conversion of Microsoft 
Office input files. 
1.  If the Use Excel page layout option is selected, the print page layout as specified inside the 
Excel input files is used when converting this file to PDF. This option is disabled by default, 
C# PDF Text Extract Library: extract text content from PDF file in
Free online source code for extracting text from adobe PDF document in C#.NET class. Ability to extract highlighted text out of PDF document.
delete text pdf document; how to remove text watermark from pdf
VB.NET PDF Text Extract Library: extract text content from PDF
SharePoint. Extract text from adobe PDF document in VB.NET Programming. Extract file. Extract highlighted text out of PDF document. Image
erase pdf text online; remove text from pdf acrobat
PDF Compresor Enterprise – Manual  
Setting up Job Entries: 24 
such that each non-empty sheet inside an Excel input file is converted to one PDF output 
2.  When Process MS  Office documents with OpenOffice is chosen, all office  input files are 
converted using OpenOffice. Obviously, an OpenOffice installation must be present in this 
case. This option is switched off by default and each input document is processed using its 
native application. 
3.  The option Remove tagging information ensures that structure information generated by 
office applications during PDF export is disposed. Structure information is important for 
accessible documents and should generally be kept. However, if file size is critical this option 
can help to create smaller PDF output. 
Blank Page Detection Options 
On the Blank Page Detection tab you can configure options for the Blank Page Detection of input 
files. Pages that are detected as blank are always exempt from text recognition (OCR). 
1.  The option Detect blank pages serves to enable or disable blank page detection. 
2.  In the Excluded margins box, you can choose, how much of the margins of all pages should 
not be part of the blank page detection. This way, it is possible to exclude invariable page 
headers or footers or punched holes, for example. You can also choose between the units 
millimeter (mm) and hundredths of an inch (1/100 inch). 
3.  The blank page detection segments the area of the  page to be  worked on into tiles of 
configurable size. The detection is done tile per tile. If in the end all tiles are classified as 
C# PDF insert text Library: insert text into PDF content in C#.net
C#.NET PDF SDK - Insert Text to PDF Document in C#.NET. This C# coding example describes how to add a single text character to PDF document. // Open a document.
how to erase in pdf text; remove text from pdf
C# PDF metadata Library: add, remove, update PDF metadata in C#.
C#.NET PDF SDK - Edit PDF Document Metadata in C#.NET. Allow C# Developers to Read, Add, Edit, Update and Delete PDF Metadata in .NET Project.
erase pdf text; how to edit and delete text in pdf file
PDF Compresor Enterprise – Manual  
Setting up Job Entries: 25 
blank the whole page is considered blank. The unit for the Tile size value is ͞pt͟, which is 
equal to 1/72 inch. 
4.  The aŶalLJsis of a tile͛s ĐoŶteŶt is ďloĐk-based. The size of a block should be set to the size of 
the smallest meaningful symbol, e.g. the size of a punctuation dot. Depending on the page 
iŵage͛s resolutioŶ a ďloĐk spaŶs ŵultiple pixels. The unit for the Block size is ͞pt͟, which is 
equal to 1/72 inch. 
5.  &or eaĐh ďloĐk a ǀalue is ĐalĐulated that represeŶts hoǁ ŵuĐh the ďloĐk͛s Đolor iŶteŶsitLJ 
differs from other blocks in the tile. Each block that has a deviance that exceeds a certain 
value  is  considered non-blank.  This  value  is influenced  by  the  Sensitivity  property. The 
sensitivity is a value in the range of 1 through 100. A low sensitivity causes only strong 
colored structures to be counted as being non-blank. In contrast, a high sensitivity also takes 
pale textures into account. 
6.  A tile is considered non-blank if the number of non-blank blocks exceeds a certain threshold. 
The Threshold is given in per mill (one tenth of a percent) defining the maximum fraction of 
non-blank blocks in relation to blank blocks for a full size tile to still be classified as blank. 
7.  The  option Exclude blank pages from output defines whether detected blank pages are 
included in the output. Checking this option results in the exclusion of detected blank pages. 
Configuring Data Output 
The Output tab lets you configure PDF output options including the exact version of PDF to 
generate and the location where generated PDF files are placed.  
C# PDF Text Search Library: search text inside PDF file in C#.net
C#.NET. C# Guide about How to Search Text in PDF Document and Obtain Text Content and Location Information with .NET PDF Control.
how to erase text in pdf online; acrobat remove text from pdf
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
All text content of target PDF document can be copied and pasted to .txt files by keeping original layout. C#.NET class source code
how to delete text from a pdf in acrobat; delete text from pdf file
PDF Compresor Enterprise – Manual  
Setting up Job Entries: 26 
1.  Select Place output next to input file, and the generated PDF file will be placed into the same 
directory as the input file. 
Select Place output in directory and specify a folder by use of the browse button   to put 
the output somewhere else
. See Section Choosing the Service Account, p. 85, for the use of 
network shares. 
2.  Overwrite existing lets you select the behavior of PDF Compressor when it attempts to write 
an output file that is already present at the respective location: Either the output file will not 
be written (and you will find an error message in the log file, see Section Log Files, p. 79) or 
the existing file will be overwritten. 
3.  Select Delete empty folders if you want to clean up the output directory sub tree. This option 
is only available if you select Include subfolders for the input processing (see Configuring 
Input Data, p. 15). PDF Compressor always creates required output folders in advance, i.e. 
before any file is processed whose output has to be placed in that folder. On error conditions 
certain output files may be deleted resulting in empty folders. Delete empty folders helps to 
The text edit window for the output folder accepts file drag & drop: Just drag & drop a folder from the 
WiŶdoǁs™ Edžplorer iŶto this ǁiŶdoǁ͘ 
PDF Compresor Enterprise – Manual  
Setting up Job Entries: 27 
remove unneeded folders after a job has been finished (or after a hot folder has become 
4.  The option PDF Output Format lets you choose the exact version of PDF to create. 
LuraTech PDF Compressor can create PDF documents conforming with different versions of 
the PDF standard or different so-called conformance levels of PDF/A. These formats and their 
differences are briefly explained here. 
The general recommended default is PDF/A-2u. 
a.  Adobe™ Reader™ 5.0 (PDF 1.4) 
The decomposition of images into different layers and masks is supported in a usable 
way  since  Adobe™  Reader™  5.0  (PDF  1.4).  PDF  documents  produced  by  PDF 
Compressor require a viewer to support at least PDF 1.4 to be displayed properly. 
b.  Adobe™ Reader™ 6.0 (PDF 1.5)  
Adobe™ Reader™ 6.0 (PDF 1.5) is able to handle JPEG 2000 image compression. If 
you choose this format, foreground and text color images of MRC compressed pages 
will be stored in JPEG 2000/Part1 format. This results in better image quality and 
smaller  file sizes. But files created in this format require a viewer to support at least 
PDF 1.5 to be properly displayed. 
c.  Adobe™ Reader™ 7.0 (PDF 1.6) 
The Adobe™ Reader™ 7.0 compatibility mode uses the  same PDF features as for 
Adobe™ Reader™ 6.0 with the only exception that larger page sizes are supported. 
With Adobe™ Reader™ 6.0 compatibility the page size is limited to 200 by 200 inches. 
With Adobe™ Reader™ 7.0 compatibility there is no such limit. 
d.  PDF/A-1a (ISO 19005-1) 
Same as PDF/A-1b, but with automatically inserted rudimentary tagging information 
to conform to basic requirements of PDF/A-1a. 
e.  PDF/A-1b (ISO 19005-1) 
This is the basic compliance level of the original PDF/A document standard for long-
term preservation. It is  based on PDF 1.5 with further restrictions  regarding e.g. 
metadata, encryption and transparency. 
f.  PDF/A-2b (ISO 19005-2) 
PDF/A-2 is a revision of the original PDF/A-1 standard, allowing for some additional 
types of content, such as images compressed using JPEG2000 and other PDF/A files 
embedded as attachments. 
g.  PDF/A-2u (ISO 19005-2) 
This is the general recommended default. The format is the same as PDF/A-2b with 
the additional advantage that all text within the PDF must have a consistent Unicode 
h.  PDF/A-3b (ISO 19005-1) 
The PDF/A-3 standard is equivalent to PDF/A-2 with the only difference that it allows 
files of arbitrary type to be embedded as attachment to the PDF/A-3 documents. 
PDF Compresor Enterprise – Manual  
Setting up Job Entries: 28 
i.  PDF/A-3u (ISO 19005-1) 
Corresponds to PDF/A-3b, again with the additional requirement for text within the 
PDF to have a consistent Unicode mapping. 
5.  Output Splitting can be activated in two ways: 
a.  Split output PDF files into chunks of <number> pages lets you limit the number of 
pages output to a single PDF document. Instead of writing huge PDF documents with 
many pages, a series of output files can be created, each with the specified number 
of pages. (Depending on the number of input pages, the last file of the output series 
will contain less pages.)  
This mode is typically used with Output File Renaming using a template string with 
%P, %L, or %C escape sequences (see item 6 below).  
b.  Split  output  PDF  files  when  new  barcode  is  detected  is  only  available  when the 
barcode detection is turned on at the OCR tab (see also Configuring Post-Processing, 
p. 38). If enabled, this function splits the output into multiple documents, whenever 
a new barcode is detected on a page. (The next document begins with the first page 
that contains a new barcode.) 
This mode is typically used with Output File Renaming using a template string with 
%V escape sequence representing the value of the detected barcode (see item 6 
Both Output Splitting modes imply the Output File Renaming to be turned on. 
6.  Output File Renaming can be used to customize the naming of PDF output files. The file name 
template is used to form the output file names. It uses escape sequences as specified in 
Template String Syntax Description, p. 63. If Output Splitting is enabled you need to enter 
escape sequences to distinguish the output names of the different chunks. A typical example 
for page number based splitting is %F_%P-%L, were %F is substituted by the input file name, 
%P  by the  first  page  number  within  the chunk,  and  %L  by  the  last  page  number.  See 
Template String Syntax Description, p. 63 for details and more examples, or press the help 
button   next to the entry.  
Configuring E-Mail Conversion Options 
Clicking the E-Mail Conversion Options button brings up a dialog with further options regarding 
the conversion of attachments to e-mail messages. 
Note: These options are only available if the Born Digital Conversion Option is installed, since 
otherwise no e-mails can be converted. 
Note: It is essential to understand, that both e-mail message formats such as MSG and EML and 
the PDF format support the concept of attachments. These attachments are files of arbitrary 
formats embedded in the overall file, which acts as a container. 
PDF Compresor Enterprise – Manual  
Setting up Job Entries: 29 
1.  PDF Compressor offers the following options for converting the attachments of e-mail input 
a.  The Default Conversion option chooses the best conversion available for the selected PDF 
Output Format (see Configuring Data Output, p. 25) 
  When converting to PDF/A-1 the e-mail attachments of all supported input file 
types  are converted  to  PDF/A-1  and  appended  as  pages  to the  PDF  output 
document,  since  PDF/A-1 does not allow  for PDF attachments.   A  bookmark 
bearing  the  file  name  of  the  e-mail  attachment  points  to  the  beginning  its 
contents within the PDF output document.   
  PDF/A-2 permits  attachments in PDF/A format. Therefore the  default  here is 
converting each e-mail attachment to a PDF/A-2 document and then to attach it 
to the output document as a PDF attachment. 
  Since PDF/A-3 additionally allows PDF attachments of arbitrary file format, the 
default here is to convert e-mail attachments to PDF/A and append them as 
pages  to  the  PDF  output  document.  In  addition  the  e-mail  attachments  are 
embedded as PDF attachments in their original format.  
  In all other cases – i.e. when generatiŶg Reader™ 5.0, 6.0 or 7.0 compatible PDF 
– each e-mail attachment is converted to a PDF document and then embedded 
as an attachment to the PDF output document.   
PDF Compresor Enterprise – Manual  
Setting up Job Entries: 30 
b.  Ignore  Attachments  simply  discards  all  e-mail  attachments  and  merely  converts  the 
message bodies. 
c.  The Specific Conversion  setting lets you specify  in detail how attachments should be 
processed. Conforming to the selected PDF Output Format you may choose an arbitrary 
combination of appending e-mail attachments as  pages or  embedding  them  as  PDF 
attachments in  their  original format or converted to PDF(/A). The options described 
below serve to configure this specific conversion. 
d.  The  option  Treat  errors  during  attachment  processing  as  warnings  causes  PDF 
Compressor  to  continue  processing  even  if  it  failed  to  process  one or  more  e-mail 
attachments. Otherwise this is considered an error and processing the corresponding job 
is halted. 
2.  Filter Attachments by File Type 
If settings chosen under E-Mail Attachment Conversion Options require the conversion of an 
e-mail attachment  to PDF(/A) the PDF Compressor will try to convert attachments of  all 
supported  input  file  types.  Embedding  e-mail  attachments  as  PDF  attachments  in  their 
respective original format works for any file type.  
The Filter Attachments by File Type option serves to discriminate among e-mail attachment 
types by specifying a list of file extensions. If Off is chosen here, PDF Compressor will process 
attachments as described in the previous paragraph. 
If Process only matching is selected only e-mail attachments with the specified file extensions 
will be processed; all others will be ignored. 
If Process all non-matching is chosen e-mail attachments with the specified file extensions 
will be ignored and all others will be processed. 
The file extensions must be separated by spaces, either with or without leading dot – i.e. 
ďoth ͞ŵpeg mpg jpeg jpg͟ aŶd ͘͞ŵpeg ͘ŵpg ͘jpeg .jpg͟ are ǀalid͘  
3.  Filter Attachments to Convert to PDF 
This set of options further restricts the set of e-mail attachment types specified by the Filter 
Attachments by File Type options regarding the types of files to convert to PDF(/A). If Off is 
chosen  here, PDF  Compressor will convert all attachments  of supported input file types 
which have passed the previous filter. 
If  Convert  only  matching  is  selected  only  e-mail  attachments  with  the  specified  file 
extensions will be converted to PDF(/A); all others will be excluded from the conversion. 
If Convert all non-matching is chosen e-mail attachments with the specified file extensions 
will be excluded and all others will be converted to PDF(/A). 
Configuring Advanced Output Options 
Clicking the Advanced Output Options button brings up a dialog with further settings concerning 
output generation. 
PDF Security 
The PDF Security tab lets you configure the security features of the output PDF documents. 
Currently only security compatibility for Adobe™ Reader™ 3.0 and higher, and Adobe™ Reader™ 
Documents you may be interested
Documents you may be interested