Options for Word
The  settings  on  the  ‘Word’  tab  relate  to 
issues  such  as  comments,  tables  of  con-
tents,  and the  ‘Enable advanced tagging’ 
function. 
All of these features help users to pro-
duce structured PDF files (tagged PDFs). 
However,  it  only  makes  sense  to  adopt 
tags when carrying out a PDF conversion 
if  the  source  Word  document  is  already 
completely  and  consistently  structured 
using  formats.  (For  more  information, 
see  the  ‘Accessible PDF  files’  chapter  on 
page 52.) 
Nevertheless, it  is  possible  to  success-
fully  create  PDF/A-1b-compliant  files 
without using such structural elements.
Bookmarks
Users can choose to use Word formats for 
the generation of PDF bookmarks. Book-
marks  are  permitted  for  PDF/A.  Users 
can  make  personal  specifications  for 
styles, headings, or Word bookmarks.
So how do you create a PDF/A-1a-compliant 
file?
The  conversion  setting  for  PDF/A-1a 
takes the form of a checkbox in the PDF-
Maker  Settings. If  this  checkbox  is acti-
vated, the settings  in  the  ‘Advanced  Set-
tings’ pulldown menu  are  locked  to pre-
vent  users  from  making  conf licting  set-
tings.
This constitutes the entire setup proce-
dure for the PDF/A generation. To create 
 future-proof  PDF,  the  user  now  only 
has to click ‘Convert to Adobe PDF’. 
The ‘Word’ tab contains the ‘Enable advanced tagging’ checkbox, 
which is useful for users who want to generate structured PDFs.
Starting the conversion: This button is used to trigger PDF conver-
sion using PDFMaker. It uses the current default settings to do so.
PDF/A-1a: This PDF conversion setting is activated by selecting a 
checkbox. It activates a function that can convert the advanced fea-
tures of the higher compliance level, such as fonts and structure, 
from Office documents into the resulting PDF files.
30
PDF/A 
in a Nutshell
PDF/A creation
Pdf find and replace text - search text inside PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn how to search text in PDF document and obtain text content and location information
pdf make text searchable; cannot select text in pdf
Pdf find and replace text - VB.NET PDF Text Search Library: search text inside PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn How to Search Text in PDF Document and Obtain Text Content and Location Information in VB.NET application
converting pdf to searchable text format; how to make a pdf document text searchable
PDF/A using the 3-Heights PDF Producer
Exporting PDF from Window applications 
is not only a facility that is offered in more 
recent  Office  versions  or  in  conjunction 
with the Adobe Distiller – there is a whole 
range of converters that can generate PDF 
documents.  However,  only a  few products 
are capable of handling PDF/A.
PDF Tools AG’s 3-Heights PDF Producer 
produces  PDF/A-compliant  files  for  long-
term archiving. 周is tool is capable of cre-
ating  PDF  documents  that  meet  various 
specifications  (including  PDF/A-compli-
ance)  from  any  Windows  program  using 
GDI  printer  drivers.  周e  3-Heights  PDF 
Producer offers both synchronous and par-
allel  generation  of  PDF  documents.  周e 
tool  also  supports  both  client-side  and 
server-side PDF generation. 
In  addition  to  a  so晴ware  developer  kit 
for application development, runtime pack-
ages  are  also  available  as  installation  kits 
for redistribution on clients and multi-user 
servers.  Swiss-based  PDF  Tools  AG  pro-
vides a whole host of tools and libraries for 
the  creation  and  processing  of  PDFs.  周e 
company’s products  can  be  purchased  di-
rectly or via OEM partners. A free test ver-
sion  of  the  3-Heights  Producer  Developer 
Kit (SDK) is  available  on  the manufactur-
er’s Web site: www.pdf-tools.com. 
PDF/A
PDF 1.4
PDF 1.5
GDI
3-Heights™
PDF Kernel
Windows
Applications
3-Heights™
PDF Producer
PDF
Printer Driver
API
3-Heights PDF Producer: This solution 
latches on to Windows’ print functions to 
deliver different types of PDFs, including 
PDF/A.
Printer selection: Selecting the 3-Heights 
PDF Producer as the printer enables the 
generation of PDF documents from any 
Windows program.
PDF/A creation
PDF/A 
in a Nutshell 
31
VB.NET PDF replace text library: replace text in PDF content in vb
and ASP.NET webpage. Find and replace text in PDF file in preview without adobe PDF reader component installed. Able to pull text
pdf text search; pdf searchable text
VB.NET PDF File Merge Library: Merge, append PDF files in vb.net
When you have downloaded the RasterEdge Image SDK for .NET, you can unzip the package to find the RasterEdge.Imaging.PDF.dll in the bin folder under the root
can't select text in pdf file; convert pdf to searchable text
PDF/A ‘en masse’
In some  cases,  instead  of  needing  to ar-
chive  single  documents  or  hundreds  of 
documents per day as PDF/A, users need 
to  archive  large  datasets  consisting  of 
tens  of  thousands  of  documents.  The 
number  of  invoices,  contractual  docu-
ments,  and  receipts  regularly  generated 
by  companies  working  in  telecommuni-
cations,  energy supply,  or  public  admin-
istration,  can  be  extremely  substantial. 
Since these documents are normally per-
sonalized  (that  is,  addressed  to  certain 
recipients),  databases  or  structured  data 
often  come  into  play  when  creating 
them. 
PDF/A ‘from nothing’
周is  term  refers  to  PDF  files  for  which 
there is no fully-formed source document. 
Instead,  they  are  generated  ‘on-the-fly’ 
from  variable  elements. Example:  An  In-
ternet  supplier  provides  a  password-pro-
tected  area  where  customers  can  down-
load  current  invoicing  documents.  Vari-
able  data  such  as  names,  addresses,  cus-
tomer  numbers,  and  invoice  details  are 
delivered  from  a  database.  周e  page  lay-
out,  company  logo,  and  a  current  adver-
tisement  are  o晴en  compiled  from  data-
bases in accordance with the design speci-
fications of the company’s designers. More 
rarely,  fixed  page  backgrounds  are  used 
and  the  personalized  specifications  are 
added to them. 
Solutions  that  are  capable  of generating 
PDF documents ‘en masse’ from database-
supported content have been on the market 
for  a  long  time.  However,  PDF/A-compli-
ance is a relatively new feature. It was intro-
duced  immediately  a晴er  the  adoption  of 
the PDF/A standard.
PDFlib for high-volume PDF/A generation
周e  Munich-based  company  PDFlib  sup-
plies tools for developers. 周e PDFlib pro-
gram family is used to produce and process 
PDFs,  and  enables  PDF  documents  to  be 
generated  from  structure  data  (text  from 
databases,  XML)  using  a  library  (‘lib’ 
stands for ‘library’). 周e new PDF files that 
are  created  in  this  way  can  be  filled  with 
variable content if required. 周is might in-
clude  adding  different  names  for  invoice 
forms or business cards.
PDFlib  products  for  the automatic gen-
eration of PDFs in high-throughput condi-
tions  are  used  in  business  and  prepress 
workflows and in the Web2Print field. 周e 
library has supported the important PDF/X 
prepress standard for years. As of PDFlib 7, 
it  also  supports  the  high-volume  genera-
tion  of  PDF/A-1a  and  PDF/A-1b  docu-
ments. 
周e  PDFlib product range offers PDF/A 
support for various application areas.
■■PDF/A documents can be created from 
scratch. 周e process can  draw on material 
stored in a database.
■■Scanned documents or other pixel-
based  image  files  can  be  converted  to 
PDF/A.
■■Existing PDF/A documents can be sub-
jected to further processing in an automat-
ed  workflow.  For  instance,  they  can  be 
merged or split.
■■In addition, the PDFlib can create 
PDF/A-1a  files  that  contain  all  required 
structural information.
For more information on PDFlib 
solutions, see www.pdflib.com 
on the Internet.
32
PDF/A 
in a Nutshell
PDF/A creation
VB.NET PDF File & Page Process Library SDK for vb.net, ASP.NET
document. If you find certain page in your PDF document is unnecessary, you may want to delete this page directly. Moreover, when
how to make a pdf document text searchable; find and replace text in pdf
VB.NET Create PDF Library SDK to convert PDF from other file
Create writable PDF file from text (.txt) file in VB.NET project. you can download the RasterEdge .NET Image SDK and find the PDF processing component DLL
find text in pdf image; find and replace text in pdf file
Creating PDF/A from print data streams
Structured data or databases do not consti-
tute  the  only  starting  point  for  the  high-
volume generation of  PDF/A documents  – 
print data streams can also be used to cre-
ate  a  large  number of  PDF  documents  for 
archiving. Print streams are used for batch 
printing output. 周e print data can be con-
verted in order to generate formats that are 
suitable  for  archiving,  such  as  TIFF  or 
PDF/A.
DocBridge by Compart
Compart,  which  is  based  in  Böblingen, 
Germany, develops solutions for document 
management  and  high-volume  printing. 
Medium-sized  and  large  companies  from 
various  industries  use  this  supplier’s  pro-
grams  and  services  to  automatically  pro-
cess  large  amounts  of  data  traffic. 
DocBridge, a modular solution constructed 
from several components, contains the Doc 
Bridge Mill – a tool for processing a whole 
range of file formats.
PDF has been part of Compart’s develop-
ment  scope  as  both  an  input  and  output 
format  for a long  time. In  the light  of  the 
adoption  of PDF/A as  a standard for long-
term archiving, the company has added an 
option  for  PDF/A-compliant  output  to  its 
products. 
For more information on Compart, visit 
www.compart.net on the Internet. 
Compart DocBridge Mill: As well as struc-
turing, changing content, and creating in-
dexes, this solution can convert input data 
streams to PDF/A.
DocBridge Mill
Converting
Formats
Classification
and Indexing
Restructuring
Changing
Page Content
Input
Datastreams
AFP/MO:DCA
AFP Mixed Mode
PDF
PCL
ASCII/EBCDIC Line Mode 
LCDS/DJDE
Metacode/DJDE
Lotus Notes CDR
RTF
SAP ALF + OTF
SVG
WMF
PC Documents
Raster Formats
.. .
DjVu
AFP/MO:DCA
PDF
PCL
ASCII/EBCDIC Line Mode
IPDS
IJPDS
Metacode/DJDE
PostScript
SVG
Raster Formats
PC Printer
...
DjVu
Output
Datastreams
Apfelholz – photocase.com/de
PDF/A creation
PDF/A 
in a Nutshell 
33
C# HTML5 PDF Viewer SDK deployment on Visual Studio .NET
Unzip the download package and you can find a project XDoc.PDF.HTML5 Viewer Demo or XDoc.PDF.HTML5 Editor Once done debugging with x86 dlls, replace the x86
search pdf files for text programmatically; find text in pdf files
VB.NET PDF - Deploy VB.NET HTML5 PDF Viewer on Visual Studio.NET
to How to Build Online VB.NET PDF Viewer in Unzip the download package and you can find a project named XDoc Once done debugging with x86 dlls, replace the x86
select text in pdf; how to select text in pdf image
3.
From PDF to PDF/A: Converting 
PDFs to archive PDFs
Many users already use PDF to store docu-
ments  in  digital  archives  in  companies, 
public  authorities,  or  privately.  Now  that 
the PDF/A standard has been adopted, they 
have the opportunity to create archive doc-
uments  from  their  existing  files,  thereby 
ensuring that they can be used in the long 
term. In addition,  recipients of traditional 
PDF  files that need  to be  retained  but  are 
not yet available as PDF/A can now convert 
them to archive PDF  documents. In order 
to do so, they need to know the answer to 
the following question: How do you create 
PDF/A documents from PDF files?
PDF/A generation with 
Preflight
When  Acrobat  Professional  (Version  8  or 
higher)  is  used  to  convert  PDF  files  to 
PDF/A, the ‘engine’ that carries out the ac-
tual  conversion  is  the  integrated  Preflight 
plug-in. Even if the conversion is triggered 
using the  Acrobat 8 export function or  by 
Starting the Preflight tool: The command for opening the tool is lo-
cated on the ‘Advanced’ menu.
Karoline Swiezynski – photocase.com/de
34
PDF/A 
in a Nutshell
C# PDF File Permission Library: add, remove, update PDF file
Text: Replace Text in PDF. Image: Insert Image to PDF. Image: Remove Image from using RasterEdge.XDoc.PDF; In the following code table, you will find a piece of
search pdf for text in multiple files; searching pdf files for text
VB.NET PDF File Permission Library: add, remove, update PDF file
to PDF. Text: Delete Text from PDF. Text: Replace Text in PDF. In the following code table, you will find a VB NET code sample for how to set PDF file permissions
search text in pdf image; convert pdf to searchable text online
clicking  ‘Save  As’, the  Preflight  module  is 
responsible for converting the file. 
周e Preflight module is opened from the 
Acrobat  ‘Advanced’  menu  or  by  pressing 
Shi晴+Ctrl+X.
周e  lower  section  of  the main  Preflight 
window immediately provides information 
on the  status  of  the opened PDF  file  with 
regard  to  the  PDF  standard:  Is  the  docu-
ment  PDF/A  and/or  PDF/X-compliant? 
(PDF/X is a prepress standard.) If the PDF 
file was not created as a PDF/A, the user re-
ceives a message telling him or her that the 
file  is  ‘not  a  PDF/A  file’.  If  the  user  now 
wants  to  trigger  PDF/A  conversion,  he  or 
she can simply click the PDF icon.
周e Preflight tool uses a dialog box to ask 
the  user  whether  the  existing  PDF  files 
should be converted to PDF/A-1a or to a re-
stricted PDF/A-1b version. 
Conversion to PDF/A-1b
In  the  first  scenario,  the  user  selects  the 
‘PDF/A-1b’  standard  and  sets  the  output 
condition to ‘sRGB’ in the dialog box. 周is 
indicates that the  PDF  in question  is des-
tined  to  be  displayed  on  a  monitor.  Since 
the PDF file quite possibly already contains 
an output intent, the tool provides a check-
box that specifies that the present intent is 
to  be used.  In  addition, another  checkbox 
prevents  the  embedding  of  the  ICC  color 
profile if it is not required. 周is reduces the 
resulting file size.
When  the  user  clicks  the  ‘OK’  button, 
the Preflight tool searches the existing PDF 
document to see whether it meets the pre-
requisites  for  successful  conversion  to 
PDF/A.  If  the  prerequisites  are  met,  the 
conversion  takes  place.  周e  green  tick  in 
this  example  shows  that  no  problems  oc-
curred  during  the  conversion.  Details  on 
the  conversion  process  are  shown  in  the 
Results window  in  the  form  of  a  list.  周e 
list  contains  information  such  as  the  fact 
that  the  tool  added  the  file  name  suffix 
‘_A1b’ to the source document. 
Conversion to PDF/A-1a
周e second scenario describes the conver-
sion of a PDF file to  PDF/A-1a. 周e proce-
dure  is  the  same  as  for  scenario  1  except 
that  the  compliance  level  ‘1a’  is  chosen 
along with an output condition that is suit-
able  for  four  color  printing  (for  example, 
ISO Coated).
Again, the Preflight tool checks that the 
relevant document meets the prerequisites 
for the conversion.  
Following the conversion: The Results win-
dows shows the steps that were carried 
out and informs the user that the conver-
sion was successful.
Preflight: The PDF/A icon is also a pushbutton that triggers conver-
sion to PDF/A.
Preflight: The PDF/A conversion options relating to the level of the 
PDF/A standard (1b in this example) and the output intent.
PDF/A-1a: Conversion settings with an output intent for profession-
al offset printing.
From PDF to PDF/A
PDF/A 
in a Nutshell 
35
In this second example, 
 red  X  clearly  indicates 
that  the  conversion  can-
not  be  carried  out  suc-
cessfully.  Preflight  uses 
the Results window to in-
form the user of the prob-
lems  that  occurred.  An 
additional area below  the 
list explains why the prob-
lems  that  occurred  pre-
vent  the  document  from 
being  successfully  con-
verted to PDF/A-1a.
周e  file  does  not  have 
the  required  MarkInfo 
entry.  周is  error  message 
is  relatively  common  if 
the person generating the 
PDF  has  not  structured 
the  content  of  the  docu-
ment  using  tags  before-
hand.  周is  structural  in-
formation  is  one  of  the 
things required in order to define the text 
flow order for document layouts that have 
multiple  columns,  images,  and  captions.  In this example, the source PDF document 
must be re-exported from the source pro-
gram  either  using  different  preparation 
methods/settings or repaired.
Direct selection of a profile
Experienced users can take advantage of a 
more  direct  way  of  selecting  the  required 
PDF/A test or conversion profile.
For  example,  they  can  choose  to  select 
one of the  PDF/A  profiles  from  the  list in 
order to check a document for PDF/A suit-
ability  or,  if  possible, to immediately  con-
vert  it  to  PDF/A-1a  or  PDF/A-1b  using  a 
specified output condition. 周e conversion 
profiles  are  all  assigned  one  of  the  four 
most common output intents. 
If the output intent required for a special 
workflow is not contained in the list, a new, 
modified  PDF/A  profile  can  be  set  up  on 
the ‘Edit Profile’ screen.
周e  user  selects  the  required  profile  for 
the verification or conversion from the list 
and clicks ‘Execute’. Processing can also be 
started by double-clicking the correspond-
ing profile name. 
Profile list in Preflight: Both verification and conversion can be car-
ried out using the delivered PDF/A profiles.
Conversion not possible: If the PDF file in 
question does not meet the prerequisites 
for conversion PDF/A, Preflight terminates 
the conversion process and provides the 
user with detailed information on the rea-
sons for the failure of the process. For an 
extensive overview of these error messag-
es, see the appendix.
For more  information  on  inte-
grating this structural informa-
tion  via  tags  either  before  or 
after conversion, see the ‘Acces-
sibility’ chapter on page 50.
36
PDF/A 
in a Nutshell
From PDF to PDF/A
Converting PDF to PDF/A 
with pdfaPilot
周anks  to its largely self-explanatory  user 
interface, callas so晴ware’s pdfaPilot allows 
even  unexperienced  users  with  no  prior 
knowledge to convert documents to PDF/A 
and verify them. 周is professional tool is a 
plug-in  for  Adobe  Acrobat  Standard  and 
Professional Versions 6, 7, and 8. 周e con-
version  from  existing  PDF  documents  to 
PDF/A normally needs three steps and can 
be achieved in maximum of four:
■■周e PDF document to be converted is 
opened  in  Acrobat.  pdfaPilot  is  called  up 
from  the  tool  icon  or  using  the  ‘Plug-Ins’ 
menu item.
■■Clicking on the ‘Convert to PDF/A-1b’ 
pushbutton  causes  pdfaPilot  to  start  the 
conversion process.
■■If the conversion can be carried out with-
out problems, a dialog box informs the user 
that  the  conversion  was  successful.  If  the 
tool found elements or settings for the PDF 
file that prevent it from being converted to a 
PDF/A-compliant document, it reports these 
elements instead. Users can open these error 
messages  by  clicking  them.  周ey  then  re-
ceive tips on how to solve the problems en-
countered in order to be able to carry out a 
successful conversion to PDF/A next time.
High-volume processing with pdfaPilot CLI
周e pdfaPilot  CLI (Command Line Inter-
face)  is  designed  for  high-volume  PDF/A 
conversion  and  validation.  周is  solution 
enables  the  server-based,  automated  gen-
eration of PDF/A files in companies or ad-
ministrative departments. 
Automation: pdfaPilot is also available as 
a command-line (CLI) module. pdfaPilot 
Validator CLI is a pure validation tool and 
pdfaPilot Converter CLI can validate, cor-
rect, and convert files. 
First and last steps: pdfaPilot starts the 
conversion process when the user clicks on 
the orange pushbutton. When the conver-
sion has finished, the info field shows that 
the document is now PDF/A-compliant. 
For  information  on  pdfaPilot, 
including  a  downloadable 
demo  version,  go  to  the  fol-
lowing Internet address: 
www.callassoftware.com
From PDF to PDF/A
PDF/A 
in a Nutshell 
37
4.
Is this really a PDF/A file? 
PDF/A validation
 PDF/A  document  created  with  Adobe 
Acrobat can be easily recognized by the file 
name  extension  ‘_A1a’  or  ‘_A1b’.  Other 
PDF/A  generators  use  similar  procedures. 
So why is an additional check needed when 
you receive a PDF/A file by e-mail or open a 
document from an archive? 
周e  answer  is  simple:  Because  PDF/A 
files cannot be protected from further edit-
ing  by  measures  including  encryption  or 
passwords. Doing so  would contradict the 
PDF/A  regulations,  since  PDF/A  content 
must be available in its entirety without se-
curity measures. 
周is  means  that  a  PDF/A  file  that  was 
once  standard-compliant  can  lose  that 
compliance  as  a result of unintentional  or 
deliberate changes without it being obvious 
that it is no longer compliant with the stan-
dard. 
However,  further  investigation  using 
tools such as Adobe Acrobat Preflight, cal-
las  so晴ware’s  pdfaPilot,  or  PDFlib  7  by 
PDFlib, all of which are specially designed 
for  PDF/A  validation,  can  safely  and  reli-
ably uncover this kind of problem. 
Of  course,  even  deception  cannot  be 
ruled  out  – it is  quite  possible for users  to 
manually add a file suffix such as ‘_A1b’ to 
a PDF file before sending it even if the file 
in  question  has  never  actually  been  con-
verted to PDF/A. 周is is why checks consti-
Paul Schubert – PixelQuelle.de
38
PDF/A 
in a Nutshell
tute a prerequisite for the successful use of 
PDF/A. PDF/A data should be validated for 
standard  compliance  at  two  places  in  the 
process flow: When PDF/A files are received 
and  before  (external  or  internal)  PDF/A 
documents are  transferred to a digital  ar-
chive  (data  storage  drive,  CD-ROM,  or 
DVD-ROM).
Validation with Preflight
Acrobat  8  Professional’s  Preflight  tool  is 
not designed only for the creation of PDF/A 
files –  it  can  also  be used  to test  and vali-
date  PDF/A  documents  for  their  actual 
compliance with the standard. 
周e PDF/A icon at the bottom le晴 of the 
Preflight window gives a quick overview of 
the  PDF/A  compliance  of  an  open  docu-
ment. If a user opens a PDF/A file that has 
not yet been validated, the yellow question 
mark  icon  appears  along  with  a  message 
that  names  the output intent contained in 
the  PDF  document  and  informs  the  user 
that the file has not yet been validated. 
If the PDF/A icon does not appear in the 
Preflight window, the status display may be 
deactivated in the Preflight preferences. 
Clicking  the  icon  starts  the  Preflight 
PDF/A check. 周e tool works through a list 
of conditions that the PDF document must 
fulfill  in  order  to  comply with  the  PDF/A 
standard.  More than one  hundred  specifi-
cations  must  be  observed  in  order  for  a 
document to be declared standard-compli-
ant. 
If the check finds no deviations from the 
standard,  the  so晴ware  indicates  that  the 
PDF/A file  is standard-compliant  (indicat-
ed  by  the  green  tickmark)  and  names  the 
output intent. 
Calling up Preflight: This tool is called from 
the Acrobat menu (using the 
‘Advanced’ menu item), by pressing 
Ctrl+Shift+X, or by clicking the tool icon.
PDF/A status: The status icon has three 
possible states: A file can be not yet vali-
dated, successfully validated, or have 
failed the validation.
Successful validation: Clicking on the 
PDF/A icon with the yellow question mark 
starts the validation process. The result (in 
this case – successful) appears after a few 
seconds. Everything's fine.
PDF/A validation
PDF/A 
in a Nutshell 
39
Documents you may be interested
Documents you may be interested