pdf conversion in c# : Extract data from pdf file Library control class asp.net web page winforms ajax itext_so-sample0-part1251

Extract data from pdf file - extract form data from PDF in C#.net, ASP.NET, MVC, Ajax, WPF
Help to Read and Extract Field Data from PDF with a Convenient C# Solution
exporting data from pdf to excel; extracting data from pdf forms to excel
Extract data from pdf file - VB.NET PDF Form Data Read library: extract form data from PDF in vb.net, ASP.NET, MVC, Ajax, WPF
Convenient VB.NET Solution to Read and Extract Field Data from PDF
extract data from pdf file; extract data from pdf table
TheBestiTextQuestionsonStackOverflow
iTextSoftware
Thisbookisforsaleathttp://leanpub.com/itext_so
Thisversionwaspublishedon2015-10-22
ThisisaLeanpubbook.LeanpubempowersauthorsandpublisherswiththeLeanPublishing
process.LeanPublishingistheactofpublishinganin-progressebookusinglightweighttoolsand
manyiterationstogetreaderfeedback,pivotuntilyouhavetherightbookandbuildtractiononce
youdo.
©2014-2015iTextSoftware
C# PDF Text Extract Library: extract text content from PDF file in
Able to extract and get all and partial text content from PDF file. How to C#: Extract Text Content from PDF File. Add necessary references:
how to fill out a pdf form with reader; extract data from pdf form
VB.NET PDF Text Extract Library: extract text content from PDF
Extract and get partial and all text content from PDF file. Extract highlighted text out of PDF document. Extract Text Content from PDF File in VB.NET.
pdf form data extraction; fill in pdf form reader
Thisbookiswrittenbyadeveloperfordevelopers.
Itisdedicatedtoallthedeveloperswhotakeprideinwritinggoodcode.
VB.NET PDF File Compress Library: Compress reduce PDF size in vb.
External cross references. Private data of other applications. Flatten visible layers. VB.NET Demo Code to Optimize An Exist PDF File in Visual C#.NET Project.
how to save editable pdf form in reader; extract data from pdf forms
VB.NET PDF File Merge Library: Merge, append PDF files in vb.net
Microsoft Office Word, Excel and PowerPoint data to PDF form. Merge PDF with byte array, fields. Merge PDF without size limitation. Append one PDF file to the end
flatten pdf form in reader; export excel to pdf form
Contents
introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
WhyStackOverflow? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
Acknowledgments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
Howtousethisbook? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
QuestionsaboutPDFingeneral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
WhatisthedifferencebetweeniText,JasperReportsandAdobeLC?. . . . . . . . . . . . . . . . . . . . . .
4
DoesaPDFfilehavestyles,headersandfooters? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
Gettingstarted. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
HowtogenerateanddesignPDFswithiTextoriTextSharp? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
HowtocreateacomplexPDFdocument? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
HowtosetthepagesizetoEnvelopesizewithLandscapeorientation? . . . . . . . . . . . . . . . . . . .
9
Fonts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
HowtousethefontVerdanain
PdfStamper
? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Whydoesn’tFontFactory.GetFont()workforallfonts? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Whyaren’tmyfontsgettingregistered? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Images . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Whyaren’timagesaddedsequentially? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
HowtogettheimageDPIinPDF? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
HowtopreservehighresolutionimagesinPDF? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Absolutepositioningoftext . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
HowtowriteaZapfdingbatscharacterataspecificlocationonapage? . . . . . . . . . . . . . . . . . . . 19
Howtoreduceredundantcodewhenaddingcontentatabsolutepositions? . . . . . . . . . . . . . . 20
Whydoes
ColumnText
ignorethehorizontalalignment? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
Tables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Howtoright-aligntextina
PdfPCell
? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Howtousemultiplefontsinasinglecell? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Howtointroducearowspan?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Howtochangewidthofsinglecolumnoftable?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Whatisthe
PdfPTable.DefaultCell
propertyusedfor? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
C# PDF File Merge Library: Merge, append PDF files in C#.net, ASP.
Merge Microsoft Office Word, Excel and PowerPoint data to PDF form. Append one PDF file to the end of another and save to a single PDF file.
pdf form save in reader; how to make pdf editable form reader
C# PDF File Compress Library: Compress reduce PDF size in C#.net
All object data. File attachment. External cross references. Private data of other applications. Flatten visible layers. C#.NET DLLs: Compress PDF Document.
extract data from pdf to excel; how to save pdf form data in reader
CONTENTS
HowtodrawaborderlesstableiniTextSharp?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Whydoesn’t
getDefaultCell().setBorder(PdfPCell.NO_BORDER)
haveanyeffect? . . . 30
Tableevents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Howtouseadottedlineasacellborder? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Howtocreateatablewithroundedcorners?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Pageevents. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Howtoaddarectangletoeverypageofadocument?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
HowcanIaddanimagetoallpagesofmyPDF? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Howtosetafixedbackgroundimageforallmypages? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
ParsingXMLandXHTML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
WhyisitsodifficulttoconvertXMLtoPDF? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
HowtoaddexternalCSSwhilegeneratingPDF? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
HowtodoHTMLtoXMLconversiontogenerateclosedtags? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
InspectaPDFwithiText . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
WhydoIgetan“
InvalidPdfException
:PDFheadersignaturenotfound”?. . . . . . . . . . . . . . 44
HowtoGetPDFpagewidthandheight?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
ManipulatingexistingPDFs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
HowtoupdateaPDFwithoutcreatinganewPDF?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
HowtoaddanimagewatermarktoaPDFfile? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Whydoesthefunctiontoconcatenate/mergePDFscauseissuesinsomecases? . . . . . . . . . 48
Howtomergedocumentscorrectly? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Interactiveforms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Howtofilloutapdffileprogrammatically?(AcroFormtechnology) . . . . . . . . . . . . . . . . . . . . . . 54
Howtofilloutapdffileprogrammatically?(DynamicXFA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
HowtofillXFAformusingiTextwithoutbreakingusagerights? . . . . . . . . . . . . . . . . . . . . . . . . . 57
Actionsandannotations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Howtocreatealinktoaspecificpagenumber? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Howtoinserta“linkedrectangle”withiText? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
HowtoaddamapswithapointertoaPDF? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
ExtractingtextfromPDFs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Howtoreadtextfromaspecificposition? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
GeneralquestionsaboutiText . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
UnitTestingandAutomatedTestingQuestions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
WhydoIgeta“Couldnotfind
PdfGraphics2D
”error? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
WhydoIgeta“
getOutputStream()
hasalreadybeencalledforthisresponse”errorinJSP? 68
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
By using RsterEdge XDoc PDF SDK for .NET, VB.NET users are able to extract image from PDF page or file and specified region on PDF page, then get image
java read pdf form fields; export pdf form data to excel spreadsheet
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
Page, a Region on a Page, and PDF Document. C#.NET extract image from multiple page adobe PDF file library for Visual Studio .NET.
how to flatten a pdf form in reader; export pdf data to excel
CONTENTS
Legalquestions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
WhatisthedifferencebetweenLowagieandiText? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
CaniText2.1.7orearlierbeusedcommercially?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Tobecontinued… . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
introduction
Acoupleofyearsago,Idecidedtoself-publishnewbooksaboutiText,asopposedtoworkingwith
apublisherasIdidbeforeforthe“iTextinAction”books.Thisledtoabookaboutdigitalsignatures
thatisavailablefordownload¹ontheiTextsite,andabookcalled“TheABCofPDF”²publishedon
LeanPub.Thegoalof“TheABCofPDF”wastostartwithabookthatlooksatPDFatthelowest
level,examiningthesyntaxofaPDFfileandaPDFpage,andthentocontinuewritingaseriesof
booksthatexplainhowtouseiTextonahigherlevel,answeringquestionssuchas:
• HowtocreateaPDFfromscratch?
• HowtocreatePDFfromHTML?
• HowtofilloutPDFforms?
• HowtoparseaPDFfile?
• …
However,inspiteofthefactthatmorethan15,000peopledownloaded“TheABCofPDF”,itturned
outthatpeoplereallywantedmetowriteadifferentkindofbook.I’vereceivedmanycomments
throughLeanPubfrompeoplewhoweredisappointedthattheABC-bookdidn’texplainhowto
useiText.Theyexpectedabookwithmorepracticalexamples,insteadofexamplesthathelpsthem
understandthePDFspecification.Somepeopleevenusedthefeedbackformtoaskmetechnical
questions.Unfortunately,Iwasunabletoanswerthesequestions,becausethepeoplepostingthem
didn’trealizethatIreceivedthesequestionsanonymously.EvenifIknewtheanswers,Ididn’tknow
whoorwheretosendthemto.
Allofthisfacedmewithadilemma:doIstopwriting“TheABCofPDF”andstartwritingoneof
theotherbooksthatwereplanned?Ifso,whichpartofiTextismostimportanttoiTextusers?The
planfortheABCwastowriteabookofabout150pages,butmuchtomysurprise,Iwasonlyhalf
waywhenIfinishedwritingpage150.Didn’tIhaveotherwritingpriorities?
ThensuddenlyIhadanidea:whynotwriteabookwithquestionsandanswers?Whynotcreatea
bookentitled“TheBestiTextQuestionsonStackOverflow?”
WhyStackOverflow?
IjoinedStackOverflowonAugust24,2012.Upuntilthen,Ihadbeenansweringmanyquestions
ontheiTextmailing-list.Thismailing-listhostedonSourceForgeusedtobeanimportantsource
¹
http://itextpdf.com/book/digitalsignatures
²
https://leanpub.com/itext_pdfabc/
introduction
2
of inspiration. I composed two “iText in n Action” ” books for Manning Publications,simply y by
reorganizingthemanyanswersandexampleswritteninanswertoquestionintoarealbook.
However,atsomepointIgottiredofthemailing-list.WhenIreferredtoanexampleinoneofmy
books,peoplewouldaccusemefortryingto“trickthemintobuyingmybook.”Themailing-listwas
alsousedbypeoplespreadingfalseallegations,suchas“iTextisnolongeropensource.”Onecould
explainthatthesepeoplewerewrong,forinstancebyprovidingalinktothesourcecode³,butthere
wasnowaytoawardpeopleforprovidinggoodanswersandtodiscouragepeoplefrompostingbad
answers.Itfeltasiftheungratefulwerewinningthedebate.
ThenIdiscoveredStackOverflow⁴wherepeoplebuildareputationgettingreputationpointswhen
theyaskgoodquestionsandprovidegoodanswers,losingpointswhentheypostbadquestionsor
badanswers.Itookme2yearsandalmost2monthstobecomeaTrustedUser,astatusthatrequires
20,000reputationpoints.SinceIregisteredonStackOverflow,Ihavepostedanswerstomorethan
1,000questions.Lookingbackatsomeofthemoreelaborateanswers,Ithoughtitwouldbeagood
ideatobundlethosequestionsandanswersthatareof“bookquality”.
Acknowledgments
IhaveselectednothingbutquestionsIhaveansweredmyself⁵,butitgoeswithoutsayingthatI
can’tanswereverysinglequestionaboutiTextpersonally.Forinstance:whenIamtravelling,Iam
off-lineformanyhours.AsunansweredquestionsaboutiTextgivemestress,Iamalwayshappyto
seethatotherpeoplejumpinwhenI’mawayfrommykeyboard.
IwanttothankAlexisPigeonforeditingmanyiTextquestionsinordertoclarifywhatisasked.I
relyonChrisHaasforansweringquestionsthatrequiretheC#skillsthatIammissing.Inoticethat
Iskipquestionsaboutdigitalsignatures,becauseIknowthatMichaelKlink’sanswerwillbemuch
moreaccuratethanmine.
Ialsowanttothankthemanypeoplewhoacceptedoneofmyanswers,becausethat’showone
buildsareputationonStackOverflow.Iknowthatsomepeopledown-votemebecausemystylecan
beharshattimes.Somebodyoncetweeted:“SpentalotoftimetodayonStackOverflowandrealized
thatBrunoLowagieiskindofadick.”Ahwell,Ihopethatthebalanceispositive.
Pleaseunderstandthatitishardformewhenpeopletalkabout“Lowagie”asifit’sathing,nota
person.Sometimespeoplestartbysayingthattheyareusing“Lowagiesoftware”andthentheystart
cursingatmeifIgivethemananswertheydon’tlike,forinstance:pleaseuseamorerecentversion
insteadofaversionthathasbeendeclared“EndofLife”morethanfiveyearsago.Soitgoes…Not
everydeveloperrealizesthatI’montheirsideandthattheirjobismucheasierifonlytheirboss
wouldpurchaseacommercialiTextlicensesothattheycanusethemostrecentversion.
³
https://github.com/itext/itextpdf
http://stackoverflow.com
http://stackoverflow.com/users/1622493/bruno-lowagie
introduction
3
Howtousethisbook?
I’vetriedorganizingthequestionsandanswersindifferentcategories.Thiswasn’talwayssimple.
Ifsomebodyasksaquestionaboutaddinganimagetoatable,shouldthisquestionbecategorized
under“images”orunder“tables”?Ifthere’saquestionaboutXHTMLcontentthatneedstobeadded
toacolumn,isthatan“XML”ora“
ColumnText
”question?Abookisn’tawebsitewhereyoucan
easilyintroduceataxonomy.That’swhyItookgreatcarewhencreatingthetableofcontents.
Inmanycases,Irephrasedtheoriginalquestionsothatyouunderstandwhataquestionisaboutat
aglance,justbybrowsingthebookmarks.Insomecases,Ievenhadtorewritethequestion.
Allthequestionsaremarkedwithaquestionmarkiconlikethis:
thisisaquestion
Attimes,Ithrowinaquestionofmyselftoclarifythings.Thesequestionsaremarkedwithan
informationicon:
Thisisanextraquestionaddedbymyself
Sometimes,itwasimportanttoaddacommentthatwasmadeonStackOverflow.Ihavemarked
commentslikethis:
Thisisacomment
Ihopeyouenjoythisbook,andthatithelpsyousolvingallyouriTextproblems.Ifnot,pleasepost
aquestiononStackOverflow⁶and,whoknows,maybeyourquestionwillbeaddedtothisbook.
http://stackoverflow.com
QuestionsaboutPDFingeneral
Whenpostinga questionon n StackOverflow,peoplecantagtheirposts as iText oriTextSharp
questions.Thisallowsmetoquicklyfindthosequestionsbyperformingasimplequeryforposts
taggedasitext*questions⁷.Thisincludesthetagsitext,itextsharp,itextpdfanditextg.
However,notallquestionstaggedthiswayareiText-related.Sometimes,peopleusingiTexthave
questionsthatareaboutPDFingeneral.
WhatisthedifferencebetweeniText,JasperReports
andAdobeLC?
ActuallyIwanttoknowthedifferenceorcomparisonbetweendifferentPDFcreation/
generationtechniques.ForExample:iText,AdobeLC,JasperReports,etc.
Iwouldliketoknowtheexactadvantage/disadvantageofusingeachofthem.
CurrentlyIamusingAdobeLCES2andwouldliketoalsoknowtheadvantageofusing
Adobesoftwareoverothertechniques.
PostedonStackOverflowonMar19,2013⁸byuser2185226⁹
That’saverybroadquestionandIseethatitalreadyhasavotetoclosethequestionforthisreason.
Letmegivethenutshellversionoftheanswer.Icouldeasilywriteabookonthistopic(andmaybe
onedayIwill).
• iTextisalibrarythatcanbeusedbydeveloperstoenhancetheirwebandotherapplications
withPDFfunctionality:createPDF,filloutPDFforms,examineandmanipulateexisting
PDFs.
• JasperReportsisaBusinessIntelligence/ReportingtoolthatusesanoldiTextversiontocreate
reports.ItisdistributedbyJasperSoft/TIBCO.JasperReportsonlyusesalimitedpartofthe
completeiTextfunctionality.CreatingPDFisjustoneofmanyfeaturesofJasperReports,and
JasperSoftusesiTexttoimplementthatfeature.
http://stackoverflow.com/questions/tagged/itext*
http://stackoverflow.com/questions/15492738/difference-between-itext-and-adobe-lc
http://stackoverflow.com/users/2185226/user2185226
Documents you may be interested
Documents you may be interested