convert pdf to image c# itextsharp : Exporting pdf form to excel control software system azure windows .net console Head_First_HTML_CSS_XHTML26-part764

232
Chapter 6
Wow, no difference.  Well, we didn’t 
really expect any because all the 
DOCTYPE does is let the browser 
know for sure you’re using HTML 4.01.
The DOCTYPE test drive
Make the changes to your “lounge.html” file in the  
“chapter6/lounge” folder and then load the page in your browser.
Add a DOCTYPE to the “directions.html” and “elixir.html” file as well. Go 
ahead and give them a good test. Just like “lounge.html”, you won’t see 
any fireworks (but you might sleep a bit better tonight).
Exercise 
testing with a document type
Exporting pdf form to excel - extract form data from PDF in C#.net, ASP.NET, MVC, Ajax, WPF
Help to Read and Extract Field Data from PDF with a Convenient C# Solution
extracting data from pdf into excel; extract pdf data to excel
Exporting pdf form to excel - VB.NET PDF Form Data Read library: extract form data from PDF in vb.net, ASP.NET, MVC, Ajax, WPF
Convenient VB.NET Solution to Read and Extract Field Data from PDF
extracting data from pdf files; how to fill pdf form in reader
standards, compliance, and all that jazz
you are here 
233
See, piece of cake. 
The DOCTYPE is in our 
pages and working fine.
Jim:  Yeah, really easy. But here’s what I still don’t get: we put this 
DOCTYPE at the top of our file to tell the browser our page is HTML 4.01 
but that doesn’t ensure that the file really is HTML 4.01.  We could have 
made a mistake. So what’s the point?
Frank:  You’re right, because your promise to the browser is only good if 
you actually have written perfect HTML 4.01. That’s what I was going to 
get to next.  What we can do is make use of a free online service that can 
look at a page and tell us if it’s compliant.
Jim:  Really? How does that work?
Frank: Well, this service first looks at the document type and then checks 
all your HTML and makes sure it’s actually correct... like checking to make 
sure you’re spelling your tag names right, your elements are nested properly, 
that your inline elements are inside block elements and so on. It’s called a 
validator.
Jim:  Wow, and this is free? Who provides this service?
Frank:  The guys who came up with the standards.  They’re called the 
World Wide Web Consortium, or W3C for short.
Jim:  This sounds like the answer to writing compliant HTML. But how do 
I know all those things you just mentioned, like what elements go inside what 
elements?
Frank:  Let’s check out the validator first and then we’ll come back to that...
C# PDF Convert to Word SDK: Convert PDF to Word library in C#.net
PDF Library in C#.NET Class. Best C#.NET PDF to Microsoft Office Word converter SDK for exporting PDF to Word in Visual Studio .NET.
how to save pdf form data in reader; pdf data extraction to excel
C# PDF Convert to SVG SDK: Convert PDF to SVG files in C#.net, ASP
without quality loss. C# sample code for quick integration in .NET framework program for exporting PDF from SVG. In some situations
how to type into a pdf form in reader; c# read pdf form fields
234
Chapter 6
Meet the  W3C validator
There are three ways you 
can check your HTML: 
The W3C validator is located at http://validator.w3.org.
(1) If your page is on the Web, then 
you can type in the URL here,  
click the “Check” button, and the 
service will retrieve your HTML 
and check it.
(2) You can click “Choose file” (or 
“Browse” if you’re using Windows) 
and choose a file on your computer.  
When you’ve selected the file, click 
“Check”, and the browser will upload 
the page for the service to check.
(3) Or, copy and paste your 
HTML into this form. Then 
click “Check” and the service 
will check your HTML.
Let’s give the validator a spin and have it check out the 
lounge files. To follow along, just point your browser to 
http://validator.w3.org.
validating your html
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
Free evaluation library for exporting PDF to Text in both C#.NET WinForms application and ASP.NET WebForms. RasterEdge.XDoc.Excel.dll. RasterEdge.XDoc.PDF.dll.
extract data out of pdf file; how to save fillable pdf form in reader
C# PDF Convert to Images SDK: Convert PDF to png, gif images in C#
NET. Support exporting PDF to multiple image forms, including Jpg, Png, Bmp, Gif, Tiff, Bitmap, .NET Graphics, and REImage. Support
export pdf data to excel; html form output to pdf
standards, compliance, and all that jazz
you are here 
235
Validating the Head First Lounge
We’re going to use option (3) to validate the “lounge.html” 
file.  That means we need to copy and paste the HTML from 
“lounge.html” into the form at the bottom of the W3C validator 
Web page; keep following along and give it a try...
We’re using method (2) here.  We clicked on the “Choose File” button and browsed to 
the file “lounge.html”, which now has the DOCTYPE for Transitional HTML 4.01 at 
the top. We’re ready for the big moment... will the Web page validate? Bets anyone? 
Click “Check” (and turn the page) to find out...
Feel free to use method (1) or 
(3) if it’s more convenient.
How to C#: Basic SDK Concept of XDoc.PDF for .NET
C# programmers can convert Word, Excel, PowerPoint Tiff Various PDF annotation features can be integrated into deleting, modifying, importing, exporting, and so
extract data from pdf form fields; fill in pdf form reader
VB.NET PDF: Basic SDK Concept of XDoc.PDF
VB.NET programmers can convert Word, Excel, PowerPoint Tiff Various PDF annotation features can be integrated deleting, modifying, importing, exporting, and so
extract data from pdf; how to type into a pdf form in reader
236
Chapter 6
Houston, we have a problem...
That red on the page can’t be good. It doesn’t look 
like the page validated. We’d better take a look...
This doesn’t look bad. It looks like in 
HTML 4.01 we have to put an alt 
attribute in the <img> element.
We failed the 
validation. It 
looks like there 
is one error.
This must be 
the error.
Because the W3C frequently revises the 
validator, you may not see exactly the 
same error messages. No worries, just 
keep following along because all the stuff 
in the next few pages is important, even if 
you don’t see the error above.
The W3C is constantly 
revising the validator. 
Watch it!
the alt attribute is required
C# Create PDF from images Library to convert Jpeg, png images to
Create PDF from images in both .NET WinForms and ASP.NET application. .NET converter control for exporting high quality PDF from images in C#.NET.
html form output to pdf; filling out pdf forms with reader
VB.NET PDF - Convert PDF with VB.NET WPF PDF Viewer
Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process. VB.NET Word, VB.NET Excel, VB.NET illustrates some conversion tabs and features for PDF exporting.
how to make a pdf form fillable in reader; extract pdf data into excel
standards, compliance, and all that jazz
you are here 
237
<!DOCTYPE html PUBLIC “-//W3C//DTD HTML 4.01 Transitional//EN” 
“http://www.w3.org/TR/html4/loose.dtd”>
<html>
<head>
<title>Head First Lounge</title>
</head>
<body>
<h1>Welcome to the New and Improved Head First Lounge</h1>
<img src=”drinks.gif” alt=”Drinks”>
<p>
Join us any evening for refreshing 
<a href=”elixir.html”>
elixirs</a>
conversation and maybe a game or two 
of <em>Dance Dance Revolution</em>.  
Wireless access is always provided;  
BYOWS (Bring Your Own Web Server).
</p>
<h2>Directions</h2>
<p>
You’ll find us right in the center of downtown 
Webville. If you need help finding us, check out our 
<a href=”directions.html”>
detailed directions</a>
Come join us!
</p>
</body>
</html>
Why do you think the alt attribute is required in HTML 4.01?
brain
power
?
Fixing that error
You know the alt attribute; 
add it into the <img> element.
Okay, this looks pretty simple to fix. You just need to add an 
alt
attribute to your <img> elements in HTML 4.01. Go 
ahead and open “lounge.html”, make the change, save, and 
then let’s try to validate again.
C# WPF PDF Viewer SDK to convert and export PDF document to other
Form Process. Data: Read, Extract Field Data. Data: Auto PDF, VB.NET Word, VB.NET Excel, VB.NET illustrates some conversion tabs and features for PDF exporting.
extract data from pdf table; how to fill out a pdf form with reader
VB.NET Create PDF from images Library to convert Jpeg, png images
REImage. .NET converter control for exporting high quality PDF from images. Turn multiple image formats into one or multiple PDF file.
extract data from pdf into excel; pdf form field recognition
238
Chapter 6
We’re not there yet...
Hmm; it looks like we’re now “tentatively valid HTML 4.01 Transitional.” That 
sounds like “close, but no cigar.” Let’s take a look:
There’s definitely some 
issue with the lounge Web 
page, but what the heck 
does this mean??
It looks like 
if we fix the 
problem above 
we’ll have valid 
HTML.
So, we’ve got a perfectly valid HTML file in terms of how we’ve 
written the HTML, but it looks like we have to tell it something 
about our “Character Encoding”. To solve that we’re going to have 
to find out what the heck it means...
tentatively valid html
standards, compliance, and all that jazz
you are here 
239
See, we’re getting this 
error message that 
the validator can’t find a 
character encoding.
Frank: The character encoding tells the browser what kind of 
characters are being used in the page.  For instance, pages can be 
written using encodings for English, Chinese, Arabic, and lots of other 
types of characters.
Jim:  What’s so hard about figuring out how to display a character?  
If there’s an “a” in the file, then the browser should display an “a”.  
Right?  
Frank: Well, what if you’re using Chinese in your pages?  It’s an 
entirely different “alphabet” and it has a heck of a lot more than 26 
A-Z characters.
Jim:  Oh.  Good point.... But shouldn’t the browser be able to tell the 
difference? Those other languages look nothing like English.
Frank:  No; the browser is just reading data.  It could assume it was 
getting English-language characters, but what if it’s not?  The character 
encoding takes the guesswork out of it.
Jim:  We’ve had the site up for a long time; why is this an issue now?
Frank:  Because the validator is saying “Hey, if I’m going to validate 
your page, you’d better tell me up front what characters you’re going 
to use!” And think about it, we’d want to do that for the browsers out 
there anyway. Don’t stress, we just need to add one more line to our 
HTML, called a 
<meta>
tag.  I should have thought of this sooner.
Jim:  Got any other surprises for us?  I really thought our Web page 
would validate after we put the document type definition in our file...
Frank:  I sure hope there are no more surprises! Let’s get the 
<meta>
tag in there and find out.
240
Chapter 6
using <meta> to specify a content type
Adding a <meta> tag to specify the content type
<meta http-equiv=”Content-Type” content=”text/html; charset=ISO-8859-1”>
Most of you reading this book are probably using English or Western-European 
languages (the so-called “Latin” languages), so you’ll need a 
<meta>
tag in your 
HTML that looks like this:
Just like other HTML tags, the 
<meta> tag has attributes.  
“meta” means we’re 
going to tell the 
browser something 
about the page...
You’re going to throw this line in as the first thing inside the 
<head>
element of your 
HTML. This tag tells any browser the content type of your file, and what kinds of 
characters are used to encode it.  Let’s look at the 
<meta>
tag in a little more detail...
And we’re going to 
tell it something 
more about the 
content type of 
the page.
First we tell it that this is an HTML 
file. This is a bit redundant, because the 
browser already knows that (remember we 
told it that in the DOCTYPE as well).
The content attribute 
is where we specify 
the content type 
information.
<meta 
http-equiv=”Content-Type” content=”text/html; charset=ISO-8859-1”>
Here’s the new part; this tells 
the browser that we’re using 
the ISO-8859-1 character 
encoding. 
Q: 
DOCTYPES, <meta> tags... ugh, do I need to really 
remember all this to write Web pages?
A: 
Specifying a DOCTYPE and a 
<meta>
 content tag 
are kind of like taxes: you gotta do them to be compliant. Look 
at it this way: you already understand them more than 99% of 
the Web page writing population, which is great. But at the end 
of the day, everyone just puts the DOCTYPE and <meta> tag in 
their HTML and moves on with life. So make sure you’ve got the 
right DOCTYPE and <meta> tag and then go do something much 
more fun. 
Q: 
ISO-8859-1?
A: 
Work with us here.  It’s like WD-40; you don’t worry about 
why it’s called that, you just use it.
ISO-8859-1 is the character encoding for “Latin-1” characters, 
which can represent almost all the European languages. If 
you’re writing in another language, check out the information on 
character encoding at  
http://www.w3.org/International/O-charset.html.
there are no
Dumb Questions
Notice that this whole 
string is the value of the 
content attribute.
standards, compliance, and all that jazz
you are here 
241
Making the validator (and more 
than a few browsers) happy with a 
<meta> content tag...
Okay, you know the plan.  You just need to type the 
<meta>
content type 
line right into your HTML. Let’s first add it to the “lounge.html” file:  
<!DOCTYPE html PUBLIC “-//W3C//DTD HTML 4.01 Transitional//EN” 
“http://www.w3.org/TR/html4/loose.dtd”>
<html>
<head>
<meta http-equiv=”Content-Type” content=”text/html; charset=ISO-8859-1”>
<title>Head First Lounge</title>
</head>
<body>
<h1>Welcome to the New and Improved Head First Lounge</h1>
<img src=”drinks.gif” alt=”Drinks”>
<p>
Join us any evening for refreshing 
<a href=”elixir.html”>
elixirs</a>
conversation and maybe a game or two 
of <em>Dance Dance Revolution</em>.  
Wireless access is always provided;  
BYOWS (Bring Your Own Web Server).
</p>
<h2>Directions</h2>
<p>
You’ll find us right in the center of downtown 
Webville. If you need help finding us, check out our 
<a href=”directions.html”>
detailed directions</a>
Come join us!
</p>
</body>
</html>
Want to place another bet? Is this going to validate? First, make the 
changes to your “lounge.html” file, save it and reload it into your 
browser.  Once again, you won’t notice any change, but the browser will. 
Now let’s see if it validates...
Here’s the <meta> tag. 
We’ve added it to the 
<head> element above the 
<title> element.
Always add this line 
above any other 
elements in the 
<head> element.
Documents you may be interested
Documents you may be interested