extract table data from pdf c# : Bookmark page in pdf SDK application project winforms windows azure UWP edgarfm-vol2-v1112-part1858

March 2009 
5-13 
EDGAR Filer Manual (Volume II) 
HTML documents are identified by the *.htm  filename extension, which will follow 
any pre-<HTML> comment tags (i.e., <!DOCTYPE >). The <HTML> tag is 
considered an optional tag within *.htm  documents.  
In order to properly link documents within a submission, all linked documents must 
be named exactly as they are linked.  
Note: You must provide a filename in the following format:  
[Maximum 32 characters (including suffix); use “a-z” characters (lower 
case, only), 0-9 (but NOT for the first character), no spaces or special 
characters, at most one ‘.’, ‘-’, or ‘_’ char, and the extension must be *.htm, 
*.txt, *.pdf, *.fil, *.gif, *.jpg]  
Warning: 
Except for CORRESP submissions, graphic files associated 
with non-public HTML documents (i.e., cover) will be 
immediately disseminated even though the non-public 
document will not.  
You may also use the EDGARLink Error Check, but if an error is found you must use 
your HTML authoring tool to edit your documents.  
Always review your submission documents separately through a browser before you 
transmit it to EDGAR.  
Note: Ownership forms do not use EDGARLink, but this tool may be 
used to verify the format of any attached documents.  
EDGAR will NOT accept any TEST or LIVE submissions that have attached HTML documents 
with unacceptable content, as described above. Each HTML document within an EDGAR 
submission must be "resolvable", that is all links (if any) must be to other HTML, Graphics, 
ASCII, or SGML within the same submission (with the single exception being <A HREF=> 
references to the “(http://www.sec.gov/Archives/edgar/data/)..” website).  
Graphics will be attached as documents (like PDF documents). All documents with acceptable 
content will be disseminated with a <FILENAME> tag and value (up to 32 characters) in order 
to identify the document properly for internal references (if any).  
We recommend that you assemble your HTML and other documents in a single directory and 
test view them in a browser before you attach them to your submission. All HTML documents 
should be compatible with a Microsoft Internet Explorer (MSIE) 3.0+ or Netscape 3.0+ browser. 
As part of our receipt and acceptance process, we will be extracting all of your attached 
documents and graphics to a single directory and check all references for inconsistencies and 
errors. We estimate that submissions with HTML document and graphic content will increase the 
average submission size by about 70-150 percent, depending on your use of HTML 3.2/4.0 
formatting techniques.  
5.2.2.2  Acceptable HTML Document Tags  
Due to the EDGAR restrictions described previously, EDGAR will accept only a subset of the 
HTML 3.2/4.0 tagging standard. The following table lists the set of acceptable HTML document 
header tags available to you.  
Note: All HTML attributes are supported for each HTML tag listed, unless otherwise specified.   
Bookmark page in pdf - add, remove, update PDF bookmarks in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Your C# Project with Rapid PDF Internal Navigation Via Bookmark and Outline
bookmarks pdf; add bookmark pdf
Bookmark page in pdf - VB.NET PDF bookmark library: add, remove, update PDF bookmarks in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Your VB.NET Project with Rapid PDF Internal Navigation Via Bookmark and Outline
pdf export bookmarks; convert word pdf bookmarks
EDGAR Filer Manual (Volume II) 
5-14 
March 2009 
Document Tags  
Definition  
<HTML>  
Identifies text as an HTML document  
<!--> or <! DOCTYPE>  
Comment -- does not appear in the browser, only in the HTML source code 
<!DOCTYPE> tag is used to identify which HTML standard is used by the 
HTML text.  
Note: These tags may appear in-between the <TEXT> and <HTML> tags.  
<BODY>  
Signifies the body of the HTML document  
Note: The BACKGROUND attribute is not supported for this tag.  
<HEAD>  
Signifies header information for an HTML document  
<ISINDEX>  
Signifies that the document is an index for a search engine  
<META>  
Extended information to be included in the document header  
Note: The HTTP-EQUIV attribute is not supported for this tag.  
<TITLE>  
Title of document displayed at the top of the browser  
5.2.2.3  Acceptable HTML Tags Within a Document Body  
Due to the EDGAR restrictions described previously, EDGAR will accept only a subset of the 
HTML 3.2/4.0 tagging standard. The following table lists the set of acceptable HTML document 
“body” tags (tags that change the appearance of the text when displayed by a browser) that are 
available to you.  
Note: All HTML attributes are supported for each HTML tag listed, unless otherwise specified.   
Document Body Tags  
Definition  
&#...  
Escape Sequences – Used to display characters normally reserved (such as “<”) 
as plain text in the HTML document  
<A>  
Anchor/Hyperlink  
Note: For the attribute HREF, the following references are supported: 
References to other PUBLIC HTML, ASCII/SGML or PDF 
documents within the submission (i.e., <A HREF="ex-99.htm">) 
References to submissions stored at http://www.sec.gov/.... 
locations (i.e., <A
HREF="http://www.sec.gov/Archives/edgar/data/...">) 
Bookmark (internal) references will be supported  
(i.e., <A NAME=“linkanchor”> and <A HREF=#linkanchor>)  
All other uses of the HREF attribute are not supported and illegal, including 
non-local references, the use of the “TARGET” attribute, and the “mailto:” and 
“ftp:” designations.  
<ADDRESS>  
Address -- usually italicized  
<B>  
Bold  
<BIG>  
Big Text -- increases font size  
VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
Please follow the sections below to learn more. DLLs for Deleting Page from PDF Document in VB.NET Class. How to VB.NET: Delete a Single PDF Page from PDF File.
create bookmark in pdf automatically; add bookmark pdf file
VB.NET PDF Page Insert Library: insert pages into PDF file in vb.
PDF: Insert PDF Page. VB.NET PDF - How to Insert a New Page to PDF in VB.NET. Easy to Use VB.NET APIs to Add a New Blank Page to PDF Document in VB.NET Program.
create bookmarks pdf; how to add bookmarks to pdf document
March 2009 
5-15 
EDGAR Filer Manual (Volume II) 
Document Body Tags  
Definition  
<BLOCKQUOTE>  
Block Quote -- usually indented  
<BR>  
Line Break  
<CAPTION>  
Caption -- can only be used with tables  
<CENTER>  
Centers elements between tags  
<CITE>  
Citation  
<CODE>  
Code  
<DD>  
Definition  
<DFN>  
Definition -- same as using <I>  
<DIR>  
Directory List  
<DIV>  
Division -- helps separate a document into parts  
<DL>  
Definition List -- used with <DT> and <DD>  
<DT>  
Definition Term  
<EM>  
Emphasized -- similar to using Bold  
<FONT>  
Allows alteration of font contained within tags  
<H1>  
Heading 1 -- largest heading size  
<H2>  
Heading 2  
<H3>  
Heading 3  
<H4>  
Heading 4  
<H5>  
Heading 5  
<H6>  
Heading 6 -- smallest heading size  
<HR>  
Horizontal Rule -- displays a thin line across the page for separation of text  
<I>  
Italics  
<IMG SRC=>  
Image reference 
Note: Only local JPEG and GIF graphic files may be referenced (i.e., <IMG 
SRC="graph10q.gif"> or<IMG SRC="graph10q.jpg">) 
The attributes DYNSRC, LOOP, LOOPDELAY, START, and CONTROLS are 
not supported for this tag.  
<KBD>  
Keyboard -- pre-formatted text  
<LI>  
List Item -- used by <DIR>, <MENU>, <OL>, and <UL>  
<LISTING>  
Listing -- same as using <PRE>  
<MENU>  
Menu List  
<OL>  
Ordered List -- includes numbers  
<P>  
Paragraph  
<PLAINTEXT>  
Plain Text  
<PRE>  
Pre-formatted Text  
C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
application. Able to remove a single page from PDF document. Ability Demo Code: How to Delete a Single PDF Page from PDF File in C#.NET. How to
adding bookmarks in pdf; bookmark a pdf file
C# PDF Page Rotate Library: rotate PDF page permanently in C#.net
Using this C# .NET PDF rotate page control SDK, you can easily select any page from a multi-page PDF document file, rotate selected PDF page to special
adding bookmarks to a pdf; edit pdf bookmarks
EDGAR Filer Manual (Volume II) 
5-16 
March 2009 
Document Body Tags  
Definition  
<SAMP>  
Sample -- uses a fixed-width font and is same as using <PRE>  
<SMALL>  
Small Text -- decreases font size  
<STRIKE> 
Strikethrough  
<STRONG>  
Strong -- similar to using Bold  
<SUB>  
Subscript  
<SUP>  
Superscript  
<TABLE>  
Table  
Note: EDGAR will not accept or disseminate HTML documents with nested 
<TABLE> tags.  
<TD>  
Table Data or Cell  
<TH>  
Table Header -- displayed in bold  
<TR>  
Table Row Note: The WIDTH attribute supports percentage (%) values as well 
as pixel values.  
<TT>  
Teletype -- uses a fixed-width font and is same as using <PRE>  
<U>  
Underlined  
<UL>  
Un-ordered List -- bullets only  
<VAR>  
Variable -- uses a fixed-width font and is same as using <PRE>  
<XMP>  
Example -- same as using <PRE>  
Please see APPENDIX A, MESSAGES REPORTED BY EDGAR, for a listing of various errors 
and warnings associated with the processing of HTML documents within EDGAR.  
Note: The < CAPTION> and <TABLE> tags are currently used within ASCII/SGML EDGAR 
documents and also used in HTML documents but they are “visually” interpreted 
differently.  
5.2.2.4  HTML Tags that are NOT Supported by EDGAR  
EDGAR will suspend and not disseminate submissions with the following HTML tags:  
<ACRONYM> 
<APPLET> 
<AREA>  
<BASE> 
<BASEFONT> 
<BDO>  
<BUTTON> 
<COL> 
<COLGROUP>  
<DEL> 
<FIELDSET> 
<FORM>  
<FRAME> 
<FRAMESET> 
<IFRAME>  
<INPUT> 
<INS> 
<LABEL>  
<LEGEND> 
<MAP> 
<META HTTP_EQUIV…>  
<NOFRAMES> 
<NOSCRIPT> 
<OBJECT>  
<OPTION> 
<PARAM> 
<Q>  
<S> 
<SCRIPT> 
<SELECT> 
VB.NET PDF Page Replace Library: replace PDF pages in C#.net, ASP.
Image: Insert Image to PDF. Image: Remove Image from PDF Page. Image: Copy, Paste, Cut Image in Page. Link: Edit URL. Bookmark: Edit Bookmark. Metadata: Edit
bookmarks in pdf reader; how to add bookmark in pdf
C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
String filepath = @""; String outPutFilePath = @""; PDFDocument doc = new PDFDocument(filepath); // Copy the first page of PDF document.
create bookmarks pdf file; bookmark page in pdf
March 2009 
5-17 
EDGAR Filer Manual (Volume II) 
<SPAN> 
<STYLE> 
<TBODY> 
<TEXTAREA> 
<TFOOT> 
<THEAD>  
*All other tags not represented in Section 5.2.2.3, Acceptable HTML Tags Within a Document 
Body.  
5.2.2.5  Acceptable Attributes for EDGAR HTML Tags  
Due to the EDGAR restrictions described previously, only a subset of the HTML 3.2/4.0 tag 
attributes are accepted by EDGAR. The following table lists the set of acceptable HTML tag 
attributes that you can use.  
Note: Many of the following attributes are supported passively only since their primary 
function may be to support actions that are restricted by EDGAR. Refer to any HTML 
3.2 reference book for actual values available for these attributes.  
Attribute  
Description  
Parent Tag(s)  
align  
Align text  
<H1>-<H6>, <HR>, <P>, 
<CAPTION>, <DIV>, <TABLE>, 
<TD>, <TH>, <TR>  
alink  
Highlight color when hypertext links are 
used  
<BODY>  
bgcolor  
Background color of the document body  
<BODY>, <TABLE>  
border  
Thickness of the table border  
<TABLE>  
cellpadding 
Sets the spacing between the border and 
the content of the table cells  
<TABLE>  
cellspacing  
Sets the spacing between the cells in a 
table  
<TABLE>  
class  
Space-separated list of classes  
MANY  
clear  
Moves down past floating images on either 
margin  
<BR>  
color  
Sets the color of the text  
<FONT>  
colspan  
Causes the cell to span a number of 
columns  
<TD>, <TH>  
compact  
Render lists in a more compact style  
<DIR>, <DL>, <MENU>, <OL>, 
<UL>  
content  
Associated information  
<META>  
dir  
Direction of text  
MANY
1
height  
The height of a cell in pixels or percentage 
of screen height  
<TD>, <TH>  
href  
Link to another document  
<A>  
1
Many HTML tags use this attribute. 
C# PDF Page Replace Library: replace PDF pages in C#.net, ASP.NET
Page: Replace PDF Pages. An Excellent PDF Control Allows C# Users to Replace the Original PDF Page with New PDF Page from Another PDF File in C#.NET.
create bookmarks in pdf; copy pdf bookmarks
VB.NET Create PDF from Excel Library to convert xlsx, xls to PDF
Image: Insert Image to PDF. Image: Remove Image from PDF Page. Image: Copy, Paste, Cut Image in Page. Link: Edit URL. Bookmark: Edit Bookmark. Metadata: Edit
editing bookmarks in pdf; how to add bookmarks to a pdf
EDGAR Filer Manual (Volume II) 
5-18 
March 2009 
Attribute  
Description  
Parent Tag(s)  
id  
Document-wide unique id  
MANY  
lang  
Language specification  
MANY  
link  
Color used to stroke the text for unvisited 
hypertext links.  
<BODY>  
name  
Meta-information name or link name  
<META> or <A>  
noshade  
Display as a solid rule  
<HR>  
nowrap  
Prevents word-wrapping within a cell  
<TD>, <TH>  
prompt  
Specifies a prompt string for an input field  
<ISINDEX>  
rel  
Forward link types  
<LINK>, <A>  
rev  
Reverse link types  
<LINK>, <A>  
rowspan  
Causes the cell to span a number of rows  
<TD>, <TH>  
size  
Amount of space assigned for an input field   <HR>, <FONT>  
src  
Graphic reference  
<IMG>  
start  
Starting sequence number  
<OL>  
style  
Associated Style info  
MANY  
text  
Color used to stroke the document’s text  
<BODY>  
title  
Advisory title string  
<LINK>  
type  
Style of bullet  
<LI>, <OL>, <UL>  
valign  
Sets the vertical alignment of the content 
within a cell  
<TD>, <TH>, <TR>  
vlink  
Color used to stroke the text for visited 
hypertext links.  
<BODY>  
width  
Width of a column in pixels or percentage of 
screen width  
<HR>, <TABLE>, <TD>, <TH>  
5.2.2.6  Extended Character Sets within HTML Documents  
Within HTML documents, extended-ASCII characters (i.e., the British Pound Sterling symbol, £, 
and the Japanese Yen symbol, ¥) can be represented by their ISO-8859-1 (Latin 1) decimal 
character reference specification. The Pound Sterling symbol (£) can be represented by the 
following character string: &#163. The Yen symbol (¥) can be represented by the following 
character string: &#165. Many W3C-certified websites contain complete ISO-8859-1 extended 
character reference listings, like the sample from http://www.htmlhelp.com/reference/charset 
below. Please note that EDGAR will suspend a submission that contains an extended ASCII 
character. EDGAR will support extended character references only.  
A partial listing of Relevant ISO-8859-1 Extended Character References for SEC HTML 
documents includes:   
March 2009 
5-19 
EDGAR Filer Manual (Volume II) 
Description 
Hex  
Character Reference 
(Dec)  
Entity Name  
Symbol  
small italic f, function 
of, f florin  
83  
&#131;  
&fnof;  
ƒ  
low horizontal ellipsis   85  
&#133;  
&hellip; &ldots;   …  
dagger mark  
86  
&#134;  
&dagger;  
†  
double dagger mark   87  
&#135;  
&Dagger;  
‡  
letter modifying 
circumflex  
88  
&#136;  
¹  
per thousand (mille) 
sign  
89  
&#137;  
&permil;  
‰  
capital S caron or 
hacek  
8A  
&#138;  
&Scaron;  
Š  
left single angle 
quotemark (guillemet)  
8B  
&#139;  
&lsaquo;  
‹  
capital OE ligature  
8C  
&#140;  
&OElig;  
Œ  
round filled bullet  
95  
&#149;  
&bull; 
trademark sign  
99  
&#153;  
&trade;  
™  
small s caron or 
hacek  
9A  
&#154;  
&scaron;  
š  
right single angle 
quotemark (guillemet)  
9B  
&#155;  
&rsaquo;  
›  
small oe ligature  
9C  
&#156;  
&oelig;  
œ  
capital Y dieresis or 
umlaut  
9F  
&#159;  
&Yuml;  
Ÿ  
non-breaking space   A0  
&#160;  
&nbsp;  
inverted exclamation 
mark  
A1  
&#161;  
&iexcl;  
¡  
cent sign  
A2  
&#162;  
&cent;  
¢  
pound sterling sign  
A3  
&#163;  
&pound;  
£  
general currency sign   A4  
&#164;  
&curren;  
¤ 
yen sign  
A5  
&#165;  
&yen;  
¥  
section sign  
A7  
&#167;  
&sect;  
§ 
spacing dieresis or 
umlaut  
A8  
&#168;  
&uml; &die;  
¨  
copyright sign  
A9  
&#169;  
&copy;  
©  
feminine ordinal 
indicator 
AA  
&#170;  
&ordf;  
ª 
left (double) angle 
quote (guillemet)  
AB  
&#171;  
&laquo;  
«  
EDGAR Filer Manual (Volume II) 
5-20 
March 2009 
Description 
Hex  
Character Reference 
(Dec)  
Entity Name  
Symbol  
registered trademark 
sign   
AE  
&#174;  
&reg;  
®  
spacing macron 
(long) accent,  
AF  
&#175;  
&macr;  
¯ 
degree sign  
B0  
&#176;  
&deg;  
°  
plus-or-minus sign  
B1  
&#177;  
&plusmn;  
±  
superscript 2  
B2  
&#178;  
&sup2;  
²  
superscript 3  
B3  
&#179;  
&sup3;  
³  
spacing acute accent   B4  
&#180;  
&acute;  
´  
micro sign  
B5  
&#181;  
&micro;  
µ 
middle dot, centered 
dot  
B7  
&#183;  
&middot;  
•  
spacing cedilla  
B8  
&#184;  
&cedil;  
¸  
superscript 1  
B9  
&#185;  
&sup1;  
¹  
masculine ordinal 
indicator  
BA  
&#186;  
&ordm;  
º  
right (double) angle 
quote(guillemet)  
BB  
&#187;  
&raquo;  
»  
fraction 1/4  
BC  
&#188;  
&frac14;  
¼  
fraction 1/2  
BD  
&#189;  
&frac12; &half;   ½  
fraction 3/4  
BE  
&#190;  
&frac34;  
¾  
inverted question 
mark  
BF  
&#191;  
&iquest;  
¿  
Your HTML editor may use the "Entity-Name" (i.e., &yen) of the character you wish to 
reference rather than the standard character reference. Either technique may be used within an 
HTML document that is attached to an SEC submission.  
To represent ASCII/SGML tagging phrases within an HTML document, use the following 
identifiers for the reserved characters "<" and ">": &lt for "<", and &gt for ">". This will 
prevent the browser from misinterpreting the characters for display purposes. Please note that the  
<R> tag can be represented either directly as <R> or indirectly as &ltR&gt. For all other uses of 
the reserved "< >" characters, you can also use their ISO-8859-1 representation.  
5.2.2.7  Template for an Attached HTML Document  
The following is an acceptable template for an attached HTML document.  
Note: All documents are attached to page two of the submission template.  
<HTML>  
<HEAD>  
March 2009 
5-21 
EDGAR Filer Manual (Volume II) 
{Head tags and text} 
</HEAD> 
<BODY>  
{HTML body tags and text............}  
</BODY> 
</HTML>  
5.2.2.8  ASCII or SGML Functionality to be Preserved within HTML Documents  
EDGAR allows you to use several ASCII or SGML tags within HTML documents, primarily to 
preserve existing functionality. Details on the use of these tags can be found in Section 5.2.1.3, 
Using Tags in Attached Documents. However, in HTML documents you cannot use all of the 
tags that can be used in ASCII documents. The following ASCII/SGML tagging functions are 
preserved in HTML documents:  
Paging  
EDGAR allows the ASCII or SGML <PAGE> tag within HTML 
documents, even though common browsers and HTML 3.2 do not support 
this tag. You may need to use this tag to differentiate pages to end-users.  
Redlining  
HTML documents may be marked to show changed materials within 
paragraphs; however, only one set of redline tags (the begin and end 
redline) may be on a text line. Press Enter or Return after each ending 
redline tag (</R>). In addition, do not use font tags within a set of redline 
tags.  
EDGAR allows you to use the ASCII or SGML <R> and </R > tags within 
HTML documents, even though this tag is not supported by common 
browsers and HTML 3.2. You may want to use this tag set to highlight 
sections of text for us. Sections of your submission text that you mark with 
these redlining tags will be highlighted for our staff in BOLD Magenta 
color in order to differentiate that section of text from other non-redlined 
sections.  
The <R> and </R > tags can also be represented as &ltR&gt and 
&lt/R&gt, respectively. Either format will signify a redline request to 
EDGAR. The redline tags within the HTML document are not 
disseminated to the public. Each redline tag character will be replaced by a 
blank character (‘ ‘) before the submission is disseminated. The blanks 
will not be visible from the browser but will be visible in the HTML 
source code.  
Important: If you do not form your redline tags correctly, the tags can appear 
in your disseminated filing.  
Sample HTML document with Redline tags:  
EDGAR Filer Manual (Volume II) 
5-22 
March 2009 
<HTML> 
...  
... 
<p align="center"><strong>TESTFILE COMPANY </strong></p> 
<p align="center"><strong>NOTES TO FINANCIAL STATEMENTS </strong></p> 
<p align="center"><strong>September 30, 1999</strong></p> 
<p>&nbsp;</p> 
&ltR&gt  
<p>Note 1. Summary of Significant Accounting Policies</p> 
&lt/R&gt  
... 
... 
</HTML>  
You may wish to submit HTML documents, or parts of HTML documents, before you file your 
submission or master segment. EDGAR allows only Type 2 (full document) modules and 
segments in HTML format. You may create them exactly as you would create ASCII/SGML 
modules and segments. See Section 5.3 for more information on modules and segments. You 
would attach your Type 2 module or segment to your "Master" submission template by selecting 
the Module/Segment Reference page.  
5.2.2.9  ASCII or SGML Functionality Not Supported within HTML Documents  
EDGAR will NOT support the following ASCII or SGML document tags within an HTML 
document that is submitted to EDGAR as part of a Live or Test submission:  
<S>  
<C>  
Since tables are interpreted differently in HTML, the <S> and <C> tags are NOT accepted.  
Warning: 
The presence of an <S> or <C> tag in an HTML document will cause EDGAR to 
suspend the submission.  
EDGAR will also NOT support the following ASCII or SGML footnote tags within an HTML 
document that is submitted to EDGAR as part of a Live or Test submission.  
<FN>  
<F1>  
<F2>, etc.  
Warning: 
The presence of a footnote tag in an HTML document will cause EDGAR to 
suspend the submission.  
You can simulate a footnote using the <SUP> and <SUB> tags with an internal <A href=#xxxx 
> hyperlink. This technique allows browser users to reference any footnote information easily.  
5.2.2.10 SEC Recommendations on Preparing Submissions with HTML Documents  
The following are specific SEC recommendations concerning the creation of SEC-approved 
HTML documents:  
Documents you may be interested
Documents you may be interested