how to display pdf file in c# : Extract text from pdf to excel control application platform web page html winforms web browser Excel97-2007BinaryFileFormat(xls)Specification1-part264

Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 10 of 349 
RRDINSDELBEGIN: Beginning of a row/column insert/delete revision record block 
(150h) ........................................................................................................................ 332
RRDINSDELEND: End of a row/column insert/delete revision record block (151h)
................................................................................................................................... 332
RRDINSERTSH: Sheet insert revision (14Dh) ........................................................ 333
RRDMOVE: Cell(s) move revision (140h) .............................................................. 333
RRDMOVEBEGIN: Beginning of a cell(s) move revision record block (14Eh) .... 333
RRDMOVEEND: End of a cell(s) move revision record block (14Fh) ................... 333
RRDNOTE: Comment revision (01Ch).................................................................... 334
RRDRENSHT: Sheet Rename Revision (13Eh) ...................................................... 335
RRDRSTETXP: Formatting run definition (154h) .................................................. 335
STXP Structures.................................................................................................. 335
RRDTQSIF: Query Table field change revision (808h) ........................................... 336
RRDUSERVIEW: Custom View revision (1ACh) .................................................. 337
RRTABID: Map of Sheet Id’s (13Dh)
...................................................................... 337
USRFILELOCK: File Lock (195h) .......................................................................... 337
USREXCL: Exclusive File Lock (194h) .................................................................. 337
User Names Stream......................................................................................................... 338
CUSR: Count of users (191h) ................................................................................... 338
USRCHK: Version info (198h) ................................................................................ 338
CBUSR: User info byte offsets (192h) ..................................................................... 338
BCUsrs: Brief-case users (197h) .............................................................................. 339
USRINFO: User info (193h) ..................................................................................... 339
SHORTDTR Structures ...................................................................................... 339
Chart Records.................................................................................................................. 340
CHARTFRTINFO: Chart Future Record Type Info (850h) ..................................... 340
FRTWRAPPER: Chart Future Record Type Wrapper (851h) ................................. 340
STARTBLOCK: Chart Future Record Type Start Block (852h) ............................. 341
ENDBLOCK: Chart Future Record Type End Block (853h) ................................... 343
STARTOBJECT: Chart Future Record Type Start Object (854h) ........................... 343
ENDOBJECT: Chart Future Record Type End Object (855h) ................................. 343
CATLAB: Category Labels (856h) .......................................................................... 344
YMULT: Y Multiplier (857h) .................................................................................. 344
SXVIEWLINK: Chart PivotTable Name (858h) ...................................................... 345
PIVOTCHARTBITS: PivotChart Bits (859h) .......................................................... 345
FRTFONTLIST: Chart Font List (85Ah) ................................................................. 346
PIVOTCHARTLINK: Pivot Chart Link (861h) ....................................................... 347
Information Rights Management (IRM) ......................................................................... 347
DataSpaces ................................................................................................................ 347
DRMContent ............................................................................................................. 347
DRMViewerContent ................................................................................................. 348
Extract text from pdf to excel - extract text content from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File
copy and paste text from pdf; extract text from pdf file using java
Extract text from pdf to excel - VB.NET PDF Text Extract Library: extract text content from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
How to Extract Text from PDF with VB.NET Sample Codes in .NET Application
cut text pdf; copy paste text pdf file
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 11 of 349 
Introduction 
The Binary Interchange File Format (BIFF) is the file format Microsoft Office Excel 
workbooks are saved to (aka *.xls).  Microsoft Excel versions 5.0 and later use 
compound files (explained later in this document); this is the OLE implementation of the 
Structured Storage Model.  For more information on this standard, see  
http://download.microsoft.com/download/0/B/E/0BE8BDD7-E5E8-422A-ABFD-
4342ED7AD886/WindowsCompoundBinaryFileFormatSpecification.pdf
File Format Versions 
This document covers the implementation of BIFF versions 5, 7, and 8 for versions of 
Microsoft Excel released since version 5.0 and as noted in the following table: 
BIFF version  Microsoft Office Excel version 
BIFF5 
Microsoft Excel version 5.0 (XL5) 
BIFF7 
Microsoft Excel 95 (XL7) (also called Microsoft Excel version 7) 
BIFF8 
Microsoft Excel 97 (XL8), Microsoft Excel 2000 (XL9), Microsoft Excel 
2002 (XL10), Microsoft Office Excel 2003 (XL11), Microsoft Office 
Excel 2007 (XL12) 
You can identify the BIFF version used in an XLS file from the Beginning Of File (
BOF
record present in all BIFF version 5, 7, and 8 files.  In BIFF4 and earlier versions, 
various records (other than the 
BOF
record) have version information specified in the 
high-order byte of their record numbers.  This was a redundant methodology, so for 
versions of BIFF after BIFF4, Excel obtains the BIFF version by reading the 
BOF
record. 
The record descriptions in this document apply to BIFF versions 5, 7, and 8.  If 
records have differences between the various BIFF versions, they are noted in the 
record descriptions within this document. 
The following tables describe the new and changed records in BIFF8 as compared to 
BIFF7.  For more information on these records, see the record description listed later 
in this document. 
Note:  unless otherwise noted, the use of the word Excel without a reference to a 
specific version or release implies the generic function or ability of Excel for releases 
5.0 through 2007.  Also, a form of shorthand notation is used throughout this 
document to indicate release levels of Excel.  For example, XL9 = Microsoft Excel 
2000, XL10 = Microsoft Excel 2002, XL11 = Microsoft Office Excel 2003, XL12 = 
Microsoft Office Excel 2007 and so on. 
New Records in BIFF8 for Microsoft Excel 97 
Number  Record 
1B1h 
CF 
1BAh 
CODENAME 
1B0h 
CONDFMT 
1B5h 
DCONBIN 
161h 
DSF 
1BEh 
DV 
1B2h 
DVAL 
1C0h 
EXCEL9FILE 
FFh 
EXTSST 
VB.NET Create PDF from Excel Library to convert xlsx, xls to PDF
Editor; C#: WPF PDF Viewer; C#: Create PDF from Word; C#: Create PDF from Excel; PDF; C# Page: Insert PDF pages; C# Page: Delete PDF pages; C# Read: PDF Text Extract
can't copy and paste text from pdf; export text from pdf to word
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
Image: Extract Image from PDF. |. Home ›› XDoc.PDF ›› C# PDF: Extract PDF Image. How to C#: Extract Image from PDF Document.
a pdf text extractor; extract text from pdf acrobat
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 12 of 349 
Number  Record 
1B8h 
HLINK 
FDh 
LABELSST 
E5h 
MERGECELLS 
ECh 
MSODRAWING 
EBh 
MSODRAWINGGROUP 
EDh 
MSODRAWINGSELECTION 
DCh 
PARAMQRY 
1Afh 
PROT4REV 
1BCh 
PROT4REVPASS 
1ADh 
QSI 
1C1h 
RECALCID 
1B7h 
REFRESHALL 
FCh 
SST 
1AEh 
SUPBOOK 
C6h 
SXDB 
122h 
SXDBEX 
F1h 
SXEX 
1BBh 
SXFDBTYPE 
F2h 
SXFILT 
F9h 
SXFMLA 
FBh 
SXFORMAT 
103h 
SXFORMULA 
F6h 
SXNAME 
F8h 
SXPAIR 
F0h 
SXRULE 
F7h 
SXSELECT 
100h 
SXVDEX 
1B6h 
TXO 
1A9h 
USERBVIEW 
1AAh 
USERSVIEWBEGIN 
1ABh 
USERSVIEWEND 
160h 
USESELFS 
162h 
XL5MODIFY 
Changed Records in BIFF8 for Microsoft Excel 97 
Number  Record 
09h 
BOF 
85h 
BOUNDSHEET 
200h 
DIMENSIONS 
0Bh 
INDEX 
1Ch 
NOTE 
5Dh 
OBJ 
DCh 
SXEXT 
1Ah 
VERTICALPAGEBREAKS 
23Eh 
WINDOW2 
5Ch 
WRITEACCESS 
59h 
XCT 
E0h 
XF 
C# Create PDF from Excel Library to convert xlsx, xls to PDF in C#
Create PDF from Excel. |. Home ›› XDoc.PDF ›› C# PDF: Create PDF from Excel. Export PDF from Excel with cell border or no border.
copy pdf text to word; c# extract text from pdf
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
Image: Extract Image from PDF. |. Home ›› XDoc.PDF ›› VB.NET PDF: Extract PDF Image. VB.NET PDF - Extract Image from PDF Document in VB.NET.
copying text from pdf into word; copy text pdf
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 13 of 349 
The User Names and Revision Log streams support the shared workbooks features 
that were added in Excel 95.  The BIFF record data in shared list records (records 
that begin with 
RR
), and the binary format of the User Names and Revision Log 
streams are documented. 
The
DocumentSummaryInformation
and 
SummaryInformation
streams support 
the document properties available in Excel 95 and 97, which are standardized across 
Microsoft Office applications. 
SummaryInformation
and 
DocumentSummaryInformation
are widely understood and additional information 
can be found at:
http://msdn2.microsoft.com/en-us/library/aa380376(VS.85).aspx
http://poi.apache.org/apidocs/org/apache/poi/hpsf/SummaryInformation.htm
l
http://poi.apache.org/apidocs/org/apache/poi/hpsf/DocumentSummaryInfor
mation.html
FRT Record Description 
Excel 97 and later versions support Future Record Types (
FRT
s).  These records are 
used to roundtrip information that was not supported in that version.  Basically, data 
in an 
FRT
is ignored by versions of Excel that do not recognize the command name 
or data format.  This allows data to be retained by Excel from a file read to a file 
save, but ultimately the data is ignored and not acted upon by the version of Excel 
that encounters the data.  While Excel 97 may not support a new command, record, 
or data format, it does save the unsupported command, record, or data in a defined 
manner and write these elements back to the record stream when the file is saved.  
For example, this allows an Excel 2000 or later version of Excel to load back new 
records without loss of data. 
When Excel 97 or later encounters unrecognized 
FRT
records, it writes them to the 
record stream at the end of the current record block. 
Note: 
FRT
records longer than the maximum allowable record length use the 
CONTINUEFRT
record instead of the 
CONTINUE
record for additional information. 
The 
FRT
header definition is: 
Record Data 
Offset  Field Name 
Size 
Contents 
rt 
Record type; this matches the BIFF 
rt
that 
appears in the first two bytes of the record 
grbitFrt 
FRT
flags; see following table 
REF 
REF
structure; this is only present when the 
bitfFrtRef
flag is set in 
grbitFrt
; otherwise 
the actual record data starts in this position 
The 
grbitFrt
field has the following option flags. 
Bits  Mask  Flag Name 
Contents 
0001h 
bitfFrtRef 
1= a 
REF
structure is present in the 
FRT
header 
0002h 
bitfFrtVolatile 
1= Excel should give an alert when saving if 
that version doesn't recognize the 
FRT
C# HTML5 Viewer: Load, View, Convert, Annotate and Edit Excel
freely implement conversion from Excel document to PDF, Tiff and HTML file. Users can add annotations to Excel when viewing it online and use text search and
find and replace text in pdf; extract text from pdf
C# PDF insert text Library: insert text into PDF content in C#.net
Text to PDF. C#.NET PDF SDK - Insert Text to PDF Document in C#.NET. Providing C# Demo Code for Adding and Inserting Text to PDF File Page with .NET PDF Library.
delete text from pdf with acrobat; acrobat remove text from pdf
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 14 of 349 
15-2  FFFCh  (Reserved) 
Reserved; must be zero 
The 
REF
structure has the following fields. 
Offset  Field Name  Size 
Contents 
rwFirst 
The first row of the range associated with the record 
10 
rwLast 
The last row of the range associated with the record 
12 
colFirst 
The first column of the range associated with the record 
14 
colLast 
The last column of the range associated with the record 
New FRT Records in Excel 2000 
Number  Record 
812h 
CONTINUEFRT 
803h 
DBQUERYEXT 
804h 
EXTSTRING 
800h 
HLINKTOOLTIP 
80Ah 
OLEDBCONN 
807h 
QSIF 
806h 
QSIR 
802h 
QSISXTAG 
80Eh 
SXPIEX 
80Dh 
SXTH 
80Fh 
SXVDTEX 
80Ch 
SXVIEWEX 
810h 
SXVIEWEX9 
80Bh 
WOPT 
New FRT Records in Excel 2002 
Number  Record 
863h 
BOOKEXT 
865h 
CRASHRECERR 
86Ah 
DATALABEXT 
86Bh 
DATALABEXTCONTENTS 
86Ch 
CELLWATCH 
866h 
HFPicture 
813h 
REALTIMEDATA 
862h 
SHEETEXT 
864h 
SXADDL 
868h 
FEAT 
867h 
FEATHEADR 
86dh 
FEATINFO 
New FRT Records in Excel 2003 
Number  Record 
875h 
CONTINUEFRT11 
874h 
DROPDOWNOBJIDS 
872h 
FEAT11 
871h 
FEATHEADR11 
873h 
FEATINFO11 
C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
Page: Extract, Copy and Paste PDF Pages. Easy to Use C# Code to Extract PDF Pages, Copy Pages from One PDF File and Paste into Others in C#.NET Program.
cut and paste text from pdf document; cut text from pdf document
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
Integrate following RasterEdge C#.NET text to PDF converter SDK dlls into your C#.NET project assemblies; RasterEdge.XDoc.Excel.dll.
extract text from pdf open source; extract text from pdf file
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 15 of 349 
New FRT Records in Mac Excel 11 
Number  Record 
8c9h 
LNEXT 
8cah 
MKREXT 
8cbh 
CRTCOOPT 
8c0h 
AUTOWEBPUB 
8c1h 
LISTOBJ 
8c2h 
LISTFIELD 
8c3h 
LISTDV 
8c4h 
LISTCONDFMT 
8c5h 
LISTCF 
8c6h 
FMQRY 
8c7h 
FMSQRY 
8c8h 
PLV 
New FRT Records in Excel 2007 
Number  Record 
876h 
DCONN 
877h 
LIST12 
878h 
FEAT12 
879h 
CONDFMT12 
87Ah 
CF12 
87Bh 
CFEX 
87Ch 
XFCRC 
87Dh 
XFEXT 
87Eh 
EZFILTER12 
87Fh 
CONTINUEFRT12 
881h 
SXADDL12 
884h 
MDTINFO 
885h 
MDXSTR 
886h 
MDXTUPLE 
887h 
MDXSET 
888h 
MDXPROP 
889h 
MDXKPI 
88Ah 
MDTB 
88Bh 
PLV 
88Ch 
COMPAT12 
88Dh 
DXF 
88Eh 
TABLESTYLES 
88Fh 
TABLESTYLE 
890h 
TABLESTYLEELEMENT 
892h 
STYLEEXT 
893h 
NAMEPUBLISH 
894h 
NAMECMT 
895h 
SORTDATA12 
896h 
THEME 
897h 
GUIDTYPELIB 
898h 
FNGRP12 
899h 
NAMEFNGRP12 
89Ah 
MTRSETTINGS 
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 16 of 349 
89Bh 
COMPRESSPICTURES 
89Ch 
HEADERFOOTER 
8A3h 
FORCEFULLCALCULATION 
The Workbook Compound File 
An OLE 2 compound file is essentially ―a file system within a file.‖  The compound file 
contains a hierarchical system of storages and streams.  A storage is analogous to a 
directory, and a stream is analogous to a file in a directory.  Each Excel workbook is 
stored in a compound file, an example is shown in the following illustration.  This file 
is a workbook that contains three sheets: a worksheet (Book stream – Sheet1 
substream records) with a PivotTable (SX DB storage), a Visual Basic module (VBA 
PROJECT storage), and a chart (Book stream - Chart1 substream records). 
If a workbook contains embedded objects, then the file will also contain storages 
written by the applications that created the objects.  The 
PivotTable
data cache 
storage and 
VBA PROJECT
storage are not covered in this document. The 
CompObj
stream contains OLE 2 component object data, and the 
Summary Info
stream 
contains the standardized file summary information such as title, subject, author, 
and so on. 
The 
Book
stream begins with a 
BOF
record, and is followed by 
workbook global 
records
up to the first 
EOF
.  The 
workbook global
section contains one 
BOUNDSHEET
record for each sheet in the workbook.  You can use the 
dt
field 
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 17 of 349 
(document type), the 
lbPlyPos
field (stream position of the 
BOF
record for the 
sheet), and the 
cch
/
rgch
fields (sheet name as a byte-counted string) to quickly 
read selected sheets in the workbook. 
Each sheet in the workbook is stored after the workbook global section, beginning 
with 
BOF
and ending with 
EOF
.  If you read the file in a continuous stream (instead 
of using the 
BOUNDSHEET
records), you can test the 
dt
field of each 
BOF
record to 
determine the sheet type. 
Simple Save (new for BIFF7 and later) 
Excel 95 and 97 use a simple save method from OLE 2, developed to increase 
performance.  Excel uses the simple save method if a workbook has no: 
Visual Basic
modules 
PivotTables 
embedded objects on worksheets 
When Excel saves a workbook using simple save, the streams in the file must be at 
least 4k bytes long.  The OLE 2 code adds padding bytes to the streams to ensure 
they are at least 4k bytes long.  If you use a low-level binary viewer (instead of the 
BiffView utility) to examine the resulting file, the padding bytes appear as ―garbage‖ 
at the end of the streams. 
To find the actual end of the 
Book
stream, increment a counter each time a 
BOF
record is read and then decrement it every time an 
EOF
record is read.  When the 
counter reaches zero, the last 
EOF
in the Book stream was read. 
Double Stream File 
For improved backward compatibility, Excel 97 has a save file type option: Microsoft 
Excel 97 & 5.0/95 Workbook.  When a workbook is saved using this file type, 
Excel writes two complete book streams.  The first stream in the file is the Microsoft 
Excel 5.0/95 format (BIFF5/BIFF7), and the second one is the Microsoft Excel 97 
format (BIFF8).  The 
DSF
record, which only appears in the BIFF8 stream, indicates 
the file is a double stream file. 
To distinguish the two streams, the BIFF5/BIFF7 stream is called 
Book
, and the 
BIFF8 stream is called 
Workbook
Unicode Strings in BIFF8 
Excel 97 and later versions use unicode strings.  In BIFF8, strings are stored in a 
compressed format.  Each string contains the following fields: 
Offset  Field Name  Size  Contents 
cch 
Count of characters in the string (Note: this is the number 
of characters, NOT the number of bytes) 
grbit 
Option flags (see 
grbit
field definition table below) 
rgb 
var  Array of string characters and formatting runs  
Unicode strings usually require 2 bytes of storage per character.  Because most 
strings in USA/English Excel have all of the high bytes of unicode characters set to 
00h
, the strings can be saved using a compressed unicode format.  The 
grbit
field 
specifies the compression encoding as shown in the following table. 
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 18 of 349 
grbit field definition: 
Bits  Mask  Flag Name  Contents 
01h 
fHighByte 
=0 if all the characters in the string have a high byte of 
00h
and only the low bytes are saved in the file 
(compressed) 
=1 if at least one character in the string has a nonzero 
high byte and therefore all characters in the string are 
saved as double-byte characters (not compressed) 
02h 
(Reserved)  Reserved; must be 0 (zero) 
04h 
fExtSt 
Extended string follows (East Asian versions, see text) 
08h 
fRichSt 
Rich string follows 
7–4  F0h 
(Reserved)  Reserved; must be 0 (zero) 
An unformatted string with all high bytes set to 
00h
has 
grbit=00h
 This implies 
there are no formatting runs (
crun
), which means the 
crun
runs count field does 
not exist. 
An unformatted string that has at least one character with a nonzero high byte has 
grbit=01h
A formatted string with all high bytes set to 
00h
has 
grbit=08h
if the string has 
several different character formats applied. 
The easiest way to understand the contents of BIFF8 strings is to look at an 
example.  Suppose the string this is red ink is in a cell, and is formatted so the 
word red is red.  The 
rgb
field of the 
SST
record appears as follows (text characters 
in bold): 
0F 00 08 02 00 74 68 69 73 20 69 73 20 72 65 64 20 69 6E 6B 
08 00 06 00 0B 00 05 00 
Swapping bytes and reorganizing: 
000F  08  0002 74 68 69 73 20 69 73 20 72 65 64 20 69 6E 6B 
0008  0006  000B  0005 
This 
rgb
field of the 
SST
record parses as follows: 
Data 
Description 
000F 
String is 15 characters long. 
08 
The 
grbit
is set to 
08h
, which indicates a rich string. 
0002 
Count of formatting runs (runs follow the string and are not 
included in the character count; if there are no formatting 
runs, this field does not exist). 
74 68 69 73 20 69 73 20 
72 65 64 20 69 6E 6B 
The string characters; Note: in this case, each character is 
one byte. 
0008  0006 
Run number 1: index to 
FONT
record 6 (
ifnt
, 0-based) for 
characters beginning with character number 8 (0-based). 
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 19 of 349 
Data 
Description 
000B  0005 
Run number 2: index to 
FONT
record 5 (
ifnt
, 0-based) for 
characters beginning with character number B (0-based). 
Extended Strings in East Asian Versions 
In East Asian versions (for example, Japanese Microsoft Excel), extended strings 
may appear in the 
SST
record (
fExtSt
is set in the 
grbit
field).  These strings 
store additional fields with phonetic, language ID, or keyboard ID information.  The 
first two fields of extended strings (
cch
and 
grbit
) are identical to the nonextended 
strings described in the preceding text. 
Extended strings contain the following fields. 
Extended strings (not rich: fRichSt is not set) 
Offset  Field Name  Size  Contents 
cch 
Count of characters in the string data (Note: this is the 
number of characters, NOT the number of bytes) 
grbit 
Option flags (see 
grbit
field definition table above) 
cchExtRst 
Length of 
ExtRst
data 
rgb 
var  String data 
var 
ExtRst 
var 
ExtRst
data (not documented; length of this field is 
given by 
cchExtRst
Extended strings (rich: fRichSt is set) 
Offset  Field Name  Size  Contents 
cch 
Count of characters in the string data (Note: this is the 
number of characters, NOT the number of bytes) 
grbit 
Option flags (see 
grbit
field definition table above) 
crun 
Count of formatting runs 
cchExtRst 
Length of 
ExtRst
data 
rgb 
var  String data 
var 
rgSTRUN 
var  Array of formatting run structures; length is equal to 
(
crun
x 4) bytes 
var 
ExtRst 
var 
ExtRst
data (not documented; length of this field is 
given by 
cchExtRst
Other Microsoft Excel File Formats 
Excel creates several other files, some of which are documented in this material.  
The workspace file (.XLW extension in Microsoft Windows) and the toolbar file (.XLB 
extension in Microsoft Windows) are not covered in this document.  The files are 
used to configure Excel‘s UI and do not contain user data. 
This document contains BIFF documentation for Excel version 5.0, Excel 95, Excel 
97, Excel 2000, Excel 2002, Office Excel 2003 and Office Excel 2007 only 
Documents you may be interested
Documents you may be interested