how to display pdf file in c# : Copy text from scanned pdf to word software SDK dll winforms wpf html web forms Excel97-2007BinaryFileFormat(xls)Specification27-part283

Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 270 of 349 
Record Data 
BIFF8 
Offset  Name 
Size  Contents 
guid 
16 
Globally unique identifier for the custom view 
20 
iTabid 
Tab index for the sheet (1-based) 
24 
wScale 
Window zoom magnification 
28 
icv 
Index to color value 
32 
pnnSel 
Pane number of the active pane 
36 
grbit 
Option flags 
40 
refTopLeft 
Reference structure describing the visible area of the 
top-left pane (see text) 
48 
operNum 
16 
Array of 2 IEEE floating-point numbers that specify the 
vertical and horizontal positions of the pane split 
64 
colRPane 
The first visible column of the right pane  
(=–1 implies no vertical split) 
66 
rwBPane 
The first visible of the bottom pane  
(=–1 implies no horizontal split) 
The 
grbit
field contains the following option flags: 
Bits 
Mask 
Name 
Contents 
00000001h 
fShowBrks 
=1 if page breaks are displayed 
00000002h 
fDspFmlaSv 
=1 if the window should display formulas 
=0 if the window should display value 
00000004h 
fDspGridSv 
=1 if the window should display gridlines 
00000008h 
fDspRwColSv 
=1 if the window should display row and 
column headings 
00000010h 
fDspGutsSv 
=1 if outline symbols are displayed 
00000020h 
fDspZerosSv 
=1 if the window should display 0 (zero) 
values 
=0 if the window should suppress display of 
0 (zero) values 
00000040h 
fHorizontal 
=1 if the sheet is to be centered between 
the horizontal margins when printed 
00000080h 
fVertical 
=1 if the sheet is to be centered between 
the vertical margins when printed 
00000100h 
fPrintRwCol 
=1 to print row and column headings 
00000200h 
fPrintGrid 
=1 to print gridlines 
10 
00000400h 
fFitToPage 
=1 if the Fit To option is on (Page Setup 
dialog box, Page tab) 
11 
00000800h 
fPrintArea 
=1 if there is at least one print area on the 
sheet 
Copy text from scanned pdf to word - extract text content from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File
delete text from pdf with acrobat; delete text from pdf preview
Copy text from scanned pdf to word - VB.NET PDF Text Extract Library: extract text content from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
How to Extract Text from PDF with VB.NET Sample Codes in .NET Application
get text from pdf into excel; extract text from scanned pdf
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 271 of 349 
12 
00001000h 
fOnePrintArea 
=1 if there is only one print area on the 
sheet 
13 
00002000h 
fFilterMode 
=1 if the list is filtered 
14 
00004000h 
fEzFilter 
=1 if AutoFilter is active (the drop-down 
arrows are displayed) 
16–15  00018000h  (Reserved) 
17 
00020000h 
fSplitV 
=1 if the window is split vertically 
18 
00040000h 
fSplitH 
=1 if the window is split horizontally 
20–19  00180000h 
fHiddenRw 
2 bits true => hidden 
rw
s are defined as 
name 
21 
00200000h 
fHiddenCol 
=1 if there is at least one hidden column on 
the sheet 
23–22  00C00000h  (Reserved) 
24 
01000000h 
fSizeWithWn 
=1 if the chart is sized with window (chart 
sheet only) 
25 
02000000h 
fFilterUnique 
=1 if the view contains a filtered list 
26 
04000000h 
fSheetLayoutVi
ew 
=1 if the sheet is in page break preview 
31–27  F8000000h  (Reserved) 
The sheet view settings are saved using standard BIFF records that occur between 
the 
USERSVIEWBEGIN
record and the 
USERSVIEWEND
record. 
The guid is a unique identifier for a particular custom view for the entire workbook.  
The same guid can be found on 
USERSVIEWBEGIN
records for other sheets and also 
in the 
USERBVIEW
record for the workbook. 
USERSVIEWEND: End of Custom View Records (1ABh) 
The 
USERSVIEWEND
record marks the end of the settings for a custom view 
associated with the sheet. 
Record Data 
BIFF8 
Offset  Name 
Size  Contents 
fValid 
=1 if the view settings saved are valid 
The 
fValid
field is 1 if all records from 
USERSVIEWBEGIN
to 
USERSVIEWEND
record 
are valid.  Otherwise it is 0. 
USESELFS: Natural Language Formulas Flag (160h) 
This record stores a flag bit. 
Record Data 
BIFF8 
Offset  Name 
Size  Contents 
fUsesElfs 
=1 if this file was written by a version of Excel that can 
use natural-language formula input 
C# PDF - Extract Text from Scanned PDF Using OCR SDK
edit, C#.NET PDF pages extract, copy, paste, C# a page of PDF document and extract its text content. Recognize scanned PDF document and output OCR result to MS
extract text from pdf; copy text pdf
VB.NET PDF Convert to Word SDK: Convert PDF to Word library in vb.
webpage. Create high quality Word documents from both scanned PDF and searchable PDF files without losing formats in VB.NET. Support
extract text from pdf file using java; extract formatted text from pdf
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 272 of 349 
VCENTER: Center Between Vertical Margins (84h) 
If the Center On Page Vertically option is on in the Page Setup dialog box, 
Margins tab, then 
fVCenter=1
Record Data 
Offset  Name 
Size  Contents 
fVCenter 
=1 if the sheet is to be centered between the vertical 
margins when printed 
VERTICALPAGEBREAKS: Explicit Column Page Breaks 
(1Ah) 
The 
VERTICALPAGEBREAKS
record contains a list of explicit column page breaks. 
Record Data 
BIFF8 
Offset  Name 
Size  Contents 
cbrk 
Number of page breaks 
rgbrk 
var 
Array of 
brk
structures 
The 
cbrk
field contains the number of page breaks.  Each element of the 
rgbrk
structure contains three 2-byte integers: the first specifies the column of the break, 
the second specifies the starting row, and the third specifies the ending row for the 
break.  All row and column numbers are 1-based, and the breaks occur after the row 
or column.  This array is sorted by column, and then by starting/ending row.  No two 
page breaks may overlap. 
Record Data 
BIFF7 and earlier 
Offset  Name 
Size  Contents 
cbrk 
Number of page breaks 
rgcol 
var 
Array of columns 
The 
cbrk
field contains the number of page breaks.  The 
rgcol
field is an array of 
2-byte integers that specifies columns.  Excel sets a page break before each column 
contained in the list of columns in the 
rgcol
field.  The columns must be sorted in 
ascending order. 
WEBPUB: Web Publish Item (801h) 
This is a 
FRT
record.  It stores the information for a single published web page.  It 
appears in the sheet stream for the sheet from which this item was published. 
Record Data 
Offset  Name 
Size  Contents 
rt 
Record type; this matches the BIFF 
rt
in the first two 
bytes of the record;  = 0801h 
grbitFrt 
FRT
flags; see 
FRT
Records for more information 
ref 
var 
Range reference; see 
FRT
Records for more information 
C# Create PDF from Word Library to convert docx, doc to PDF in C#.
A convenient C#.NET control able to turn all Word text and image content into high quality PDF Easy to create searchable and scanned PDF files from Word.
copy pdf text to word with formatting; how to copy and paste pdf text
VB.NET Create PDF from Word Library to convert docx, doc to PDF in
Remove Image from PDF Page. Image: Copy, Paste, Cut Export all Word text and image content into high Easy to create searchable and scanned PDF files from Word.
c# read text from pdf; .net extract pdf text
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 273 of 349 
Offset  Name 
Size  Contents 
var 
tws 
Type of Web Source: 
1= 
twsSheet
; Entire Sheet was published 
2= 
twsPrintArea
; the Print Area was published 
3= 
twsAutoFilter
; an AutoFilter was published 
4= 
twsRef
; a range of cells was published 
5= 
twsChart
; a Chart was published 
6= 
twsPivotTable
; a PivotTable was published 
7= 
twsQuery
; a Query Table was published 
8= 
twsLabel
; a named range was published 
var 
twd 
Type of Web Page created: 
0= 
twdHtmlPlain
; non-interactive page 
1= 
twdHtmlCalc
; page uses Spreadsheet functionality 
2= 
twdHtmlList
; page uses PivotTable functionality 
3= 
twdHtmlChart
; page uses Chart functionality 
var 
grfOptions 
Common options; see following table 
var 
(Reserved) 
Reserved; must be zero 
var 
nStyled 
Style number (usually the same as the number inside 
stDivId
var 
cb 
Size of information that follows 
var 
stSrcName 
var 
Source data name (does not exist if 
tws
is 
twsRef
); 
zero length string if 
tws
is a type that has no name (ie 
the item is the entire sheet or the AutoFilter) 
var 
stFileDest 
var 
Unicode string; name of the file that is written out; 
should never be zero length 
var 
stDivId 
var 
Unicode string identifier used for the DIV tag ID 
attribute; should never be zero length 
var 
stTitle 
var 
Unicode string; title for published data in the HTML file; 
can be zero length 
var 
idCrtShape 
var 
XL10: if 
tws=twsChart
, this is a 4-byte chart shape id; 
otherwise this is zero length 
var 
rgb 
var 
Future information 
The 
grfOptions
field contains the following option flags: 
Bits  Mask  Name 
Contents 
0001h 
fNew 
1= this item is not yet published 
0002h 
fAutoRepublish 
1= auto-republish is on 
0004h  (Reserved) 
0008h 
fMhtml 
1= publish in MHTML 
15-4  FFF0h  (unused) 
WINDOW1: Window Information (3Dh) 
The 
WINDOW1
record contains workbook-level window attributes.  The 
xWn
and 
yWn
fields contain the location of the window in units of 1/20
th
of a point, relative to the 
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
Text can be extracted from scanned PDF image with OCR file, converted by our C# PDF to text converting library as, PDF to HTML converter assembly, PDF to Word
extract text from pdf open source; copy text from pdf reader
C# PDF insert text Library: insert text into PDF content in C#.net
Powerful .NET PDF edit control allows modify existing scanned PDF text. Ability to change text font, color, size and location and output a new PDF document.
copy formatted text from pdf; c# get text from pdf
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 274 of 349 
upper-left corner of the Excel window client area.  The 
dxWn
and 
dyWn
fields contain 
the window size, also in units of 1/20
th
of a point. 
Record Data 
Offset  Name 
Size  Contents 
xWn 
Horizontal position of the window. 
yWn 
Vertical position of the window. 
dxWn 
Width of the window. 
10 
dyWn 
Height of the window. 
12 
grbit 
Option flags. 
14 
itabCur 
Index of the selected workbook tab (0-based). 
16 
itabFirst 
Index of the first displayed workbook tab (0-based). 
18 
ctabSel 
Number of workbook tabs that are selected. 
20 
wTabRatio 
Ratio of the width of the workbook tabs to the width of 
the horizontal scroll bar; to obtain the ratio, convert to 
decimal and then divide by 1000. 
The 
grbit
field contains the following option flags: 
Offset  Bits  Mask  Name 
Contents 
01h 
fHidden 
=1 if the window is hidden 
02h 
fIconic 
=1 if the window is currently displayed as 
an icon 
04h 
(Reserved) 
08h 
fDspHScroll 
=1 if the horizontal scroll bar is displayed 
10h 
fDspVScroll 
=1 if the vertical scroll bar is displayed 
20h 
fBotAdornment 
=1 if the workbook tabs are displayed 
40h 
fNoAFDateGroup 
=1 if the AutoFilter should not group 
dates (Excel 11 (2003) behavior) 
(New for Office Excel 2007) 
80h 
(Reserved) 
7–0  FFh 
(Reserved) 
WINDOW2: Sheet Window Information (23Eh) 
The 
WINDOW2
record contains window attributes for a sheet in a workbook. 
Record Data 
BIFF8 
Offset  Name 
Size  Contents 
grbit 
Option flags 
rwTop 
Top row visible in the window 
colLeft 
Leftmost column visible in the window 
10 
icvHdr 
Index to color value for row/column headings and 
gridlines 
C# PDF - Read Barcode on PDF in C#.NET
Page: Replace PDF Pages. Page: Move Page Position. Page: Extract, Copy and Paste PDF Pages. Page: Rotate a PDF Page. PDF Read. Text: Extract Text from PDF. Text
copy paste pdf text; extract all text from pdf
VB.NET PDF Convert to Text SDK: Convert PDF to txt files in vb.net
Text extraction from scanned PDF image with OCR component in VB.NET. Integrate following RasterEdge text to PDF converter SDK dlls into RasterEdge.XDoc.PDF.dll.
.net extract text from pdf; c# extract text from pdf
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 275 of 349 
14 
wScaleSLV 
Zoom magnification in page break preview 
16 
wScaleNormal 
Zoom magnification in normal view 
18 
(Reserved) 
The 
grbit
field contains the option flags shown in the following table. 
Offset  Bits  Mask  Name 
Contents 
01h 
fDspFmla 
=1 if the window should display formulas 
=0 if the window should display value 
02h 
fDspGrid 
=1 if the window should display gridlines 
04h 
fDspRwCol 
=1 if the window should display row and 
column headings 
08h 
fFrozen 
=1 if the panes in the window should be 
frozen 
10h 
fDspZeros 
=1 if the window should display 0 (zero) 
values 
=0 if the window should suppress display 
of 0 (zero) values 
20h 
fDefaultHdr 
=1 (see the following explanation) 
=0 use 
rgbHdr
color 
40h 
fRightToLeft 
=1 if text is right-to-left 
80h 
fDspGuts 
=1 if outline symbols are displayed 
01h 
fFrozenNoSplit 
=1 if the panes in the window are frozen 
but there is no split 
02h 
fSelected 
=1 if the sheet tab is selected 
04h 
fPaged 
=1 if the sheet is currently being displayed 
in the workbook window 
08h 
fSLV 
=1 if the sheet was saved while in page 
break preview 
7–4  F0h 
(Reserved) 
fDefaultHdr
is 1 if the window‘s row and column headings and gridlines should be 
drawn in the window‘s default foreground color.  If this field is 0, the color index in 
the 
icvHdr
field is used instead. 
Record Data 
BIFF7 and earlier 
Offset  Name 
Size  Contents 
grbit 
Option flags 
rwTop 
Top row visible in the window 
colLeft 
Leftmost column visible in the window 
10 
rgbHdr 
Row/column heading and gridline color 
The 
grbit
field contains the following option flags: 
Offset  Bits  Mask  Name 
Contents 
01h 
fDspFmla 
=1 if the window should display formulas 
=0 if the window should display value 
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 276 of 349 
02h 
fDspGrid 
=1 if the window should display gridlines 
04h 
fDspRwCol 
=1 if the window should display row and 
column headings 
08h 
fFrozen 
=1 if the panes in the window should be 
frozen 
10h 
fDspZeros 
=1 if the window should display 0 (zero) 
values 
=0 if the window should suppress display of 
0 (zero) values 
20h 
fDefaultHdr 
=1 (see the following explanation) 
=0 use 
rgbHdr
color 
40h 
fArabic 
=1 for the Arabic version of Excel 
80h 
fDspGuts 
=1 if outline symbols are displayed 
01h 
fFrozenNoSplit 
=1 if the panes in the window are frozen but 
there is no split 
02h 
fSelected 
=1 if the sheet tab is selected 
04h 
fPaged 
=1 if the sheet is currently being displayed in 
the workbook window 
7–3  F8h 
(Reserved) 
fDefaultHdr
is 1 if the window‘s row and column headings and gridlines should be 
drawn in the window‘s default foreground color.  If this field is 0, the RGB color in 
the 
rgbHdr
field is used instead. 
WINDOWPROTECT: Windows Are Protected (19h) 
The 
WINDOWPROTECT
record stores an option from the Protect Workbook dialog 
box. 
Record Data 
Offset  Name 
Size  Contents 
fLockWn 
=1 if the workbook windows are protected 
WOPT: Web Options (80Bh) 
Introduced in Excel 9 (2000) this is a 
FRT
record.  It stores the information from the 
Web Options dialog. 
Record Data 
Offset  Name 
Size  Contents 
rt 
Record type; this matches the BIFF 
rt
in the first two bytes of the record; 
=080Bh 
grbitFrt 
FRT
flags; must be zero 
grbit 
Options; see following table 
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 277 of 349 
10 
bScreenSize 
Target monitor screen size 
0= 544x376 
1= 640x480 
2= 720x512 
3= 800x600 
4= 1024x768 
5= 1152x882 
6= 1152x900 
7= 1280x1024 
8= 1600x1200 
9= 1800x1440 
10= 1920x1200 
11 
dwPixelsPerInch 
Target monitor pixels per inch 
15 
uiCodePage 
Code page index value 
19 
cchLocationOfComponents 
length of the string in 
rgbLocationOfComponents
21 
rgbLocationOfComponents 
var  Unicode string; the path to the location 
for download of the Microsoft Office 
Web Components 
var 
rgbFuture 
var  Space reserved for bytes from future 
versions of Excel 
The 
grbit
field contains following option flags. 
Bits 
Mask 
Name 
Contents 
0001h 
fRelyOnCSS 
1= Do not write HTML information that 
is already written in CSS 
0002h 
fOrganizeInFolder 
0= Write HTML files all to the same 
location 
1= Create a folder for the supporting 
files for files saved as HTML 
0004h 
fUseLongFileNames 
1= Use Long filenames when writing 
HTML files 
0008h 
fDownloadComponents 
1= Download Microsoft Office Web 
Components 
0010h 
fRelyOnVML 
0= Write out image files for objects 
0020h 
fAllowPNG 
1= Use PNG format for images 
15-6 
FFC0h 
(Reserved) 
Reserved; must be zero 
WRITEACCESS: Write Access User Name (5Ch) 
This record contains the user name, which is the name entered when installing Excel. 
Record Data 
BIFF8 
Offset  Name 
Size  Contents 
stName 
112 
User name as an unformatted unicode string
 The name 
is always padded with spaces so the size of the 
stName
field is exactly 112 bytes. 
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 278 of 349 
Record Data 
BIFF7 and earlier 
Offset  Name 
Size  Contents 
cch 
Length of the user name 
stName 
31 
User name, padded with spaces (20h) so the size of the 
stName
field is exactly 31 bytes 
WRITEPROT: Workbook Is Write-Protected (86h) 
This record is 4 bytes long, and it has no record data field.  If the 
WRITEPROT
record 
is present in the 
Book
stream, it signifies the worksheet has a Write Reservation 
password (File menu, Save As command, Options dialog box).  For information 
about the password (
wResPass
), see ―FILESHARING
‖. 
WSBOOL: Additional Workspace Information (81h) 
This record stores information about workspace settings. 
Record Data 
Offset  Name 
Size  Contents 
grbit 
Option flags 
The 
grbit
field contains the following option flags: 
Offset  Bits  Mask  Name 
Contents 
01h 
fShowAutoBreaks 
=1 if automatic page breaks are visible 
3–1  E0h 
(unused) 
10h 
fDialog 
=1 if the sheet is a dialog sheet 
20h 
fApplyStyles 
=0 if automatic styles are applied to an 
outline 
40h 
fRwSumsBelow 
=1 if summary rows appear below detail 
in an outline 
80h 
fColSumsRight 
=1 if summary columns appear to the 
right of detail in an outline 
01h 
fFitToPage 
=1 if the Fit option is on (Page Setup 
dialog box, Page tab) 
02h 
(Reserved) 
3–2  06h 
fDspGuts 
=1 if outline symbols are displayed 
5–4   
(Reserved) 
fAee 
=1 if the Alternate Expression 
Evaluation option is on (Options dialog 
box, Calculation tab) 
fAfe 
=1 if the Alternate Formula Entry 
option is on (Options dialog box, 
Calculation tab) 
Microsoft Office Excel 97-2007 Binary File Format (.xls) Specification 
Page 279 of 349 
XCT: CRN Record Count (59h) 
For BIFF8, an 
XCT
record precedes a 
CRN
record.  The 
XCT
and 
CRN
records are 
grouped with their associated 
SUPBOOK
record. 
For BIFF7 and earlier, the 
XCT
record stores the number of 
CRN
records (type 5Ah) in 
the file.  The 
CRN
records immediately follow the 
XCT
record. 
Record Data 
BIFF8 
Offset  Name 
Size  Contents 
ccrn 
Count of 
CRN
records that follow 
itab 
Index (0-based) to sheet tab associated with the 
CRN
record(s) 
Record Data 
BIFF7 and earlier 
Offset  Name 
Size  Contents 
ccrn 
Count of 
CRN
records that follow 
XF: Extended Format (E0h) 
The 
XF
record stores formatting properties.  There are two different 
XF
records, one 
for cell records and another for style records.  The 
fStyle
bit is true if the 
XF
is a 
style 
XF
 The 
ixfe
of a cell record (
BLANK
LABEL
NUMBER
RK
, and so on) points 
to a cell 
XF
record, and the 
ixfe
of a 
STYLE
record points to a style 
XF
record.  
Note: in previous BIFF versions, the record number for the 
XF
record was 43h. 
Prior to BIFF5, all number format information was included in 
FORMAT
records in the 
BIFF file.  Beginning with BIFF5, many of the built-in number formats were moved to 
an internal table and are no longer saved with the file as 
FORMAT
records.  Use the 
ifmt
to associate the built-in number formats with an 
XF
record.  However, the 
internal number formats are no longer visible in the BIFF file. 
The following table lists all the number formats that are now maintained internally.  
Note: 17h through 24h are reserved for international versions and are 
undocumented at this time. 
Index to internal 
format (ifmt) 
Format string 
00h 
General 
01h 
02h 
0.00 
03h 
#,##0 
04h 
#,##0.00 
05h 
($#,##0_);($#,##0) 
06h 
($#,##0_);[Red]($#,##0) 
07h 
($#,##0.00_);($#,##0.00) 
08h 
($#,##0.00_);[Red]($#,##0.00) 
09h 
0% 
0ah 
0.00% 
0bh 
0.00E+00 
0ch 
# ?/? 
0dh 
# ??/?? 
Documents you may be interested
Documents you may be interested