c# winforms pdf viewer control : Extract pages from pdf reader software control dll winforms web page asp.net web forms file_formats_in-house_preservation2-part1143

File Format Guidelines for Management and Long-Term Retention of Electronic records 
Page 
13
Most spreadsheet editing software is capable of outputting to OpenDocument Spreadsheet format, as in this example 
from Microsoft
®
Office 2010. 
2.4.2 Comma-separated file (.csv) 
See also 2.2.2 Comma-separated file (.csv) US-ASCII or UTF-8 encoding 
Comma-separated files are plain text files that store tabular data. They are capable of storing spreadsheets without styling or formatting 
(such as borders, fonts, column widths, etc.) Like files with the .txt extension, they are usually encoded in either US-ASCII or Unicode UTF-8. 
Extract pages from pdf reader - copy, paste, cut PDF pages in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Easy to Use C# Code to Extract PDF Pages, Copy Pages from One PDF File and Paste into Others
extract pdf pages acrobat; copy pdf pages to another pdf
Extract pages from pdf reader - VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Detailed VB.NET Guide for Extracting Pages from Microsoft PDF Doc
extract one page from pdf file; add and delete pages from pdf
File Format Guidelines for Management and Long-Term Retention of Electronic records 
Page 
14
They are distinguished by the fact that they contain values separated by commas and line breaks such that spreadsheet and database 
applications (like Microsoft
®
Excel
®
and Access
®
) can easily open and parse the data.  
Comma-separated files cannot preserve styling, formulas, graphs, charts, or the relationships between multiple 
sheets. This can be important information that has been identified as having enduring value, in which case the 
OpenDocument Spreadsheet format should be used.  
TIP: If you save from Microsoft
®
Excel
®
as a CSV file, choose ´CSV (Comma delimited) (*.csv)µ, instead of ´CSV 
(Macintosh) (*.csv)µ or ´CSV (MS-DOS) (*.csv)µ: 
2.4.3 Tab-delimited file (.txt) 
See also 2.2.3 Tab-delimited file (.txt) US-ASCII or UTF-8 encoding 
C# PDF Text Extract Library: extract text content from PDF file in
inputFilePath); PDFTextMgr textMgr = PDFTextHandler.ExportPDFTextManager(doc); // Extract text content C# example code for text extraction from all PDF pages.
delete pages out of a pdf; acrobat extract pages from pdf
VB.NET PDF Text Extract Library: extract text content from PDF
PDF ›› VB.NET PDF: Extract PDF Text. VB.NET PDF - Extract Text from PDF Using VB. How to Extract Text from PDF with VB.NET Sample Codes in .NET Application.
extract pages from pdf on ipad; copying a pdf page into word
File Format Guidelines for Management and Long-Term Retention of Electronic records 
Page 
15
Tab-delimited files are similar to comma separated files, the difference being that the values in one are separated by commas and in the 
other by tabs. Tab-delimited files carry the standard .txt extension. Like comma-separated files, tab-delimited files are not capable of 
storing spreadsheets formula, styling, or formatting (such as borders, fonts, column widths, etc.).  
As with the comma-separated files described above, tab-delimited files should be encoded in either US-ASCII or Unicode UTF-8. 
Tab-delimited files cannot preserve styling, formulas, graphs, charts, or the relationships between multiple sheets. This 
can be important information that has been identified as having enduring value, in which case the OpenDocument 
Spreadsheet format should be used. 
Like the ODS and CSV files described above, tab delimited files can be saved from most spreadsheet editing tools, 
including Microsoft
®
Office 2010: 
2.4.4 PDF/A-1a (.pdf) (ISO 19005-1 compliant PDF/A) 
PDF/A may be an appropriate format for preserving spreadsheets, where styling, graphs, and charts are important elements to preserve, 
but formulas are not. PDF/A preserves the rendering—or ´look and feelµ—of the original spreadsheet, but hidden types of information like 
formulas are lost. 
PDF-Archival (more commonly known as PDF/A) is an international standard developed by the Association for Information and Image 
Management International (AIIM International) for the use of PDF files for archiving and preservation of electronic documents.  The State 
Archives of North Carolina recommends PDF/A, Version 1, full compliance (PDF/A-1a) as a preservation format for word processing 
documents and other files. See also 2.1.1 PDF/A-1a (.pdf) (ISO 19005-1 compliant PDF/A)
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
Image: Extract Image from PDF. |. Home ›› XDoc.PDF ›› C# PDF: Extract PDF Image. How to C#: Extract Image from PDF Document.
delete pages from pdf file online; deleting pages from pdf in reader
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
Image: Extract Image from PDF. |. Home ›› XDoc.PDF ›› VB.NET PDF: Extract PDF Image. VB.NET PDF - Extract Image from PDF Document in VB.NET.
extract one page from pdf acrobat; convert selected pages of pdf to word
File Format Guidelines for Management and Long-Term Retention of Electronic records 
Page 
16
PDF/A files cannot preserve formulas, but can preserve styling, graphs, charts, and multiple sheets. Such elements may 
not render precisely the same as in the original, so it is important to check the PDF file to ensure it saved as desired. 
2.4.5 Special Note on Google Docs™ 
Google Docs™ is a cloud-based document editing service offered by Google™. Spreadsheets may be created on Google Docs™ and 
exported in various formats, including Microsoft
®
Excel
®
97-2003 (.xls), OpenDocument Spreadsheet (.ods), Comma-separated file (.csv), 
HTML (.html), and others. The recommendations described in this document apply to all spreadsheets, regardless of whether they were 
created using Google Docs™. The State Archives of North Carolina recommends that spreadsheets with styling, formulas, graphs, charts, or 
relationships between multiple sheets be saved in the OpenDocument Spreadsheet format. Those without styling, formulas, graphs, charts, or 
multiple sheets may be saved as comma-separated or tab-delimited files. See 2.4.1 OpenDocument Spreadsheets (.ods), 2.4.2 Comma-
separated file (.csv), and 2.4.3 Tab-delimited file (.csv)
Currently, state agencies are required to keep public records on state-owned devices and servers. Session Laws of North 
Carolina, SL 2011-39 §11(c) mandates that ´State agencies developing and implementing information technology 
projects/applications shall use the State infrastructure to host their projects.µ Agencies may obtain an exception to this 
requirement. However, in the absence of such an exception, state agencies should ensure that a copy of any records 
created in the Google Docs™ cloud have also been exported and retained on state-owned devices. Please note that 
´state agenciesµ does not include local governments. 
C# PDF Page Insert Library: insert pages into PDF file in C#.net
doc2.Save(outPutFilePath); Add and Insert Multiple PDF Pages to PDF Document Using C#. Add and Insert Blank Pages to PDF File in C#.NET.
deleting pages from pdf file; copy pages from pdf to new pdf
VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
doc.Save(outPutFilePath). How to VB.NET: Delete Consecutive Pages from PDF. doc.Save(outPutFilePath). How to VB.NET: Delete Specified Pages from PDF.
convert few pages of pdf to word; cutting pdf pages
File Format Guidelines for Management and Long-Term Retention of Electronic records 
Page 
17
Documents created in Google Docs™ should be exported for long-term preservation as OpenDocument Format (.ods). 
Alternatively, documents can be exported and retained as Comma Separated Values (.csv) if there is no need to retain 
formulas, styling, graphs, charts, or the relationships between multiple sheets. 
VB.NET PDF Page Insert Library: insert pages into PDF file in vb.
Page: Insert PDF Pages. |. Home ›› XDoc.PDF ›› VB.NET PDF: Insert PDF Page. Add and Insert Multiple PDF Pages to PDF Document Using VB.
copy one page of pdf to another pdf; add and remove pages from pdf file online
C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
doc.Save(outPutFilePath); Demo Code: How to Delete Consecutive Pages from PDF in C#.NET. Demo Code: How to Delete Specified Pages from PDF in C#.NET.
extract page from pdf; delete page from pdf document
File Format Guidelines for Management and Long-Term Retention of Electronic records 
Page 
18
2.5 Audio 
Digitized audio ´samplesµ sound waves at intervals, rather than recording the entire continuous sound wave as analog audio does. The digitized 
samples are then encoded into binary signal and packaged into a file format that tells software how to read the encoded binary data. The digitized 
audio file format also provides technical and descriptive information about the file (called ´metadataµ), such as the sampling rate, the quality of each 
sample (measured by bit depth), the creator of the original audio, the playback time, the date of creation, etc.  
Sampling and 4-bit quantization of an analog 
signal (red) using Pulse-code modulation. The red 
line is the analog sound wave, and the gray area is 
the digitized approximation.
Image courtesy of Wikipedia, http://en.wikipedia.org/wiki/File:Pcm.svg 
(accessed 4/27/2012) 
File Format Guidelines for Management and Long-Term Retention of Electronic records 
Page 
19
2.5.1 Broadcast WAVE Format LPCM (.wav) 
The Broadcast WAVE format (BWF) with LPCM encoding is a subtype of the WAVE format (Waveform Audio File Format). In 1997, the BWF 
format was introduced by the European Broadcast Union (EBU) in 1997 and has since gained widespread use as the preferred archival 
format for audio files.  Version 0 appeared in 1997, Version 1in 2001, and Version 2 in May 2011. Versions 0 and 1 are very similar, and 
Version 2 includes new loudness metadata. 
The standard WAVE specification allows for an unlimited number of data ´chunksµ to sit in the head of a WAVE file. A BWF file simply 
includes additional metadata in the head of the file, including the EBU’s ´Broadcast Audio Extensionµ chunk, commonly known as the ´bextµ 
chunk. The bext chunk allows for important archival metadata to be embedded in the file, including the title of the recording, the recording’s 
creator, whether the recording is part of a compilation, and much more. This information tells listeners what they are listening to, identifies 
essential preservation information, and allows multi-part recordings (such as multiple tracks) to be played back properly. 
The data within a WAVE file is usually encoded with Linear Pulse Code Modulated Audio (LPCM), although it can also contain other variations 
of Pulse Code Modulated Audio (such as DPCM or ADPCM) and MPEG-encoded audio. The recommended preservation standard is to use 
LPCM. Alternative encodings are rarely used. 
Please contact the State Archives for more information about tools to convert simple WAVE files to BWF. 
For more technical information about BWF preservation, please see the Federal Agencies Digitization Guidelines 
Initiative Audio-Visual Working Group recommendations.
8
2.5.2 WAVE Format LPCM (.wav) 
The Waveform Audio File Format (WAVE) is a standard master format for digital audio. Although it can contain compressed audio, WAVE 
files nearly always contain audio in uncompressed linear pulse code modulation format (LPCM).  
WAVE files are widely used throughout the commercial and preservation sectors with a standardized set of additional metadata fields 
contained within the ´bextµ header chunk (see 2.5.1 Broadcast WAFE Format LPCM (.wav)). WAVE files that do not contain this additional 
8
Federal Agencies Digitization Guidelines Initiative (FADGI), Guidelines: Embedded Metadata in Broadcast WAVE Files, 
http://www.digitizationguidelines.gov/guidelines/digitize-embedding.html (accessed 9/7/2012). 
File Format Guidelines for Management and Long-Term Retention of Electronic records 
Page 
20
metadata chunk will be missing important information that will aid in their long-term preservation, and may not easily be identifiable to 
listeners: 
2.6 Digital Video 
Digital videos combine multiple elements, including visual data, audio data, subtitles or pointers to external subtitles, and descriptive information 
(metadata) essential for playback. Digital video files are complex, and have many layers of encoded data. In order to be able to access a digital 
video file, software must be able to recognize not only the umbrella file format, but also the encoders used to package the video and audio inside 
the file format. An MXF file, for example, may contain JPEG2000-encoded image files representing every frame in the video, wrapped into the 
Motion JPEG2000 format, combined with PCM audio. MXF provides the final container that links the Motion JPEG with the PCM audio, but it could 
also be used to link other forms of audio and video. Although the file extension (.mxf, .mov, or .mp4, for example) reflects the final container, it does 
not necessarily identify the component parts of the digital video.  
2.6.1 AVI, full frame (uncompressed), WAVE PCM audio (.avi) 
AVI, or Audio Video Interleaved, is a multimedia container file format developed by Microsoft
®
. Conforming to RIFF (Resource Interchange 
File Formats) AVI is a fully documented, proprietary format that has been widely adopted for video production and filmmaking. The National 
Archives and Records Administration (NARA) uses AVI as a preservation master format for reformatted video materials, and NARA supports 
the open-source AVI MetaEdit tool for the capture and normalization of AVI file embedded metadata.
9
AVI files may contain full frame uncompressed video or compressed video, including MPEG, JPEG 2000, DV Digital Video, DivX, and other 
compression codecs. Audio in AVI files is WAVE PCM. 
2.6.2 Special Note on SD (Standard Definition) and HD (High Definition) videos 
9
AVI-MetaEdit can be downloaded from NARA’s Github site: https://github.com/usnationalarchives (accessed 5/17/2012). 
File Format Guidelines for Management and Long-Term Retention of Electronic records 
Page 
21
Several factors independent of file format help determine the quality and playability of digital video files, including the display resolution, 
scanning type (progressive scanning or interlaced scanning), and frame rate.  The State Archives will accept digital video files that adhere to 
established NTSC standard broadcast resolutions for either SD (Standard Definition) or HD (High Definition) video:
10
Standard Definition NTSC:  
720 x 480 29.97fps (480i, 480p)  
Aspect ratios: 4:3 or 16:9  
High Definition NTSC:  
1280 x 720 (720p60, 720p30, 720p24)  
1920 x 1080 (1080i60, 1080p30, 1080p24)  
Aspect ratio: 16:9   
2.7 Raster Images 
Raster images, also known as ´bit-mappedµ images or ´bitmaps,µ are still images created with a grid of pixels, or very small squares of color. The 
following is a useful introduction to raster images from the Library and Archives Canada (LAC):
11
A
RASTER IMAGE IS COMPRISED OF BITS OF INFORMATION REPRESENTING UNIQUELY VALUED PIXELS IN THE FORM OF A GRID
.
I
MAGE RESOLUTION IS 
MEASURED BY PIXELS PER INCH 
(PPI);
HOWEVER THE PRINTING ABBREVIATION 
DPI
(
DOTS PER INCH
)
IS ALSO COMMONLY USED TO DESCRIBE IMAGE 
RESOLUTION
.
A
LL DIGITAL PHOTOGRAPHS
,
REGARDLESS OF FILE TYPE
,
ARE RASTER IMAGES
T
HE MORE PIXELS THERE ARE IN RELATION TO THE AREA
,
THE HIGHER THE RESOLUTION
.
T
HE HIGHER THE RESOLUTION
,
THE SHARPER THE IMAGE IS AND 
THE LARGER THE FILE
.
[…] 
D
IGITAL IMAGE RESOLUTION IS GREATLY MISUNDERSTOOD
.
D
IGITAL IMAGES THEMSELVES HAVE NO SIZE OTHER THAN THE NUMBER  OF PIXELS THEY 
CONTAIN
.
T
HE IMAGE ONLY HAS REAL DIMENSIONS 
(
INCHES OR CM
)
WHEN IT IS IN AN ANALOGUE FORM BEFORE DIGITIZATION
,
OR AFTER IT HAS 
BEEN PRINTED
10
See similar recommendations from Library and Archives Canada (LAC), Local Digital Format Registry (LDFR): File Format Guidelines for Preservation and Long-term 
Storage, Version 1.0 (2010), 21-22. 
11
Library and Archives Canada (LAC), Local Digital Format Registry (LDFR): File Format Guidelines for Preservation and Long-term Storage, Version 1.0 (2010), 24-25. 
File Format Guidelines for Management and Long-Term Retention of Electronic records 
Page 
22
T
HERE ARE TWO BASIC MEASURES FOR DIGITAL IMAGERY CHARACTERISTICS
S
PATIAL RESOLUTION 
CAPTURING DETAIL 
(PPI)
AND
T
ONAL RESOLUTION 
COLOUR
,
BIT DEPTH AND DYNAMIC RANGE
G
ENERALLY
,
THE HIGHER THE 
PPI
AND THE LARGER THE BIT DEPTH
,
THE MORE ACCURATE THE IMAGE WILL BE TO ITS ORIGINAL COLOUR
.
B
LACK AND 
WHITE IMAGES ARE NOT CHARACTERIZED BY COLOUR RESOLUTION
.
T
HEY ARE COMPRISED OF BRIGHTNESS VALUES THAT REPRESENT 
256
DIFFERENT 
SHADES OF GRAY
C
OLOUR 
D
EPTH 
N
UMBER OF 
C
OLOURS 
V
ISIBLE 
1
BIT 
(
MONOCHROME
)
2
4
BIT 
16
8
BIT 
(
INDEXED COLOUR
)
256
24
BIT 
(
TRUE COLOUR
)
16,777,216
C
OMMON 
"
COLOUR RESOLUTIONS
"
ARE 
1
BIT PER PIXEL
,
FOR SOLID BLACK
-
AND
-
WHITE NONREALISTIC IMAGES
;
8
BITS PER PIXEL FOR GRAYSCALE 
IMAGES
,
NONREALISTIC  COLOUR  IMAGES
,
AND  COARSE  REALISTIC  IMAGES
;
AND 
24
BITS  PER  PIXEL
,
FOR 
"
PHOTOGRAPHIC  QUALITY
"
REALISTIC 
IMAGES
.
48
BITS PER PIXEL IS IN INCREASING USE FOR ULTRAHIGH QUALITY IMAGES
G
RAYSCALE IMAGES HAVE A MAXIMUM COLOUR DEPTH OF 
8
BITS
.
T
HIS IS BECAUSE WHEN DEFINING SHADES OF GRAY IN TERMS OF 
RGB,
EACH OF 
THE 
3
RED
,
GREEN AND BLUE COMPONENTS MUST BE EQUAL 
(
I
.
E
.
R=192
G=192
B=192,
OR 
R=128
G=128
B=128).
S
INCE THESE THREE 
COMPONENTS MUST BE EQUAL
,
THERE ARE ONLY 
256
POSSIBLE COMBINATIONS
,
WHICH EQUALS 
8
BITS OF COLOUR
.
I
NDEXED COLOUR IMAGES  ARE LIMITED TO A MAXIMUM OF 
256
COLOURS 
(8-
BIT
),
WHICH CAN BE ANY 
256
COLOURS FROM THE SET OF 
16.7
MILLION 
24
BIT COLOURS
.
E
ACH IMAGE FILE CONTAINS 
[
ITS
]
OWN PALETTE WHICH PROVIDES A REFERENCE INDEX NUMBER USED BY THE COMPUTER 
TO IDENTIFY EACH COLOUR
.
Documents you may be interested
Documents you may be interested