Protein Data Bank Contents Guide: 
Atomic Coordinate Entry Format Description 
Version 3.20 
Document Published by the wwPDB  
This format complies with the PDB Exchange Dictionary (PDBx) 
http://mmcif.pdb.org/dictionaries/mmcif_pdbx.dic/Index/index.html. 
©2008 wwPDB 
Pdf data extraction - extract form data from PDF in C#.net, ASP.NET, MVC, Ajax, WPF
Help to Read and Extract Field Data from PDF with a Convenient C# Solution
extract pdf data into excel; edit pdf form in reader
Pdf data extraction - VB.NET PDF Form Data Read library: extract form data from PDF in vb.net, ASP.NET, MVC, Ajax, WPF
Convenient VB.NET Solution to Read and Extract Field Data from PDF
how to save a pdf form in reader; vb extract data from pdf
PDB File Format v. 3.2 
Page i 
Table of Contents 
1. Introduction .................................................................................................................................. 1
Basic Notions of the Format Description ...................................................................................... 2
Record Format ............................................................................................................................. 4
Types of Records ......................................................................................................................... 5
PDB Format Change Policy .......................................................................................................... 9
Order of Records ........................................................................................................................ 10
Sections of an Entry ................................................................................................................... 12
Field Formats and Data Types ................................................................................................... 14
2. Title Section ............................................................................................................................... 16
HEADER .................................................................................................................................... 16
OBSLTE ..................................................................................................................................... 19
TITLE.......................................................................................................................................... 21
SPLIT (added) ............................................................................................................................ 22
CAVEAT ..................................................................................................................................... 23
COMPND (updated) ................................................................................................................... 24
SOURCE (updated) .................................................................................................................... 26
KEYWDS .................................................................................................................................... 31
EXPDTA (updated) ..................................................................................................................... 33
NUMMDL (added) ...................................................................................................................... 35
MDLTYP (added) ....................................................................................................................... 36
AUTHOR .................................................................................................................................... 38
REVDAT (updated) .................................................................................................................... 40
SPRSDE ..................................................................................................................................... 43
JRNL (updated) .......................................................................................................................... 45
REMARK .................................................................................................................................... 55
REMARKs 0-4 ........................................................................................................................ 55
REMARK 0 (added), Re-refinement notice ......................................................................... 55
REMARK 1 (updated), Related publications ....................................................................... 57
REMARK 2 (updated), Resolution ....................................................................................... 64
REMARK 3 (updated), Final refinement information ........................................................... 66
Refinement using X-PLOR .................................................................................................. 67
Refinement using CNS ........................................................................................................ 69
Refinement using CNX ........................................................................................................ 71
Refinement using REFMAC ................................................................................................ 74
Refinement using NUCLSQ ................................................................................................ 83
Refinement using PROLSQ, CCP4, PROFFT, GPRLSA, and related programs ................ 85
Refinement using SHELXL .................................................................................................. 87
Refinement using TNT/BUSTER ......................................................................................... 89
Refinement using PHENIX .................................................................................................. 92
Refinement using Electron Microscopy ............................................................................. 100
Example for Solution Scattering ........................................................................................ 102
Non-diffraction studies ....................................................................................................... 102
REMARK 4 (updated), Format .......................................................................................... 103
REMARKs 5 - 99 .................................................................................................................. 104
VB.NET PDF Text Extract Library: extract text content from PDF
Application. Advanced Visual Studio .NET PDF text extraction control, built in .NET framework 2.0 and compatible with Windows system.
extracting data from pdf into excel; extract table data from pdf
C# PDF Text Extract Library: extract text content from PDF file in
Image text extraction control provides text extraction from PDF images and image files. Best C#.NET PDF text extraction library and component for free download.
how to extract data from pdf to excel; how to save a filled out pdf form in reader
PDB File Format v. 3.2 
Page ii 
REMARK 100 (updated), Deposition or Processing Site ...................................................... 104
REMARKs 200-265, Experimental Details ............................................................................ 105
REMARK 200 (updated), X-ray Diffraction Experimental Details ...................................... 105
REMARK 205, Fiber Diffraction, Fiber Sample Experiment Details .................................. 108
REMARKs 210 and 215/217, NMR Experiment Details .................................................... 108
REMARK 230, Neutron Diffraction Experiment Details ..................................................... 110
REMARK 240 (updated), Electron Crystallography Experiment Details ............................ 113
REMARK 245 (updated), Electron Microscopy Experiment Details .................................. 115
REMARK 247, Electron Microscopy details ...................................................................... 117
REMARK 250, Other Type of Experiment Details ............................................................. 117
REMARK 265, Solution Scattering Experiment Details ..................................................... 118
REMARKs 280-290, Crystallographic Details ....................................................................... 120
REMARK 280, Crystal ....................................................................................................... 120
REMARK 285, CRYST1 .................................................................................................... 120
REMARK 290, Crystallographic Symmetry ....................................................................... 121
REMARK 300 (updated), Biomolecule .............................................................................. 122
REMARK 350 (updated), Generating the Biomolecule ...................................................... 124
Example 
When software predicts multiple quaternary assemblies ................................. 126
REMARK 375 (updated), Special Position ........................................................................ 128
REMARK 400, Compound ................................................................................................ 128
REMARK 450, Source ....................................................................................................... 129
REMARK 465 (updated), Missing residues ....................................................................... 129
REMARK 470 (updated), Missing Atom(s) ........................................................................ 130
REMARK 475 (added), Residues modeled with zero occupancy ...................................... 131
REMARK 480 (added), Polymer atoms modeled with zero occupancy ............................. 132
REMARK 500 (updated), Geometry and Stereochemistry ................................................ 133
REMARK 525 (updated), Distant Solvent Atoms .............................................................. 140
REMARK 600, Heterogen ................................................................................................. 140
REMARK 610, Non-polymer residues with missing atoms ................................................ 142
REMARK 615, Non-polymer residues containing atoms with zero occupancy .................. 142
REMARK 620 (added), Metal coordination ....................................................................... 143
REMARK 630 (added), Inhibitor Description ..................................................................... 145
REMARK 650, Helix .......................................................................................................... 146
REMARK 700, Sheet ......................................................................................................... 147
REMARK 800 (updated), Important Sites .......................................................................... 149
REMARK 999, Sequence .................................................................................................. 151
3. Primary Structure Section ........................................................................................................ 152
DBREF (standard format) ......................................................................................................... 152
DBREF1 / DBREF2 (added) ..................................................................................................... 155
SEQADV .................................................................................................................................. 157
SEQRES (updated) .................................................................................................................. 159
MODRES (updated) ................................................................................................................. 161
4. Heterogen Section (updated) ................................................................................................... 163
HET .......................................................................................................................................... 163
HETNAM .................................................................................................................................. 165
HETSYN ................................................................................................................................... 167
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document in VB.NET Project. DLLs for PDF Image Extraction in VB.NET.
collect data from pdf forms; make pdf form editable in reader
VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.
VB.NET PDF - PDF File Pages Extraction Guide. Detailed VB.NET Guide for Extracting Pages from Microsoft PDF Doc. Free PDF document
change font size pdf form reader; pdf data extraction
PDB File Format v. 3.2 
Page iii 
FORMUL .................................................................................................................................. 168
5. Secondary Structure Section ................................................................................................... 170
HELIX ....................................................................................................................................... 170
SHEET ..................................................................................................................................... 172
6. Connectivity Annotation Section .............................................................................................. 175
SSBOND (updated) .................................................................................................................. 175
LINK (updated) ......................................................................................................................... 177
CISPEP .................................................................................................................................... 179
7. Miscellaneous Features Section .............................................................................................. 181
SITE ......................................................................................................................................... 181
8. Crystallographic and Coordinate Transformation Section ........................................................ 184
CRYST1 ................................................................................................................................... 184
ORIGXn .................................................................................................................................... 186
SCALEn.................................................................................................................................... 187
MTRIXn .................................................................................................................................... 189
9. Coordinate Section .................................................................................................................. 191
MODEL..................................................................................................................................... 191
ATOM ....................................................................................................................................... 194
ANISOU .................................................................................................................................... 197
TER .......................................................................................................................................... 200
HETATM ................................................................................................................................... 202
ENDMDL .................................................................................................................................. 204
10. Connectivity Section .............................................................................................................. 205
CONECT .................................................................................................................................. 205
11. Bookkeeping Section ............................................................................................................. 207
MASTER .................................................................................................................................. 207
END .......................................................................................................................................... 209
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
Document. Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document. C# Project: DLLs for PDF Image Extraction. In
extract data from pdf file to excel; filling out pdf forms with reader
VB.NET PDF Library SDK to view, edit, convert, process PDF file
PDF Text Extraction. Mature and robust APIs are provided for programmers to integrate and perform PDF text extraction feature in .NET windows and web project.
extract data from pdf into excel; how to flatten a pdf form in reader
PDB File Format v. 3.2 
Page 1 
1. Introduction 
The Protein Data Bank (PDB) is an archive of experimentally determined three-dimensional 
structures of biological macromolecules that serves a global community of researchers, educators, 
and students. The data contained in the archive include atomic coordinates, crystallographic structure 
factors and NMR experimental data. Aside from coordinates, each deposition also includes the 
names of molecules, primary and secondary structure information, sequence database references, 
where appropriate, and ligand and biological assembly information, details about data collection and 
structure solution, and bibliographic citations. 
This comprehensive guide describes the "PDB format" used by the members of the worldwide Protein 
Data Bank (wwPDB; Berman, H.M., Henrick, K. and Nakamura, H. Announcing the worldwide Protein 
Data Bank. Nat Struct Biol 10, 980 (2003)). Questions should be sent to info@wwpdb.org 
Information about file formats and data dictionaries can be found at http://wwpdb.org. 
Version History: 
Version 2.3: The format in which structures were released from 1998 to July 2007. 
Version 3.0: Major update from Version 2.3; incorporates all of the revisions used by the wwPDB to 
integrate uniformity and remediation data into a single set of archival data files including IUPAC 
nomenclature.  See http://www.wwpdb.org/docs.html
for more details. 
Version 3.1: Minor addenda to Version 3.0, introducing a small number of changes and extensions 
supporting the annotation practices adopted by the wwPDB beginning in August 2007 including chain 
ID standardization and biological assembly . 
Version 3.15: Minor addenda to Version 3.20, introducing a small number of changes and extensions 
supporting the annotation practices adopted by the wwPDB beginning in October 2008 including 
DBREF, taxonomy and citation information. 
Version 3.20: Current version, minor addenda to Version 3.1, introducing a small number of changes 
and extensions supporting the annotation practices adopted by the wwPDB beginning in December 
2008 including DBREF, taxonomy and citation information.  
September 15 2008, initial version 
November 15 2008, add examples for Refmac template and coordinate with alternate conformation.  
December 24 2008, update REMARK 3 templates/examples, add Norine database in DBREF, update 
REMARK 500 on chiral center. 
C#: Demos and Sample Codes for Image Content Extraction Using OCR
C# Sample Code for Png Image Text Extraction. This C# OCR demo code illustrates how to extract text from Png and save to png.pdf. // Set the training data path.
how to make a pdf form fillable in reader; pdf form data extraction
C# PDF File Permission Library: add, remove, update PDF file
Form Process. Data: Read, Extract Field Data. Data: Auto Fill-in Field Data. Field: Insert Choose to offer PDF annotation and content extraction functions.
extract data from pdf file; using pdf forms to collect data
PDB File Format v. 3.2 
Page 2 
Basic Notions of the Format Description 
Character Set 
Only non-control ASCII characters, as well as the space and end-of-line indicator, appear in a PDB 
coordinate entry file. Namely:  
abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ 
1234567890 
` - = [ ] \ ; ' , . / ~ ! @ # $ % ^ & * ( ) _ + { } | : " < > ? 
The use of punctuation characters in the place of alphanumeric characters is discouraged. 
The space, and end-of-line:. The end-of-line indicator is system-specific character; some systems 
may use a carriage return followed by a line feed, others only a line-feed character.  
Special Characters 
Greek letters are spelled out, i.e., 
alpha
,
beta
,
gamma
, etc. 
Bullets are represented as  
(DOT)
Right arrow is represented as  
-->
Left arrow is represented as  
<--
If "
=
" is surrounded by at least one space on each side, then it is assumed to be an equal sign, e.g., 
+ 4 = 6
Commas, colons, and semi-colons are used as list delimiters in records that have one of the following 
data types: 
List 
SList 
Specification List 
Specification 
If a comma, colon, or semi-colon is used in any context other than as a delimiting character, then the 
character must be escaped, i.e., immediately preceded by a backslash, "\".  
VB.NET PDF File Permission Library: add, remove, update PDF file
Data: Read, Extract Field Data. Data: Auto Fill-in Field Data. Field: Insert, Delete, Update Choose to offer PDF annotation and content extraction functions.
extract data from pdf form to excel; java read pdf form fields
C# PDF File Merge Library: Merge, append PDF files in C#.net, ASP.
Merge Microsoft Office Word, Excel and PowerPoint data to PDF form. PDF document splitting, PDF page reordering and PDF page image and text extraction.
pdf data extraction to excel; export excel to pdf form
PDB File Format v. 3.2 
Page 3 
Example - Use of 
\
” character:
COMPND        MOL_ID: 1; 
COMPND      2 MOLECULE: GLUTATHIONE SYNTHETASE; 
COMPND      3 CHAIN: A; 
COMPND      4 SYNONYM: GAMMA-L-GLUTAMYL-L-CYSTEINE\:GLYCINE LIGASE 
COMPND      5 (ADP-FORMING); 
COMPND      6 EC: 6.3.2.3; 
COMPND      7 ENGINEERED: YES 
COMPND        MOL_ID: 1; 
COMPND      2 MOLECULE: S-ADENOSYLMETHIONINE SYNTHETASE; 
COMPND      3 CHAIN: A, B; 
COMPND      4 SYNONYM: MAT, ATP\:L-METHIONINE S-ADENOSYLTRANSFERASE; 
COMPND      5 EC: 2.5.1.6; 
COMPND      6 ENGINEERED: YES; 
COMPND      7 BIOLOGICAL_UNIT: TETRAMER; 
COMPND      8 OTHER_DETAILS: TETRAGONAL MODIFICATION 
PDB File Format v. 3.2 
Page 4 
Record Format 
Every PDB file is presented in a number of lines. Each line in the PDB entry file consists of 80 
columns. The last character in each PDB entry should be an end-of- line indicator.  
Each line in the PDB file is self-identifying. The first six columns of every line contains a record name, 
that is left-justified and separated by a blank. The record name must be an exact match to one of the 
stated record names in this format guide.  
The PDB file may also be viewed as a collection of record types. Each record type consists of one or 
more lines.  
Each record type is further divided into fields. 
Each record type is detailed in this document. The description of each record type includes the 
following sections: 
Overview 
Record Format 
Details 
Verification/Validation/Value Authority Control 
Relationship to Other Record Types 
Examples 
Known Problems 
For records that are fully described in fixed column format, columns not assigned to fields must be left 
blank. 
PDB File Format v. 3.2 
Page 5 
Types of Records 
It is possible to group records into categories based upon how often the record type appears in an 
entry. 
One time, single line:
There are records that may only appear one time and without continuations in a 
file. Listed alphabetically, these are: 
RECORD TYPE            DESCRIPTION 
------------------------------------------------------------------------------------ 
CRYST1                 Unit cell parameters, space group, and Z. 
END                    Last record in the file. 
HEADER                 First line of the entry, contains PDB ID code, 
classification, and date of deposition. 
NUMMDL                 Number of models. 
MASTER                 Control record for bookkeeping. 
ORIGXn                 Transformation from orthogonal coordinates to the 
submitted coordinates (n = 1, 2, or 3). 
SCALEn                 Transformation from orthogonal coordinates to fractional 
crystallographic coordinates (n = 1, 2, or 3). 
It is an error for a duplicate of any of these records to appear in an entry. 
One time, multiple lines
: There are records that conceptually exist only once in an entry, but the 
information content may exceed the number of columns available. These records are therefore 
continued on subsequent lines. Listed alphabetically, these are:  
RECORD TYPE            DESCRIPTION 
----------------------------------------------------------------------------------- 
AUTHOR                 List of contributors. 
CAVEAT                 Severe error indicator. 
COMPND                 Description of macromolecular contents of the entry. 
EXPDTA                 Experimental technique used for the structure determination. 
MDLTYP                 Contains additional annotation pertinent to the coordinates 
presented in the entry. 
KEYWDS                 List of keywords describing the macromolecule. 
OBSLTE                 Statement that the entry has been removed from distribution 
and list of the ID code(s) which replaced it. 
PDB File Format v. 3.2 
Page 6 
SOURCE                 Biological source of macromolecules in the entry. 
SPLIT                  List of PDB entries that compose a larger  macromolecular 
complexes. 
SPRSDE                 List of entries obsoleted from public release and replaced by 
current entry. 
TITLE                  Description of the experiment represented in the entry. 
The second and subsequent lines contain a continuation field, which is a right-justified integer. This 
number increments by one for each additional line of the record, and is followed by a blank character. 
Multiple times, one line:
Most record types appear multiple times, often in groups where the 
information is not logically concatenated but is presented in the form of a list. Many of these record 
types have a custom serialization that may be used not only to order the records, but also to connect 
to other record types. Listed alphabetically, these are:  
RECORD TYPE            DESCRIPTION 
----------------------------------------------------------------------------------- 
ANISOU                 Anisotropic temperature factors. 
ATOM                   Atomic coordinate records for standard groups. 
CISPEP                 Identification of peptide residues in cis conformation. 
CONECT                 Connectivity records. 
DBREF                  Reference to the entry in the sequence database(s). 
HELIX                  Identification of helical substructures. 
HET                    Identification of non-standard groups heterogens). 
HETATM                 Atomic coordinate records for heterogens. 
LINK                   Identification of inter-residue bonds. 
MODRES                 Identification of modifications to standard residues. 
MTRIXn                 Transformations expressing non-crystallographic symmetry 
(n = 1, 2, or 3). There may be multiple sets of these records. 
REVDAT                 Revision date and related information. 
SEQADV                 Identification of conflicts between PDB and the named   
sequence database. 
SHEET                  Identification of sheet substructures. 
SSBOND                 Identification of disulfide bonds. 
Documents you may be interested
Documents you may be interested