PDB File Format v. 3.2 
Page 47 
13 - 16       LString(4)    "TITL"         Appears on all continuation records. 
17 - 18       Continuation  continuation   Permits long titles.                
20 - 70       LString       title          Title of the article. 
4. REF
* REF is a group of fields that contain either the publication status or the name of the publication (and 
any supplement and/or report information), volume, page, and year. There are two forms of this sub-
record group, depending upon the citation's publication status.  
4a. If the reference has not been published yet, the sub-record type group has the form: 
COLUMNS       DATA TYPE     FIELD           DEFINITION 
-------------------------------------------------------------------------------- 
1 -  6       Record name   "JRNL  " 
13 - 16       LString(3)    "REF" 
20 - 34       LString(15)   "TO BE PUBLISHED" 
* Publication name (first item in pubName field): 
If the publication is a serial (i.e., a journal, an annual, or other non-book or non-monographic item 
issued in parts and intended to be continued indefinitely), use the abbreviated name of the publication 
as listed in PubMed with periods. 
If the publication is a book, monograph, or other non-serial item, use its full name according to the 
Anglo-American Cataloguing Rules, 2nd Revised Edition; (AACR2R). (Non-serial items include 
theses, videos, computer programs, and anything that is complete in one or a finite number of parts.) 
If there is a sub-title, verifiable in an online catalog, it will be included using the same punctuation as 
in the source of verification. Preference will be given to verification using cataloging of the Library of 
Congress, the National Library of Medicine, and the British Library, in that order. 
If a book is part of a monographic series: the full name of the book (according to the AACR2R) is 
listed first, followed by the name of the series in which it was published. The series information is 
given within parentheses and the series name is preceded by "IN:" and a space. The series name 
should be listed in full unless the series has an accepted ISO abbreviation. If applicable, the series 
name should be followed, after a comma and a space, by a volume (V.) and/or number (NO.) and/or 
part (PT.) indicator and its number and/or letter in the series.  
* Supplement (follows publication name in pubName field): 
Extract data from pdf - extract form data from PDF in C#.net, ASP.NET, MVC, Ajax, WPF
Help to Read and Extract Field Data from PDF with a Convenient C# Solution
extract data out of pdf file; pdf form data extraction
Extract data from pdf - VB.NET PDF Form Data Read library: extract form data from PDF in vb.net, ASP.NET, MVC, Ajax, WPF
Convenient VB.NET Solution to Read and Extract Field Data from PDF
how to extract data from pdf file using java; exporting pdf data to excel
PDB File Format v. 3.2 
Page 48 
If a reference is in a supplement to the volume listed, or if information about a "part" is needed to 
distinguish multiple parts with the same page numbering, such information should be put in the REF 
sub-record.  
A supplement indication should follow the name of the publication and should be preceded by a 
comma and a space. Supplement should be abbreviated as "SUPPL." If there is a supplement 
number or letter, it should follow "SUPPL." without an intervening space. A part indication should also 
follow the name of the publication and be preceded by a comma and a space. A part should be 
abbreviated as "PT.", and the number or letter should follow without an intervening space. 
If there is both a supplement and a part, their order should reflect the order printed on the work itself.  
* Report (follows publication name and any supplement or part information in pubName field): 
If a book has a report designation, the report information should follow the title and precede series 
information. The name and number of the report is given in parentheses, and the name is  preceded 
by "REPORT:" and a space.  
* Reconstruction of publication name: 
The name of the publication is reconstructed by removing any trailing blanks in the pubName field, 
and concatenating all of the pubName fields from the continuation lines with an intervening space. 
There are two conditions where no intervening space is added between lines: when the pubName 
field on a line ends with a hyphen or a period, or when the line ends with a hyphen (-). When the line 
ends with a period (.), add a space if this is the only period in the entire pubName field; do not add a 
space if there are two or more periods throughout the pubName field, excluding any periods after the 
designations "SUPPL", "V", "NO", or "PT".  
* Volume, page, and year (volume, first page, year fields respectively): 
The REF sub-record type group also contains information about volume, page, and year when 
applicable. 
In the case of a monograph with multiple volumes which is also in a numbered series, the number in 
the volume field represents the number of the book, not the series. (The volume number of the series 
is in parentheses with the name of the series, as described above under publication name.) 
COLUMNS       DATA TYPE     FIELD          DEFINITION 
------------------------------------------------------------------------------------- 
1 -  6       Record name   "JRNL  " 
13 - 16       LString(3)    "REF " 
17 - 18       Continuation  continuation   Allows long publication names. 
20 - 47       LString       pubName        Name of the publication including section 
or series designation. This is the only 
field of this sub-record which may be 
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
Image: Extract Image from PDF. |. Home ›› XDoc.PDF ›› C# PDF: Extract PDF Image. How to C#: Extract Image from PDF Document.
collect data from pdf forms; exporting pdf form to excel
C# PDF Text Extract Library: extract text content from PDF file in
XDoc.PDF ›› C# PDF: Extract PDF Text. C# PDF - Extract Text from PDF in C#.NET. Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File.
extract data from pdf file to excel; extract data from pdf table
PDB File Format v. 3.2 
Page 49 
continued on successive sub-records. 
50 - 51       LString(2)    "V."           Appears in the first sub-record only, 
and only if column 55 is non-blank. 
52 - 55       String        volume         Right-justified blank-filled volume 
information; appears in the first 
sub-record only. 
57 - 61       String        page           First page of the article; appears in  
the first sub-record only. 
63 - 66       Integer       year           Year of publication; first sub-record only. 
VB.NET PDF Text Extract Library: extract text content from PDF
PDF ›› VB.NET PDF: Extract PDF Text. VB.NET PDF - Extract Text from PDF Using VB. How to Extract Text from PDF with VB.NET Sample Codes in .NET Application.
extract pdf form data to excel; pdf form field recognition
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
Image: Extract Image from PDF. |. Home ›› XDoc.PDF ›› VB.NET PDF: Extract PDF Image. VB.NET PDF - Extract Image from PDF Document in VB.NET.
extract pdf form data to xml; extract data from pdf c#
PDB File Format v. 3.2 
Page 50 
5. PUBL
* PUBL contains the name of the publisher and place of publication if the reference is to a book or 
other non-journal publication. If the non-journal has not yet been published or released, this sub-
record is absent.  
* The place of publication is listed first, followed by a space, a colon, another space, and then the 
name of the publisher/issuer. This arrangement is based on the ISBD(M) International Standard 
Bibliographic Description for Monographic Publications (Rev.Ed., 1987) and the AACR2R, and is 
used in public online catalogs in libraries. Details on the contents of PUBL are given below. 
* Place of publication:  
Give the place of publication. If the name of the country, state, province, etc. is considered necessary 
to distinguish the place of publication from others of the same name, or for identification, then follow 
the city with a comma, a space, and the name of the larger geographic area.  
If there is more than one place of publication, only the first listed will be used. If an online catalog 
record is used to verify the item, the first place listed there will be used, omitting any brackets. 
Preference will be given to the cataloging done by the Library of Congress, the National Library of 
Medicine, and the British Library, in that order.  
* Publisher's name (or name of other issuing entity): 
Give the name of the publisher in the shortest form in which it can be understood and identified 
internationally, according to AACR2R rule 1.4D. 
If there is more than one publisher listed in the publication, only the first will be used in the PDB file. If 
an online catalog record is used to verify the item, the first place listed there will be used for the name 
of the publisher. Preference will be given to the cataloging of the Library of Congress, the National 
Library of Medicine, and the British Library, in that order.  
* Ph.D. and other theses: 
Theses are presented in the PUBL record if the degree has been granted and the thesis made 
available for public consultation by the degree-granting institution.  
The name of the degree-granting institution (the issuing agency) is followed by a space and 
"(THESIS)".  
* Reconstruction of place and publisher: 
The PUBL sub-record type can be reconstructed by removing all trailing blanks in the pub field and 
concatenating all of the pub fields from the continuation lines with an intervening space.  
Continued lines do not begin with a space. 
C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
Page: Extract, Copy and Paste PDF Pages. Easy to Use C# Code to Extract PDF Pages, Copy Pages from One PDF File and Paste into Others in C#.NET Program.
cannot save pdf form in reader; extract table data from pdf
VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.
VB.NET: Extract PDF Pages and Save into a New PDF File. You VB.NET: Extract PDF Pages and Overwrite the Original PDF File. Instead
how to save editable pdf form in reader; pdf data extraction tool
PDB File Format v. 3.2 
Page 51 
COLUMNS       DATA TYPE     FIELD          DEFINITION 
-------------------------------------------------------------------------------------- 
1 -  6       Record name   "JRNL  " 
13 - 16       LString(4)    "PUBL" 
17 - 18       Continuation  continuation   Allows long publisher and place names. 
20 - 70       LString       pub            City of publication and name of the 
publisher/institution. 
6. REFN (changed)
* REFN is a group of fields that contain encoded references to the citation. No continuation lines are 
possible. Each piece of coded information has a designated field.  
* There are two forms of this sub-record type group, depending upon the publication status. 
6a. This form of the REFN sub-record type group is used if the citation has not been published. 
COLUMNS       DATA TYPE     FIELD          DEFINITION 
-------------------------------------------------------------------------------- 
1 -  6       Record name   "JRNL  " 
13 - 16       LString(4)    "REFN" 
6b. This form of the REFN sub-record type group is used if the citation has been published. 
COLUMNS       DATA TYPE     FIELD          DEFINITION 
------------------------------------------------------------------------------- 
1 -  6       Record name   "JRNL  " 
13 - 16       LString(4)    "REFN" 
36 - 39       LString(4)    "ISSN" or      International Standard Serial Number or  
"ESSN"         Electronic Standard Serial Number. 
41 - 65       LString       issn           ISSN number (final digit may be a 
letter and may contain one or  
more dashes). 
VB.NET PDF Form Data fill-in library: auto fill-in PDF form data
from PDF Page. Image: Copy, Paste, Cut Image in Page. Link: Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process. Data: Read, Extract
edit pdf form in reader; java read pdf form fields
C# PDF Form Data fill-in Library: auto fill-in PDF form data in C#
Online C# Tutorial to Automatically Fill in Field Data to PDF with C#.NET Library. C#.NET Demo Code: Auto Fill-in Field Data to PDF in C#.NET.
c# read pdf form fields; extract data from pdf into excel
PDB File Format v. 3.2 
Page 52 
7. PMID (added)
* PMID lists the PubMed unique accession number of the publication related to the entry.   
COLUMNS       DATA TYPE     FIELD          DEFINITION 
-------------------------------------------------------------------------------- 
1 -  6       Record name   "JRNL  " 
13 - 16       LString(4)    "PMID" 
20 – 79       Integer       continuation  unique PubMed identifier number assigned to  
the publication describing the experiment. 
Allows for a long PubMed ID number. 
8. DOI (added)
 DOI is the Digital Object Identifier for the related electronic publication (“e
-
pub”), if applicable.  
* Every DOI consists of a publisher prefix, a fore-
slash (“/”), and then a suffix which can be any 
length 
and may include a combination of numbers and alphabets.   
For example: 10.1073/PNAS.0712393105
COLUMNS       DATA TYPE     FIELD          DEFINITION 
-------------------------------------------------------------------------------- 
1 -  6       Record name   "JRNL  " 
13 - 16       LString(4)    "DOI " 
20 – 79       LString       continuation   Unique DOI assigned to the publication 
describing the experiment. 
Allows for a long DOI string. 
Verification/Validation/Value Authority Control 
wwPDB verifies that this record is correctly formatted. 
Citations appearing in JRNL may not also appear in REMARK 1. 
Relationships to Other Record Types 
The publication cited as the JRNL record may not be repeated in REMARK 1. 
Example 
1         2         3         4         5         6         7         8 
12345678901234567890123456789012345678901234567890123456789012345678901234567890 
JRNL        AUTH   G.FERMI,M.F.PERUTZ,B.SHAANAN,R.FOURME                         
JRNL        TITL   THE CRYSTAL STRUCTURE OF HUMAN DEOXYHAEMOGLOBIN AT            
JRNL        TITL 2 1.74 A RESOLUTION                                             
PDB File Format v. 3.2 
Page 53 
JRNL        REF    J.MOL.BIOL.                   V. 175   159 1984               
JRNL        REFN                   ISSN 0022-2836                                
JRNL        PMID   6726807                                                       
JRNL        DOI    10.1016/0022-2836(84)90472-8                                  
PDB File Format v. 3.2 
Page 54 
Known Problems 
* Interchange of bibliographic information and linking with other databases is hampered by the lack of 
labels or specific locations for certain types of information or by more than one type of information 
being in a particular location. This is most likely to occur with books, series, and reports. Some of the 
points below provide details about the variations and/or blending of information.  
* Titles of the publications that require more than 28 characters on the REF line must be continued on 
subsequent lines. There is some awkwardness due to volume, page, and year appearing on the first 
REF line, thereby splitting up the title. 
* Information about a supplement and its number/letter is presented in the publication's title field (on 
the REF lines in columns 20 - 47).  
* When series information for a book is presented, it is added to the REF line. The number of REF 
lines can become large in some cases because of the 28-column limit for title information in REF.  
* Books that are issued in more than one series are not accommodated.  
* Pagination is limited to the beginning page.  
PDB File Format v. 3.2 
Page 55 
REMARK  
Overview 
REMARK records present experimental details, annotations, comments, and information not included 
in other records. In a number of cases, REMARKs are used to expand the contents of other record 
types. A new level of structure is being used for some REMARK records. This is expected to facilitate 
searching and will assist in the conversion to a relational database.  
The very first line of every set of REMARK records is used as a spacer to aid in reading. 
COLUMNS       DATA TYPE     FIELD         DEFINITION 
-------------------------------------------------------------------------------------- 
1 -  6       Record name   "REMARK" 
8 - 10       Integer       remarkNum     Remark number. It is not an error for 
remark n to exist in an entry when 
remark n-1 does not. 
12 - 70       LString       empty         Left as white space in first line 
of each new remark. 
REMARKs 0-4 
REMARK 0, 1, 2, 3, and 4 detailed below, are specific for re-refinement, references, resolution,  final 
refinement, and PDB File Format version, respectively. 
REMARK 0 (added), Re-refinement notice 
REMARK 0 identifies entries in which a re-refinement has been performed using the data from an 
existing entry. 
Template 
1         2         3         4         5         6         7         8 
12345678901234567890123456789012345678901234567890123456789012345678901234567890 
REMARK   0  
REMARK   0 THIS ENTRY yyyy REFLECTS AN ALTERNATIVE MODELING OF THE  
REMARK   0 ORIGINAL STRUCTURAL DATA (RxxxxSF or xxxx.MR) DETERMINED BY  
REMARK   0 AUTHORS OF THE PDB ENTRY xxxx: 
REMARK   0 AUTHOR INITIALS, AUTHOR LAST NAME  
Note: In entries where REMARK 0 is included as described above, remarks REMARK 1 and 
REMARK 900 will also reflect the reuse of existing experimental data. 
PDB File Format v. 3.2 
Page 56 
REMARK 200 REMARK: AUTHOR USED THE SF(MR) DATA FROM ENTRY xxxx.  
NOTE: the rest of REMARKs 200 and 280 are blank, since the re-refinement author did not collect 
original data. 
Documents you may be interested
Documents you may be interested