AMNH Research Library 
MARC Conversion Guidelines 
Revised 1-12-2013 
General Notes 
These are the guidelines to the second and third steps in creating MARC records for the AMNH Library online catalog and 
WorldCat. The first step was gathering data into spreadsheets which includes authority work and data clean up. Next is 
preparing the spreadsheet for MARC conversion. The third and final stage is processing data into MARC records using MarcEdit 
and OCLC Connexion. 
This document provides step-by-step procedures to be used as recommended guidelines for spreadsheet preparation for MARC 
conversion. Please keep in mind there may be alternative ways to achieve the same result.  
You will need: 
MS Excel 2010 
MarcEdit (open-source MARC editor developed by Terry Reese): 
http://people.oregonstate.edu/~reeset/marcedit/html/downloads.html 
OCLC Connexion (logon credentials required) 
Review of the Process 
This is a 3-step process: 
Gathering data in a spreadsheet 
Preparing the data for MARC conversion 
Processing data into MARC records 
Each stage requires quality control and review and/or reconfiguration of the data: 
Gathering stage 
o
Authority work 
o
Review of data with supervisors, Head of Special Collections and Head of Cataloging 
Preparing stage 
o
Reconfigure spreadsheet to create 1:1 map of spreadsheet columns to MARC fields 
Processing stage 
o
Create multiple line entries for repeatable fields 
o
Add 008 and 015 leader information 
o
Final review of subfields, indicator codes and punctuation before uploading into catalog  
Guidelines for data gathering can be found online:  
http://images.library.amnh.org/hiddencollections/wp-content/uploads/2011/11/min-cat-guidelines-MARC6.pdf 
Preparing the spreadsheet 
Once the records have been approved by the Science Collection Managers and AMNH Archivist, the spreadsheet data can be 
reconfigured to facilitate MARC conversion.  For this project a number of changes must be made to the general layout of the 
spreadsheet which will be covered in detail. This is the  time to add subfield codes to MARC fields such as Creator (1XX), Call 
Number (099), Subjects (6XX), Contributors (7XX), Condition (583), and Immediate Source of Acquisition (541). There are ways 
to automate the insertion of subfield codes into the data, however some fields require manual revision. 
Processing and batch-converting spreadsheet data into MARC 
The better you can prepare the spreadsheet, the cleaner the conversion into MARC.  MarcEdit has several tools to automate 
editing, which I will not go into here.  For the purposes of expediting catalog creation of minimal-level records, all heavy editing 
is done using Excel. 
Converting image pdf to text - software application project:C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net, ASP.NET MVC, WinForms, WPF application
C# PDF to Text (TXT) Converting Library to Convert PDF to Text
www.rasteredge.com
Converting image pdf to text - software application project:VB.NET PDF Convert to Text SDK: Convert PDF to txt files in vb.net, ASP.NET MVC, WinForms, WPF application
VB.NET Guide and Sample Codes to Convert PDF to Text in .NET Project
www.rasteredge.com
Preparing the spreadsheet 
SETTING UP THE  WORKING EXCEL FILE 
1.
Create a copy of the cataloging spreadsheet: 
a.
Save a version of the approved and final spreadsheet for batching.  For example, I replaced ͞ AT͟ to 
͞ AT H͟ in the title:  AT H-Slides_db.  It is important to keep a clean master record (͞ AT͟) of the 
spreadsheet for other uses. 
2.
Delete unnecessary columns containing notes from supervisors and the ͞Side Notes͟ column.   
3.
Delete all header columns leaving only the MARC code header and the catalog data. 
4.
Suggestion: color code headers to identify fields that require modification 
a.
Purple = add subfield codes (099, 1XX, 541, 583, 65X, 6XX, 7XX) 
b.
Blue = fields added to the spreadsheet after gathering descriptive data (852, 506, 949) 
c.
Grey = leave data as is 
Additional columns (blue) should have the following information; all are required for MARC records: 
Field Name 
Code 
Content 
Location (R) 
852 
NNMNH $b Research Library, Special Collections 
Restrictions on Access Note (R) 
506 
Please contact Special Collections; materials are sometimes restricted. 
Local Processing Information (NR)
1
949 
*ov=.b;bn=speco;i=/loc=speco/ty=5/v=; 
elow is a screenshot of a working ͞ AT H͟ spreadsheet with some coded headers. 
Note: If you have any records to skip for more review, this is the time to delete them.  Also delete any unnecessary records, 
e.g., merged records. Master spreadsheet files with these records should be saved with a different name.  Remember, this is a 
working file to create MARC records. 
1
Not technically required for MARC, but required for local uses.  The Local Processing Information identifies the holding information in the 
Millenium catalog and represents availability of the collection in the Library, Special Collections. This may change for other Science Department 
locations. 
software application project:VB.NET PDF Converter Library SDK to convert PDF to other file
This guide give a series of demo code directly for converting MicroSoft Office which users may quickly render and convert TIFF image file to PDF document.
www.rasteredge.com
software application project:C# PDF Converter Library SDK to convert PDF to other file formats
NET SDK library and components for converting PDF file in convert PDF to various document and image file formats Allow users to convert PDF to Text (TXT) file.
www.rasteredge.com
GENERAL DATA CLEAN-UP (AACR2-COMPLIANT) AND ADDING MARC SUBFIELD CODES  
Global checklist: Punctuation 
Title (245) should NOT end with a period 
Note: terminal periods will be added through MarcEdit 
Bulk Dates (245 $g) should be enclosed in parenthesis.  
Example: (bulk 1992-1993) 
Physical Description (300) should NOT end with a period 
Example: 1 box (0.25 linear feet) 
Example: 12 slides 
Conservation Note (583) should be all lowercase, statements separated with a semicolon, no period at the end 
Example: slide 79-57 has three puncture holes in the film; some slides have reddish hue 
Add subfields to the (purple) columns 
Make sure authorized names and subject headings have appropriate subfields and punctuation.  Ideally this work will have 
been completed already.  Do a thorough review of the subject (65X, 690) fields to make sure the headings are in the correct 
columns: topical, geographic location, local subject, etc. 
Field 
subfield code(s) 
Where 
Example 
099 
$a  
Between acronym and unique call number 
PSC $a 10 
541 
$a, $c, $d 
Refer to minimal-cataloging guidelines for more detail  $c Donated by $a Chantal Boulanger, $d 
May 1990. 
583 
$c, $l 
(subfield ͚el͛) 
Run a Find+Replace to modify condition statement 
Dates are formatted as yyymmdd 
condition reviewed $c 20110826 $l good 
583 
$l 
(subfield ͚el͛) 
Each additional note should be preceded with $l.  
Semicolon is added to the first statement to separate 
the general condition note from the detailed 
description. 
;$lsleeve is warping due to the weight of 
the slides 
Separate data from 1XX, 6XX, and 7XX fields 
For ease of gathering data, main entries, entity subjects, and contributors were added to a single column respectively with the 
corresponding attribute of ͞Personal͟, ͞ orporate͟ or ͞Meeting͟ names.  These now have to be divided into separate columns: 
100, 110, 111, 600, 610, 611, 700, 710 and 711.  
Note: Excel 2010 required for use of filters.  
These steps detail separating columns for the 1XX field, but should be repeated for 6XX and 7XX 
1.
Select, copy and paste the entire 1XX column 
2.
Rename one of the headers ͞100͟ 
3.
Open up the Data tab in Excel and click Filter 
4.
Open the filter options for the 100/110/111 column and select ͞Personal͟.  Now only rows of data containing 
͞Personal͟ in this particular column will be displayed. 
5.
Clear contents of personal names in the original 1XX column.  Leave the new ͞100͟ column for now.   
Note: It is important that you use the ͞ lear contents͟ function rather than the ͞Delete͟ function.  Deleting cells in 
Excel can shift the data into different rows, destroying the alignment of the catalog entry! 
6.
Open the filter options again for the 100/110/111 column and select ͞ orporate͟ and ͞Meeting͟ 
7.
Clear contents of entries in the new 100 column 
8.
Click Filter in the Data tab to deselect this view.  The 100 column should now only contain personal names and the 
original 1XX column should contain only corporate and meeting names. 
9.
Repeat these steps 1-8 for ͞ orporate͟ with the new column heading titled 110.  
10.
For the remaining meeting names, simply rename the 1XX column to 111. 
11.
Review the data to make sure there are no repeating names in the new columns created.   
ONLY when you are confident each column is representing the correct information and no information was 
accidentally repeated or deleted, complete the final step: 
12.
Delete the entire 100/110/111 column (containing the drop-down information). 
Pay close attention: Though each catalog record is represented by ONE main entry, a single record may have SEVERAL entity 
subjects and contributors, or SEVERAL OF BOTH.  Be very careful when clearing contents in the 6XX and 7XX fields – DO NOT 
ACCIDENTALLY DELETE ALL THE DATA DISPLAYED IN THE FILTERED VIEW!  These names can be relevant to the record and 
software application project:VB.NET Image: Tutorial for Converting Image and Document in VB.NET
VB.NET Project for Converting Image to Byte Array, Convert Word to Image in VB.NET Application. Use VB.NET Code to Convert Image to Stream, PDF to Image
www.rasteredge.com
software application project:C# PDF Convert to Word SDK: Convert PDF to Word library in C#.net
watermark and save PDF text, image, table, hyperlink and bookmark to Word without losing format. Powerful components for batch converting PDF documents in C#
www.rasteredge.com
should remain.  If you think you may have wholesale deleted data without first checking the content (as I have the misfortune 
of knowing firsthand), undo your actions until you are back to a good starting point. 
Below are screenshot examples for separating the 1XX column. 
Data > Filter mode for Personal / Corporate / Meeting name drop-down column 
software application project:C# PDF Convert to HTML SDK: Convert PDF to html files in C#.net
source code for quick integration and converting PDF to HTML is a 100% clean .NET document image solution, which that are included in target PDF document file.
www.rasteredge.com
software application project:C# PDF Convert to Tiff SDK: Convert PDF to tiff images in C#.net
If using x86, the platform target should be x86. C# programming sample for PDF to Tiff image converting. // Load a PDF file. String
www.rasteredge.com
Filtered view for Personal names.  Clear contents of personal names in the original 1XX column. Do not delete cells with data. 
Remember to select  
Clear contents, NOT 
Delete 
software application project:C# PDF Convert to Jpeg SDK: Convert PDF to JPEG images in C#.net
RasterEdge PDF to JPEG converting control SDK (XDoc.PDF for .NET) supports converting PDF document to JPEG image file in .NET developing platforms using simple
www.rasteredge.com
software application project:VB.NET PDF Convert to Word SDK: Convert PDF to Word library in vb.
VB.NET PDF Converting DLLs for PDF-to-Word. This is an example for converting PDF to Word (.docx) file in VB.NET program. ' Load a PDF document.
www.rasteredge.com
For subject and contributor fields that contain more than one type of entity, the information will have to be parsed out one by 
one into their correct columns.  
COMBINING CELLS IN EXCEL 
Some cells are more easily joined in Excel than in MarcEdit. While MarcEdit does allow you to join and split cells through the 
Text Delimited Translator, the tool which converts the xls file into mrk, the results were not what I had expected.  These next 
steps show you how to combine multiple cells, such as 245 and 583, into one representative data cell for each catalog record.  It 
uses multiple steps to add subfields to data and combine the sum of the parts.  If you are familiar with combining cells, you may 
want to skip the detailed steps. 
General Note: Make sure your new cells are formatted as ͞General͟.  Some columns may be specified as text, particularly the 
ones that contain numbers.  You can select the column, right-click and choose Format cells to change this. 
Combining 245 fields 
1.
Insert a new column to the left of 245 $f (inclusive dates) 
2.
In the first blank cell of this new column, type ͞, $f ͟ 
Note: the comma is added to join with the end of the title statement in 245 later. 
3.
Fill down ͞, $f ͟ 
4.
Insert a new column to the right of 245 $f (inclusive dates) 
5.
In the first blank cell of this new column, enter the function code ͞=[click on first cell showing value: ͞, $f ͟]&[click on 
first cell showing the value for inclusive date]͟ 
6.
Hit enter.  
7.
Fill down function.  The cells should populate with the data from the 2 columns. 
Note: Additionally I also copy and paste this data again as VALUES to delete the function.  This should leave you with 
solid values in the cells rather than a string of cell coordinates. 
8.
Delete the ͞, $f ͟ and 245 $f columns. 
9.
Manually add ͞$g͟ before any bulk dates.  Usually there are not to many so it is faster to spot check and add the 
subfield  
10.
Insert a new column to the right of 245 $g (bulk dates) 
11.
In the first blank cell, enter ͞=͟ then click on the cells to be joined: 245 title statement, 245 $f (combined) & 245 $g 
12.
Hit enter and fill down.  Also copy and paste column as values – recommended! 
13.
Delete 245 title statement, 245 $f (combined) & 245 $g columns. 
Cut & paste Audubon 
to 600 field 
Use function codes to join cell values 
Copy and paste this data again as VALUES to delete the function
FUNCTION 
VALUE 
Modifying 583 data and combining 583 fields 
1.
Select the 583 drop-down column and run a Find+Replace Good/Fair/Poor with the following: 
Find 
Replace 
Good  condition reviewed $c [XXXXXXXX] $l good 
Fair 
condition reviewed $c [XXXXXXXX] $l fair 
Poor  condition reviewed $c [XXXXXXXX] $l poor 
[XXXXXXXX] = date of review as yyyymmdd (year-month-day) 
2.
In the second 583 (condition note) field, add $l (subfield ͚el͛) before each condition description.  Depending on the 
volume of data in this field, you may want to add the subfields manually or automate insertion by combining cells or 
running a Find+Replace. 
3.
Insert a new column to the right of 583 (condition note) 
4.
In the first blank cell of this new column, enter the equation ͞=͟ followed by the two 583 columns separated by ͞&͟ 
5.
Hit enter.  
6.
Fill down equation. 
7.
Copy and paste column as Values 
8.
Delete original 583 columns. 
9.
Additionally, data that includes further description of the condition should also be preceded by a semi-colon.  Judge 
the volume of data to consider filling it in automatically.  The field should read something like this (with the semi-
colon in red): ͞condition reviewed $c 20110826 $l good; $l some slides are individually sleeved in plastic͟ 
VALUE 
VALUE 
Find+Replace ͞Good͟ with ͞condition reviewed $c [XXXXXXXX] $l good͟ 
After combining the two 583 fields, copy & paste the data as VALUES to delete the function 
Add a semi-colon to data that includes further description of the condition: ͞…good; $l…͟ 
Documents you may be interested
Documents you may be interested