Brief information about patent/license issues
Royalty-free ISO standard
Key related links (Websites describing it, documentation, etc.)
http://www.web3d.org/x3d/what-x3d
http://en.wikipedia.org/wiki/X3D
http://fileformats.archiveteam.org/wiki/X3D
Risk summary
External References
Externally referenced content may be difficult to identify, collect and preserve
X3D documents can embed network-accessible content within a file
Multiple Profiles
X3D specifies several profiles for varying levels of capability including X3D Core, X3D 
Interchange, X3D Interactive, X3D CADInterchange, X3D Immersive, and X3D Full
X3D supports multiple encodings (XML, VRML, Binary)
X3D supports optional compression
Support for all of these options may vary across software platforms
Embedded
X3D documents may themselves be embedded in other XML or HTML files which present 
their own archival challenges
Mitigation of key risks
Mitigating external references risk
Disallow X3D files that include linked external content
Download linked external content and embed directly in X3D file
Mitigating multiple profiles risk
Weigh different profiles and decide if only some will be accepted
Convert to a preferred encoding
Mitigating embedded
Disallow X3D files embedded in other documents
Make sure that containing documents themselves conform to archival requirements
References
Archaeology Data Service. (n.d.). Archaeology Data Service / Digital Antiquity Guides to Good Practice. 
Retrieved from http://guides.archaeologydataservice.ac.uk/g2gp/TextDocs_2
Archivematica. (2014). Format Policies. Retrieved from https://www.archivematica.org/wiki/Format_policies
Library of Congress. (n.d.). Recommended Format Specifications. Textual Works and Musical Compositions. 
Retrieved from http://www.loc.gov/preservation/resources/rfs/textmus.html
NARA. (n.d.). NARA 2014-04: Appendix A, Revised Format Guidance for the Transfer of Permanent Electronic 
Records – Tables of File Formats. Retrieved from http://www.archives.gov/records-
mgmt/policy/transfer-guidance-tables.html#computeraided
Convert pdf file into ppt - Library application component:C# Create PDF from PowerPoint Library to convert pptx, ppt to PDF in C#.net, ASP.NET MVC, WinForms, WPF
Online C# Tutorial for Creating PDF from Microsoft PowerPoint Presentation
www.rasteredge.com
Convert pdf file into ppt - Library application component:VB.NET Create PDF from PowerPoint Library to convert pptx, ppt to PDF in vb.net, ASP.NET MVC, WinForms, WPF
VB.NET Tutorial for Export PDF file from Microsoft Office PowerPoint
www.rasteredge.com
Appendix B - Metadata Recommendations 
Table of Contents
Table of Contents
Recommendations
Validity
Notes on Specific File Types
DWG
DXF
STEPFile
Glossary
References
Appendix
Recommendations
Goals: 
Evaluate the completeness of the content after transformations (e.g. number of geometric 
primitives).  
Aid in selecting or aggregating files for risk analysis, preservation or delivery planning 
Certain elements are applicable to word documents that may also be applicable to CAD and similar 
file types. DocMD (document metadata) includes PageCount, Language, Font, FontName, 
IsEmbedded, Reference, Features, documentMetadataExtension. For more formal definitions of 
these properties, see Chou & Goethals, 2012.
The DocMD elements that seem relevant to 2D and 3D files are:
Semantic Unit
PageCount
Semantic Components
None
Description
Total number of pages in the CAD file
Data Constraint
Min 1
Obligation
Optional
Cardinality
1
Characteristic
Structure
Note
Semantic Unit
Language
Library application component:Online Convert PowerPoint to PDF file. Best free online export
Convert a PPTX/PPT File to PDF. Just upload your file by clicking on the blue button or drag-and-drop your pptx or ppt file into the drop area.
www.rasteredge.com
Library application component:How to C#: Convert PDF, Excel, PPT to Word
Program.RootPath + "\\" Output.docx"; // Load a PDF document How to C#: Convert Excel to Word. RootPath + "\\" Output.docx"; // Load an Excel (.xlsx) file.
www.rasteredge.com
Semantic 
Components
None
Description
A language identifier specifying the natural language used in the document
Data Constraint
String (or some kind of controlled vocabulary like ISO 639-2 alpha-3 
language codes)
Obligation
Optional
Cardinality
0 - N
Characteristic
Content
Note
Semantic Unit
Font
Semantic 
Components
FontName
isEmbedded
Description
A list of fonts used in the document
Data Constraint
Container
Obligation
Optional
Cardinality
0 - N
Characteristic
Content, Appearance
Note
This element allows a repository to store the names of all fonts used in a file. 
Some repositories may choose to store only the non-embedded fonts. The use of 
non-embedded fonts may hinder the long term preservation of the documents. For 
example, a document encoded with a proprietary non-embedded math font may 
not be migrated due to unavailability of the specific math font. It is recommended 
that repositories record at least the nonembedded fonts to assist in identifying the 
documents with potential long-term preservation risks.
Semantic Unit
FontName
Semantic Components
None
Description
Name of a font
Data Constraint
String
Obligation
Mandatory
Cardinality
Library application component:How to C#: Convert Word, Excel and PPT to PDF
Program.RootPath + "\\" Output.pdf"; // Load an Excel (.xlsx) file. XLSXDocument doc = new XLSXDocument(inputFilePath); // Convert Excel to PDF.
www.rasteredge.com
Library application component:C# TIFF: Learn to Convert MS Word, Excel, and PPT to TIFF Image
In order to convert Microsoft Word, Excel, and PowerPoint to Tiff image file Visual C#.NET It is quiet easy to integrate this SDK into your C# program, by
www.rasteredge.com
Characteristic
Content, Appearance
Note
Semantic Unit
isEmbedded
Semantic Components
None
Description
An indication of whether or not a font is embedded in a document
Data Constraint
Boolean
Obligation
Optional
Cardinality
Characteristic
Content, Appearance
Note
The following list includes general suggestions for the level of detail that should be translated 
between different CAD file formats (Wikipedia, CAD). Some of these are already covered by DocMD 
elements above.
model description 
is the data wireframe, surface, or solid?  
topology (BREP) information 
face and edge identifications 
feature information and history  
PMI annotation 
text and annotations (fonts, format) 
color and layer of graphical objects 
Based on these recommendations and the info available in the headers, I would recommend the 
following elements beyond what is in DocMD. 
Semantic Unit
Features
Semantic 
Components
None
Description
Additional document features
Data Constraint
hasAnnotations, hasKinematics, hasMaterialProperties, hasTolerances, 
hasTransparencies
Obligation
Optional
Cardinality
0 - N
Library application component:VB.NET PowerPoint: Convert & Render PPT into PDF Document
image source into PDF document file which may be to save converted image source to PDF format, RasterEdge offers other encoding APIs to convert rendered image
www.rasteredge.com
Library application component:VB.NET PowerPoint: Process & Manipulate PPT (.pptx) Slide(s)
how to split one PPT (.pptx) document file into smaller sub slides and merge/split PPT file without depending & profession imaging controls, PDF document, image
www.rasteredge.com
Characteristic
Content
Note
Semantic Unit
Representation
Semantic Components
RepresentationType
ObjectCount
Description
Types of geometric primitives present in the model
Data Constraint
Container
Obligation
Optional
Cardinality
0 - N
Characteristic
Content
Note
Semantic Unit
RepresentationType
Semantic 
Components
Description
Which method the file uses for representing shapes.
Data Constraint
has2DPointSets
has3DPointSets
has2DRasterData: Object contains two dimensional raster data or textured 
surfaces in a three dimensional model
has3DRasterData: Object contains voxel data or stacked 2d raster data
hasBREP: Object contains shapes defined by boundary representation methods
hasImplicitCurves: Object contains two dimensional lines or curves defined by 
implicit equations
hasImplicitSurfaces: Object contains three dimensional surfaces defined by 
implicit equations
hasParametricCurves: Object contains two dimensional lines or curves defined by 
parametric equations
hasParametricSurfaces: Object contains three dimensional surfaces defined by 
parametric equations
hasTriangleMesh
Obligation
Required
Cardinality
1
Characteristic
Content
Library application component:C# PDF Convert: How to Convert MS PPT to Adobe PDF Document
VB.NET Read: PDF Image Extract; VB.NET Write: Insert text into PDF; FILE_TYPE_UNSUPPORT: Console.WriteLine("Fail: can not convert to PDF, file type unsupport
www.rasteredge.com
Library application component:VB.NET PowerPoint: Read & Scan Barcode Image from PPT Slide
barcode scanning SDK to detect PDF-417 barcode advanced Codabar barcode scanning function into PPT processing projects that is contained in .pptx document file.
www.rasteredge.com
Note
The possible values for this can inform whether or not the file is 2D or 3D.
The representation types hasImplicitCurves, hasImplicitSurfaces, 
hasParametricCurves, hasParametricSurfaces may be too low level to be 
meaningful. In particular, it is unlikely that they will be used in conjunction with the 
accompanying ObjectCount variable.
Semantic Unit
ObjectCount
Semantic 
Components
None
Description
Number of geometric primitives of the given representation type (facets of a 
polygon mesh, points in a point cloud, etc)
Data Constraint
Min 0
Obligation
Optional
Cardinality
1
Characteristic
Content
Note
Can be useful for validating conversions.
Semantic Unit
Units
Semantic Components
None
Description
The type of unit system defined in the file.
Data Constraint
hasStandard
hasMetric
Obligation
Optional
Cardinality
0 - N
Characteristic
Content
Note
Some people will use both unit systems in one file.
Semantic Unit
Extent
Semantic 
Components
Dimension
Description
An approximate maximum extent of all aggregated objects contained in the 
file
Data Constraint
None
Obligation
Optional
Cardinality
0-1
Characteristic
Content
Note
Semantic Unit
Dimension
Semantic 
Components
axis
magnitude
units
Description
A one-dimensional component of the approximate maximum extent of all 
aggregated objects contained in the file
Data Constraint
axis: x,y,z
magnitude: decimal (positive)
units: string (km, inches, miles, m, etc -- some standard set to use here?)
Obligation
Optional
Cardinality
1-3
Characteristic
Content
Note
Note: The FITS documentation states that the following technical non-domain-specific metadata are 
captured. Therefore, they are not part of my recommendations (FITS XML).
copyrightBasis element  
copyrightNote element 
created element (file creation date) 
creatingApplicationName element (name of the software used to create the file) 
creatingApplicationVersion element (version of the software used to create the file) 
creatingos element (Operating system used to create the file) 
filepath element (full filepath to the file) 
filename element (name of the file) 
fslastmodified element (last modified date based on file system metadata) 
inhibitorType element (type of file inhibitor) 
inhibitorTarget element (what is being inhibited) 
lastmodified element (last modified date based on metadata embedded in the file) 
md5checksum element (MD5 value for the file) 
rightsBasis element 
size element (size of the file in bytes) 
Validity
Typical validation properties for solid models include the volume, centre of gravity and calculated 
weight of each solid in the model. For solid and surface models, surface areas can be used. Another 
versatile technique is the use of a point cloud: this is where a large set of co-ordinates is calculated 
such that each co-ordinate lies on a surface in the model. The distribution of these points should not 
be random: they can be sparse across flat surfaces, but need to be denser where surfaces curve 
more steeply, and particularly dense along edges and corners (Ball, 2013).
Notes on Specific File Types
DWG
http://www.opendesign.com/files/guestdownloads/OpenDesign_Specification_for_.dwg_files.pdf
DXF
http://images.autodesk.com/adsk/files/acad_dxf0.pdf
STEPFile
Types, entities, rules and functions 
(http://www.steptools.com/support/stdev_docs/stpcad/html/index.html
)
As each CAD system has its own method of describing geometry, both mathematically and 
structurally, there is always some loss of information when translating data from one CAD data 
format to another. The intermediate file formats are also limited in what they can describe, and they 
can be interpreted differently by both the sending and receiving systems.
It is therefore important when transferring data between systems to identify what needs to be 
translated.
If only the 3D model is required for the downstream process, then only the model description needs 
to be transferred. However, there are levels of detail. For example: is the data wireframe, surface, or 
solid; is the topology (BREP
) information required; must the face and edge identifications be 
preserved on subsequent modification; must the feature information and history be preserved 
between systems; and is PMI
annotation to be transferred.
With product models, retaining the assembly structure may be required.
If drawings need to be translated, the wireframe geometry is normally not an issue; however text, 
dimensions and other annotation can be an issue, particularly fonts and formats. No matter what 
data is to be translated, there is also a need to preserve attributes (such as color and layer of 
graphical objects) and text information stored within the files. Sometimes, however, there is a 
problem caused by too much information being preserved. An example are the constraints placed on 
designers arising out of the design intent-history captured in parametric design systems. The 
receiving system must provide designers with the design freedom to modify geometry without having 
to understand the history of, or undo, the design tree. (Wikipedia, 2015, CAD)
Glossary
BREP (Boundary Representation): A method of solid modelling where the solids are defined in 
terms of their boundaries (surfaces).
CAD (Computer-Aided Design)
Exchange format: A format that has been designed to be read and written by several different 
software applications with a minimum of loss. Exchange formats can be vendor neutral (as with 
IGES and STEP AP 203) or tied to a popular software product, though in the latter case they are 
typically different from the software’s native format. AutoDesk, for 
example, maintains an exchange 
format called DXF, which is related to but distinct from DWG, the native file format of its AutoCAD 
product.
Feature: A feature in the modelling sense is a generic characteristic or shape with a certain
significance, with implications for its relationship with other features and various other
parametric constraints. Examples might include a curved blend between two surfaces (which
will affect how the boundary behaves under stress) or a keyway (which will need to
accommodate a matching key).
PMI (Product and Manufacturing Information): In the widest sense, this refers to the additional 
information needed to manufacture a part from the shape data present in a 2D drawing or 3D CAD 
model. At a minimum, it includes geometric dimensions and tolerances (which see) but may include 
other annotations, and specifications of finishes and materials.
Shape data: The points, lines, surfaces and solid objects making up the geometric information in a 
CAD model, but not the product and manufacturing information, parametric relationships/properties, 
feature semantics or construction history.
References
Adobe. (2008). PRC Format Specification. Retrieved from 
http://help.adobe.com/livedocs/acrobat_sdk/9/Acrobat9_HTMLHelp/API_References/PRCReference/
PRC_Format_Specification/index.html
AIG. Engineering File Format Registry. 
http://gicl.cs.drexel.edu/index.php/Category:Engineering_format
Ashenfelder, Mike. (2014). Untangling the Knot of CAD Preserv
ation. “The Signal.” The Library of 
Congress. Retrieved from http://blogs.loc.gov/digitalpreservation/2014/08/untangling-the-knot-of-
cad-preservation/
Autodesk. (2007). DXF Reference. Retrieved from         
http://images.autodesk.com/adsk/files/acad_dxf0.pdf
Ball, Alex. (2013). Preserving Computer-Aided Design (CAD). Digital Preservation Coalition 
Technology Watch Report.
Retrieved from http://dx.doi.org/10.7207/twr13-02
Chou, C. C., & Goethals, A. (2012). Document Metadata: document technical metadata for digital 
preservation. Retrieved from http://library.harvard.edu/sites/default/files/documentMD_2012.pdf
Ecma International. (2007). Universal 3D File Format. Retrieved from http://www.ecma-
international.org/publications/files/ECMA-ST/ECMA-363%204th%20Edition.pdf
FACADE. (2009). Final Report for the MIT FACADE Project: October 2006 
August 2009. Retrieved 
from http://www.cvaa.be/sites/default/files/projecten/bijlagen/bib_3896_facade_final.pdf
FITS XML. Retrieved from http://projects.iq.harvard.edu/fits/fits-xml
ISO 10303-21:2002 Industrial automation systems and integration -- Product data representation 
and exchange -- Part 21: Implementation methods: Clear text encoding of the exchange structure.
Open Design Alliance. (2013). Open Design Specification for .dwg files, Version 5.3. Retrieved from 
http://www.opendesign.com/files/guestdownloads/OpenDesign_Specification_for_.dwg_files.pdf
PREMIS Editorial Committee. (2008). PREMIS Data Dictionary for Preservation Metadata. Retrieved 
from http://www.loc.gov/standards/premis/v2/premis-2-0.pdf
Web3D Consortium. (2015). Recommended Standards. Retrieved from            
http://www.web3d.org/standards
Wikipedia. (2015). CAD data exchange. Retrieved from 
http://en.wikipedia.org/wiki/CAD_data_exchange
Documents you may be interested
Documents you may be interested