Managing Digital Research Data 
Information Literacy Program 
17 
as converting PowerPoint to PDF) may occur. Most archives are able to perform the 
conversion but it is best if the depositor does the conversion to ensure that they are 
happy with the result. 
The time and costs associated with archiving are often underestimated. Each item of 
data deposited will need to have metadata written for it, which will be very time 
consuming if your data consists of several hundred images that were taken some 
years ago. It is therefore best to write metadata as the data is created and to archive 
data continuously rather than leaving it until the end of the project. It is 
recommended that you include the costs of archiving in your grant application. 
4.3.6
... 
Metadata 
Metadata is often described as “data about data”
34
, and helps people to discover, 
understand and re-use data. It can be used to describe physical items as well as 
digital items (files, documents, images, datasets, etc.). It includes descriptive 
metadata, such as title, time, author, keywords, relations to other data objects; 
administrative metadata such as ownership and use permissions; and history of 
changes to the data, versions etc. Good metadata is key for research data access and 
re-use. 
Metadata are usually found in separate file with several text fields that describe the 
attributes of another piece of data, such as an experimental dataset, image, or video. 
Sometimes, metadata is written into source data file itself, such as in jpeg files from 
digital cameras. 
Metadata usually contains at least the following information about the data: 
Filename 
File size (kilobytes, megabytes, etc.) 
File type (LaTeX document, JPEG image, etc.) 
Date of creation 
Author or copyright holder 
Brief description 
Keywords 
You can think of the metadata, in relation to the data it describes, as being analogous 
to the abstract or keywords of a paper – it is there to help people find your data and 
quickly decide if it is what they need. If you want people to find and reuse your data  
(and therefore help you by citing your work), then it is worth your while making good 
metadata in order to ‘sell’ your data. 
Metadata is critical for archiving; most archives will not accept data that does not 
have adequate metadata. Creating metadata at the end of a project is also extremely 
difficult, as you may have to go through several hundred photographs or audio files. 
Metadata should therefore be made as the data is created. 
Metadata schemas/standards include what are considered essential elements to 
describe any data.  A list of commonly used disciplinary standards can be found in the 
ANU Data Management Libguide
35
34
Metadataen.wikipedia.org/wiki/Metadta  
35
http://libguides.anu.edu.au/content.php?pid=372387&sid=3050506 
Extract pages from pdf file - copy, paste, cut PDF pages in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Easy to Use C# Code to Extract PDF Pages, Copy Pages from One PDF File and Paste into Others
copy pages from pdf to word; delete blank page from pdf
Extract pages from pdf file - VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Detailed VB.NET Guide for Extracting Pages from Microsoft PDF Doc
extract page from pdf; delete pages from pdf reader
Managing Digital Research Data 
18 
Information Literacy Program 
5
ANU’s Data Management Services 
This section discusses the various data management services available at the ANU. 
The ANU’s ITS and your Local IT Support Staff (LITSS) provide the majority of the 
data management services. They provide the day-to-day data management services 
like backups and shared drives. 
Data archiving is more specialized and is performed by: ANU Data Commons, the ANU 
Supercomputing Facility (ANUSF), and the Australian Data Archive (ADA). 
The IT Services website
36
contains extensive information on the ANU’s information 
services. 
5.1
Local IT Support Staff (LITSS) 
The majority of your data management needs will be provided by your Local IT 
Support Staff, or LITSS
37
.  
The services that they provide are usually determined by the head of college, so the 
services will vary between colleges and even schools. Most colleges will provide a file 
server and web hosting and employ staff as LITTS
38
A file server is a computer that stores data and makes it accessible to your computer 
via a network connection. Normally it will appear as a mounted drive and behave the 
same as any other directory on your computer. It is recommended that you keep all 
your files on your mounted drive as the file server is automatically backed up at 
regular intervals and is less likely to fail. If you choose to keep your work on the hard-
drive of your desktop/laptop, then you will need to perform the backups yourself. 
If your data is sensitive then you should either store the data on your computer’s 
hard-drive or encrypt the data before placing it on the mounted drive. Your LITSS 
may be able to set up your account to automatically encrypt a directory within your 
mounted drive. If you forget the password it will be impossible to recover the data. 
Most colleges have web servers for hosting faculty and department websites. They 
may also allow academic staff to use these webservers for personal or research group 
websites. This is an easy way to make your publications and datasets available online, 
but it is recommended to store the data in an archive, such as ANU Data Commons, 
and link to it from your website. 
Your LITSS may also provide a mounted drive for collaborative work. Normally a 
fileserver provides a directory that only you can access, but your LITSS may be able 
to set up a mounted drive that several people can contribute to. Using a mounted 
drive creates problems such as keeping track of changes and simultaneous edits. If 
the data is being edited often or there are a large number of people using the data, 
then it is best to use version control software. 
Finally, your LITSS are your first point of contact if you need software for data 
management, such as EndNote database tools, office suits, and conversion tools
39
36
ITS   
37
LITSS Informationits.anu.edu.au/litss/support-model.html  
38
Find LITSSits.anu.edu.au/litss/contacts/  
39
Software Informationinformation.anu.edu.au/daisy/infoservices/8/29.html  
C# PDF File & Page Process Library SDK for C#.net, ASP.NET, MVC
File: Merge PDF; C# File: Split PDF; C# Page: Insert PDF pages; C# Page: Delete PDF pages; C# Read: PDF Text Extract; C# Read: PDF Image
cut pages from pdf file; delete pages of pdf online
C# PDF Text Extract Library: extract text content from PDF file in
to C#: Extract Text Content from PDF File. textMgr = PDFTextHandler.ExportPDFTextManager( doc); // Extract text content for text extraction from all PDF pages.
cut and paste pdf pages; export pages from pdf reader
Managing Digital Research Data 
Information Literacy Program 
19 
5.2
Information Technology Services (ITS) 
Information Technology Services group at the ANU are responsible for the 
undergraduate computer laboratories, the major mail servers, and more. In regards to 
data management, they provide the Homedrive fileserver, Alliance, Wattle and other 
webservers. 
5.2.1
... 
Homedrive 
Homedrive is the main university wide filestore
40
. All research staff and students have 
an account on Homedrive; research staff and research students are allocated 4.5GB of 
space. If your department does not have its own fileserver then you can use 
Homedrive as your mounted drive. 
5.2.2
... 
Alliance 
Alliance is an online collaboration environment
41
. It can be accessed through any web 
browser and provides tools such as a wiki, forums, and calendar. All ANU staff and 
students can log into Alliance and create a ‘project’. The creator of a project can make 
the project public or private and can give read or write access (called access and 
maintain) to individuals. It can be used to collaboratively write documents, discuss 
research on the forums or with the chat tool, and more. 
Alliance is one of the easiest ways to share data between small groups of researchers. 
The data can be accessed from any internet-connected computer and researchers 
outside of ANU can be given a guest account. Alliance limits accepts individual file 
uploads up to 25Mb. 
5.2.3
... 
Webserver 
The ANU IT services group manages over 800 webservers. If your school does not 
have a webserver for staff pages, you can request an account on the main ANU 
webserver. Any website that is a directory of www.anu.edu.au (such as 
www.anu.edu.au/polsci/ and www.anu.edu.au/music/ ) are hosted by the main ANU 
webserver. Personal websites are usually placed in a directory named after your 
University ID number – www.anu.edu.au/~u1234567/ 
40 
https://myfiles.anu.edu.au
41
alliance.anu.edu.au  
VB.NET PDF Text Extract Library: extract text content from PDF
Extract and get partial and all text content from PDF file. Extract highlighted text out of PDF document. Extract Text Content from PDF File in VB.NET.
cut pdf pages online; extract pages from pdf online tool
C# PDF Page Insert Library: insert pages into PDF file in C#.net
Add and Insert Blank Pages to PDF File in C#.NET. This C# demo explains how to insert empty pages to a specific location of current PDF file.
delete page from pdf acrobat; export one page of pdf preview
Managing Digital Research Data 
20 
Information Literacy Program 
5.3
Information Literacy Program 
The Information Literacy Program (ILP) provides a variety of resources for training 
staff and students in Digital and Information Literacy
42
. These include instructor-led 
training courses and online training courses
43
Several training courses are offered that can assist in data management: 
Microsoft Office – Word, Excel, PowerPoint (Presentation Techniques) 
EndNote – Reference management software for Microsoft Word 
NVivo – Qualitative data organization tool  
SPSS – Statistical analysis software 
Internet and Research – How to use internet searches effectively 
Search Strategies and Subject Databases/ Scholarly Information Online– How 
to use online databases effectively 
5.4
Open Research@ANU 
Open Research@ANU, (formerly known as ANU Digital Collections) is the designated 
institutional repository of the University
44
It provides long-term storage and dissemination of ANU research publications. Open 
Research@ANU has its own search tools (accessible via web interface) and is indexed 
by major search engines such as Google, thus increasing the likelihood of your 
research being re-used. 
Open Research@ANU holds, for example, ANU Digital Theses, journal articles, 
conference papers and more. Contact Open Research@ANU staff at 
repository.admin@anu.edu.au if you would like to add your research to the online 
collection.  Increasingly, funding agencies are requiring research results be made 
available in institutional repositories.  For further information, contact repository staff 
on X59729. 
5.5
ANU Data Commons 
The ANU Data Commons provides a specialist data archiving service, providing long 
term storage of research data. Data can be uploaded in a number of ways and 
specialist upload facilities are available to both upload large datasets, large numbers 
of files, or data generated by research instruments. 
Data stored within the Data Commons can be either public, private or available by 
request, ie people can search for and find the metadata description, but need to ask 
you directly for permission to access the data itself. 
The Data Commons can create Digital Object Identifiers as an aid to data citation and 
can also publish your metadata record to Research Data Australia to aid discovery 
Further information, as well as links to user documentation, is available online at 
http://itservices.anu.edu.au/research-computing/anu-data-commons/ 
42
ILP (Information Literacy Program)anulib.anu.edu.au/research-learn 
43
ILP Trainingtraining.anu.edu.au  
44
Open Research@ANUhttp://openresearch.anu.edu.au/  
VB.NET PDF Page Insert Library: insert pages into PDF file in vb.
Moreover, you may use the following VB.NET demo code to insert multiple pages of a PDF file to a PDFDocument object at user-defined position.
copy page from pdf; extract one page from pdf reader
C# PDF File Split Library: Split, seperate PDF into multiple files
note, PDF file will be divided from the previous page of your defined page number which starts from 0. For example, your original PDF file contains 4 pages.
extract pages from pdf acrobat; extract page from pdf document
Managing Digital Research Data 
Information Literacy Program 
21 
5.6
National Computational Infrastructure (NCI) 
The National Computational Infrastructure (NCI
45
) is Australia’s national research 
computing  facility, providing world-class services to Australian researchers, 
industry and government. 
NCI is home to the Southern Hemisphere’s most highly-integrated supercomputer 
and filesystems, Australia’s highest performance research cloud, and one of the 
nation’s largest data catalogues—all supported by an expert team. 
The NCI provides: 
Compute facilities for intensive processing or analysis 
Mass Data Storage Facilities (MDSS) for projects with large data 
requirements (greater than 20Gb) 
Dataset hosting for very large datasets of national significance 
Consultancy and training to help people solve complex problems and to help 
them use the facilities 
Use of NCI is usually free to ANU researchers upon application for an account
46
Resources are allocated through the National Computational Merit Allocation 
Scheme (NCMAS)
47
, or the Australian National University Allocation Scheme
48
Applications are submitted online
48
5.7
Australian Data Archive (ADA) 
The Australian Data Archive (ADA) — now incorporating the Australian Social Science 
Data Archive — is a consortium of leading national Australian universities, managed 
by the Australian National University (ANU). 
ADA employs a team of professional data archivists, advised by a panel of leading 
social scientists, provides both stewardship and outreach services to the Australian 
community. The archive: 
acquires, documents, preserves and disseminates data online to a broad range 
of social science researchers in the university, government, and other sectors 
provides the only comprehensive social science data collection in Australia, with 
a catalogue of over 2000 data sets 
holds data from Australian surveys, opinion polls and censuses and includes 
data from other countries within the Asia Pacific region 
provides specialist services within specific subject areas, including Indigenous 
studies, electoral behaviour, criminology and some humanities disciplines, and 
within specific data types, including quantitative, qualitative, time series and 
panel data, and historical statistics 
locates and manages access to overseas social science data sets required by 
Australian based researchers 
plays an important role on behalf of the Australian Research Council (ARC) 
through the management and dissemination of ARC funded data collections 
arising from Discovery and Linkage grants 
45
NCI (National Computational Infrastructure), nci.org.au 
46
my.nci.org.au/mancini 
47
https://my.nci.org.au/anu/ 
48
https://ncmas.nci.org.au/2016/ 
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
Page, a Region on a Page, and PDF Document. C#.NET extract image from multiple page adobe PDF file library for Visual Studio .NET.
copy web pages to pdf; delete pages from pdf file online
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
By using RsterEdge XDoc PDF SDK for .NET, VB.NET users are able to extract image from PDF page or file and specified region on PDF page, then get image
convert selected pages of pdf to word; acrobat export pages from pdf
Managing Digital Research Data 
22 
Information Literacy Program 
5.8
Australian National Data Service (ANDS) 
The ANU is a partner in the ANDS initiative, which engages in partnerships with 
the research institutions to enable better local data management that enables 
structured data collections to be created and published
49
. These connected 
data collections, together with the shared national infrastructure, form the 
Australian Research Data Commons. 
Data collections can be searched using the Research Data Australia (RDA) 
service
50
ANU students and staff can publish their data into the RDA
51
by contacting 
ANDS
52
49
ANDS (Australian National Data Service)www.ands.org.au/  
50
RDA (Research Data Australia)
https://researchdata.ands.org.au/
51
Publish My Datawww.ands.org.au/services/publish-my-data.html  
52
services@ands.org.au 
Managing Digital Research Data 
Information Literacy Program 
23 
6
Writing a Data Management Plan 
This chapter gives an outline for a generic data management plan. Each project will be 
different and have different types of data, so some sections may not apply. 
Remember that a data management plan is a living document and should be reviewed 
and updated regularly, especially if unforeseen data is collected. 
The recommended structure for a data management plan is as follows: 
1.
Project description 
2.
Survey of existing data 
3.
Data to be created 
Data organization methods (optional) 
4.
Data administration issues: 
a.
Funding and legislative requirements 
b.
Data owners and stakeholders 
c.
Access and security 
d.
Backups 
5.
Data sharing and archiving 
6.
Responsibilities 
7.
Budget 
Project description 
Write a few paragraphs about the research project to give some perspective to the 
remainder of the plan. Use this section to introduce any terminology that will be used 
in the DMP. 
6.1
Survey of existing data 
Whilst not compulsory, it is good practice to see if there are existing data that could 
replace or augment the data you are planning to create. For example, in the UK it is a 
condition of Economic and Social Research Council (ESRC) grants that you conduct a 
review of the UK Data Archive to ensure that the data you are planning to create does 
not already exist. 
Have you searched the web and data archives for similar datasets? 
Are there any datasets that could assist with your research? 
How do the existing datasets fail to meet your requirements and therefore 
require new data to be created? 
6.2
Data to be created 
You should list all the data that will be created during the project. The remainder of 
the DMP then deals with how each item of data will be managed. 
6.3
Data organization methods 
Data organization methods are largely a matter of personal preference and will usually 
not be of interest to the recipients of the DMP. The exception would be if resources 
were required for IT infrastructure, software, or training. 
Managing Digital Research Data 
24 
Information Literacy Program 
6.4
Data administration issues 
6.4.1
... 
Funding and legislative requirements 
List any relevant policies. Some policies (such as data archiving) are relevant to all 
research projects, whereas privacy will usually be associated with medical and social 
science projects. 
Does any of your data contain personal information that must be kept 
confidential? 
Does your funding agreement require data archiving? 
Are there any other data management requirements in your funding 
agreement? 
6.4.2
... 
Data owners and stakeholders 
List the owners and stakeholders of the data. Also note who will own any intellectual 
property created by your research. 
6.4.3
... 
Access and security 
List who will have access to the research data and what access permissions they will 
have for specific data. If the data will be distributed at some point, list the access 
restrictions and any embargoes that will be used. 
Describe how the access permissions will be enforced and what IT security practices 
will be used. If you have sensitive data, describe any special measures used to store 
and backup this data. 
Is any data of a sensitive nature? 
What are the implications of unauthorized access to this data? 
Are there any safe measures warranted? (encryption, external hard-drive in 
locked cabinet/safe) 
6.4.4
... 
Backups 
List what data will be backed up and what the backup schedule is. Also mention if any 
data will be kept under version control and how that will be implemented. 
Is there a backup service already available or will you need to do it yourself? 
How often will backups occur? 
Who will be responsible for performing backups? 
How will sensitive data be backed up? 
6.5
Data sharing and archiving 
6.5.1
... 
File formats, standards and conventions 
List what formats, standards, and conventions will apply to each data item. Justify the 
use of particular formats in terms of usability, longevity, suitability for archiving. 
Will other researchers be able to use this format? 
Will this format be usable in ten years time? 
Does your archive accept this file format or can you easily convert to an 
acceptable format? 
Managing Digital Research Data 
Information Literacy Program 
25 
6.5.2
... 
Sharing 
List what data will be made available for other researchers to use. 
What data will be shared? 
What facilities will be used/required to distribute the data? 
How will the data be licensed? 
What access restrictions will be placed on each item of data? 
6.5.3
... 
Archiving and disposal 
Estimate the amount of storage space required for archiving, which archive you intend 
to use, and whether or not you have discussed your project with the archive manager. 
If the data is sensitive, describe how you will ensure the data will be safely disposed. 
Which archive service will be used? 
How long must you keep your data archived for? 
When do you plan to archive each item and will they have an embargo period? 
How much time and resources will be required for archiving? 
What metadata will be needed for each data type? 
6.6
Responsibilities 
List who will be responsible for ensuring each item in the data management plan is 
carried out. Also note who is responsible for reviewing and modifying the data 
management plan. 
6.7
Budget 
Now that the data management methods and responsibilities have been established, 
you can estimate the costs of data management for your project. Often the time 
involved in documenting, writing metadata, and archiving are underestimated. Make 
note of any costs associated with using data management services or purchasing 
equipment (such as fileservers, backup media, software, etc.) used for data 
management. 
Managing Digital Research Data 
26 
Information Literacy Program 
7
Glossary of Terms 
AIATSIS Australian Institute of Aboriginal and Torres Strait Islander 
Studies 
Alliance Online collaborative environment for ANU staff and students 
ANUSF ANU Supercomputer Facility 
APAC Australian Partnership for Advanced Computing 
ARC Australian Research Council 
Archive Digital Archive 
ASEDA Aboriginal Studies Electronic Data Archive 
ASSDA Australian Social Sciences Data Archive 
Backup A copy of data kept for recovery in case of accidental deletion or 
loss of data 
Bazaar A distributed version control system for collaborative tracking of 
project history 
BibTeX A software tool and a file format for generating bibliographies in 
LaTeX 
Binary file A file that cannot be read without appropriate software, contrast 
with a text file which can be read with any text editor 
BlueNet Australian data archive for the marine sciences 
CAI Computer Assisted Interview - a computer program which helps direct 
an interview based n the responses given 
CD Compact Disc – the oldest form of optical disc, can store 700Mb 
CiteSeer Online scientific literature digital library 
Client A program used to interact with a server. For example, an FTP client 
is needed to download and upload files to an FTP server. 
Creative Commons An organization that provides generic licenses for 
freely distributed data 
Data Digital research data 
Dataset A collection of related data such as tables of numeric data or a 
group of related images 
Data administration Anything done to protect data or enhance the quality 
of data 
Data management Anything outside of using the data, such as organizing, 
protecting, sharing and archiving data 
Data organization Tools and techniques for working more efficiently with 
data 
Data sharing Actively making research data available for use by other 
researchers 
Desktop The most common type of PC (personal computer) 
DocBook An XML file format for documents 
DVD Digital Versatile Disc – an optical disc used for storing data, can store 
4.7Gb or roughly 7 CDs 
Encryption Making data unreadable to anyone without the correct 
password or encryption key 
EndNote Software tool for managing bibliography databases and 
generating bibliographies in MS Word documents 
Excel Microsoft Excel, software tool for working with spreadsheets 
Documents you may be interested
Documents you may be interested