download pdf c# : Remove metadata from pdf control SDK system azure wpf html console Succeed_600555_WP4_D4.1_RecommendationsOnFormatsAndStandards_v1.14-part110

Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 42/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
also create the main prerequisites for successful preservation actions. Nevertheless the 
question of born-digital newspapers will not be covered by this format. 
Advantages and drawbacks 
The advantages of ENMAP cover: 
ENMAP is based on practical considerations drawn from the experience of 
refining 10 million newspaper pages from 12 European libraries. 
ENMAP clusters different kinds of information about a digital newspaper in 
standardized container formats. 
ENMAP stores information in a way that make it easy to use for various purposes 
(be it refinement, online presentation or preservation). 
Drawbacks include: 
ENMAP may be too comprehensive for smaller institutions who do not have a 
large newspaper collection.  
There may not be many digitisation service providers that can deliver ENMAP 
without additional cost. 
Implementation 
The guidelines are set up and maintained by the Europeana Newspapers project. The 
Europeana Newspapers project is partially funded under the ICT Policy Support 
Programme (ICT PSP, http://ec.europa.eu/ict_psp) as part of the Competitiveness and 
Innovation Framework Programme by the European Community. 
10 million pages of digital newspapers will be produced in the ENMAP format by the 
partners of the Europeana newspapers project.
33
Text Encoding  Initiative 
Overview 
The TEI (Text Encoding Initiative) is an international organization founded in 1987 to 
develop guidelines for encoding machine-readable texts in the humanities and social 
sciences. „TEI‟ is also used to refer to the TEI Guidelines  themselves, and to the set of 
schemas they describe. 
The TEI Guidelines for Electronic Text Encoding and Interchange define and document a 
markup language for representing the structural, renditional and conceptual features of 
texts.  These  guidelines  are  expressed  as  a  modular,  extensible  XML  schema, 
accompanied by detailed documentation, and are published under an open-source 
license. 
33
-
-
Remove metadata from pdf - add, remove, update PDF metadata in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# Developers to Read, Add, Edit, Update and Delete PDF Metadata
pdf keywords metadata; remove metadata from pdf acrobat
Remove metadata from pdf - VB.NET PDF metadata library: add, remove, update PDF metadata in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Enable VB.NET Users to Read, Write, Edit, Delete and Update PDF Document Metadata
read pdf metadata; batch update pdf metadata
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 43/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
Since  1994,  the  TEI  Guidelines  have  been  widely  used  by  libraries,  museums, 
publishers, and individual scholars to present texts for online research, teaching and 
preservation. 
Since 2001, the TEI is organized as a member-funded consortium. Its chief deliverable is 
a set of Guidelines, which specify encoding methods for machine-readable texts.  
The most recent version of the TEI guidelines is known as P5. It was initially released in 
November 2007 and has been updated since then on a six-month cycle. 
Rules and recommendations made in these Guidelines are expressed in terms of what is 
currently the most widely used markup language for digital resources of all kinds: the 
Extensible Markup Language (XML), as defined by the World Wide Web Consortium's 
XML Recommendation. However, the TEI encoding scheme itself does not depend on this 
language; it was originally formulated in terms of SGML (the ISO Standard Generalized 
Markup Language), a predecessor of XML, and may in future years be re-expressed in 
other ways as the field of markup develops and matures. 
TEI customisation 
The TEI provides a number of basic, general-purpose customizations. One of the best-
known of these is TEI Lite. 
TEI Lite has been widely adopted, particularly by beginners and by big institutional 
projects that rely on large teams of encoders to markup their documents. 
Although there is no default schema, TEI P5 does provide a number of example 
customizations which may very well meet your needs, which can be downloaded from the 
TEI web site or from within the Roma interface (see 
Table 18
). 
Table 18 TEI customisations provided by the TEI consortium 
Name 
Description 
TEI Lite 
TEI Lite, the most widely used TEI customization; includes basic elements for 
simple documents 
TEI Tite 
A constrained customization designed for use by keyboarding vendors. 
Bare 
TEI Absolutely Bare, a very barebones schema with the absolute minimum of 
elements 
Corpus 
TEI  for  Linguistic  Corpora,  includes  the  modules  for  encoding  linguistic 
corpora 
MS 
TEI  for  Manuscript  Description,  includes  the  elements  for  describing 
manuscripts and complex physical aspects of documents 
Drama 
TEI with Drama, includes the TEI drama module 
Speech 
TEI for Speech Representation, includes the TEI module for spoken language 
Odds 
TEI for authoring ODD, includes the TEI module for creating ODD files and 
customizations 
allPlus 
TEI with with all modules included, plus all external additions 
TEI + SVG  
TEI with SVG 
TEI + Math 
TEI with MathML 
VB.NET PDF remove image library: remove, delete images from PDF in
Insert Image to PDF. Image: Remove Image from PDF Page. Image: Copy, Paste, Cut Image in Page. Link: Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete
pdf xmp metadata viewer; c# read pdf metadata
VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
Able to remove a single page from adobe PDF document in VB.NET. Ability to remove consecutive pages from PDF file in VB.NET. Enable
clean pdf metadata; edit pdf metadata
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 44/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
TEI + XInclude 
TEI with XInclude 
Usage 
The  recommended  way  to  customize  the  TEI  is  to create a formal  specification 
expressing your customizations, as an XML document using TEI ODD markup; this can 
then be compiled into a suitable DTD, RELAX NG schema or W3C Schema (together 
with the appropriate reference documentation), using the Roma
34
program. Advanced 
users can also create the ODD by hand using normal XML editing tools. 
If, however, you intend to make extensive use of the TEI in conjunction with other 
schemas written in RELAX NG, working directly with the RELAX NG modules is 
probably the best skill to learn. Typical TEI users are more likely to work solely within 
the confines of the TEI, and may need to use DTDs or W3C Schema as well as RELAX 
NG, and so writing customizations in the TEI's own language is usually better. 
There are several important reasons why this high-level method is recommended: 
It is independent of the schema type (DTD, RELAX NG schema, W3C schema) 
and the resulting specification can be used to generate a schema in any of these 
schema languages. 
It lets you document your work using the familiar TEI markup. 
It provides full access to the TEI class system. 
The Roma utilities generate a single, portable, schema file which you can transfer 
to other people without worrying about link dependencies. 
Lexical Markup Framework 
Objectives 
The goals of LMF are to provide a common model for the creation and use of lexical 
resources
35
, to manage the exchange of data between and among these resources, and to 
enable the merging of large number of individual electronic resources to form extensive 
global electronic resources. 
Types  of  individual  instantiations  of  LMF  can  include  monolingual,  bilingual  or 
multilingual lexical resources. The same specifications are to be used for both small and 
large lexicons, for both simple and complex lexicons, for both written and spoken lexical 
representations. 
Description 
LMF is one of the members of the ISO/TC37 family of standards. LMF is composed of the 
following components: 
The core package that is the structural skeleton which describes the basic 
hierarchy of information in a lexical entry. 
Extensions of the core package which are expressed in a framework that 
describes the reuse of the core components in conjunction with the additional 
34
http://www.tei-c.org/Roma/  
35
http://en.wikipedia.org/wiki/Lexical_resource   
C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
console application. Able to remove a single page from PDF document. Ability to remove a range of pages from PDF file. Free trial package
metadata in pdf documents; read pdf metadata java
C# PDF Password Library: add, remove, edit PDF file password in C#
String outputFilePath = Program.RootPath + "\\" Remove.pdf"; // Remove password in the input file and output to a new file. int
adding metadata to pdf; edit pdf metadata acrobat
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 45/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
components required for a specific lexical resource. 
The core package is depicted in Figure 11. 
Figure 11: Core Package of LMF 
The extensions are specifically dedicated to morphology, machine readable dictionary, 
syntax, semantics, multilingual notations, morphological patterns, multiword expression 
patterns, and constraint expression patterns. 
Additional extensions can be defined by users. These should adhere to a number of key 
standards. Data elements should be organized in classes and subclasses and the data 
elements should also be registered as data categories at ISOcat
36
The Open Language Archives Community 
Description 
OLAC, the Open Language Archives Community, is an international partnership of 
institutions and individuals who are creating a worldwide virtual library of language 
resources by:  
36
http://www.isocat.org  
C# PDF bookmark Library: add, remove, update PDF bookmarks in C#.
Ability to remove and delete bookmark and outline from PDF document. Merge and split PDF file with bookmark. Save PDF file with bookmark open.
remove metadata from pdf file; pdf metadata extract
C# PDF remove image library: remove, delete images from PDF in C#.
Insert Image to PDF. Image: Remove Image from PDF Page. Image: Copy, Paste, Cut Image in Page. Link: Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete
pdf metadata extract; rename pdf files from metadata
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 46/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
Developing  consensus  on best current practice for the digital archiving of 
language resources, and  
Developing a network of interoperating repositories and services for housing and 
accessing such resources. 
Standards for metadata 
The OLAC metadata set is based on the Dublin Core (DC) metadata set and uses all 
fifteen elements defined in that standard. To provide greater precision in resource 
description, OLAC follows the DC recommendation for qualifying elements by means of 
element refinements or encoding schemes. 
The qualifiers recommended by DC are applicable across a wide range of resources. 
However, the language resource community has a number of resource description 
requirements that are not met by these general standards. In order to meet these needs, 
members of OLAC have developed community-specific qualifiers, and the community at 
large has adopted some of them as recommended best practice for language resource 
description. These recommended qualifiers are listed in OLAC-Extensions
37
The XML implementation of OLAC metadata follows the "Guidelines for implementing 
Dublin Core in XML". 
Medieval Unicode Font Initiative 
Overview 
The Medieval Unicode Font Initiative
38
is an international workgroup with the goal of 
harmonizing  and  eventually  standardizing  the  encoding  and  display  of  special 
characters, which can be found in historical documents but are not currently part of 
Unicode. 
Goals 
Unicode is today‟s commonly recognized standard for encoding documents which may be 
potentially multilingual and based on multiple scripts. As far as modern languages and 
writing systems are concerned Unicode covers a large number of alphabets and special 
characters. For historical material, however, this support is not quite as complete. The 
lack  of  standardized  code  points  for  such  characters  is a major impediment for 
digitization projects dealing with historical documents. MUFI is therefore pursuing two 
major goals: As a short term solution, unprecedented characters are collected, clarified, 
and assigned a code point in the Private Use Area of Unicode. An important aspect of 
this is to coordinate the allocation of code points and to maintain the character 
recommendation list. As a long term solution, MUFI is proposing such characters to 
Unicode in order for them to be included in future versions of the standard. 
37
http://www.language-archives.org/REC/olac-extensions.html   
38
http://www.mufi.info/  
C# TIFF: TIFF Metadata Editor, How to Write & Read TIFF Metadata
You can also update, remove, and add metadata. List<EXIFField> exifMetadata = collection.ExifFields; You can also update, remove, and add metadata.
change pdf metadata creation date; pdf xmp metadata viewer
VB.NET PDF delete text library: delete, remove text from PDF file
projects. Basically, you can use robust APIs to select a PDF page, define the text character position, and remove it from PDF document.
delete metadata from pdf; pdf metadata editor online
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 47/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
Character recommendations 
MUFI is maintaining a list of current character recommendations which are agreed by 
the workgroup and coordinated with some other initiatives like the TITUS project and 
Junicode. Following these recommendations for characters which are not part of Unicode 
(yet) will minimize the risk of code point collisions (different meaning for the same code 
point)  between  different  digitization  projects  and  software  solutions.  The  MUFI 
character recommendations are provided in alphabetical as well as code chart order
39
Font pages 
Closely related to the maintenance of recommendations is the problem of how to display 
documents using this intermediate character encoding solution. MUFI is therefore also 
working on fonts which provide graphical representations for the above mentioned 
Private Use Area code points as defined in the recommendations
40
3.3 Relevant ERICs 
ERICs play an important role in Europe‟s innovation, especially in the context of joint 
establishment and operation of research infrastructures.  In the following subsections 
practices of two digitization-related ERICs are presented. 
Digital Research Infrastructure  for the Arts and Humanities (DARIAH) 
The Digital Research Infrastructure for the Arts and Humanities (DARIAH) aims to 
facilitate long-term access to, and use of, all European Arts and Humanities (A+H) 
digital research data. The main goals of this initiative is to create an infrastructure of 
people, information, tools, and methodologies for investigating, exploring and supporting 
work across the broad spectrum of the digital humanities. This vision also includes the 
exploration and definition of common standards to ensure interoperability of metadata 
and data across different locations, different disciplines, different scholarly and cultural 
traditions as well as different languages.  
To foster the interoperability of tools in the A+H domain, which may include digital 
objects like text, music, images or other artifacts, DARIAH relies on the widely adopted 
Dublin Core standard in combination with the Text Encoding Initiative (TEI) format. 
Since simple Dublin Core is usually not sufficient to give an extensive description of 
digital objects, domain-specific profiles such as CEI (charters), epiDoc (epigraphic data) 
or MEI (music) are used to provide a more fine-grained description. 
The DARIAH project contributes to the establishment of common standards, comparable 
to TEI, in various research areas to foster the interoperability between the numerous 
institutions. Additionally, DARIAH may also give impulses to the further development of 
TEI such as the treatment of Hebraic texts in TEI (currently developed by the Research 
Data group) or the development of a persistent identifier (PID) meta-resolver. DARIAH 
39
http://www.mufi.info/specs/  
40
http://www.mufi.info/fonts/  
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 48/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
will also organize expert seminars in order to gain feedback from humanities scholars 
concerning the ways in which they use TEI tools, the needs they have for the further 
development of them, with a specific focus on how they wish them to interact with TEI 
markup. 
Common  Language Resources and Technology Infrastructure  (CLARIN) 
Overview 
CLARIN is the short name for the Common Language Resources and Technology 
Infrastructure, which aims at providing easy and sustainable access for scholars in the 
humanities and social sciences to digital language data (in written, spoken, video or 
multimodal form) and advanced tools to discover, explore, exploit, annotate, analyze or 
combine them, independent of where they are located (see http://clarin.eu/). 
Metadata principles 
CLARIN endorses two methods to describe metadata: CMDI, ISOcat. These will be 
described below. 
CLARIN  proposes  the  CLARIN  Metadata  Initiative  (CMDI),  a  component-based 
approach: you can combine several metadata components (sets of metadata elements) 
into a self-defined scheme that suits your particular needs: a profile. Profiles and 
components are stored in a Component Registry to promote reuse.  
There are tools available to convert other existing metadata formats like Dublin Core 
and OLAC to CMDI. 
The data categories mentioned in the metadata (CMDI) should be registered at ISOcat
41
.  
ISO 12620 provides a framework for defining data categories (DC‟s) compliant with the 
ISO/IEC 11179 family of standards. According to this model, each DC is assigned a 
unique administrative identifier, together with information on the status or decision-
making process associated with the DC. In addition, DC specifications in the Data 
Category  Registry  (DCR)  contain  linguistic  descriptions,  such as DC definitions, 
statements  of  associated  value  domains,  and examples. DC specifications can be 
associated with a variety of data element names and with language-specific versions of 
definitions, names, value domains and other attributes. 
3.4 Application  packaging 
Introduction 
Software maintenance is one of the most crucial parts of the software development life-
cycle. Because it is a post-deployment activity it brings a lot of potential risks, including 
loss of applicability, increased complexity or lower quality. Specific challenges that need 
to be faced in this context have been identified by Lehman and stated as a series of laws 
41
http://www.isocat.org  
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 49/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
of software evolution
42
. Some of the key aspects of software maintenance include simple, 
efficient and cost-aware procedures for installation, upgrades, patches and retirement. 
Such activities can be usually performed in an automated manner (supervised by the 
system administrator). Recommended way for such activities is application packaging, 
which means creating operating system aware packages for a particular software tool. 
These packages have a potential to substantially reduce the cost of maintenance, and in 
the context of open-source tools have a potential to increase their take up thanks to 
simplified (in many cases automatic) installation procedure. 
Packaging for Operating Systems 
Operating systems (OS) determine how the application needs to be installed in order to 
work properly. Prescription includes the rules for storing executable files, defining 
dependencies as well as documentation. Multiple tools exist to support building and 
verifying application packages for all the leading operating systems.  
In general there are two types of packages: binary and source. The difference is that the 
binary package is installed as a ready to use executable, while the source package needs 
to be compiled before installation. Source packages are mostly used in Linux-based OS 
and MacOS (e.g. by using MarPorts). In case of Windows it is more common to work with 
binary packages or even ready to run software executables.  
Tools that support creating packages are usually based on scripts and files structure 
(including descriptive files about version, dependencies, etc.) that should be installed 
into the target OS. For example Debian-based Linux OS uses .deb packages, which can 
include various information like metadata about the software, necessary libraries, 
executable files, shell script to run, etc. The final package can be provided as a 
single  .deb  file,  which  can  be  easily  installed,  using  the  OS  build-in  package 
management tool. The .deb package is composed of multiple items, but the most 
important elements are:  
The control file which contains information about the software, including 
dependencies, version, maintainer, short description, install size, etc. 
The copyright file, which contains intellectual property information, especially 
license under which the software is distributed. 
The changelog file consisting of information about all the changes that has been 
performed in the upstream code. 
The rules file stating how the files need to be handled during the build procedure 
in order to actually build a package. 
Documentation files, which include manpages, examples, extended 
documentation, etc. 
There are multiple application packaging tools available for different OS. Most common 
examples, which mostly originate from the open-source community are:  
In case of Debian-based Linux OS: dh tools, lintian, dpkg-deb. 
42
http://users.ece.utexas.edu/~perry/work/papers/feast1.pdf   
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 50/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
In case of MS Windows examples are WiX Toolset, MAKEMSI , NSIS. 
In case of MacOS this can be freely available PackageMaker. 
Packaging for cloud technologies 
Cloud technologies are currently an important element of the IT infrastructures. More 
and more services are offered via cloud technologies, which usually bring reduction of 
costs thanks to optimized consumption of storage and processing resources. In the 
context of digitization it is already visible and present on the market. The examples 
include DuraCloud, Omeka.net or ABBYY Cloud solution.  
Cloud computing is highly based on a virtualization, which enables  cost effective 
management of available hardware components. Virtual servers are usually configured 
using the virtual machine image, which makes it possible to create or  run a new virtual 
servers. The examples cover different formats, including OVF (Open Virtualization 
Format), Amazon Machine Images (AMI), Virtual Disk Image (VDI), QEMU copy-on-
write version 2 (qcow2). Additionally to that there are initiatives, such as Application 
Packaging Standard (APS), which provide standard ways of software packaging for cloud 
Software As A Service (SaaS) model. It means that having the tool packaged according to 
APS it is possible to easily deploy it on any SaaS cloud, which supports the standard. 
Digitization and tools packaging 
Digitization process is usually composed of many steps that are performed manually or 
automatically (e.g. scanning can be done manually, while conversion to delivery format 
can be automated). In order to follow mass digitization practices it is important to 
enhance digitization workflow with as many automated processing as possible. This is 
usually done by integration of new tools and resources into the digitization workflow. For 
the simplicity of the integration process, wider take-up of tools and ease of their further 
maintenance it is important to use packaging techniques. There are already available 
good examples of such an approach, e.g. software packages maintained by Open Planets 
Foundation
43
or IMPACT Center of Competence
44
. Such packages can be directly used to 
deploy or update particular tools on the targeted operating system. 
3.5  Summary  of ongoing and emerging activities 
Recent activities in the context of semantic technologies indicate that it is an important 
aspect for the whole information society. More and more projects and institutions aim at 
leveraging semantic technologies and opening up their data, by making them available 
according to the Linked Open Data paradigm, The Europeana Data Model (EDM) is one 
of  the  most  prominent  examples  that  make it possible to share data in  a more 
informative way than commonly used in Dublin Core based metadata harvesting. There 
are multiple activities around EDM, including  those, which aim at increasing its 
interoperability, e.g. EDM – FRBRoo application profile task force. Another example is 
43
https://bintray.com/openplanets  
44
https://bintray.com/impactocr  
Reccomendations for metadata and data formats for 
online availability and long-term preservation, version 
1.1, 16/01/2014 
Page 51/97 
Succeed is supported by the European Union under FP7-ICT and coordinated by Universidad de Alicante. 
the D2ME project which builds on EDM and therefore makes sure that content delivered 
to  Europeana  by  project  partners  reaches  a  high  level  of  information  and 
interoperability, which is especially valuable in the context of digital humanities (e.g. 
semantic annotations). In the Linked Heritage project the LIDO format has been 
selected as a way of providing digital content to Europeana. One of the criteria, which 
indicated LIDO, was interoperability with EDM. In the context of this project it is 
interesting to note that LIDO seems to be a good solution for quite extensive description 
of digital objects, which covers the needs of various cultural heritage institutions. At the 
same time it provides a good opportunity to expose data with the open data paradigm in 
mind. 
OCR representation and supporting linguistic resources seems to be an important 
element in every digitization project. Preservation of this information is important from 
the perspective of the user (e.g. more possibilities for automated analysis) as well as the 
content holder (e.g. lowering costs by OCR results reuse when producing new delivery 
formats). Current awareness of these needs is limited, as only 11 recommendations and 
practices  (described in section 2) tackled this issue in their documents. The most 
common format for OCR results representation is ALTO. It is widely used by various 
institutions  across  the  world,  including  recent  activities  such  as the Europeana 
Newspaper project. The ALTO format has limitations, which mostly origin from the fact 
that it was designed as a supplement for the METS format. Therefore specific functions 
are assumed to be handled by the METS and not the ALTO format itself (e.g. logical 
structure). The PAGE (Page Analysis and Ground-Truth Elements) is a XML-based 
format framework related to production and evaluation of Optical Character Recognition 
and Document Image Analysis results. One of its goals was to overcome limitations of 
the existing formats (like ALTO). Although the format addresses various needs of OCR 
results representation it is not widely used by the cultural heritage community. Another 
possibility  for  the OCR results representation  are TEI guidelines which provide 
principles for encoding machine-readable texts useful for humanities and social sciences. 
The coverage of the TEI format is extensive, including various features of texts. There 
are multiple customizations of TEI, including TEI for linguistic corpora and TEI lite for 
simple documents. A dedicated format for representing linguistic resources is LMF, 
which is a part of ISO/TC37 family of standards. The OLAC metadata set is developed by 
the institutions, which create virtual library of language resources. The metadata set is 
an extension of the Dublin Core and provides a common way of describing language 
resources, such as corpuses, transcriptions, word lists, etc. 
ERICs relevant in the context of textual resources and digitization investigate various 
approaches  for  improved  research.  DARIAH  is  leveraging  TEI  and Dublin Core 
standards for describing digital objects, and contributes to comparable standards as well. 
CLARIN is focused on language resources and proposes a CLARIN Metadata Initiative 
(CMDI) for describing them.  
The last aspect of the digitization process investigated in this section is application 
packaging, which is highly important element, especially in the context of small and 
medium cultural heritage institutions, where IT expertise is not really advanced. 
Documents you may be interested
Documents you may be interested