ado.net pdf c# : Export excel to pdf with bookmarks software application cloud windows html azure class bizer-heath-berners-lee-ijswis-linked-data0-part728

Linked Data - The Story So Far
Christian Bizer, Freie Universität Berlin, Germany
Tom Heath,Talis Information Ltd, United Kingdom
Tim Berners-Lee, Massachusetts Institute of Technology, USA
This is a preprint of a paper to appear in: Heath, T., Hepp, M., and Bizer, C. (eds.). Special
Issue on Linked Data, International Journal on Semantic Web and Information Systems
(IJSWIS). http://linkeddata.org/docs/ijswis-special-issue
Abstract
The term Linked Data refers to a set of best practices for publishing and connecting
structured data on the Web. These best practices have been adopted by an increasing
number of data providers over the last three years, leading to the creation of a global data
space containing billions of assertions - the Web of Data. In this article we present the
concept and technical principles of Linked Data, and situate these within the broader context
of related technological developments. We describe progress to date in publishing Linked
Data on the Web, review applications that have been developed to exploit the Web of Data,
and map out a research agenda for the Linked Data community as it moves forward.
Keywords:Linked Data, Web of Data, Semantic Web, Data Sharing, Data Exploration
1. Introduction
The World Wide Web has radically altered the way we share knowledge by lowering the
barrier to publishing and accessing documents as part of a global information space.
Hypertext links allow users to traverse this information space using Web browsers, while
search engines index the documents and analyse the structure of links between them to
infer potential relevance to users' search queries (Brin & Page, 1998). This functionality has
been enabled by the generic, open and extensible nature of the Web (Jacobs & Walsh,
2004), which is also seen as a key feature in the Web's unconstrained growth.
Despite the inarguable benefits the Web provides, until recently the same principles that
enabled the Web of documents to flourish have not been applied to data. Traditionally, data
published on the Web has been made available as raw dumps in formats such as CSV or
XML, or marked up as HTML tables, sacrificing much of its structure and semantics. In the
conventional hypertext Web, the nature of the relationship between two linked documents is
implicit, as the data format, i.e. HTML, is not sufficiently expressive to enable individual
entities described in a particular document to be connected by typed links to related
entities.
However, in recent years the Web has evolved from a global information space of linked
documents to one where both documents and data are linked. Underpinning this evolution is
a set of best practices for publishing and connecting structured data on the Web known as
Export excel to pdf with bookmarks - add, remove, update PDF bookmarks in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Your C# Project with Rapid PDF Internal Navigation Via Bookmark and Outline
how to add bookmarks on pdf; add bookmarks to pdf file
Export excel to pdf with bookmarks - VB.NET PDF bookmark library: add, remove, update PDF bookmarks in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Your VB.NET Project with Rapid PDF Internal Navigation Via Bookmark and Outline
bookmarks in pdf from word; bookmark pdf reader
Linked Data. The adoption of the Linked Data best practices has lead to the extension of the
Web with a global data space connecting data from diverse domains such as people,
companies, books, scientific publications, films, music, television and radio programmes,
genes, proteins, drugs and clinical trials, online communities, statistical and scientific data,
and reviews. This Web of Data enables new types of applications. There are generic Linked
Data browsers which allow users to start browsing in one data source and then navigate
along links into related data sources. There are Linked Data search engines that crawl the
Web of Data by following links between data sources and provide expressive query
capabilities over aggregated data, similar to how a local database is queried today. The Web
of Data also opens up new possibilities for domain-specific applications. Unlike Web 2.0
mashups which work against a fixed set of data sources, Linked Data applications operate
on top of an unbound, global data space. This enables them to deliver more complete
answers as new data sources appear on the Web.
The remainder of this paper is structured as follows. In Section 2 we provide an overview
of the key features of Linked Data. Section 3 describes the activities and outputs of the
Linking Open Data project, a community effort to apply the Linked Data principles to data
published under open licenses. The state of the art in publishing Linked Data is reviewed in
Section 4, while section 5 gives an overview of Linked Data applications. Section 6
compares Linked Data to other technologies for publishing structured data on the Web,
before we discuss ongoing research challenges in Section 7.
2. What is Linked Data?
In summary, Linked Data is simply about using the Web to create typed links between data
from different sources. These may be as diverse as databases maintained by two
organisations in different geographical locations, or simply heterogeneous systems within
one organisation that, historically, have not easily interoperated at the data level.
Technically, Linked Data refers to data published on the Web in such a way that it is
machine-readable, its meaning is explicitly defined, it is linked to other external data sets,
and can in turn be linked to from external data sets.
While the primary units of the hypertext Web are HTML (HyperText Markup Language)
documents connected by untyped hyperlinks, Linked Data relies on documents containing
data in RDF (Resource Description Framework) format (Klyne and Carroll, 2004). However,
rather than simply connecting these documents, Linked Data uses RDF to make typed
statements that link arbitrary things in the world. The result, which we will refer to as the
Web of Data, may more accurately be described asa web of things in the world, described
by data on the Web.
Berners-Lee (2006) outlined a set of 'rules' for publishing data on the Web in a way that all
published data becomes part of a single global data space:
1. Use URIs as names for things
2. Use HTTP URIs so that people can look up those names
3. When someone looks up a URI, provide useful information, using the standards
(RDF, SPARQL)
4. Include links to other URIs, so that they can discover more things
These have become known as the 'Linked Data principles', and provide a basic recipe for
publishing and connecting data using the infrastructure of the Web while adhering to its
architecture and standards.
VB.NET PDF File Compress Library: Compress reduce PDF size in vb.
document file. Remove bookmarks, annotations, watermark, page labels and article threads from PDF while compressing. Also a preview
how to bookmark a pdf file; convert word to pdf with bookmarks
VB.NET PDF File Split Library: Split, seperate PDF into multiple
Demo Code in VB.NET. The following VB.NET codes explain how to split a PDF file into multiple ones by PDF bookmarks or outlines.
adding bookmarks to pdf reader; export excel to pdf with bookmarks
The Linked Data Technology Stack
Linked Data relies on two technologies that are fundamental to the Web: Uniform Resource
Identifiers (URIs) (Berners-Lee et al., 2005) and the HyperText Transfer Protocol (HTTP)
(Fielding et al., 1999). While Uniform Resource Locators (URLs) have become familiar as
addresses for documents and other entities that can be located on the Web, Uniform
Resource Identifiers provide a more generic means to identify any entity that exists in the
world.
Where entities are identified by URIs that use thehttp://scheme, these entities can be
looked up simply by dereferencing the URI over the HTTP protocol. In this way,the HTTP
protocol provides a simple yet universal mechanism for retrieving resources that can be
serialised as a stream of bytes (such as a photograph of a dog), or retrieving descriptions of
entitiesthat cannot themselves be sent across the network in this way(such as the dog
itself).
URIs and HTTP are supplemented by a technology that is critical to the Web of Data – RDF,
introduced above. Whilst HTML provides a means to structure and link documents on the
Web, RDF provides a generic, graph-based data model with which to structure and link data
that describes things in the world.
The RDF model encodes data in the form ofsubject,predicate,objecttriples. The subject
and object of a triple are both URIs that each identify a resource, or a URI and a string
literal respectively. The predicate specifies how the subject and object are related, and is
also represented by a URI.
For example, an RDF triple can state that two people,AandB, each identified by a URI, are
related by the fact thatAknowsB. Similarly an RDF triple may relate a personCto a
scientific articleDin a bibliographic database by stating thatCis the author ofD. Two
resources linked in this fashion can be drawn from different data sets on the Web, allowing
data in one data source to be linked to that in another, thereby creating a Web of Data.
Consequently it is possible to think of RDF triples that link items in different data sets as
analogous to the hypertext links that tie together the Web of documents.
RDF links(Bizer & Cyganiak & Heath, 2007)take the form of RDF triples, where the subject
of the triple is a URI reference in the namespace of one data set, while the object of the
triple is a URI reference in the other. Figure 1 shows two example RDF links. The first link
states that a resource identified by the URIhttp://www.w3.org/People/Berners-Lee/card#i
is member of another resource calledhttp://dig.csail.mit.edu/data#DIG. When the subject
URI is dereferenced over the HTTP protocol,thedig.csail.mit.eduserver answers with a RDF
description of the identified resource, in this case the MIT Decentralized Information Group.
When the object URI is dereferenced the W3C server provides an RDF graph describing Tim
Berners-Lee. Dereferencing the predicate URIhttp://xmlns.com/foaf/0.1/memberyieldsa
definition of the link typemember, described in RDF using theRDF Vocabulary Definition
Language (RDFS), introduced below.The second RDF link connects the description of the
film Pulp Fiction in the Linked Movie Database with the description of the film provided by
DBpedia, by stating that the URIhttp://data.linkedmdb.org/resource/film/77and the URI
http://dbpedia.org/resource/Pulp_Fiction_%28film%29refer to the same real-world entity -
the film Pulp Fiction.
C# PDF File Split Library: Split, seperate PDF into multiple files
Split PDF file by top level bookmarks. The following C# codes explain how to split a PDF file into multiple ones by PDF bookmarks or outlines.
adding bookmarks to pdf; excel pdf bookmarks
C# PDF File Compress Library: Compress reduce PDF size in C#.net
NET framework. Remove bookmarks, annotations, watermark, page labels and article threads from PDF while compressing. C# class demo
pdf bookmarks; pdf export bookmarks
Subject: http://dig.csail.mit.edu/data#DIG
Predicate:http://xmlns.com/foaf/0.1/member
Object: http://www.w3.org/People/Berners-Lee/card#i
Subject: http://data.linkedmdb.org/resource/film/77
Predicate: http://www.w3.org/2002/07/owl#sameAs
Object: http://dbpedia.org/resource/Pulp_Fiction_%28film%29
Figure 1. Example RDF links
The RDF Vocabulary Definition Language (RDFS) (Brickley & Guha, 2004) and the Web
Ontology Language (OWL) (McGuinness & van Harmelen, 2004) provide a basis for creating
vocabularies that can be used to describe entities in the world and how they are related.
Vocabularies are collections of classes and properties. Vocabularies are themselves
expressed in RDF, using terms from RDFS and OWL, which provide varying degrees of
expressivity in modelling domains of interest. Anyone is free to publish vocabularies to the
Web of Data(Berrueta &Phipps, 2008), which in turn can be connected by RDF triples that
link classes and properties in one vocabulary to those in another, thereby defining mappings
between related vocabularies.
By employing HTTP URIs to identify resources, the HTTP protocol as retrieval mechanism,
and the RDF data model to represent resource descriptions, Linked Data directly builds on
the general architecture of the Web (Jacobs & Walsh, 2004). The Web of Data can therefore
be seen as an additional layer that is tightly interwoven with the classic document Web and
has many of the same properties:
• The Web of Data is generic and can contain any type of data.
• Anyone can publish data to the Web of Data.
• Data publishers are not constrained in choice of vocabularies with which to
represent data.
• Entities are connected by RDF links, creating a global data graph that spans data
sources and enables the discovery of new data sources.
From an application development perspective the Web of Data has the following
characteristics:
• Data is strictly separated from formatting and presentational aspects.
• Data is self-describing. If an application consuming Linked Data encounters data
described with an unfamiliar vocabulary, the application can dereference the URIs
that identify vocabulary terms in order to find their definition.
• The use of HTTP as a standardized data access mechanism and RDF as a
standardized data model simplifies data access compared to Web APIs, which rely
on
heterogeneousdata models and access interfaces.
• The Web of Data is open, meaning that applications do not have to be implemented
against a fixed set of data sources, but can discover new data sources at run-time
by following RDF links.
3. The Linking Open Data Project
The most visible example of adoption and application of the Linked Data principles has been
the Linking Open Data project [Endnote: http://esw.w3.org/topic/SweoIG/TaskForces/
C# PDF Convert to HTML SDK: Convert PDF to html files in C#.net
Export PDF images to HTML images. The HTML document file, converted by C#.NET PDF to HTML SDK, preserves all the original anchors, links, bookmarks and font
bookmark pdf in preview; how to add bookmarks to pdf document
How to C#: Basic SDK Concept of XDoc.PDF for .NET
C# programmers can convert Word, Excel, PowerPoint Tiff, Jpeg, Bmp, Png, and Gif to PDF document. This class describes bookmarks in a PDF document.
add bookmarks to pdf online; add bookmark pdf
CommunityProjects/LinkingOpenData], a grassroots community effort founded in January
2007 and supported by the W3C Semantic Web Education and Outreach Group [Endnote:
http://www.w3.org/2001/sw/sweo/]. The original and ongoing aim of the project is to
bootstrap the Web of Data by identifying existing data sets that are available under open
licenses, converting these to RDF according to the Linked Data principles, and publishing
them on the Web.
Participants in the early stages of the project were primarily researchers and developers in
university research labs and small companies. Since that time the project has grown
considerably, to include significant involvement from large organisations such as the BBC,
Thomson Reuters and the Library of Congress. This growth is enabled by the open nature of
the project, where anyone can participate simply by publishing a data set according to the
Linked Data principles and interlinking it with existing data sets. An indication of the range
and scale of the Web of Data originating from the Linking Open Data project is provided in
Figure 2. Each node in this cloud diagram represents a distinct data set published as Linked
Data, as of March 2009.
Figure 2. Linking Open Data cloud diagram giving an overview of published data sets and
their interlinkage relationships.
The arcs in Figure 2 indicate that links exist between items in the two connected data sets.
Heavier arcs roughly correspond to a greater number of links between two data sets, while
bidirectional arcs indicate the outward links to the other exist in each data set.
C# Create PDF Library SDK to convert PDF from other file formats
create searchable PDF document from Microsoft Office Word, Excel and PowerPoint. Create and save editable PDF with a blank page, bookmarks, links, signatures
bookmarks in pdf reader; bookmarks pdf reader
VB.NET PDF: Basic SDK Concept of XDoc.PDF
VB.NET programmers can convert Word, Excel, PowerPoint Tiff, Jpeg, Bmp, Png, and Gif to PDF document. This class describes bookmarks in a PDF document.
how to add bookmark in pdf; create bookmark in pdf automatically
The content of the cloud is diverse in nature, comprising data about geographic locations,
people, companies, books (Bizer & Cyganiak & Gauss, 2007), scientific publications (Van de
Sompel et al., 2009), films (Hassanzadeh & Consens, 2009), music, television and radio
programmes (Kobilarov et al, 2009), genes, proteins, drugs and clinical trials(Belleau et al.,
2008, Jentzsch et al., 2009), online communities, statistical data, census results, and
reviews (Heath & Motta, 2008).
Calculating the exact size of the Web of Data is challenging due to the fact that much of the
data is being generated by wrappers around existing relational databases or APIs and
therefore first need to be crawled before it can be counted or analyzed (Hausenblas et al.,
2008). Alternatively, the size of the Web of Data can be estimated based on the data set
statistics that are collected by the LOD community in the ESW wiki. According to these
statistics, the Web of Data currently consists of 4.7 billion RDF triples, which are interlinked
by around 142 million RDF links (May 2009). [Endnote:
http://esw.w3.org/topic/
TaskForces/CommunityProjects/LinkingOpenData/DataSets/LinkStatistics
and
http://esw.w3.org/topic/TaskForces/CommunityProjects/LinkingOpenData/DataSets/
Statistics
]
As Figure 2 shows, certain data sets serve as linking hubs in the Web of Data. For example,
the DBpedia data set (Auer et al., 2007) consists of RDF triples extracted from the
"infoboxes" commonly seen on the right hand side of Wikipedia articles, while Geonames
[Endnote: http://www.geonames.org/ontology/] provides RDF descriptions of millions of
geographical locations worldwide. As these two data sets provide URIs and RDF descriptions
for many common entities or concepts, they are frequently referenced in other more
specialised data sets and have therefore developed into hubs to which an increasing number
of other data sets are connected.
4. Publishing Linked Data on the Web
By publishing data on the Web according to the Linked Data principles, data providers add
their data to a global data space, which allows data to be discovered and used by various
applications. Publishing a data set as Linked Data on the Web involves the following three
basic steps:
1. Assign URIs to the entities described by the data set and provide for dereferencing these
URIs over the HTTP protocol into RDF representations.
2. Set RDF links to other data sources on the Web, so that clients can navigate the Web of
Data as a whole by following RDF links.
3. Provide metadata about published data, so that clients can assess the quality of
published data and choose between different means of access.
In the following, we will give an overview about each of these tasks as well as about tools
that have been developed to support publishers with each task.
Choosing URIs and RDF Vocabularies
Data providers can choose between two HTTP URI usage patterns to identify entities: 303
URIs and hash URIs. Both patterns ensure that clients can distinguish between URIs that
identify real-world entities and URIs that identify Web documents describing these real-
world entities(Sauermann & Cyganiak, 2008).In an open environment like the Web,
different information providers publish data about the same real-world entity, for instance a
geographic location or a celebrity. As they may not know about each other, they introduce
different URIs to identify the same entitiy. For instance, DBpedia uses the URI
http://dbpedia.org/resource/Berlinto identify Berlin, while Geonames uses the URI
http://sws.geonames.org/2950159/to identify Berlin. As both URIs refer to the same real-
world entity, they are called URI aliases. URI aliases are common on the Web of Data, as it
can not realistically be expected that all information providers agree on the same URIs to
identify an entity. URI aliases also provide an important social function to the Web of Data
as they are dereferenced to different descriptions of the same real-world entity and thus
allow different views and opinions to be expressed on the Web. In order to still be able to
track that different information providers speak about the same entity, it is common
practice that information providers setowl:sameAslinks to URI aliases they know about.
Different communities have specific preferences on the vocabularies they prefer to use for
publishing data on the Web. The Web of Data is therefore open to arbitrary vocabularies
being used in parallel. Despite this general openness, it is considered good practice to reuse
terms from well-known RDF vocabularies such as FOAF, SIOC,SKOS,DOAP, vCard, Dublin
Core, OAI-ORE orGoodRelationswherever possible in order to make it easier for client
applications to process Linked Data. Only if these vocabularies do not provide the required
terms should data publishers define new, data source-specific terminology (Bizer &
Cyganiak & Heath, 2007). If new terminology is defined, it should be made self-describing
by making the URIs that identify terms Web dereferencable (Berrueta & Phipps, 2008). This
allows clients to retrieve RDF Schema or OWL definitions of the terms as well as term
mappings to other vocabularies. The Web of Data thus relies on a pay as you go data
integration approach (Das Sarma & Dong & Halevy, 2008) based on a mixture of using
common vocabularies together with data source-specific terms that are connected by
mappings as deemed necessary.
A common serialization format for Linked Data is RDF/XML (Beckett, 2004). In situations
where human inspection of RDF data is required, Notation3 (Berners-Lee, 1998), and its
subset Turtle (Beckett and Berners-Lee, 2008), are often provided as alternative, inter-
convertible serializations, due to the greater perceived readability of these formats.
Alternatively, Linked Data can also be serialized as RDFa (Adida et al., 2008) which provides
for embedding RDF triples into HTML. In the second case, data publishers should use the
RDFaaboutattribute to assign URIs to entities in order to allow other data providers to set
RDF links to them.
Link Generation
RDF links allow client applications to navigate between data sources and to discover
additional data. In order to be part of the Web of Data, data sources should set RDF links to
relatedentitiesin other data sources. As data sources often provide information about large
numbersof entities, it is common practice to use automated or semi-automated approaches
to generate RDF links.
In various domains, there are generally accepted naming schemata. For instance, in the
publication domain there are ISBNand ISSN numbers, in the financial domain there are
ISINidentifiers, EAN and EPC codes are widely used to identify products, in life science
various accepted identification schemata exist for genes, molecules, and chemical
substances. If the link source and the link target data sets already both support one of
these identification schema, the implicit relationship between entities in both data sets can
easily be made explicit as RDF links. This approach has been used to generate links between
various data sources in the LOD cloud.
If no shared naming schema exist, RDF links are often generated based on the similarity of
entities within both data sets. Such similarity computations can build on a large body of
related work on record linkage (Winkler, 2006) and duplicate detection (Elmagarmid et al.,
2007) within the database community as well as on ontology matching (Euzenat & Shvaiko,
2007) in the knowledge representation community. An example of a similarity based
interlinking algorithm is presented in (Raimond et al., 2008). In order to set RDF links
between artists in the Jamendo and Musicbrainz data sets, the authors use a similarity
metric that compares the names of artists as well as the titles of their albums and songs.
Various RDF link generation frameworks are available, that provide declarative languages
for specifying which types of RDF links should be created, which combination of similarity
metrics should be used to compare entities and how similarity scores for specific properties
are aggregated into an overall score. The Silk framework (Volz et al., 2009) works against
local and remote SPARQL [Endnote:http://www.w3.org/TR/rdf-sparql-query/]endpoints
and is designed to be employed in distributed environments without having to replicate data
sets locally. The LinQL framework (Hassanzadeh et al., 2009) works over relational
databases and is designed to be used together with database to RDF mapping tools such as
D2R Server or Virtuoso.
Metadata
Linked Data should be published alongside several types of metadata, in order to increase
its utility for data consumers. In order to enable clients to assess the quality of published
data and to determine whether they want to trust data, data should be accompanied with
meta-information about its creator, its creation date as well as the creation method (Hartig,
2009). Basic provenance meta-information can be provided using Dublin Core terms or the
Semantic Web Publishing vocabulary (Carroll et al., 2005). The Open Provenance Model
(Moreau et al., 2008) provides terms for describing data transformation workflows. In (Zhao
et al., 2008), the authors propose a method for providing evidence for RDF links and for
tracing how the RDF links change over time
In order to support clients in choosing the most efficient way to access Web data for the
specific task they have to perform, data publishers can provide additional technical
metadata about their data set and its interlinkage relationships with other data sets: The
Semantic Web Crawling sitemap extension (Cyganiak et al., 2008) allows data publishers to
state which alternative means of access (SPARQL endpoint, RDF dumps) are provided
besides dereferenceable URIs. The Vocabulary Of Interlinked Datasets (Alexander et al.,
2009) defines terms and best practices to categorize and provide statistical meta-
information about data sets as well as the linksets connecting them.
Publishing Tools
A variety of Linked Data publishing tools has been developed. The tools either serve the
content of RDF stores as Linked Data on the Web or provide Linked Data views over non-
RDF legacy data sources. The tools shield publishers from dealing with technical details such
as content negotiation and ensure that data is published according to the Linked Data
community best practices (Sauermann & Cyganiak, 2008; Berrueta & Phipps, 2008; Bizer &
Cyganiak & Heath, 2007). All tools support dereferencing URIs into RDF descriptions. In
addition, some of the tools also provide SPARQL query access to the served data sets and
support the publication of RDF dumps.
• D2R Server.D2R Server (Bizer & Cyganiak, 2006) is a tool for publishing non-RDF
relational databases as Linked Data on the Web. Using a declarative mapping
language, the data publisher defines a mapping between the relational schema of
the database and the target RDF vocabulary. Based on the mapping, D2R server
publishes a Linked Data view over the database and allows clients to query the
database via the SPARQL protocol.
• Virtuoso Universal Server.The OpenLink Virtuoso server[Endnote:
http://www.openlinksw.com/dataspace/dav/wiki/Main/VOSRDF] provides for serving
RDF data via a Linked Data interface and a SPARQL endpoint. RDF data can either
be stored directly in Virtuoso or can be created on the fly from non-RDF relational
databases based on a mapping.
• Talis Platform.The Talis Platform[Endnote: http://www.talis.com/platform/] is
delivered as Software as a Service accessed over HTTP, and provides native storage
for RDF/Linked Data. Access rights permitting, the contents of each Talis Platform
store are accessible via a SPARQL endpoint and a series of REST APIs that adhere to
the Linked Data principles.
• Pubby.The Pubby server (Cyganiak & Bizer, 2008) can be used as an extension to
any RDF store that supports SPARQL. Pubby rewrites URI requests into SPARQL
DESCRIBE queries against the underlying RDF store. Besides RDF, Pubby also
provides a simple HTML view over the data store and takes care of handling 303
redirects and content negotiation between the two representations.
• Triplify.The Triplify toolkit (Auer et al, 2009) supports developers in extending
existing Web applications with Linked Data front-ends. Based on SQL query
templates, Triplify serves a Linked Data and a JSON view over the application's
database.
• SparqPlug.SparqPlug (Coetzee, Heath and Motta, 2008) is a service that enables
the extraction of Linked Data from legacy HTML documents on the Web that do not
contain RDF data. The service operates by serialising the HTML DOM as RDF and
allowing users to define SPARQL queries that transform elements of this into an RDF
graph of their choice.
• OAI2LOD Server.The OAI2LOD (Haslhofer & Schandl, 2008) is a Linked Data
wrapper for document servers that support the Open Archives OAI-RMH protocol.
• SIOC Exporters.The SIOC project has developed Linked Data wrappers for several
popular blogging engines, content management systems and discussion forums such
as WordPress, Drupal, and phpBB [Endnote:http://sioc-project.org/exporters].
A service that helps publishers to debug their Linked Data site is the Vapourvalidation
service[Endnote:http://vapour.sourceforge.net/]. Vapour verifies that published data
complies with the Linked Data principles and community best practices.
5. Linked Data Applications
With significant volumes of Linked Data being published on the Web, numerous efforts are
underway to research and build applications that exploit this Web of Data. At present these
efforts can be broadly classified into three
categories: Linked Data browsers, Linked Data
search engines, and domain-specific Linked Data applications. In the following section we
will examine each of these categories.
Linked Data Browsers
Just as traditional Web browsers allow users to navigate between HTML pages by following
hypertext links, Linked Data browsers allow users to navigate between data sources by
following links expressed as RDF triples. For example, a user may view DBpedia's RDF
description of the city of Birmingham (UK), follow a 'birthplace' link to the description of the
comedian Tony Hancock (who was born in the city), and from there onward into RDF data
from the BBC describing broadcasts in which Hancock starred. The result is that a user may
begin navigation in one data source and progressively traverse the Web by following RDF
rather than HTML links. The Disco hyperdata browser [Endnote: http://www4.wiwiss.fu-
berlin.de/bizer/ng4j/disco/] follows this approach and can be seen as a direct application of
the hypertext navigation paradigm to the Web of Data.
Data, however, provides human interface opportunities and challenges beyond those of the
hypertext Web. People need to be able to explore the Web of links between items, but also
to powerfully analyze data in bulk. The Tabulator (Berners-Lee et al, 2006; Berners-Lee et
al, 2008), for example, allows the user traverse the Web of Data, and expose pieces of it in
a controlled way, in "outline mode"; to discover and highlight a pattern of interest; and then
query for any other similar patterns in the data Web. The results of the query form a table
that can then be analyzed with various conventional data presentation methods, such as
faceted browsers, maps, timelines, and so on.
Tabulator and Marbles (Becker & Bizer, 2008) ) (see Figure 3)are among the data browsers
which track the provenance of data, while merging data about the same thing from different
sources.While authors such as (Karger & schraefel, 2006) have questioned the use of
graph-oriented views over RDF data, as seen in browsers such as FOAFNaut [Endnote:
http://www.jibbering.com/foaf/], (Hastrup, Cyganiak & Bojars, 2008) argue that such
interfaces fill an important niche, and describe their Fenfire browser that follows this display
paradigm.
Documents you may be interested
Documents you may be interested