pdf xchange c# : Html form output to pdf control SDK platform web page wpf windows web browser paper0-part1751

LinkedGeoData {
Adding a Spatial Dimension to the Web of Data
Soren Auer, Jens Lehmann, and Sebastian Hellmann
Universitat Leipzig, Institute of Computer Science,
Johannisgasse 26,04103Leipzig,Germany
{lastname}@informatik.uni-leipzig.de
http://aksw.org
Abstract. In order to employ the Web as a medium for data and in-
formation integration, comprehensive datasets and vocabularies are re-
quired as they enable the disambiguation and alignment of other data
and information. Manyreal-life information integration and aggregation
tasks are impossible without comprehensive background knowledge re-
latedtospatialfeaturesoftheways,structuresandlandscapessurround-
ingus. In this paper wecontribute tothe generation ofaspatialdimen-
sionfortheDataWebbyelaboratingonhowthecollaborativelycollected
OpenStreetMap data can be transformed and represented adhering to
theRDF datamodel,howthis datacanbeinterlinkedwith otherspatial
data sets, how it can be made accessible for machines according to the
linked data paradigm and for humans by means of a faceted geo-data
browser.
1 Introduction
It ismeanwhile widely acknowledgedthatthe DataWebwillbe an intermediate
step on the way to the Semantic Web. The Data Web paradigmcombines light-
weight knowledge representation techniques (such as RDF, RDF-Schema and
simpleontologies)withtraditionalWebtechnologies(suchasHTTPandREST)
for publishing and interlinking data and information.
In orderto employ the Web as a mediumfor data and information integra-
tion, comprehensive datasets and vocabularies are required as they enable the
disambiguationandalignmentofotherdataandinformation. WithDBpedia [1],
alarge reference dataset providing encyclopedic knowledge about a multitude
of dierent domains is already available. A number of other datasets tackling
domains suchasentertainment, bio-medicine orbibliographicdataare available
in the emerging linked Data Web1.
Many real-life information integration and aggregation tasks are, however,
impossible withoutcomprehensive background knowledge related to spatial fea-
turesoftheways, structuresand landscapessurroundingus. Suchtasksinclude,
1
See, for example, the listing at: http://esw.w3.org/topic/TaskForces/
CommunityProjects/LinkingOpenData/DataSets
Html form output to pdf - extract form data from PDF in C#.net, ASP.NET, MVC, Ajax, WPF
Help to Read and Extract Field Data from PDF with a Convenient C# Solution
extract pdf form data to excel; edit pdf form in reader
Html form output to pdf - VB.NET PDF Form Data Read library: extract form data from PDF in vb.net, ASP.NET, MVC, Ajax, WPF
Convenient VB.NET Solution to Read and Extract Field Data from PDF
how to save a pdf form in reader; c# read pdf form fields
2
Auer etal
for example, todepictlocally the oeringsofthe bakery shopnextdoor, tomap
distributed branches of a company or to integrate information about historical
sights along a bicycle track.
With the OpenStreetMap (OSM)2 project, a rich source of spatial data is
freely available. It is currently usedprimarily for rendering various map visual-
izations, but has the potential to evolve into a crystallization point for spatial
Web data integration. In thispaper we contribute to the generationof an addi-
tional spatial dimension forthe Data Web by elaborating on:
{ how the OpenStreetMap data can be transformedand representedadhering
to the RDF data model,
{ how this data canbe interlinkedwith otherspatial data sets,
{ how it can be made accessible for machines according to the linked data
paradigmand forhumans by means of a faceted geo-data browser.
The resulting RDF data comprises approximately 2 billion triples. In order
to achieve satisfactory querying performance, we have developed a number of
optimizations. These include a one-dimensional geo-spatial indexing as well as
summary tables for property and property value counts. As a result, querying
andanalyzing LinkedGeoData ispossible in real-time;thusenabling completely
new spatial Data Web applications.
The paper is structured as follows: after introducing the OpenStreetMap
project in Section 2, we describe how the OSM data can be transformed into
the RDF datamodelinSection3 andbe publishedasLinkedData inSection4.
We present a mapping methodology for establishing mappings to existing data
sources on the Data Web in Section 5. In Section 6 we showcase a faceted geo-
data browser and editor and conclude in Section 7 with an outlook to future
work.
2 The OpenStreetMap Project
OpenStreetMap is a collaborative project to create a free editable map of the
world. The maps are created by using data from portable GPS devices, aerial
photography andotherfree sources. Registered userscanuploadGPStrack logs
and edit the vector data by using a number of editing tools developed by the
OSM community. Both rendered images and the vector dataset are available
for downloading undera Creative CommonsAttribution-ShareAlike 2.0 license.
OpenStreetMap was inspired by the Wiki idea - the map display features a
prominent’Edit’ tab and a full revisionhistory ismaintained.
Until now the OpenStreetMap project has succeeded in collecting a vast
amount ofgeographical data (cf. Figure 1), which in many regions already sur-
passes by far the quality of commercial geo-data providers
3
.In other regions,
2
http://openstreetmap.org
3
Dataabout the LeipzigZoo, for example,includes thelocation and sizeof dierent
animals’vivariums.
C# PDF Convert to HTML SDK: Convert PDF to html files in C#.net
Turn PDF form data to HTML form. Export PDF images to HTML images. ContextType. SVG ContextType.HTML. directory, The output file directory.
extract pdf data into excel; extract data from pdf form to excel
VB.NET PDF Password Library: add, remove, edit PDF file password
' Define input and output file path. As String = Program.RootPath + "\\" 3_pw_a.pdf" ' Create a passwordSetting.IsAnnot = True ' Allow to fill form.
extract data from pdf to excel; extract data from pdf file to excel
LinkedGeoData
3
where currently only few volunteers contribute, data is still sparse. The project,
however, enjoys a signicant growth in both active contributors and daily con-
tributed data so that uncharted territory vanishes gradually. For some regions
the project also integrates publicly available data (as with the TIGER data in
the U.S.) or data donated by cooperations (as in The Netherlands).
Category
Overall AmountDaily Additions Monthly Growth
(avg.)
in the last year
Users
127,543
200
11%
Uploaded GPS points
915,392,139
1,600,000
10%
Nodes
374,507,436
400,000
5%
Ways
29,533,841
30,000
7%
Relations
136,245
300
6%
Table 1. OSMstatistics as of June 2009.
The OSM data is represented by adheringto a relatively simple data model.
It comprises three basic types - nodes, ways and relations - each of which are
uniquely identied by a numeric id. Nodes basically represent points on earth
and have longitude and latitude values. Ways are ordered sequences of nodes.
Relationsare, nally, groupingsofmultiple nodesand/orways. Eachindividual
elementcanhave a number ofarbitrary key-value pairs(tagsin the OSMtermi-
nology). Wayswith identical startand endnodes are called closed and are used
to representbuildings orland use areas, for example.
The various OSM components are depicted in Figure 1. The data is stored
in a relational database. The data can be accessed, queriedand edited by using
aREST API, which basically uses HTTP GET, PUT and DELETE requests
with XML payload (as shown in Figure 2). The data is also published as com-
plete dumps ofthe database in thisXML format on a weekly basis. Itcurrently
accounts for more than6GB ofBzip2 compressed data. In minutely, hourly and
daily intervals the project additionally publishes changesets, which canbe used
to synchronize a local deployment ofthe data with the OSM database.
Dierent authoring interfaces, accessing the API, are provided by the OSM
community. These include the online editor Potlatch, which is implemented in
Flash and accessible directly via the edit tab at the OSM map view, as well
as the desktop applications JOSM and Merkaartor. Two dierent rendering
services are oered for the rendering of raster maps on dierent zoom levels.
With Tiles@home, the performance-intense rendering tasks are dispatched to
idle machines of community members; thus achieving timeliness. The Mapnik
renderer, in turn, operates on a central tile server and re-renders tiles only in
certain intervals.
Apart from geographical features, the key-value pairs associated with OSM
elements are a rich source of information. Such annotations are, for example,
used to distinguish dierent types of roads, to annotate points-of-interest or
to in uence the map rendering. While initially intended primarily to guide the
C# PDF Password Library: add, remove, edit PDF file password in C#
Define input and output file path. outputFilePath = Program.RootPath + "\\" 3_pw_a.pdf"; // Create a passwordSetting.IsAnnot = true; // Allow to fill form.
extract data from pdf to excel online; exporting data from pdf to excel
C# PDF File Split Library: Split, seperate PDF into multiple files
also combine generated split PDF document files with other PDF files to form a new If your page number is set as 1, then the two output PDF files will contains
export pdf form data to excel; html form output to pdf
4
Auer etal
Fig.1. Technical OpenStreetMap architectureand components.
Source: http://wiki.openstreetmap.org/wiki/Image:OSM_Components.png
map rendering, the key-value annotations now already contain a multiplicity
of information, which is actually not rendered on the map. This includes, for
example, opening hours,linkstoWebsitesorspeedlimits.Anoverviewoverthe
community-agreedannotationscan be foundat:http://wiki.openstreetmap.
org/wiki/Map_Features.
3 Transforming OSM into RDF Data Model
Astraightforwardtransformation ofOSMdata into RDF is notpractical, since
the resulting 2 billion triples are dicult to handle by existing triple stores.
Current triple stores might generally be able to load and query this amount of
data; however, response timesare according toourexperimentsnotsucientfor
practical applications. A particular issue isthe storage ofthe longitude/latitude
information, whichcancurrently by farbe moreecientlyhandledby relational
database indexing techniques.
As a result of these considerations, we chose to follow a mixed approach in
whichpartofthe dataisstoredinrelationsandanotherpartisstoredaccording
tothe RDF data model.Butevenwithregardtothe latterpartsome additional
assumptionscanconsiderablyreducetheamountofdataandincrease thequery-
ing performance. For example, OSM element ids (used to identify nodes, ways
and relations) are always positive integer values. Taking this into account, the
space allocated for storing subjects in RDF triplescan be signicantly reduced
and the indexing can be performed more eciently. Another optimization we
performed is to store ’interesting’ nodes, ways and relations (i.e. those tagged
C# PDF File Merge Library: Merge, append PDF files in C#.net, ASP.
Microsoft Office Word, Excel and PowerPoint data to PDF form. 3.pdf"; String outputFilePath = Program.RootPath + "\\" Output.pdf"; String[] inputFilePaths
pdf data extraction tool; saving pdf forms in acrobat reader
C# Create PDF from Tiff Library to convert tif images to PDF in C#
String inputFilePath = Program.RootPath + "\\" 1.tif"; String outputFilePath = Program.RootPath + "\\" Output.pdf"; // Load a TIFF file.
how to flatten a pdf form in reader; make pdf form editable in reader
LinkedGeoData
5
<node id="26890002" lat="51.051934" lon="13.7415877" version="10"
changeset="766465" user="saftl" uid="7989" visible="true"
timestamp="2009-03-09T08:49:48Z">
<tag k="name" v="Frauenkirche" />
<tag k="created_by" v="Potlatch 0.10e" />
<tag k="tourism" v="viewpoint" />
<tag k="url" v="http://www.frauenkirche-dresden.de/" />
<tag k="denomination" v="lutheran" />
<tag k="wikipedia:en" v="Frauenkirche_Dresden" />
<tag k="religion" v="christian" />
<tag k="amenity" v="place_of_worship" />
<tag k="wikipedia:de" v="Frauenkirche_(Dresden)" />
</node>
Fig.2. OSM XML excerpt representing anode.
with certain tags) together with their coordinates in a summary table named
elements. The resulting database schema isvisualized in Figure 3.
ThedatabaseispopulatedbyimportingtheXMLleswhichare publishedin
regular intervals by the OpenStreetMap project
4
.In order to be able to import
the gigantic XMLexportsmore quickly,we developedourownoptimizedimport
script, which is by a factor 3-5 faster than the Osmosis tool. It also handles
incremental updates, which are published by OSM on a minutely basis and
allow to syncronize a local withthe OSM database.
The LinkedGeoData Ontology
Apart of the LGD ontology
5
is derived from the relational representation as
shown in Figure 3. Itincludes (orreuses)classeslike geo-wgs84:SpatialThing
with subclasses node, way, relation and properties such as geo-wgs84:lat,
geo-wgs84:lon, locatedNear, rdfs:label. A major source of structure, how-
ever, are the OSM tags, i.e. attribute-value annotations to nodes, ways and
relations.
There are no restrictions whatsoever regarding the use of attributesand at-
tributevaluestoannotateelementsinOSM.Userscancreatearbitraryattributes
and attribute values. This proceeding is deliberate in order to allow new uses
as well as to accommodate unforeseen ones. There is, however, a procedure in
place torecommendandstandardizepropertiesandpropertyvaluesforcommon
uses. This procedure involves a discussion onthe OSMmailinglistand afterac-
ceptance by the community the documentation of the attribute on the OSM
wiki6.
When we examined the commonly used attributes we noticed that they fall
into three categories:
4
http://planet.openstreetmap.org/
5
TheLGDontology is available at:http://linkedgeodata.org/vocabulary
6
http://wiki.openstreetmap.org/wiki/Map_Features
C# Create PDF from PowerPoint Library to convert pptx, ppt to PDF
String inputFilePath = Program.RootPath + "\\" 1.pptx"; String outputFilePath = Program.RootPath + "\\" Output.pdf"; // Load a PowerPoint (.pptx) file.
exporting data from excel to pdf form; how to fill out a pdf form with reader
C# Create PDF from Excel Library to convert xlsx, xls to PDF in C#
String inputFilePath = Program.RootPath + "\\" 1.xlsx"; String outputFilePath = Program.RootPath + "\\" Output.pdf"; // Load an Excel (.xlsx) file.
using pdf forms to collect data; extract data from pdf file
6
Auer etal
Fig.3. LinkedGeoDatadatabaseschema.
{ classication attributes, which induce some kind of a class membership for
the element they are applied to. Example include: highway with values
motorway,secondary, pathetc. orbarrier withvalueshedge, fence, wall
etc.
{ description attributes, which describe the element by attachingto it a value
from a predened set of allowed values. Examples include: lit (indicating
streetlightning)withvaluesyes/no orinternet
access withvalueswired,
wlan, terminal etc.
{ data attributes, which annotate the element witha free text ordata values.
Examples include: opening
hours or maxwidth (indicating the maximal al-
lowed width for vehicles on a certain road).
We employ this distinction to obtain an extensive classhierarchy as well as
alarge numberofobjectand datatype properties. Theclasshierarchy isderived
fromOSMclassicationattributes.Allclassicationattributesareinterpretedas
classesandtheirvaluesarerepresentedassubclasses.Thussecondary,motorway
and path, for example, become subclasses ofthe class highway. OSM elements
tagged with classicationattributes are represented in RDF as instances of the
respective attribute value. In some cases the value ofclassication attributesis
justyes-indicatingthatanOSMelementisofacertaintype,butnosub-typeis
known. Inthis casewe,assignthe elementtobe aninstance ofthe classderived
C# Create PDF from Word Library to convert docx, doc to PDF in C#.
String inputFilePath = Program.RootPath + "\\" 1.docx"; String outputFilePath = Program.RootPath + "\\" Output.pdf"; // Load a Word (.docx) document.
cannot save pdf form in reader; export pdf form data to excel spreadsheet
C# PDF Convert to Tiff SDK: Convert PDF to tiff images in C#.net
String inputFilePath = Program.RootPath + "\\" 1.pdf"; PDFDocument doc = new PDFDocument(inputFilePath); // Convert and output to a TIFF file.
extract data from pdf using java; how to save a filled out pdf form in reader
LinkedGeoData
7
lgd-node:26890002
rdfs:comment
"Generated by Triplify V0.5" .
lgd-node:26890002
cc:license
cc:by-sa/2.0 .
lgd-node:26890002
lgd-vocabulary:attribution "This data is derived" .
lgd-node:26890002#id rdf:type
lgd-vocabulary:node .
lgd-node:26890002#id geo-wgs84:long
"13.7416"^^xsd:decimal .
lgd-node:26890002#id geo-wgs84:lat
"51.0519"^^xsd:decimal .
lgd-node:26890002#id lgd-vocabulary:created_by lgd:Potlatch+0.10e .
lgd-node:26890002#id lgd-vocabulary:religion
lgd:christian .
lgd-node:26890002#id lgd-vocabulary:name
"Frauenkirche" .
lgd-node:26890002#id lgd-vocabulary:tourism
lgd:viewpoint .
lgd-node:26890002#id lgd-vocabulary:amenity
lgd:place_of_worship .
lgd-node:26890002#id lgd-vocabulary:wikipedia%2525de
"http://de.wikipedia.org/wiki/Frauenkirche_(Dresden)" .
lgd-node:26890002#id lgd-vocabulary:wikipedia%2525en
"http://en.wikipedia.org/wiki/Frauenkirche_Dresden" .
lgd-node:26890002#id lgd-vocabulary:denomination lgd:lutheran .
lgd-node:26890002#id lgd-vocabulary:url
"http://www.frauenkirche-dresden.de/" .
lgd-node:26890002#id lgd-vocabulary:locatedNear lgd-way:23040893> .
lgd-node:26890002#id lgd-vocabulary:locatedNear lgd-way:23040894> .
Fig.4. RDF/N3 representation of OSM
node with id 26890002 (Dresdner
Frauenkirche).
fromthe classicationattribute. Consequently, a way tagged with highway=yes
wouldbecome aninstance ofthe class highway. Description attributes are con-
vertedintoobjectproperties,therespectivevaluesintoresources.Dataattributes
are represented asdatatype propertiesand their values are represented as RDF
literals.
Theresultingontology containsroughly 500 classes,50objectpropertiesand
ca. 15,000 datatype properties. Only half of the datatype properties, however,
are used more than once and only 15% are used more than 10 times. We aim
at making thisinformation timely available to the OSMcommunity so that the
coherence and integrationof OSM information can be increased.
4 Publishing LinkedGeoData
Forpublishingthederivedgeodata,weuseTriplify[2].Triplify isasimplisticbut
eective approach to publishLinked Data from relational databases. Triplify is
basedonmappingHTTP-URI requestsontorelationaldatabase queries.Triplify
transforms the resulting relations into RDF statements and publishes the data
on the Web in various RDF serializations, inparticular as Linked Data.
The database schema we developed for representing the OSM data can be
easily published using Triplify. Figure 4 shows an example of a generated RDF
for an OSM node. However, in order to retrieve information, the point or way
identiers (i.e. primary keys from the respective columns) have to be known,
8
Auer etal
which is usually not the case. A natural entry point for retrieving geo data,
however, is the neighborhood around a particular point, possibly ltered by
points holding certain attributes or being of a certain type. To support this
usagescenario,we have developedaspatialLinkedDataextension,whichallows
to retrieve geo data of a particular circular region. The structure of the URIs
used looks asfollows:
Triplify Spatial Extension
on
How to publish geo‐data using Triplify?
OpenStreetMaps–160 GB Geo Data
lots of POIs –hotels, gas stations, universities …
http://LinkedGeoData.org/near/48.213,16.359/1000/amenity=pub
LongitudeLatitude
Radius
Property
http://LinkedGeoData.org/point/212331
http://LinkedGeoData.org/point/944523
http://LinkedGeoData.org/point/234091
23.10.08
Linked Data Web
11
The linkedgeo data extensionisimplemented in Triplify by using a congu-
ration with regularexpressionURLpatterns whichextract the geo coordinates,
radius and optionally a property with associated value and inject this infor-
mation into an SQL query for retrieving corresponding points of interest. The
following representsan excerpt of the LinkedGeoData Triplify conguration:
1 /^near\/(-?[0-9\.]+),(-?[0-9\.]+)\/([0-9]+)\/?$/=>
2 SELECT CONCAT("base:",n.type,"/",n.id,"#id") AS id,
3
CONCAT("vocabulary:",n.type) AS "rdf:type",
4
longitude AS "wgs84_pos:long^^xsd:decimal",
5
latitude AS "wgs84_pos:lat^^xsd:decimal",
6
rv.label AS "t:unc", REPLACE(rk.label,":","%25"),
7
HAVERSINE(latitude,longitude) AS "distance^^xsd:decimal"
8 FROM elements n INNER JOIN tags t USING(type,id)
9
INNER JOIN resources rk ON(rk.id=t.k)
10 INNER JOIN resources rv ON(rv.id=t.v)
11 WHERE longitude BETWEEN CEIL($2-($3/1000)/abs(cos(radians($1))*111))
12
AND CEIL($2+($3/1000)/abs(cos(radians($1))*111))
13
AND latitude BETWEEN CEIL($1-($3/1000/111)) AND CEIL($1+($3/1000/111))
14 HAVING distance < $3 LIMIT 1000’
The rst line contains the regular expression, which is evaluated against
HTTPrequest URIs. If the expression matches, the referencesto parenthesized
subpatterns in the SQL query (lines 2-14) will be replaced accordingly. In this
particular case $1inthe SQLquery will be replaced withthe longitude,$2 with
the latitudeand$3withtheradius.TheSQLquery isoptimizedsoastoretrieve
rst points in the smallest rectangle covering the requested circular area (lines
11-13)andthencuttingthe resultsetintoa circularareaby usingtheHaversine
formula (line 14), which is, for the purpose of brevity, in the example called as
astored procedure.
Triplify requiresthe resultsof the SQL queries to adhere to a certain struc-
ture:Therstcolumn(line2)mustcontainidentiers,whichareusedassubjects
intheresultingtriples,whilethecolumnnamesare convertedintoproperty iden-
tiers (i.e. triple predicates) and the individual cells of the resultinto property
values(i.e. triple objects). Inourexample, we reuse establishedvocabulariesfor
typing the elements (line 3) and associating longitude and latitude values with
them(lines4 and5). The datatype forliteral valuescanbe encodedby append-
ing two carets and the datatype to the column (prospective property)name (as
LinkedGeoData
9
can be seen in lines 4, 5 and 7). For transforming the tags, which are already
stored in a key-attribute-value notation in the tags table, into RDF, we use
the special "t:unc"columnname, whichinstructsTriplify to derive theproperty
URIsfromthe nextcolumninthe resultset,insteadofusing the currentcolumn
name (line 6).
The Triplify conguration can be also used to create a complete RDF/N3
export ofthe LinkedGeoData database. The dumpamounts to 16.3 GB le size
and122MRDFtriples.ThedierentRESTservicesprovidedby LinkedGeoData
project by means of Triplify are summarized in Table 3. Some performance re-
sultsforretrievingpoints-of-interestindierentareasaresummarizedinTable2.
Location Radius Property ResultsTime
Leipzig
1km
-
291 0.05s
Leipzig
5kmamenity=pub
41 0.54s
London
1km
-
259 0.28s
London
5kmamenity=pub
495 0.74s
Amsterdam
1km
-
1811 0.31s
Amsterdam
5kmamenity=pub
64 1.25s
Table 2. Performanceresults for retrievingpoints-of-interest in dierent areas.
5 Establishing Mappings with Existing Datasources
Interlinking a knowledge base with other data sources is one of the four key
principles for publishing Linked Data according to Tim Berners-Lee
7
. Within
the Linking Open Data eort, dozens ofdata sets have already been connected
to each other via owl:sameAs links. The central interlinking hub is DBpedia,
i.e. ifwe are able tobuildlinks to DBpedia, then we are also connectedto data
sourcessuchasGeonames,theWorldFactbook,UMBEL,EuroStat,andYAGO.
For this reason, our initial eort consists of matching DBpedia resources with
LinkedGeoData. In future work, we may extend this further.
When matching two large data sets such as DBpedia and LinkedGeoData,
it isnot feasible to compare all entitiesin bothknowledge bases. Therefore, we
rst restricted ourselves to those entities in DBpedia, which have latitude and
longitudeproperties.We thenexperimentedwithdierentmatchingapproaches
and discovered that in order to achieve high accuracy, we had to take type
informationinto account.Todetectinterestingentitytypes,we queriedDBpedia
forthoseclassesinthe DBpediaontologywhichhaveinstanceswithlatitude and
longitude properties.
To proceed, we had to discover how those classes are represented in OSM.
To do this, we built a test set, which we later also used for evaluating the
matching quality. The set consisted ofthose entity pairs, where a link from the
7
http://www.w3.org/DesignIssues/LinkedData.html
10
Auer etal
Description
URL
Points of interest in a
circular area
lgd:near/%lat%,%lon%/%radius%
Example: Points of interest
ina 1000m radius around
thecenter of Dresden
lgd:near/51.033333,13.733333/1000
Points of interest in a
circular area having a
certain property
lgd:near/%lat%,%lon%/%radius%/%category%
Example: Amenities in a
1000mradius around the
center of Dresden
lgd:near/51.033333,13.733333/1000/amenity
Points of interest in a
circular area having a
certain property value
lgd:near/%lat%,%lon%/%radius%/%property%=%value%
Example: Pubs in a 1000m
radius around the centerof
Dresden
lgd:near/51.033333,13.733333/1000/amenity=pub
Aparticular pointof
interest (identied by its
OSMid)
lgd:node/%OSMid%
Example: TheCafe B’liebig
inDresden
lgd:node/264695865
Aparticular way
(identiedby its OSMid)
lgd:way/%OSMid%
Example: Alte Mensa at
TUDresden
lgd:way/27743320
Table 3. LinkedGeoDataservices providedusing Triplify.
LinkedGeoData entity to a Wikipedia page (and therefore a DBpedia resource)
had already been present. This resulted in pairs of user-created owl:sameAs
links between LinkedGeoData and DBpedia. For each of the common DBpedia
ontology classes, we pickedtheir instanceswithinthetestset. Schema matching
couldthenbeunderstoodasasupervisedmachine learningproblem,wherethose
instanceswere positive examples.Thisproblemwassolved by using DL-Learner
[7] and the result can be found in Table 4. For the cases where we did not
have instances in the test set, we consulted the OSM wiki pages. Most results
were straightforward,butwe discoveredthatsuburbsare often typedascitiesin
DBpedia and thatit is often useful to combine the DBpedia ontology with the
UMBEL class hierarchy.
The matching heuristic was then dened asa combination of three criteria:
type information, spatial distance, andnamesimilarity.Givena DBpediaentity,
we proceeded as follows: 1.) Determine the type criteria in LGD according to
Table4.2.)QueryallLGDpoints,whicharewithinacertainmaximumdistance
(dependingonthetype)fromtheDBpediapoint.3.)Computeaspatialscorefor
eachLGDpointdepending on its distance. 4.)Compute a name similarity score
Documents you may be interested
Documents you may be interested