DBpedia

Z Wikiverzity

DBpedia vytváří z Wikipedii databázi znalostí.

Info[editovat]

Jak toho využít[editovat]

Fasetové vyhledávání[editovat]

Zatím nevím, jak to správně přeložit. faseted search nebo faseted browsing, občas se to překládá také jako hierarchické vyhledávání. Fasety jsou v tomto případě vyhledávací kriteria.

Tak vyzkoušíme:

  1. města, která byla založena před rokem 1000:
  2. Němečtí vědci, kteří měli americké občanství:

Nic českého jsem tam zatím nenašel, asi to ještě nikdo nenasoukal do databáze.


Suroviny[editovat]

Cokoliv existuje v anglické wikipedii, tak má zde odpovídající URI. Třeba:

Ale když se podíváme na

což je na wikipedii redirect, tak na DBpedii tomu odpovídá

což je o dost chudší resource

No ještě si povšimneme třeba rozdílů v Properties, kterými je označeno, že jde o rodiště:

  • is dbpedia-owl:birthPlace of
  • is dbpprop:birthPlace of
  • is dbpprop:birthplace of

Takže třeba Otto Jelinek tam má uvedeny všechny tři možnosti, většina ostatních ale jen dbpedia-owl:birthPlace. Tak v tom je asi taky ještě trochu nejednotnost.

Dotazování[editovat]

Každá databáze má nějaký způsob dotazování, dotazovací jazyk – známe třeba SQL. Zde je použit dotazovací jazyk SPARQL. Interface k němu najdeme na:

Pokud tento jazyk dosud neovládáme, abychom dokázali vytvořil alespoň formálně správný dotaz, zkusíme se podívat na nějaké příklady a pak podle nich vytvořit analogický dotaz. Třeba lidé, kteří se narodili v Praze v 18. století a dříve:

PREFIX dbo: <http://dbpedia.org/ontology/>

SELECT ?name ?birth ?death ?person WHERE {
     ?person dbpedia2:birthPlace <http://dbpedia.org/resource/Prague> .
     ?person dbo:birthDate ?birth .
     ?person foaf:name ?name .
     ?person dbo:deathDate ?death
     FILTER (?birth < "1800-01-01"^^xsd:date) .
}
ORDER BY ?name

Vložíme to na:

A dostaneme jedinou odpověď:

  • name: "Jan Blažej Santini Aichel"@en
  • birth: "1677-02-03"^^xsd:date
  • death: "1723-12-07"^^xsd:date
  • person :Jan_Santini_Aichel

kde se dozvíme, že se jednalo o barokního architekta.

Linkovaná data[editovat]

Linked Data je motoda publikování RDF dat na webu a provázání dat mezi různými zdroji.

Chce to na to mít nějaký sémantický browser. Některé běhají na straně serveru, takže není zapotřebí nic instalovat. Třeba:

DISCO[editovat]

  • DISCO – nemůžu se spojit

OpenLink RDF Browser[editovat]

The Tabulator[editovat]

DBpedia Userscript[editovat]

(autor: Anja Jentzsch)

  1. Nainstalovat si Greasemonkey do Firefoxu
  2. Kliknout na DBpedia UserScript – javascript
  3. prohlídnout si ho
  4. povolit instalaci

Je to skript, který funguje jen na anglické wikipedii