Sémantický desktop: chytřejší práce s daty v souvislostech

10. 11. 2011

Doba čtení: 4 minuty

Líbí se vám článek?
Podpořte redakci

Základní myšlenkou sémantického desktopu je umožnit počítači usuzovat takovým způsobem, jakým lidé běžně uvažují, tedy pomocí sítě asociací. Je takto pracující desktop, jak o něm mluví Carla Schroderová, skutečně reálnou budoucností desktopu? Co by mohl přinést informatice jako takové a informační společnosti?

Přidat mezi oblíbené zdroje na Googlu

Sémantický… web i desktop

Současný vývoj okolo sémantického webu ukazuje, že implementovat v rámci počítačového zpracování dat funkcionalitu, která by rozumným způsobem byla schopna rozpoznat obsah a používat jej, je velice složité. Hlavním kamenem úrazu nejsou často technologie, které jsou navrženy poměrně dobře, ale často sami uživatelé (v případě sémantického webu publicisté obsahu), kteří nejsou ochotni implementovat.

Poněkud ve stínu sémantického webu roste projekt, o kterém se úplně často nemluví – sémantický desktop. Jeho hlavním představitelem je Nepomuk. Jde o síťové prostředí pro osobní ontologie na bázi řízení znalosti. Nejedná se o žádnou konkrétní aplikaci, ale pouze o framework, který funkce sémantického desktopu zpřístupňuje. Celý projekt je open-source a jeho cena byla 17 milionů eur, z toho 11,5 milionů financováno Evropskou unií, ale na vývoji se podílela řada dalších firem, jako například IBM.

V zásadě existují tři funkční varianty – první je implementace pro grafické prostředí KDE, druhá pracuje v Javě a třetí je poskytována v rámci SaS, jako komerční produkt. Asi nejpoužívanější a silně implementovanou variantou je především verze pro KDE 4, jehož je integrální součástí. Cílem je tedy poskytnout vhodnou infrastrukturu rozšiřující osobní desktop do prostředí, které podporujícího jednak správu osobních informací, tak i sdílení a výměnu těchto informací v rámci sociálních i organizačních vztahů. Tento proces probíhá na základě práce s metadaty.

Nepomuk pro práci používá v základní úrovni vlastní implementaci RDF. Pro reprezentaci vysokoúrovňových znalostí sémantického desktopu pracuje s jazyky RDFS a OWL a také disponuje vlastním jazykem NRL. Pomocí těchto jazyků je schopen vytvářet ontologie pro výměnu dat mezi aplikacemi a jejich konkrétní implementaci. Existuje několik standardizovaných ontologií (o standardizaci se stará OSCA Foundation):

anotační ontologie NAO
skupina ontologií pro informační elementy NIE (popisuje zdroje v desktopu, jako jsou soubory či e-maily)
ontologie pro modelování osobních informací PIMO (užívá ji Akonadi)
ontologie pro modelování úkolů TMO

Je zřejmé, že každá skupina programů bude různě užívat jednotlivých ontologií.

Akonadi

Asi nejdiskutovanější novinkou v oblasti sémantického desktopu a jeho integrace do KDE 4, je propojení Nepomuku s Akonadi, které spravuje PIM (Personal Information Manager) data, tedy adresář, kalendář a e-maily. Vzniká tak jednotné prostředí pro přístup k datům zcela nezávisle na konkrétních aplikacích. Akonadi spravuje získávání dat a jejich ukládání, snaží se tak nahrazovat proprietární metody jednotlivých aplikací. Data, kterými disponuje Akonadi, jsou uložena v databázi MySQL a jsou poskytována Nepomuku, který s nimi pak může přiměřeným způsobem nakládat.

Stejně jako v jiných implementacích jde zatím především o vyhledávání. Ostatně přesně na tom je postavena integrace Nepomuku do Dolphin, Krunner, Gwenview a dalších. Budoucnost může být ale podstatně pestřejší.

Hledání souvislostí?

Celý projekt sémantického desktopu je založený na práci s metadaty a to především takovými, která jsou uložená na disku a jsou často součástí jednotlivých souborů – jde o různé implementované tagy u hudebních skladeb, EXIF informace u fotografií. K jejich získání se používá vyhledávání realizované pomocí indexovacího nástroje Strigi. Další metadata může definovat sám uživatel; pomocí hvězdiček, popisů souborů, komentářů atp. Nepomuk se snaží ale také získávat informace sám aktivně – například podle zdrojů, ze kterých byl soubor stažen, u e-mailu je možné pracovat s předmětem zprávy, odesilatelem či příjemcem atp.

Podle Carli Schroderové by měl Nepomuk v budoucnosti pracovat jako jakási umělá inteligence desktopu, který bude schopen aktivně hledat souvislosti sám a aktivně je zpracovávat. Měl by tak být schopen inteligentního vyhledávání dat na počítači na základě určité spojitosti dokumentů. Bude zajímavé sledovat, jak se podaří spojení koncepce sémantického webu a desktopu. Uživatel by mohl zcela rutině klást počítači otázky po určitých informacích a ten by dokázal inteligentně najít odpovědi, a to dokonce zasazené v určitém hlubším kontextu.

Zajímavý je také rozměr sociální – jednotlivá data budou moci být sdílena nějakým komunikačním kanálem (například sociální sítí či intranetem) a znalosti by se měly propojovat také v rámci těchto sítí. To by mělo dodat Nepomuku další silnou možnost efektivnějšího budování funkčních ontologií zcela automatickým způsobem.

Závěr

Jaká je tedy praktická současná využitelnost sémantického desktopu? Obecně velmi problematická, ač samotný koncept spojující vyhledávání požadovaných dat a obsahů, jednotný přístup k informacím napříč aplikacemi a možnost efektivní výměny dat mezi počítači je jistě nosný a v budoucnosti se může jevit jako životaschopný. V době pečlivého budování znalostního managementu se jeví Nepomuk jako velice zajímavý a perspektivní počin.

Dnes jsou zde ale zcela reálné problémy, které se stále nedaří odstranit. Významnou překážkou je především zátěž systému spojená s indexací a zpracováváním výsledků i relativně malý přínos pro většinu uživatelů. Dalším probléme je nedostatek aplikací, které by byly schopné efektivně nabízené ontologie používat. Přitom právě PIM je jednoduchým a pěkným příkladem, jak je možné dobře možnosti sémantického webu „ušít“ pro praxi.

Je pravdou, že KDE je skutečně jediným grafickým prostředím, které o nasazení této technologie usiluje a může to být časem významná konkurenční výhoda. Ani tak na uživatelské prostředí zaměřené systémy jako je Mac OS X totiž nic podobného zatím implementováno nemají. A zkušenosti z KDE tak mohou být velice cenné.

Vstoupit do diskuse (43 názorů)

Michal Černý

Vystudovaný středoškolský učitel fyziky a informatiky, ale dnes vysokoškolský pedagog technologií ve vzdělávání na KISKu na FF MU. Věnuje se především kurátorství digitálního obsahu, online vzdělávání a učící se společnosti.

Já bych ocenil, kdyby autor - když už píše o teorii - trochu rozváděl pojmy. Upřímě pojmy jako "RDF, OWL, NRL, NAO, úkoly TMO" my buď neříkají vůbec nic, nebo jen vzdáleně. Takže co vlastně ten Nepomuk umí? Nemohl by autor ten článek napsat ještě jednou i pro nás, běžné uživatele?

D.A.Tiger

Sdílet

Sémantický… web i desktop

Akonadi

Hledání souvislostí?

Závěr

Autor článku

Michal Černý