Sémantický desktop: chytřejší práce s daty v souvislostech

Michal Černý 10. 11. 2011

Základní myšlenkou sémantického desktopu je umožnit počítači usuzovat takovým způsobem, jakým lidé běžně uvažují, tedy pomocí sítě asociací. Je takto pracující desktop, jak o něm mluví Carla Schroderová, skutečně reálnou budoucností desktopu? Co by mohl přinést informatice jako takové a informační společnosti?

Sémantický… web i desktop

Současný vývoj okolo sémantického webu ukazuje, že implementovat v rámci počítačového zpracování dat funkcionalitu, která by rozumným způsobem byla schopna rozpoznat obsah a používat jej, je velice složité. Hlavním kamenem úrazu nejsou často technologie, které jsou navrženy poměrně dobře, ale často sami uživatelé (v případě sémantického webu publicisté obsahu), kteří nejsou ochotni implementovat.

Poněkud ve stínu sémantického webu roste projekt, o kterém se úplně často nemluví – sémantický desktop. Jeho hlavním představitelem je Nepomuk. Jde o síťové prostředí pro osobní ontologie na bázi řízení znalosti. Nejedná se o žádnou konkrétní aplikaci, ale pouze o framework, který funkce sémantického desktopu zpřístupňuje. Celý projekt je open-source a jeho cena byla 17 milionů eur, z toho 11,5 milionů financováno E­vropskou unií, ale na vývoji se podílela řada dalších firem, jako například IBM.

V zásadě existují tři funkční varianty – první je implementace pro grafické prostředí KDE, druhá pracuje v Javě a třetí je poskytována v rámci SaS, jako komerční produkt. Asi nejpoužívanější a silně implementovanou variantou je především verze pro KDE 4, jehož je integrální součástí. Cílem je tedy poskytnout vhodnou infrastrukturu rozšiřující osobní desktop do prostředí, které podporujícího jednak správu osobních informací, tak i sdílení a výměnu těchto informací v rámci sociálních i organizačních vztahů. Tento proces probíhá na základě práce s metadaty.

Nepomuk pro práci používá v základní úrovni vlastní implementaci RDF. Pro reprezentaci vysokoúrovňových znalostí sémantického desktopu pracuje s jazyky RDFS a OWL a také disponuje vlastním jazykem NRL. Pomocí těchto jazyků je schopen vytvářet ontologie pro výměnu dat mezi aplikacemi a jejich konkrétní implementaci. Existuje několik standardizovaných ontologií (o standardizaci se stará OSCA Foundation):

  • anotační ontologie NAO
  • skupina ontologií pro informační elementy NIE (popisuje zdroje v desktopu, jako jsou soubory či e-maily)
  • ontologie pro modelování osobních informací PIMO (užívá ji Akonadi)
  • ontologie pro modelování úkolů TMO

Je zřejmé, že každá skupina programů bude různě užívat jednotlivých ontologií.

Akonadi

Asi nejdiskutovanější novinkou v oblasti sémantického desktopu a jeho integrace do KDE 4, je propojení Nepomuku s Akonadi, které spravuje PIM (Personal Information Manager) data, tedy adresář, kalendář a e-maily. Vzniká tak jednotné prostředí pro přístup k datům zcela nezávisle na konkrétních aplikacích. Akonadi spravuje získávání dat a jejich ukládání, snaží se tak nahrazovat proprietární metody jednotlivých aplikací. Data, kterými disponuje Akonadi, jsou uložena v databázi MySQL a jsou poskytována Nepomuku, který s nimi pak může přiměřeným způsobem nakládat.

Stejně jako v jiných implementacích jde zatím především o vyhledávání. Ostatně přesně na tom je postavena integrace Nepomuku do Dolphin, Krunner, Gwenview a dalších. Budoucnost může být ale podstatně pestřejší.

Hledání souvislostí?

Celý projekt sémantického desktopu je založený na práci s metadaty a to především takovými, která jsou uložená na disku a jsou často součástí jednotlivých souborů – jde o různé implementované tagy u hudebních skladeb, EXIF informace u fotografií. K jejich získání se používá vyhledávání realizované pomocí indexovacího nástroje Strigi. Další metadata může definovat sám uživatel; pomocí hvězdiček, popisů souborů, komentářů atp. Nepomuk se snaží ale také získávat informace sám aktivně – například podle zdrojů, ze kterých byl soubor stažen, u e-mailu je možné pracovat s předmětem zprávy, odesilatelem či příjemcem atp.

Podle Carli Schroderové by měl Nepomuk v budoucnosti pracovat jako jakási umělá inteligence desktopu, který bude schopen aktivně hledat souvislosti sám a aktivně je zpracovávat. Měl by tak být schopen inteligentního vyhledávání dat na počítači na základě určité spojitosti dokumentů. Bude zajímavé sledovat, jak se podaří spojení koncepce sémantického webu a desktopu. Uživatel by mohl zcela rutině klást počítači otázky po určitých informacích a ten by dokázal inteligentně najít odpovědi, a to dokonce zasazené v určitém hlubším kontextu.

Zajímavý je také rozměr sociální – jednotlivá data budou moci být sdílena nějakým komunikačním kanálem (například sociální sítí či intranetem) a znalosti by se měly propojovat také v rámci těchto sítí. To by mělo dodat Nepomuku další silnou možnost efektivnějšího budování funkčních ontologií zcela automatickým způsobem.

Závěr

Jaká je tedy praktická současná využitelnost sémantického desktopu? Obecně velmi problematická, ač samotný koncept spojující vyhledávání požadovaných dat a obsahů, jednotný přístup k informacím napříč aplikacemi a možnost efektivní výměny dat mezi počítači je jistě nosný a v budoucnosti se může jevit jako životaschopný. V době pečlivého budování znalostního managementu se jeví Nepomuk jako velice zajímavý a perspektivní počin.

widgety

Dnes jsou zde ale zcela reálné problémy, které se stále nedaří odstranit. Významnou překážkou je především zátěž systému spojená s indexací a zpracováváním výsledků i relativně malý přínos pro většinu uživatelů. Dalším probléme je nedostatek aplikací, které by byly schopné efektivně nabízené ontologie používat. Přitom právě PIM je jednoduchým a pěkným příkladem, jak je možné dobře možnosti sémantického webu „ušít“ pro praxi.

Je pravdou, že KDE je skutečně jediným grafickým prostředím, které o nasazení této technologie usiluje a může to být časem významná konkurenční výhoda. Ani tak na uživatelské prostředí zaměřené systémy jako je Mac OS X totiž nic podobného zatím implementováno nemají. A zkušenosti z KDE tak mohou být velice cenné.

Našli jste v článku chybu?
Vitalia.cz: Tesco nabízí desítky tun jídla zdarma

Tesco nabízí desítky tun jídla zdarma

Lupa.cz: Další Češi si nechali vložit do těla čip

Další Češi si nechali vložit do těla čip

Lupa.cz: Proč jsou firemní počítače pomalé?

Proč jsou firemní počítače pomalé?

Lupa.cz: Kdo vyhraje Kříšťálovou Lupu? Hlasování začalo!

Kdo vyhraje Kříšťálovou Lupu? Hlasování začalo!

DigiZone.cz: Světový pohár v přímém přenosu na ČT

Světový pohár v přímém přenosu na ČT

Lupa.cz: Patička e-mailu závazná jako vlastnoruční podpis?

Patička e-mailu závazná jako vlastnoruční podpis?

Vitalia.cz: Tradiční čínská medicína a rakovina

Tradiční čínská medicína a rakovina

Vitalia.cz: Voda z Vltavy před a po úpravě na pitnou

Voda z Vltavy před a po úpravě na pitnou

Vitalia.cz: Tahák, jak vyzrát nad zápachem z úst

Tahák, jak vyzrát nad zápachem z úst

DigiZone.cz: Digi Slovakia zařazuje stanice SPI

Digi Slovakia zařazuje stanice SPI

120na80.cz: Co je padesátkrát sladší než cukr?

Co je padesátkrát sladší než cukr?

Vitalia.cz: Tohle jsou nejlepší česká piva podle odborníků

Tohle jsou nejlepší česká piva podle odborníků

120na80.cz: Galerie: Čínští policisté testují českou minerálku

Galerie: Čínští policisté testují českou minerálku

Root.cz: Hořící telefon Samsung Note 7 zapálil auto

Hořící telefon Samsung Note 7 zapálil auto

DigiZone.cz: Numan Two: rozhlasový přijímač s CD

Numan Two: rozhlasový přijímač s CD

Vitalia.cz: Jak Ondra o astma přišel

Jak Ondra o astma přišel

Lupa.cz: Blíží se konec Wi-Fi sítí bez hesla?

Blíží se konec Wi-Fi sítí bez hesla?

DigiZone.cz: Technisat připravuje trojici DAB

Technisat připravuje trojici DAB

Podnikatel.cz: ČSSZ posílá přehled o důchodovém kontě

ČSSZ posílá přehled o důchodovém kontě

DigiZone.cz: Funbox 4K v DVB-T2 má ostrý provoz

Funbox 4K v DVB-T2 má ostrý provoz