Nebudu ti lhát: o co mě opravdu zajímalo NepomukJeště předtím, než jsem věděl, co to je, bylo to její malé logo (víte, pastelové barvy, růžová a stříbrná: dívčí věc). Jakmile jsem prozkoumal logo, zaměřil jsem se na produkt ... Nepo co?
Nepomuk es „Odpověď KDE na sémantickou plochu“. Skládá se z a rámec vytvářet a konzultovat Metadata jakéhokoli typu zdroje.
…tak jako?
Pojďme se obnovit na Wikipedii co jsou metadata
Metadata (z griego po, meta„Po“ a latinský údaj, «Co je dáno», «dat»), Doslova« o datech », jsou data, která popisují další data. Obecně, skupina metadat označuje skupinu dat, tzv zdroj. Koncept metadat je analogický s používáním indexů k vyhledání objektů namísto dat. Knihovna například používá k vyhledávání knih karty, které určují autory, tituly, vydavatele a místa. Metadata tedy pomáhají lokalizovat data. Pro různá výpočetní pole, jako je načítání informací nebo sémantický web, představují metadata ve značkách důležitý přístup k překlenutí sémantického rozsahu.
Jakmile to vyjasníme, vraťme se k tomu. Nepomuk. Co to pro mě udělá? Vyhledat prostředky prostřednictvím metadat, která mohou nebo nemusí být snadno přístupná (nebo zřejmá) pro běžného uživatele.
Když mluvíme o metadatech, můžeme je umístit do tří velkých skupin:
- Metadata specifická pro soubory.
- Metadata vytvořená uživatelem (například značky nebo hodnocení, která obvykle přidáváme do mp3).
- Metadata, která nelze snadno získat.
V druhém případě můžeme využít skutečnou výhodu indexování a kategorizace podle metadat, tj. Pomocí sémantické plochy.
Příklad:
- Uživatel stáhne přílohu e-mailu. Když se příloha uloží na disk, ztratí se odkazy jak toho, kdo odeslal e-mail, tak adresy URL, ze kterého byl e-mail stažen.
- Generování pořadí aplikací, souborů atd. uživatelů. Například, kdo je uživatel, který nejvíce zapisuje na disk sda1? Který uživatel má nejvyšší počet přijatých paketů?
Nepomuk se skládá hlavně z Soprán, Strigi a K MetaData. soprán je objektově orientovaný rámec pro Data RDF y křičet je to jednoduchý malý vyhledávací démon. KMetaData je knihovna, která usnadňuje přístup k metadatům.
Od této chvíle budete mít závratě z definic a podivných slov, ale ještě jednu definici k objasnění: Jaké jsou Data RDF?
Zatímco XML je jazyk pro modelování dat, RDF je jazyk pro specifikaci metadat. XML selže ve škálovatelnosti dat, protože pořadí prvků je nepřirozené a jeho údržba je velmi obtížná a nákladná, naopak RDF o Framework pro popis zdrojů (RDF) umožňuje interoperabilitu mezi aplikacemi, které si vyměňují srozumitelné informace na webové stránce, a poskytuje infrastrukturu, která podporuje aktivity metadat.
Tak že v zásadě by použití tohoto typu nástrojů umožnilo:
- Získejte informace „není zřejmé“ a na dosah prstu o datech v počítači. Představte si například uživatele programátorů, kteří čtením zdrojového kódu své oblíbené aplikace mohou získat informace o profilu programátorů, kteří ji vyvinuli.
- Potenciál správců balíčků lze značně zvýšit rozsáhlým využíváním bohatých metainformací obsažených v balíčcích (např. .Deb's). Skutečnost, že jí lze dát sémantickou hodnotu, by usnadnila řešení závislostí nebo konfliktů. Užitečné. Ještě před vyřešením určitého konfliktu (obvykle je uživatel požádán o potvrzení), může konzultovat vlastní meta informace uživatele a být schopen odvodit potvrzení o vyřešení konfliktu. To by bylo užitečné, ale už nejsem tak přesvědčen.
- Pomocí Strigi ve spojení s některými funkcemi linuxového jádra (jako je například subsystém Inotify) jsme mohli reindexovat upravené soubory a ušetřit tak časté vyhledávání v celém systému souborů. Zde by aplikace mohly generovat mnoho metadat ve vztahu k systémovému protokolu a protože protokoly jsou soubory ve formátu prostého textu ... lze je použít.
Závěr: pokud vy, milý příteli čtenáři, používáte KDE 4 dobře, můžete to zkusit Nepomuk. Získání výhod trvá nějakou dobu (představte si indexování a vyhledávání metadat ve všech souborech v systému…), ale odhaduji, že při dalším používání je to velmi silný nástroj.
Doufám, že jste pochopili, opouštím vás a pokračuji v testování tohoto skvělého nástroje.
Zdravím !!
PS: velmi komplikované najít informace o Nepomuk že je napsán srozumitelnou terminologií a ne ve starověkém sanskrtu jako na některých jiných stránkách ... Naštěstí jsem tento příspěvek našel v Infosofii jako referenci.
Uvidíme, jestli tomu rozumím. Bylo by to jako dávat „štítky“ na všechny naše soubory?
Řekněme, že by to bylo něco jako dávat štítky na dokumenty a využívat štítky, které tento zdroj již má, i když je nevidíte pouhým okem, ve zdroji je implicitní množství informací které lze použít s nástroji tohoto typu. hodně.
@gss: Vítejte v životě komentátora !! :)
Doufám, že ano, bylo by to opravdu užitečné.
S pozdravem,
Dobrý den, pokud se nemýlím, komentuji to poprvé.
Velmi dobrý příspěvek, pravdou je, že tato sémantika v programování je velmi dobrý pohled jako inteligentní programování zítřka.
Nejen soubory, ale složky, celé programy, databáze, aplikace, internetové stránky atd. Atd.
Je třeba myslet na to, že s tímto konceptem „archivu“ bude trochu odloženo uvažování o „knihovnách“, s metaznačkami a dalšími.
Pravda se mi jeví jako velmi dobrý příspěvek (a právě tady budou křičet někteří), téměř podobný tomu, co Se7en dělá se svým vyhledávačem.