Webový zdroj - Web resource

Webový zdroj je nějaký identifikovatelný zdroj (digitální, fyzický nebo abstraktní) přítomna nebo připojena k World Wide Web . Prostředky jsou identifikovány pomocí jednotných identifikátorů prostředků . Na sémantickém webu jsou webové prostředky a jejich sémantické vlastnosti popsány pomocí rámce popisu prostředků .

Koncept webového zdroje se během historie webu vyvinul, od raného pojmu statických adresovatelných dokumentů nebo souborů až po obecnější a abstraktnější definici, která nyní zahrnuje všechny „věci“ nebo entity, které lze identifikovat, pojmenovat, adresovat nebo zpracovávat. , jakýmkoli způsobem, na webu jako celku nebo v jakémkoli síťovém informačním systému. Deklarativní aspekty zdroje (identifikace a pojmenování) a jeho funkční aspekty (adresování a technické zacházení) nebyly v raných specifikacích webu jasně odlišné a samotná definice konceptu byla předmětem dlouhé a stále otevřené debaty zahrnující obtížné a často tajemné, technické, sociální, jazykové a filozofické problémy.

Od dokumentů a souborů po webové zdroje

V raných specifikacích webu (1990–1994) se termín zdroj téměř vůbec nepoužívá. Web je navržen jako síť více či méně statických adresovatelných objektů, v zásadě souborů a dokumentů, propojených pomocí jednotných lokátorů zdrojů (URL). Webový zdroj je implicitně definován jako něco, co lze identifikovat. Identifikace slouží dvěma odlišným účelům: pojmenování a adresování; to druhé závisí pouze na protokolu. Je pozoruhodné, že se RFC 1630 vůbec nepokouší definovat pojem zdroje; ve skutečnosti tento výraz kromě svého výskytu v URI, URL a URN téměř nepoužívá a stále hovoří o „objektech sítě“.

RFC 1738 (prosinec 1994) dále specifikuje adresy URL, přičemž termín „univerzální“ se mění na „jednotný“. Dokument systematičtěji využívá zdroje k odkazování na objekty, které jsou „dostupné“ nebo „lze je najít a získat k nim přístup“ prostřednictvím internetu. Pojem zdroj zde opět není výslovně definován.

Od webových zdrojů po abstraktní zdroje

První explicitní definice zdroje se nachází v RFC 2396 v srpnu 1998:

Prostředkem může být cokoli, co má identitu. Mezi známé příklady patří elektronický dokument, obrázek, služba (např. „Dnešní předpověď počasí pro Los Angeles“) a sbírka dalších zdrojů. Ne všechny zdroje lze „načíst“ v síti; za zdroje lze také považovat např. lidské bytosti, korporace a vázané knihy v knihovně. Prostředkem je koncepční mapování na entitu nebo sadu entit, ne nutně entitu, která odpovídá tomuto mapování v jakékoli konkrétní instanci v čase. Prostředek tedy může zůstat konstantní, i když se jeho obsah --- entity, kterým aktuálně odpovídá --- v průběhu času mění, za předpokladu, že se koncepční mapování v průběhu nezmění.

Ačkoli příklady v tomto dokumentu byly stále omezeny na fyzické entity, definice otevřela dveře více abstraktním zdrojům. Poskytnutím konceptu je dána identita a tato identita je vyjádřena dobře vytvořeným URI (jednotný identifikátor zdroje, nadmnožina adres URL), pak koncept může být také zdrojem.

V lednu 2005 činí RFC 3986 toto rozšíření definice zcela explicitním: „… abstraktní pojmy mohou být prostředky, jako jsou operátory a operandy matematické rovnice, typy vztahů (např.„ Rodič “nebo„ zaměstnanec “) nebo číselné hodnoty (např. nula, jedna a nekonečno). “

Zdroje v RDF a sémantickém webu

RDF, poprvé vydané v roce 1999, bylo nejprve určeno k popisu zdrojů, jinými slovy k standardnímu deklaraci metadat zdrojů. Popis RDF zdroje je sada trojic (předmět, predikát, objekt), kde předmět představuje zdroj, který má být popsán, predikujte typ vlastnosti relevantní pro tento zdroj a objektem mohou být data nebo jiný zdroj. Samotný predikát je považován za zdroj a identifikován identifikátorem URI. Vlastnosti jako „název“, „autor“ jsou tedy v RDF reprezentovány jako zdroje, které lze rekurzivně použít jako předmět jiných trojic. Na základě tohoto rekurzivního principu budou slovníky RDF, jako RDFS , OWL a SKOS , hromadit definice abstraktních zdrojů, jako jsou třídy, vlastnosti, koncepty, všechny identifikované identifikátory URI.

RDF také určuje definici anonymních zdrojů nebo prázdných uzlů , které nejsou identifikátory URI absolutně identifikovány.

Použití identifikátorů URI HTTP k identifikaci abstraktních zdrojů

URL , zejména HTTP URI , se často používají k identifikaci abstraktních zdrojů, jako jsou třídy, vlastnosti nebo jiný druh konceptů. Příklady lze nalézt v ontologiích RDFS nebo OWL . Vzhledem k tomu, že takové URI jsou spojeny s protokolem HTTP, vyvstala otázka, jaký druh reprezentace, pokud existuje, by měl člověk získat pro takové prostředky prostřednictvím tohoto protokolu, obvykle pomocí webového prohlížeče, a zda by syntaxe samotného URI mohla pomoci odlišit „abstraktní“ zdroje z „informačních“ zdrojů. Specifikace URI, jako je RFC 3986, ponechaly specifikaci protokolu úkol definovat akce prováděné se zdroji a neposkytují žádnou odpověď na tuto otázku. Bylo navrženo, aby HTTP URI identifikující zdroj v původním smyslu, jako je soubor, dokument nebo jakýkoli druh takzvaného informačního zdroje, měl být „lomítko“ URI-jinými slovy, neměl by obsahovat identifikátor fragmentu vzhledem k tomu, že identifikátor URI používaný k identifikaci konceptu nebo abstraktního zdroje by měl být identifikátor URI „hash“ pomocí identifikátoru fragmentu.

Například: http://www.example.org/catalogue/widgets.htmlidentifikuje a lokalizuje webovou stránku (možná poskytující nějaký lidsky čitelný popis widgetů prodávaných společností Silly Widgets, Inc.), zatímco http://www.example.org/ontology#Widgetby identifikoval abstraktní koncept nebo třídu „Widget“ v ontologii této společnosti a nemusel by nutně načíst jakýkoli fyzický zdroj prostřednictvím protokolu HTTP . Bylo však zodpovězeno, že takové rozlišení je v praxi nemožné prosadit a známé standardní slovníky poskytují široce používané protipříklady. Například koncepty Dublin Core jako „název“, „vydavatel“, „tvůrce“ jsou identifikovány „lomítkem“ jako URI http://purl.org/dc/elements/1.1/title.

Obecná otázka, jaký druh zdrojů by měl nebo neměl identifikovat identifikátor URI HTTP, byl ve W3C dříve znám jako problém httpRange-14 , za jeho názvem v seznamu definovaném (TAG). Značka TAG doručila v roce 2005 konečnou odpověď na tento problém, přičemž rozlišení mezi „informačním zdrojem“ a „neinformačním“ zdrojem závisí na typu odpovědi dané serverem na požadavek „ZÍSKAT“:

  • 2xx Úspěch naznačuje, že zdroj je zdroj informací.
  • 303 Viz Další uvádí, že zdroj může být informativní nebo abstraktní; cíl přesměrování vám mohl říci.
  • Chyba klienta 4xx neposkytuje žádné informace.

Díky tomu mohou slovníky (jako Dublin Core , FOAF a Wordnet ) nadále používat z pragmatických důvodů místo lomítka lomítko. Přestože se zdá, že tento kompromis v komunitě sémantických webů dosáhl konsensu, někteří z jeho prominentních členů, jako je Pat Hayes , vyjádřili obavy jak ohledně jeho technické proveditelnosti, tak koncepčního základu. Podle pohledu Patricka Hayese nelze samotný rozdíl mezi „informačním zdrojem“ a „jiným zdrojem“ nalézt a nemělo by být lépe jej vůbec specifikovat, přičemž nejednoznačnost referenčního zdroje je vlastní URI jako jakýkoli mechanismus pojmenování.

Vlastnictví zdrojů, duševní vlastnictví a důvěra

V RDF „kdokoli může prohlásit cokoli o čemkoli“. Zdroje jsou definovány formálními popisy, které může kdokoli publikovat, kopírovat, upravovat a publikovat na webu. Pokud je obsah webového zdroje v klasickém smyslu (webová stránka nebo online soubor) zjevně ve vlastnictví jeho vydavatele, který na něj může nárokovat duševní vlastnictví, lze abstraktní zdroj definovat nahromaděním popisů RDF, nikoli nutně kontrolováno jedinečným vydavatelem a nemusí být navzájem konzistentní. Je otevřenou otázkou vědět, zda má mít zdroj autoritativní definici s jasným a důvěryhodným vlastnictvím, a v tomto případě, jak tento popis technicky odlišit od ostatních popisů. Souběžným problémem je, jak se na takové popisy může vztahovat duševní vlastnictví.

Viz také

Reference

Citace

Prameny