Semantic Web og emnekart — Fremdeles forvirret?


Denne artikkelen ble skrevet av Kjetil Kjernsmo i et innlegg i Computerworld 18.01.2008

Steve Pepper skrev i Computerworld 14. desember et innlegg om emnekart, som ikke bare er misvisende med hensyn til hvordan Internett fungerer i dag og om webbens historie, men også om hvilke teknologier som driver utviklingen videre.

Ingressen er allerede misvisende, der påstår Pepper at man må gjennom et sentralt knutepunkt. Dette er en beskrivelse av en portal-tankegang om heldigvis aldri fikk fotfeste. En stund tenkte mange seg portaler omtrent som en bok, der man hadde en start-side alle skulle tvinges gjennom. Dette var klart imot Tim Berners-Lees ide om en desentralisert struktur, og selv om portaler og startsider fortsatt er en populær tanke kan man likefullt komme inn til en gitt side ad flere veier, via en søkemotor, ved å følge linker som man finner på webben, får i mail eller en RSS-feed.

Emnekart har hatt suksess i Norge for å hjelpe med navigasjon internt i portaler, men når Pepper påstår at Tim Berners-Lee ble sendt i feil retning har han mistet hele historien til webben. Webben var aldri ment å være bare linker mellom dokumenter, og Tim gjorde ikke bare tekniske valg. Han gjorde også politiske valg; han ikke skulle prøve å kontrollere retningen webben utviklet seg i annet enn selv å bidra til utviklingen gjennom sin standardiseringsorganisasjon World Wide Web Consortium (W3C). At han ga opp denne kontrollen gjorde at webben fikk utvikle seg i mange retninger, og som han selv sa “multimedia appeared more important for a while”.

Men tanken om linker mellom temaer, faktisk ikke bare temaer, men også linker mellom fysiske ting, som f.eks. linker mellom personer, lå hele tiden under. I dag kan vi si f.eks. “Kjetil kjenner Tim”. Omtrent samtidig med at emnekart-miljøet startet opp ble det klart at HTML alene ikke kunne oppfylle de behov man hadde, og dermed begynte man med designen av RDF (Resource Description Framework), som i dag jobbes med av et stort internasjonalt miljø. At ikke Tim skulle kjenne til emnekart-miljøet, slik Pepper hinter om i slutten av sitt innlegg er en merkelig påstand, som må være satt fram mot bedre vitende. Pepper vet godt at arbeidet han var en del av for å definere en bro mellom RDF og emnekart under W3C-paraplyen var godkjent av Tim selv. For RDF-miljøet var dette arbeidet også viktig, for det er vesentlig å bygge broer til alle miljøer.

Det er likheter mellom emnekart og RDF, men tross likheter og broer er det ikke emnekartene som kommer til å realisere Tims visjon. Mens emnekart har lite fotfeste utenfor Norge er RDF en del av en rekke Semantic Web-teknologier som har satt en hel industri i bevegelse. Hele spekteret er engasjert, fra støtte for RDF i Oracle, via en mengde større og mindre utviklings- og konsulentselskaper, til små og innovative fri programvare-prosjekter. Nå finnes det milliarder av relasjoner fritt tilgjengelig ettersom f.eks. data fra Wikipedia er formulert som RDF, og antallet vokser for hver dag. Biovitenskapene har spilt mye den samme rollen nå som høyenergifysikken gjorde i webbens barndom, og har vist hvordan Semantic Web-teknologi kan løse innviklede problemer i praksis. I Norge går oljeindustrien med OLF (Oljeindustriens Landsforening) i spissen inn for bruk av Semantic Web i det som kalles ”integrerte operasjoner” — IT-basert styring og vedlikehold av komplekse offshoreinstallasjoner.

På den åpne webben tyder alt på at Semantic Web-teknologi vil dominere, og selv om Tim igjen er en viktig skikkelse i dette arbeidet, er vi mange som drar lasset, av og til sågar i forskjellige retninger.

Kjetil Kjernsmo Senior kunnskapsingeniør, Computas AS, og medlem av W3Cs Semantic Web and Education Outreach gruppe (SWEO).

Advertisements

2 thoughts on “Semantic Web og emnekart — Fremdeles forvirret?

  1. trond

    Uten å ha lest noen av artiklene i ComputerWorld føler jeg for å kommentere et par ting:

    “Det er likheter mellom emnekart og RDF, men tross likheter og broer er det ikke emnekartene som kommer til å realisere Tims visjon.”

    Dette vil nok de fleste i “emnekartmiljøet” være fullstendig enige i. Emnekart ble ikke utviklet for å skape en “intelligent” vev, men for å gjøre det lettere å strukturere informasjon for utforsking og gjenfinning. Emnekart fokuserer mye sterkere på menneske-maskin aspektet, enn f.eks. RDF.

    Emnekart ble altså ikke utviklet for å forsøke å skape en “intelligent” web, og mange mener nok at W3C på dette punktet har satt seg vel høye og urealistiske mål.

    Jeg tror dog ikke det er tvil om at emnekart vil spille en viktig rolle innenfor neste generasjons web, “semantic web”, selv om en slik web muligens ikke er identisk med “Tims visjon”.

    “Mens emnekart har lite fotfeste utenfor Norge er RDF en del av en rekke Semantic Web-teknologier som har satt en hel industri i bevegelse.”

    Dette er både galt og rett.

    Emnekart har nok en mindre utbredelse enn RDF/OWL internasjonalt. Hva dette skyldes skal jeg ikke spekulere i, utover å tro at det kan ha noe med W3Cs rolle på web å gjøre, mangelfull markedsføring fra ISO/emnekart, bruksområder, etc.

    Samtidig har emnekart en stadig voksende utbredelse internasjonalt, og benyttes av så forskjellige selskaper som det nederlandske politiet, finske Nokia og US Dept. of Energy for (ikke alt som gjøres med emnekart er portaler!).

    At Topic Maps 2008 er sponset av bl.a. Microsoft og IBM sier vel også sitt mtp. vekst og tro på emnekart i markedet.

    Hvorvidt alle som tar i bruk RDF benytter rett verktøy for jobben, kan sikkert også diskuteres.

    “Biovitenskapene har spilt mye den samme rollen nå som høyenergifysikken gjorde i webbens barndom, og har vist hvordan Semantic Web-teknologi kan løse innviklede problemer i praksis.”

    Jeg tviler ikke på dette, og slike ting kan også gjøres med emnekart. Se f.eks. historikken hos den tyske TMRA-konferansen (www.tmra.de). I 2007 ble eksempelvis et prosjekt fra Tysklands biovitenskap-verden presentert (se http://www.informatik.uni-leipzig.de/~tmra/2007/ta.html#T7C2), hvor leverandør benyttet emnekart for jobben. Ikke fordi de synes det var interessant med emnekart, men fordi emnekart var rett verktøy for jobben!

    Har man et reelt behov for å uttrykke formal logikk er det rett at emnekart sikkert ikke alltid vil være beste valg. Dette gjelder dog begge veier — hvorfor velge RDF for å strukturere informasjon i portaler, f.eks.? I enkelte tilfeller bør brukskvalitet, og tilrettelegging for sådan, veie tungt!

    “På den åpne webben tyder alt på at Semantic Web-teknologi vil dominere […]”.

    Emnekart er en semantisk netteknologi på lik linje med RDF og OWL, da det er en betydningsbevarende teknologi (ref. semantikk) som evner å fange og strukturere alle former for metainformasjon.

    W3C har (heldigvis) ikke patent på benevnelsen semantisk vev, og “semantic web” kan ha en bredere betydning enn W3C eller Berner-Lees “visjoner”.

    Derfor vil også emnekart være sentral for en semantisk web, og derfor er i alle fall ikke jeg forvirret 😉

Comments are closed.