rpersen logo

Kapittel 2: Teoretisk rammeverk

Dette kapittelet presenterer sentrale teorier og relevant litteratur som har vært aktuelle i forbindelse med problemstillingen skissert i forrige kapittel. Noen av de viktigste teknologiene og konseptene beskrives også, i tillegg til at deler av kapittelet tar for seg relaterte systemer som har likheter med AnnForum. Kapittelet er delt opp i tre deler.

Første del omhandler bruk av teknologi som et hjelpemiddel sett i en læringskontekst, og da særlig med tanke på diskusjonsforumer. Dette innebærer blant annet en introduksjon til datastøttet læring og relaterte områder. Hvordan kan datamaskiner benyttes i en klasseroms-/studiesammenheng når det kommer til samhandling og kommunikasjon mellom elever, studenter og lærere?

Andre del tar for seg de teoriene og begrepene som har vært relevante for designet av AnnForum, samt hva som er de potensielle fordelene ved å annotere og gjenbruke læringsressurser. Noen av de sentrale teoriene og begrepene som vil bli tatt opp underveis, er blant annet: semantikk, informasjonsfremfinning, semantisk web, annoteringer, ontologier og datastøttet samarbeid. En kort introduksjon til aktuelle teknologier som blant annet XTM Topic Maps vil også bli gitt, i tillegg til en beskrivelse av systemene til Helic og Craven.

Tredje del beskriver prosessen med å gjenbruke læringsressurser, og da særlig med søkelys på annotering og klassifisering av informasjon i diskusjonsforumer. Denne delen gir også en liten introduksjon til kunnskapshåndtering, noen eksempler på slike systemer, og hvordan domenekart og ontologier kan forbedre disse systemene.

2.1 Læring, samhandling og teknologi

De siste femten til tjue årene har datateknologien utviklet seg med rekordfart, noe som har medført en stor interesse for å bruke datamaskiner i forbindelse med utdanning (Koschmann, 2006). Helt fra barnehage til universitetsnivå har man sett på de potensielle fordelene ved å innføre bruk av datamaskiner i forskjellige læringssammenhenger. Dette innebærer ikke bare bruk av datamaskiner i vanlig klasseromsundervisning, men kan også inkludere undervisning gjort over Internett ved hjelp av web-baserte læringssystemer (Web-Based Training, WBT). Men utdanning og læring er en komplisert prosess som involverer mange forskjellige aspekter, herunder psykologi, sosiologi, språk, problemløsning, sosial samhandling, forskning, metodologi og data-teoretiske fag. Det er derfor ingen triviell sak å gjøre endringer i denne prosessen, og selv om gevinstene ved riktig bruk av teknologi i en undervisningssammenheng er mange, så er det også mange fallgruver. For web-basert læring er for eksempel én av fordelene at informasjon er lett tilgjengelig, mens en ulempe er en mangel på ansikt-til-ansikt-interaksjon mellom elever og lærere. Det er derfor viktig at man tenker nøye gjennom fordelene og ulempene ved bruk av teknologi i en læringssammenheng. De ovennevnte momentene har dermed gitt en økt interesse for å forske på dette feltet når det kommer til å bruke ny teknologi relatert til utdanning og læring.

2.1.1 Datastøttet Læring

Datastøttet læring, eller Computer Supported Collaborative Learning (CSCL), er et teoretisk felt relatert til forskning, utdanning, læring og metode og ble først karakterisert av Timothy Koschmann på 1990-tallet (Koschmann, 1996). Koschmann gir en kort forklaring av begrepet og sier at man innenfor datastøttet samarbeid er opptatt av å studere «[...] hvordan mennesker kan lære sammen ved hjelp av datamaskiner [...]» (Koschmann, 2006:1-2). Lipponen bygger videre på dette og sier blant annet at man innen datastøttet læring er interessert i å se på hvordan teknologi og datamaskiner kan brukes til å støtte opp om samhandling mellom brukere og grupper av brukere i ulike, kollaborative læringssituasjoner (Lipponen, 2002). Videre sier Lipponen at feltet bygger på teori fra områder som sosiologi, språk, pedagogikk, informasjonsvitenskap og psykologi, og at det av denne grunnen har vært problematisk å komme til en felles forståelse av hva datastøttet læring egentlig betyr, og da særlig begrepet om samhandling («collaboration»). Dette henger blant annet sammen med at feltet har sitt utspring fra datastøttet samarbeid, og at de to områdene har mange likhetstrekk når det kommer til aspekter som sosial interaksjon ved hjelp av datamaskiner. Samhandling kan ifølge Lipponen i den bredeste forstand defineres som «en aktivitet eller handling der to eller flere personer utfører noe sammen» (Lipponen, 2002:2).

Dillenbourg (1999) forsøker i sin artikkel å forklare hva som menes med samhandling relatert til læring (kollaborativ læring). Kollaborativ læring, i sin bredeste form, er en situasjon der to eller flere personer forsøker å lære noe sammen. Denne vage definisjonen gir tre elementer som man kan bygge videre på: Hvor mange som er involvert, selve prosessen med å lære noe, og til slutt det å utføre læringen sammen, altså i samhandling. Men det å gi en nøyaktig definisjon av begrepet er vanskelig da ordet «kollaborativ» brukes i veldig mange forskjellige sammenhenger. Men grovt sett kan man si at man fokuserer på å løse oppgaver i fellesskap. Med andre ord har deltakerne en felles forståelse av et problem relatert til læring, og de forsøker å løse dette problemet ved at alle deltakerne er aktive. Sosial interaksjon aktørene imellom er en sentral del av kollaborativ læring, og man er ikke fullt så interessert i selve teknikkene for kommunikasjon, som hva det er som blir kommunisert.

Datastøttet læring ser ikke bare på hvordan aktører kan samhandle ansikt til ansikt, men også hvordan læring foregår over avstander, som for eksempel ved bruk av Internett (Koschmann, 2006). Men til forskjell fra e-læring, som i mange tilfeller kun tar for seg digitaliseringen og publisering av læringsinformasjon på Internett, så er man innen datastøttet samarbeid veldig opptatt av at både lærere og studenter skal være aktive i selve læringsprosessen. Et eksempel er et kurs som blir tatt over Internett, og som bruker et system for datastøttet læring som lar studentene diskutere og finne frem til informasjon i en kollaborativ kontekst. Brukerne kan da bruke dette systemet til lettere å løse problemer, utveksle ideer samt dele informasjon og læringsressurser uten å måtte oppholde seg i samme rom. Målet er med andre ord at elevene aktivt skal være med på å konstruere og oppsøke kunnskap, så vel som ta del i denne prosessen i samhandling med sine medstudenter. Det krever altså betraktelig med planlegging og arbeid for å tilrettelegge undervisning til datastøttet læring.

2.1.2 Diskusjonsforumer i læring

Et diskusjonsforum, også kalt et Internett-forum, er et populært verktøy som brukes i situasjoner der man ønsker å kunne holde en diskusjon og debattere omkring et spesifikt tema (Helic, 2005). Dette kan for eksempel være for å diskutere vitenskaplige artikler, komme med forslag til forskjellige problemstillinger eller rett og slett relatert til en hobby. Diskusjonsforumer blir derfor hovedsaklig brukt til å kommunisere med andre. Som oftest har man tilgang til dette forumet via Internett, og temaene som diskuteres, kan være innenfor forskning, hobby, utdanning, nyheter og så videre. Hovedgrunnen til at diskusjonsforumene har blitt så populære, er at de er enkle og intuitive av natur. Man blar gjennom innlegg via en trådbasert struktur og kan enkelt svare på innlegg og legge til nye innlegg ved å fylle ut skjema.

Et diskusjonsforum er et asynkront system, noe som innbefatter at brukerne ikke trenger å være pålogget samtidig for å holde en diskusjon gående, men at de heller logger seg på når det måtte passe dem best. Diskusjonsforum kan ta mange forskjellige former, men felles for de fleste er at de lar brukerne legge inn brukergenerert innhold i form av egne poste/innlegg. Noen forumer lar også brukerne legge ved bilder eller dokumenter. Disse postene er som oftest organisert i en kronologisk, trådbasert eller hierarkisk struktur og ligger tilgjengelig slik at andre brukere kan gå inn og lese hva som har blitt diskutert, samt legge til et svar eller motargument om de skulle ønske det.

De fleste forumene har en administrator samt én eller flere moderatorer i tillegg til vanlige brukere. Administratoren har det overordnede ansvaret for hele diskusjonsforumet og har som regel full kontroll. Dette kan for eksempel være sletting og redigering av poster, blokkering eller oppretting av brukere, åpning av nye tråder og så videre. En moderator er en vanlig bruker som har fått noen av administratorens privilegier, slik som for eksempel sletting og redigering av innlegg. De aller fleste diskusjonsforumene har også en del uformelle normer og regler som det forventes at deltakerne skal overholde, og moderatorens hovedoppgave er i denne sammenhengen å påse at poster som legges inn, er i tråd med forumets retningslinjer, samt å advare eller blokkere brukere som bryter disse. Eksempler på diskusjonsforumer er studenportalen til Universitetet i Bergen (figur 2.1), FLE3 sin kunnskapsbyggingsdel (figur 1.2) og diskusjonsforumet for artikler på Slashdot sine sider (figur 1.1).

Studentportalen

Figur 2.1: Studenportalen ved UiB

Studentportalen kan også muligens defineres som et gruppevaresystem relatert til datastøttet læring, hovedsaklig fordi studentene kan bruke funksjonaliteten i portalen til å ha kontakten med forelesere og andre studenter, så vel som til å lagre læringsmateriale i form av personlige dokumenter og innleveringer.

2.2 Teorier og begreper

Det har lenge vært en kjent sak at det å søke etter informasjon på Internett til tider kan være en møysommelig og tidkrevende oppgave, og en av hovedårsakene som oftest blir dratt frem i denne sammenhengen, er at Internett mangler en konseptuell struktur (Antoniou, 2004:1-2). Med en konseptuell struktur menes det her at informasjonen i hovedsak ikke kategoriseres eller sorteres på noen måte, men at den kun eksisterer i sin reneste form, for eksempel en side eller en artikkel på et nettsted med til dels store mengder ustrukturert tekst. Selv ved riktig bruk av søkemotorer som for eksempel Yahoo! eller Google vil mye tid likevel bli brukt til å lete gjennom urelevante sider før man finner frem til ønsket informasjon. Tim Berners-Lee, mannen som oppfant World Wide Web, har sagt at hovedgrunnen til dette er at data som per i dag ligger på nettet, hovedsaklig er designet, strukturert og organisert med tanke på menneskelig prosessering (Berners-Lee, 2004).

Denne organiseringen gjør det vanskelig for søkemotorer og andre software-baserte agenter å vite hvilken type informasjon det er brukeren vil ha tak i. Av denne grunnen kan man si at det oppstår et skille mellom brukerens informasjonsbehov og måten software-agenten tolker dette informasjonsbehovet på. Dette skillet blir ofte referert til som The Semantic Gap (Smoulders, 2000:5). Der et menneske kan se på et dokument/bilde og fort få en oversikt over innholdet, vil en maskin i samme situasjonen, for eksempel en søkemotor, kun se en sekvens med tegn. Software-baserte agenter tolker med andre ord ikke innholdet (semantikken) i web-dokumenter på noen måte når de søker etter informasjon, de prosesserer kun tekstens tegn ved å se på antall forekomster av ord og hvor i dokumentet ordene forekommer. Rangeringen foretas deretter på bakgrunn av den tekstbaserte analysen. Det at innholdet på nettet ikke er gjort tilgjengelig på et maskin-tilgjengelig språk, gjør det dermed vanskelig, om ikke umulig, for maskiner å bruke automatiske metoder for å finne og tolke data basert på semantikk. Dette er som allerede nevnt også et stort problem i diskusjonsforumer.

2.2.1 Semantikk

For å kunne snakke om semantisk annotering av læringsmateriale er det først nødvendig å gi en forklaring på hva semantikk er. Semantikk kan i den originale, filosofiske sammenhengen sies å være studiet av mening, og da mer spesifikt hvordan ulike ord og termer brukes for å representere informasjon i forskjellige kontekster (Merriam-Webster Online Dictionary). Særlig innen lingvistikk har semantikk blitt hyppig brukt når det kommer til å se på mening og syntaks i språk. Semantikk brukes også i forbindelse med semiotikk der man ser hvordan tegn og symboler blir brukt i forskjellige sammenhenger til å symbolisere og tolke mening. En annen variasjon er logisk semantikk, også kalt modell-teori, eller formell semantikk (Stanford Encyclopedia of Philosophy, 2005). Innen modell-teori er man opptatt av å se på den semantiske relasjonen mellom forskjellige uttrykk i formelle språk og hvordan disse formelle språkene kan brukes i forbindelse med blant annet klassifiseringer. Semantiske teorier, som for eksempel modell-teori, blir brukt innenfor en rekke forskjellige felt. I tillegg til lingvistikk er semantikk mye brukt innenfor matematikk og informasjonsvitenskap, og da særlig i relasjon til semantisk web.

2.2.2 Semantisk Web

Begrepet semantisk web ble opprinnelig utformet av Word Wide Web (www) sin grunnlegger, Tim Berners-Lee, og var hans opprinnelige visjon av hvordan nettet burde vært bygd opp (Berners-Lee, 2000). Målet med et slikt nettverk var å forbedre og effektivisere prosessen med å søke etter informasjon, blant annet ved å utvikle nye teknologier og tekniker, slik at maskiner lettere kunne tolke data og innhold på Word Wide Web. Semantisk web er nå et prosjekt drevet av The World Wide Web Consortium, under ledelse av Tim Berners-Lee, hvor hovedmålet er å endre på noen av problemene nevnt innledningsvis. Dette innebærer blant annet å kunne representere informasjon i en maskin-prosesserbar form, slik at maskiner lettere kan tolke den informasjonen som ligger der (Berners-Lee, 1998). Dette vil man få ved å utvikle nye teknologier og konsepter for representasjon av data, og to av de mest sentrale teknologiene i denne sammenhengen er Resource Descriptive Framework (RDF) og Ontology Web Language (OWL).

I et intervju fra 2007 snakker Berners-Lee om et nettverk av data, som i motsetning til et nettverk av dokumenter (designet for mennesker), kan ses på som en slags global database. Denne globale databasen vil i mye større grad legge vekt på å uttrykke meningen, altså semantikken, til informasjon enn det som per i dag er tilfellet (Berners-Lee, 2007). Maskiner kan da bruke avanserte teknikker og åpne standarder til å hente ut og tolke semantikken til informasjonen som ligger på nettet. Disse åpne standardene vil i en mye større grad gjøre det mulig å skille data og semantikk fra applikasjonslogikk og dokumentinnhold, noe som igjen vil gjøre det enklere å beskrive og lenke sammen data på en måte som gjør at maskiner bedre kan «integrere, aksessere, gjenbruke og dele informasjon på tvers av applikasjoner, forretningsområder og landegrenser».

Det å gjenbruke og dele informasjon handler om å kunne finne alternative måter å representere kunnskap på, og da mer spesifikt hvordan man kan få datamaskiner og programmer til å forstå og behandle informasjon som ellers bare ville vært tilgjengelig for mennesker. Denne problemstillingen har lenge vært sentral innenfor et område av kunstig intelligens som heter Knowledge Representation.

2.2.2.1 Knowledge Representation

Innenfor Knowledge Representation er man opptatt av å se på hvordan man kan representere kunnskap om den virkelige verden, på en slik måte som gjør at maskiner kan tolke denne informasjonen (Nilsson, 1998:301-316). Dette krever i de fleste tilfeller at representasjonene man bruker, er formaliserte og standardiserte, slik at aktørene kan ha et felles utgangspunkt. En slik formalisering innebærer blant annet at man må være enige om de overordnede regler, konsepter og terminologier for det aktuelle området, noe som igjen innebærer at man har en sentralisert struktur. Når man har etablerte standarder, kan aktørene bruke automatiske teknikker til å behandle, hente ut og til og med trekke konklusjoner ut fra data på samme måte som et menneske ville ha gjort det. Dessverre har nytteverdien av Knowledge Representation så langt vært begrenset, og en av hovedårsakene som oftest blir trukket frem, er den ovennevnte sentraliserte strukturen.

Den enorme mengden av tilgjengelig informasjon gjør at det vil være en ekstremt tidkrevende prosess å sette opp en formell representasjon av selv et ganske enkelt område. Et annet problem er hvordan man skal beskrive ulike konsepter fordi et konsept kan ha forskjellige meninger i forskjellige situasjoner. Så selv om en sentral autoritet har vært sett på som nødvendig for at systemet i det hele tatt skal kunne fungere, så fører også denne samme strukturen til at det fort blir veldig vanskelig å administrere ting etter hvert som systemet vokser (Berners-Lee, 2001). Man har rett og slett ikke funnet en enkel løsning på hvordan man kan representere menneskelig kunnskap innenfor kunstig intelligens.

Ved utformingen av semantisk web var det derfor nødvendig med en litt annen fremgangsmåte (Berners-Lee, 2001). Den enorme mengden informasjon som finnes tilgjengelig på Internett, gjør det bortimot umulig å finne en entydig beskrivelse av ulike konsepter. Mennesker definerer konsepter og tolker informasjon på forskjellig måte ut fra situasjonen de befinner seg i, og dette fører til at man ikke kan ha en ovenfra-og-ned-struktur hvor alt er hundre prosent konsist. Der hvor man innen kunstig intelligens og tradisjonell Knowledge Representation har vært nødt til å ha faste, veldefinerte og rigide regler i tillegg til en sentralisert struktur, har man innen semantisk web sagt at usikkerhet og tvetydighet er noe som er nødt til å kunne forekomme. Med så store mengder informasjon, og med så mange brukere som det er på Internett, så må man kunne gi rom for at forskjellige tolkninger kan forekomme.

2.2.2.2 Ontologier

Ontologi som begrep har sin opprinnelse i filosofien og blir definert som «teorien eller studiet av eksistens.» (Gruber, 1993:1). Ontologier henger sammen med den delen av metafysikk hvor man er opptatt med å identifisere og beskrive, med så abstrakte termer som mulig, objekter som eksisterer i den virkelige verden. Man snakker altså om et filosofisk system lagd for å kunne representere ulike tolkninger av faktiske objekter (Guarino, 1998). Gruber har skrevet en del om ontologier i forbindelse med informasjonsvitenskap og gir blant annet den følgende definisjonen: «En ontologi er en eksplisitt spesifikasjon av en konseptualisering» (Gruber, 1993:1). En konseptualisering blir i denne sammenhengen beskrevet som en forenklet og abstrakt representasjon av den virkelige verden og kan bestå av hierarki av klasser og objekter, samt relasjonene mellom disse objektene. En ontologi består som regel derfor av et avgrenset antall konsepter og relasjoner.

Ontologier har vist seg å være nyttige i situasjoner der man forsøker å kategorisere og klassifisere forskjellige typer entiter og objekter, samt relasjonene mellom disse. I denne sammenhengen snakker man mer om én ontologi, hvor det menes at man formelt vil beskrive et utvalgt domene. Ontologier har også vist seg å være nyttige når det kommer til å organisere navigasjonen på nettsider, og en ontologi blir da som oftest i form av en datamodell som beskriver konseptene for det utvalgte domenet, samt relasjonene mellom disse konseptene (Antoniou, 2004). Alle konseptene innenfor et spesifikt domene kalles for et vokabular og blir brukt som et felles utgangspunkt for aktørene. Eksempler på praktisk bruk kan være en oversikt over dyreriket (pattedyr, fugler, fisker osv.) eller en oversikt over alle personer på et universitet (lærere, studenter osv.) samt relasjonene mellom disse. Også innen legevitenskapen har man gjort bruk av ontologier til å klassifisere sykdommer, lage genkart osv.

Et av de største problemene med å lage formelle ontologier har vært at brukerne av en felles, delt ontologi kan ha forskjellige måter å representere kunnskap på. Den ideelle situasjonen ville vært å kunne spesifisere ontologiene uavhengig av et representasjonsspråk. Dette er i hovedsak et teknisk problem: Hvordan skal man kunne lage ontologier som kan representeres på forskjellige måter, uavhengig av plattformer (Gruber, s. 2, 1998)? Innenfor semantisk web har det blitt utviklet et språk for å representere ontologier, kalt Ontology Web Language (se del 2.2.2.4).

2.2.2.3 Fokusområder

Med utgangspunkt i det som allerede har blitt nevnt i del 2.2.2, kan Semantisk Web sies å fokusere på tre hovedområder:

  1. Å lage et universelt medium / felles rammeverk for informasjonsutveksling, altså et felles format for å beskrive og representere data slik at det skal kunne hentes fra flere forskjellige kilder på tvers av applikasjoner.
  2. Å utvikle språk og teknologier som gjør det mulig å si noe om hvordan data kan relateres til objekter i den virkelige verden, og som i tillegg kan tolkes av både mennesker og maskiner gjennom å tolke semantisk innhold.
  3. Å gjøre det mulig å utvikle mer avanserte Knowledge Management-systemer ved å bedre organisere informasjon (Antoniou, 2004:4).

Hensikten er altså ikke at semantisk web skal erstatte det nåværende Internett, men heller utvide det gjennom en gradvis evolusjon. Man ser for seg at dette vil føre til en rekke endringer når det gjelder hvordan applikasjoner utvikles og derfor også hvordan mennesker bruker Internett til å finne informasjon på. Noen av implikasjonene tar Tim Berners-Lee opp i en av sine første artikler om semantisk web (Berners-Lee, 2001). Der gir han blant annet et eksempelscenario hvor en såkalt «semantisk web-agent» brukes til alt fra å skru ned volum på musikken når telefonen ringer, til å bestille time hos legen for din syke mor. Et annet eksempel er at en slik agent kan brukes når man skal planlegge ferien sin, for eksempel ved at agenten finner det beste hotellet og den beste flyruten basert på predefinerte kriterier som pris, sted, bostandard osv. Igjen blir det tatt opp at semantisk web handler om å uttrykke mening og representere informasjon, slik at maskiner skal kunne utføre oppgaver som tidligere måtte gjøres manuelt av mennesker.

2.2.2.4 Teknologier

To av de mest sentrale teknologiene som vil bli brukt for å gi semantikk til data, er på nåværende tidspunkt W3C-anbefalingene Resource Descriptive Framework og Ontology Web Language.

Resource Descriptive Framework (RDF) er en datamodell som tar utgangspunkt i å beskrive ressurser i form av egenskaper og verdier (objekt-attributt-verdi). RDF er særs egnet til å representere metadata om dokumenter på Internett og blir hovedsaklig brukt for å representere ulike typer informasjon på nettet (www). Hensikten er å representere informasjon på en måte som gjør at denne informasjonen kan bli delt på tvers av forskjellige typer applikasjoner.

Ontology Web Language (OWL) er en standard for å spesifisere ontologier og blir blant annet brukt av applikasjoner som har behov for å kunne tolke innholdet av informasjon. OWL har en kraftigere syntaks enn RDF, som gjør det mulig å beskrive informasjon i en maskin-prosesserbar form. Blant annet kan OWL brukes til å representere meningen av forskjellige konsepter samt relasjonene mellom disse konseptene.

En tredje teknologi som også er relatert til semantisk web, er XML Topic Maps (XTM). Topic Maps (domenekart) gjør at man kan lage en indeks over informasjon, hvor informasjonen man indekserer til, ligger utenfor selve domenekartet (Garshol, 2002). Det er tre elementer som er sentrale for XTM: konsepter, relasjoner og forekomster (se del 3.2.2). Topic Maps brukes for det meste til å organisere ulike typer informasjon på nettsteder, men kan også brukes i flere andre sammenhenger, blant andre AnnForum.

2.2.2.5 Implikasjoner og eksempler på praktisk bruk

Selv om semantisk web har kommet et godt stykke på vei, er det nok ennå et stykke igjen til man vil se noen av de applikasjonene nevnt ovenfor. Swoogle er et eksempel på en semantisk web-applikasjon, mer spesifikt en semantisk søkemotor som lar bruker søke etter blant annet ontologier, dokumenter og termer. Et annet eksempel er konseptet om tagging og folksonomier (Shadbolt, 2005). Disse teknikkene har vært brukt en god stund nå og har vist seg å være veldig kraftige i forbindelse med organisering av informasjon. Blant annet blir de ofte brukt av forskjellige nyhetssider, som for eksempel i forbindelse med artiklene Dagbladet publiserer på nettsidene sine.

En tag kan i dette tilfellet sies å være et nøkkelord, en terminologi eller et konsept som brukes for å beskrive informasjon om et spesifikt tema. Det kan på mange måter minne om en annotering. Teknikken går ut på at ressurser klassifiseres i henhold til kategorier/konsepter/nøkkelord, for eksempel «boligmarkedet» eller «nokassaken», noe som gjør det mulig å lettere finne informasjon som omhandler samme tema. Et annet konkret eksempel på en applikasjon som bruker tagging, er Flickr. Flickr lar brukerne dele personlige bilder med hverandre ved at bildene som blir lastet opp, kategoriserer nøkkelord (tags). YouTube gjør også utstrakt bruk av tagging, slik at når man har valgt en film, så har man også muligheten til å se relaterte filmer.

2.2.3 Annoteringer

Det finnes flere forskjellige definisjoner av hva en annotering er, avhengig av hvilken situasjon man bruker de i, noe som gjør det vanskelig å gi en konsis, entydig definisjon av begrepet. Merriam-Webster Online Dictionary definerer en annotering som en to-stegs prosess: et notat eller en kommentar lagt til et dokument, så vel som selve prosessen med å annotere. Annoteringer er med andre ord ekstra informasjon som legges til et dokument, enten i form av et notat eller en tilleggskommentar, med det målet å utdype innholdet i dokumentet. En annen definisjon er gitt av W3C, som definerer annoteringer som eksterne kommentarer, notater eller forklaringer som kan legges til web-dokumenter, eventuelt utvalgte deler av et web-dokument.

Annoteringer har en lang rekke bruksområder, og et typisk eksempel er metadata (data om data) som ofte blir brukt i forbindelse med web-dokumenter. Et annet eksempel er innenfor semantisk web, hvor et av hovedmålene er å beskrive informasjon på Internett ved hjelp av en formell struktur, slik at maskiner kan tolke denne informasjonen på bakgrunn av innhold. Dette innebærer da å bruke formaliserte representasjoner i form av teknologier som RDF og OWL for å beskrive og lenke sammen informasjon. Et tredje eksempel kan være et kort sammendrag eller abstrakt av en bok, slik at man kan lese annoteringen før man bestemmer seg for å lese hele boken.

Euzenat (2002) har også skrevet en del om annoteringer i semantisk web, og han sier i denne sammenhengen at hovedmålet med en annotering er å gjøre det enklere å finne frem til informasjon på bakgrunn av en formell beskrivelse av innholdet. En formalisering av begrepet kan derfor beskrives som en relasjon mellom to objekter: dokumenter og formelle representasjoner. Ut fra disse to objektene har vi så to forskjellige funksjoner, nemlig indekseringer og annoteringer. En indeksering blir definert som en funksjon fra en formell representasjon til et dokument og gjør det blant annet mulig å hente frem et dokument på bakgrunn av en formell representasjon. En annotering på den andre siden er en funksjon fra et dokuments innhold til en formell representasjon. Denne representasjonen blir siden lagt til dokumentet og gjør det mulig å tolke dokumentet på bakgrunn av innholdet.

2.2.4 Taksonomier og folksonomier

Som nevnt i del 2.2.2.5 henger begrepet tagging sammen med klassifisering av ressurser, noe som er veldig relevant for semantisk web. Flickr og YouTube har allerede blitt nevnt som eksempler på nettsteder som benytter seg av tagging, og Gruber (2007) nevner i sin artikkel at tagging først dukket opp som en måte for folk å assosiere ressurser på Internett med personlige nøkkelord. Dette fenomenet har senere fått navnet folksonomi av Vander Wahl (2007) og brukes hovedsaklig i sosiale kontekster. Folksonomier har flere likhetstrekk med ontologier, men med den forskjellen at en folksonomi ikke benytter seg av et like formelt språk som en ontologi. Dette gjør det lettere for «vanlige» folk å benytte seg av folksonomier fremfor ontologier da de kan bruke sitt eget vokabular til å beskrive ressurser og informasjon (Vander Wahl, 2007). En folksonomi kan ses på litt i motsetning til en taksonomi, som også tar for seg klassifisering av informasjon, men innenfor et mer rigid regelsett. En taksonomi er en form for semantisk modellering som definerer et antall konsepter, samt relasjonene mellom disse konseptene som et hierarki av konsepter og underkonsepter, og har tradisjonelt sett blitt brukt innenfor vitenskapen til å for eksempel klassifisere dyr og planter (Merriam-Webster).

2.2.5 Domenemodell

Et domenekart, også kalt en domeneontologi, er en type ontologi som gir en detaljert beskrivelse av konseptene innenfor et avgrenset domene, og er nært knyttet opp til blant annet kunstig intelligens og semantisk web (Antoniou, 2004:10). Domenekart blir vanligvis konstruert manuelt av eksperter, for eksempel forskere, da det er disse som oftest innehar den nødvendige kunnskapen om det aktuelle området.
Det finnes flere forskjellige teknologier for å lage domeneontologier i forbindelse med semantisk web, hvor Ontology Web Language (OWL) nok er den mest kjente. OWL er en W3C-spesifikasjon som gjør det mulig å formelt beskrive et konseptuelt domene i relasjon til semantisk web. Andre standarder som også kan brukes for å lage ontologier, er XML Topic Maps og Resource Descriptive Framework. Topic Maps gjør det blant annet mulig å lage en oversikt over alle konseptene innenfor et utvalgt domene samt å trekke konklusjoner på bakgrunn av konseptene og relasjonene mellom dem.

2.3 Gjenbruk av læringsressurser

Det finnes flere forskjellige typer semantisk annotering og klassifisering av web-baserte ressurser, både når det gjelder diskusjonsforumer og i andre sammenhenger. Som det ble nevnt i del 1.1.1, har blant annet Chen (2004), Helic (2003) og Craven (1998) lagd systemer for semantisk annotering, men med litt forskjellige fremgangsmåter. Denne delen vil gi en forklaring til de forskjellige systemene, i tillegg til å diskutere fordelene og ulempene mellom dem. De fleste fremgangsmåtene går ut på å klassifisere ressurser på bakgrunn av semantikk, og da er teori fra semantisk web-feltet en sentral del.

2.3.1 Annotering og klassifisering av innlegg i diskusjonsforumer

Helic, Maurer og Scerbakov (2003, 2005) har skrevet en del annotering av ressurser i diskusjonsforumer, og de sier blant annet at diskusjonsforumer ikke bare kan være nyttige som et kommunikasjonsverktøy, men at de også kan inneholde mye informasjon relatert til læring. Denne informasjonen kan være i form av spørsmål, dialoger, referering til relevant litteratur lagt til av tidligere studenter, og det ville derfor vært meget nyttig om man kunne tatt vare på disse ressursene og gjort de tilgjengelige for nye studenter som nytt læringsmateriale.

Men det å gjenbruke innlegg i diskusjonsforumer er ingen enkel sak av flere årsaker. Det største problemet er at diskusjonsforumer har veldig dårlige funksjoner for informasjonsfremfinning. Bortsett fra fulltekst-søk er det så godt som ingen funksjoner for å finne frem til relevante innlegg på en enkel måte (Helic, 2005). Det er heller ikke er mulig å foreta kontekstbaserte søk eller navigere etter forskjellige konsepter. I tillegg er titlene for de forskjellige innleggene ofte lite beskrivende, noe som har sammenheng med at brukeren sjelden er motivert nok til å bruke tid på å finne en beskrivende tittel. Kombinert fører disse problemene til at det blir ekstremt vanskelig å bla seg frem til relevante innlegg på en enkel måte. Hovedgrunnen for de ovennevnte svakhetene er ifølge Helic at diskusjonsforumer har en total mangel på konseptuell struktur, og de har derfor i denne sammenhengen utviklet et system kalt WBT-master.

WBT-master et system beregnet på web-baserte diskusjonsforumer og baserer seg på at man gir en konseptuell, semantisk struktur til diskusjonsforumet (Helic, 2003). Dette gjøres med utgangspunkt i et konseptuelt skjema som inneholder konseptene for et utvalgt domene samt relasjonene mellom konseptene. Innleggene i diskusjonsforumet blir deretter tilordnet/klassifisert innleggene i henhold til disse konseptene. Selve tildelingen gjøres manuelt av brukerne. Det er to hovedfremgangsmåter for å klassifisere innlegg i diskusjonsforumer i henhold til den konseptuelle modellen. Den første måten er å gi selve forumet en predefinert struktur basert på den konseptuelle modellen. Den andre måten er benytte seg av en automatisk klassifisering av innleggene i forumet basert på å sammenlikne nøkkelord i innleggene mot konseptnavnene.

Det kan i følge Helic være problematisk å gi selve forumet en predefinert struktur hovedsaklig fordi at det kan forekomme tilfeller der et innlegg kan tilordnes flere enn et konsept. Når det gjelder den automatiske klassifiseringen så sier Helic (2005) at dette kan fungere tilfredsstillende i mange situasjoner, men at det kan føre til problemer i de tilfellene der man bruker flere språk i forumet. Man vil da bli nødt til å oversette konseptene og å ha flere forskjellige applikasjoner for de forskjellige språkene, noe som fører at det kan bli for komplisert å både implementere og administrere I stedet tok de en litt annen fremgangsmåte gjennom å adskille den konseptuelle modellen fra selve diskusjonsforumet. Selve tilordningen av innleggene til de forskjellige konseptene i WBT-master foretas manuelt før innlegget legges til, noe som krever en aktiv deltakelse fra studenten sin side. Helic nevner her at for at denne fremgangsmåten skal fungere må brukerne være motiverte nok, hvis ikke kan det hende at de ikke gidder å bruke tid på den manuelle operasjonen. Men i dette tilfellet er motivasjonen at brukerne faktisk deltar på kurset av egen fri vilje. Det ble også foretatt en evaluering i forbindelse med WBT-master, og resultatene var stort sett positive. Studentene så fordelene med et slikt system, og at de tilegnet seg ekstra kunnskap ved hjelp av systemet.

2.3.2 Knowledge Managment Systems

Større bedrifter og organisasjoner har ofte store mengder data, informasjon og kunnskap som må holdes styr på. Denne kunnskapen består som regel av tekstdokumenter, videoer og arkivfiler og er som oftest i en dårlig strukturert form (Antoniou, 2004:3-7). Knowledge Management ser på forskjellige måter for kunne å håndtere organisatorisk informasjon og kunnskap, slik at det skal bli enklere å organisere, identifisere, vedlikeholde, representere og dele til dels store mengder kunnskap.

Sett i denne sammenhengen er Knowledge Management Systems (KMS) datasystemer som kan hjelpe bedrifter må å få et tilrettelagt miljø hvor det blir enklere å lagre, analysere, gjenbruke og finne frem til organisatorisk informasjon (Maier, 2007). Brukerne av et slikt system vil da få lettere tilgang til sentral kunnskap, noe som har mange fordeler når det kommer til for eksempel utveksling av ideer, samarbeid og så videre. Andre potensielle fordeler ved å ha en slik delt kunnskapsdatabase er at det fører til mindre ekstraarbeid da man har en slags sentral database hvor man kan søke etter informasjon. I tillegg kan slike systemer gjøre det lettere å trene opp nye ansatte, noe som minsker usikkerheten ved å være avhengig av såkalt taus kunnskap.

Taus kunnskap er kunnskap som kan være særdeles viktig for en organisasjon, men som ikke er formelt skrevet ned noen plass. I stedet er denne typen kunnskap personlig og kommer ofte på bakgrunn av for eksempel erfaring (Gourlay, 2003). Det kunne derfor være ekstremt verdifullt om man kunne tatt vare på denne informasjonen når en sentral person slutter, hvis ikke vil den gå tapt. Eksempler på Knowledge Management-systemer inkluderer blant annet Lotus Notes, SAP Knowledge Warehouse, MoinMoin, KnowledgeTree, ulike typer diskusjonsforumer og ikke minst Internett.

Selv om Knowledge Management systemer kan bidra til å gjøre organiseringen av informasjon enklere så har de også flere svakheter (Antoniou, s. 3-7, 2004). Noen av disse problemene har allerede blitt nevnt i del 2.2.2 i forbindelse med Internett, og da særlig dårlige funksjoner for å søke etter informasjon, samt begrenset eller ingen konseptuell struktur. Knowledge Managment som felt er derfor særdeles relevant for Semantisk Web, hovedsaklig fordi at ny teknologi vil gjøre det mulig å lage mer avanserte KMS som ikke har de ovennevte svakhetene. Konseptuelle domenemodeller og ontologier kan i denne sammenhengen brukes til å lage en helhetlig oversikt over et spesifikt område, for eksempel innenfor en organisasjonsstruktur, slik at konsepter og informasjon lettere kan klassifisere.

Grunnen til at ontologier er så godt egnet til slike formål er at de gjør det lettere å beskrive forskjellige typer entiteter og relasjonene mellom disse entitetene på bakgrunn av innhold (se del 2.2.2.2). Når man har organisert informasjon ved hjelp av en ontologi eller endomenemodell i så blir det lettere å bruke automatiske teknikker til å hente frem ønskede data. Blant annet vil man kunne benytte seg spørringer i stedet for vanlige tekstbaserte søk; noe som blir mulig å få til nettopp fordi at man har tilgang til informasjon i en strukturert form. For eksempel vil søkemotorer kunne finne nettsider etter både konsept og innhold, fremfor å bare returnere alle sider som inneholder søkeordene. Flere eksempler på hvordan ontologier kan brukes i forbindelse med Semantisk Web og informasjonsfremfinning finnes i del 2.2.5.

Ontologier og domenemodeller er som nevnt veldig godt egnet til å klassifisere informasjon om utvalgte området, og dette gjelder også i en organisasjonssammenheng der man ofte har mye kompleks informasjon. For eksempell kan man bruke en domenemodell som et organisasjonskart, eller man kan gruppere informasjon i henhold til blant annet avdelinger. Men andre ord så kan ontologier/domenekart brukes til å forbedre funksjonaliteten i Knowledge Managment systemer ved hjelp av momentene nevnt i forrige avsnitt.

Videre til kapittel 3: Design og utvikling >>

Last updated Tue December 16 on 10:18:45

About the site | Contact