Länkade data, Malmö 10 juni 2019

Region Skåne arrangerar, i samarbete med bl.a. Malmö Universitet, en eftermiddag om länkade data, och jag samlar mina anteckningar här. I vanlig ordning gäller att de blir som de blir.

Eftermiddagen börjar lite tråkigt då en del deltagare inte kan ta sig till evenemanget pga ett bombhot mot Malmö C. Vi är dock ändå många på plats, och blir hälsade välkomna av Sara Kjellberg, bibliotekschef på Malmö Universitet.

Först ut är Marie Gustafsson Friberger, som undrar hur vi vill ha våra länkade data, prydliga eller ovårdade?

Hon ger en snabb introduktion till länkade data, och nämner TIm Berners Lee, som påpekat att data alltid har relationer till annan data (finns tydligen ett Ted Talk av honom om detta). Tre kriterier för länkade data:

  • Adresserbarhet – ge varje ting en URI
  • Enhetlig informationsmodell
  • Länka ihop

Det gör det möjligt att kombinera data från flera olika källor, t.ex. olika kulturarvsaktörer. Det möjliggör också maskinell bearbetning och kan ge bättre tillgänglighet för data i sökmotorer.

W3C-rekommendationer relaterade till länkade data har utmynnat i RDF, resource description framework. Bygger på ”tripplar”: subjekt, predikat, objekt. Olika tripplar kan sedan kopplas samman för att skapa ytterligare relationer. URI:er används för att identifiera specifika resurser/ting.

Web Ontology Language (förkortas OWL) används i vokabulärer för att beskriva begrepp och relationer mellan begrepp i någon domän. De beskriver vilken typ av relationer ting kan ha till varandra.

Marie berättar vidare om Bibframe 2.0 som ett exempel på ett ramverk för länkade biblioteksdata. Hon tipsar också om DBpedia, som bland annat möjliggör helt nya sökmöjligheter på wikipedia-data.

Ovårdade eller prydliga data (scruffy vs neat), handlar om olika synsätt inom AI-forskning, där scruffies inte tycker att det är så viktigt att förstå varför ett system ger ett visst resultat, medan de som är neat tycker att logiska system är att föredra. Samma begrepp finns inom länkade data (och semantiska webben).

Maries sista tips är vitboken om länkade data, på lankadedata.se/vitbok/introduktion.html 

Martin Persson , XML-specialist på MTM, fortsätter eftermiddagen med att prata om länkade data som dröm, politik och diskursiv praktik.

Informationstekniska drömmar: Den semantiska webben presenteras första gången 2001 i en artikel av Tim Berners Lee et al. Ett citat från artikel visar en ganska storslagen syn på vad länkade data ska göra (det ska ge oss helt nya redskap att leva, arbeta och lära oss tillsammans. Halleluja. ). När artikeln skrev trodde man kanske att webben skulle fortsätta vara fri och bara bli mer och mer öppen för alla att använda.

Martin berättar också om dokumentalisten Paul Otlet som i början av 1900-talet hade en idé om ett världsbibliotek, där all världens litteratur och kunskap skulle samlas och ”atomiseras”, beskrivas på den minsta nivån. Vannevar Busch hade en liknande idé på 1940-talet, en maskin där man skulle kunna mata in information för att snabbt kunna slå upp och visualisera den. Martins slutsats är att standardisering är alltid en ofullständig process, och ovanstående projekt är utopiska. I vardagen finns alltid massor av hinder, vilket leder till friktion.

Här segwayar Martin tjusigt över till det han skrev masteruppsats om 2014, bibliotekspolicyer för delning av öppna länkade data. Han fann då att det fanns en öppenhetsdiskurs och en auktoritetsdiskurs.  Man vill både vara öppen med data men samtidigt ses som en auktoritet, eller att man hänvisar till andra med auktoritet.

När det gäller katalogisering har samatalogisering (copy catalouging) länge varit en grej – Marin visar en annons för tryckta katalogkort från Svensk Biblioteksförening från 1930-talet, Kan man äga biblioteksmetadata, är det rimligt att ställa attribueringskrav vid publicering av öppna katalogdata? Vi påminns om konflikten mellan Libris och OCLC, angående användande av Worldcat. Problemet illustrerar att en ny teknik alltid har sällskap av andra faktorer, som juridik och politik och sociala aspekter.

Martin avslutar med att prata lite om hur Kungliga biblioteket har uttryckt sig i samband med framtagandet av Libris XL, som ju bygger på Bibframe. Man framhäver sig själva som långt framme, men säger samtidigt att det har krävt ”uthållighet och breda samarbeten”.  Martin gör en maktanalys, där det finns en viss relation mellan KB och de katalogisatörer som måste arbeta med den länkade datan varje dag, en liknande spänning som mellan länkade data-entusiaster och den lite svårare praktiken. Det som någon ser som en infrastruktur, ser en annan som sitt dagliga jobb.

Till slut: länkade data-visionen bygger på en decentraliserad webb, tilltagande centralisering blir ytterligare ett hinder.

David Haskiya, från Riksantikvarieämbetet, är siste talare för dagen. Hans rubrik går ut på att första regeln för länkade data är att inte tala om länkade data/eller iaf tala mindre om länkade data. Vi bör fokusera på annat!

Vi är i början av att länkade data börjar vara mainstream, och det märks genom att det är färre som talar om det idag.

Istället borde vi tala om hur länkade data kan/bör användas, och David nämner design thinking cykeln som en visualisering av var vi ofta är fel när det gäller länkade data, där vi ofta går direkt på en lösning, utan att först ta reda på verkliga problem, och skapa testbara prototyper för att lösa dessa problem. För slutanvändare alltså!

Ett universellt gränssnitt för åtkomst till data är inte samma sak som en universallösning (David säger också att de flesta borde anställa UX-kompetens snarare än dataexperter….). Han fortsätter sedan med att visa olika existerande gränssnitt där länkade data till exempel används för autocomplete, och disambiguation (avtvetydliggörande?), bland annat Open library.

David avslutar med att han tycker vi ska tänka stort, men börja smått. Delta i samarbeten med andra, använd existerande plattformar, vokabulärer, standarder och ramverk. Designa tekniska gränssnitt (gränssnitt för tekniker!) med användare i centrum. Öka vår informations hittbarhet på webben.

Dagen avslutas med ett panelsamtal med de tre föreläsarna där det jag tar med mig är att det är viktigt att man frågar sig varför man gör något, vad är det verkliga behovet. Länkade data är inget självändamål!