Sammanfattning av K-samöksmöte 11/12-2012

Mötet ägde rum på Stockhoms läns museum och inleddes med en runda där var och en fick presentera sig och redogöra för vad som är på gång på respektive institution.

Riksantikvarieämbetet/Kulturmiljöbild: Ommappning mot version 1.1 av protokollet pågår och beräknas vara driftsatt i början av 2013.

Historiska museet: Kommer under det närmaste året/åren att byta samlingssystem. De har rekryterat för att kunna jobba med K-samsöksdelarna av systemen. Planerar att mappa om mot version 1.1 under 2013. All media är uppmärkt med Creative Commons eller dylikt.

Livrustkammaren, Skoklosters slott och Hallwylska museet (LSH): Mappar under slutet av 2012 om mot version 1.1 av protokollet. De har sökt och fått Vinnova-pengar som används för att tillgängliggöra digitala bilder (föremålsbilder och fotosamlingar) som kommer att tillgängliggöras under generös licensiering, t ex CC by-sa.

Nationalmuseum: Planerar att ansluta till K-samsök under 2013 och väntar in att LSH:s arbete ska bli klart. Diskussioner pågår på museet hur media ska märkas upp.

Primus: Mappar centralt mot version 1.1 av protokollet. Svenska museer som använder Primus har tagit ett gemensamt beslut om hur de ska förhålla sig till upphovsrätt.

Arkitekturmuseet: Arkitekturmuseet ligger just nu i K-samsöks produktionsmiljö för test av den nya mappningen. De har fattat beslut om att fotografiska bilder tagna före 1969 är Public Domain/Public Domain Mark. Övriga bilder kommer att märkas med CC by. Detta ska vara klart så snart som möjligt. De har även tagit fram nya avtal med fotografer som tar höjd för fri licensiering av media.

Västarvet: Genomför en process för att byta system till Primus. Bohusläns museums foton är migrerade och Naturhistoriska museets foton samt Kulturlagrets foton och föremål är på gång. Har antagit ett policy-dokument för upphovsrätt (Över minnesmuren (pdf)) och mottagandet har varit övervägande positivt. I detta dokument står det bl a att default-licens ska vara CC by-sa. Den samsökstjänst som används av Västarvet, Historiska museet, Tekniska museet, Kulturarv Östergötland och Kulturarv sydost finns i en ny version.

Göteborgs stadsmuseum: Använder Carlotta och kommer att leverera data om foton och föremål till K-samsök i början av 2013. Jobbar även med hur media ska märkas upp.

Stockhols läns museum: Kommer att leverera under 2013 tillsammans med andra institutioner som använder Collective access via en gemensam nod. Länsmuseet kommer endast att leverera media med Creative Commons och kikar just nu på avtalen mellan museet och hembygdsföreningar vilket behöver skriva om. De kikar även på hur de kan använda CC på text.

Statens museer för världskultur: Alla fyra museerna har mappat om mot version 1.1 av protokollet. Har experimenterat med ”magasinet”, den digitala versionen av en ny basutställning som använder K-samsök för att visa data om föremålen. Den finns att testa som webbapp.

Stockhoms stadsmuseum: Har utvecklat ”Digitala stadsmuseet” som ska implementeras i organisationen.  Planen är att kunna leverera till K-samsök under 2013. I Stockholms stad finns en policy kring öppna data vilket innebär generösa fria licenser där det är möjligt för museets media.

Tekniska museet: Är i slutfasen av att mappa om mot version 1.1 av protokollet, klart för drift i början av 2013. Alla bilder är uppmärkta med fria licenser.

På gång i K-samsök
Johan C berättade om vad som gjorts i K-samsök under hösten, bl a:

  • Kopplingar till Wikipedia och Wikimedia Commons har utvecklats vilket innebär att i de fall som det finns en länk som pekar på data i K-samsök kan K-samsöks UGC-hubb spara ner länken till artikeln eller bilden och visa den i Kringla och potentiellt andra tjänster.
  • En inloggad användare kan även lägga in länkar direkt i Kringla.
  • Utveckling av stöd för redundans vilket innebär att om K-samsök går ner finns det en server till som tar över vilket inte märks utåt.
  • Ny mappning mot Europeanas EDM (Europeana Data Model)

Under december 2012 genomförs en teknisk review av K-samsök för att säkerställa en stabil drift och förvaltning. Konsult Johan Behrenfeldt från Decerno deltog i mötet och presenterade uppdraget samt lyssnade och lärde. Frågor som ska besvaras är bl a:

  • Finns det andra sätt att lösa det som K-samsök gör idag?
  • Hur ser kvalitén på dokumentationen ut?
  • Finns det något hindrar att vi släpper K-samsök som öppen källkod (properitära delar/rutiner/kodpaket)?
  • Hur fungerar strukturen på den semantiska webben?
  • Finns det delar i koden som innehåller lösningar som idag kan lösas på ett bättre sätt?
  • Är koden/strukturen/dokumentationen tillräcklig för utvecklare som vill göra applikationer ovanpå datan i K-samsök?

I övrigt:

  • Under 2013 kommer konsolidering att genomföras och således kommer mindre mängd utveckling att genomföras. Den utvecklingen som trots allt utförs är beroende av vad informationsförvaltarna samlat prioriterar.
  • Det finns sedan juli 2012 en ny Informationsavdelning på Riksantikvarieämbetet. För att kunna bedriva ett effektivt myndighetsarbete kommer en processkartläggning och begreppsmodellering att genomföras under 2013.
  • Riksantikvarieämbetet kommer (inom ramen för och utanför K-samsök) att delta i Digisams arbete.

Diskussion om användargenererad information
Användargenererad information diskuterades. K-samsöks UGC-hubb (User Generated Content) är konstruerad på ett sådant sätt att den har potential att låta flera institutioner/K-samsöksutveklare använda den för att skriva och läsa data via ett API. Idag används den dock endast av Kringla. På detta sätt skulle UGC-data skapar i olika tjänster komma flera till nytta. Alla var överens om att idén är god. Ska Riksantikvarieämbetet erbjuda en sådan tjänst krävs det dock ett utredningsarbete kring myndighetens roll som förvaltare av dessa data då den kommer att vara unik och inte kopior som i fallet med K-samsöks data i övrigt. Per L från Västarvet berättade att i deras tjänst har man kunnat kommentera i ungefär två år. På denna tid har ungefär 2500 kommentarer skrivits varav ca 2300 varit av en typ som tillför information till samlingarna. Om man använder UGC-hubben som beskrivs ovan, hur får institutioner veta om t ex rättningsförslag eller frågor framkommer i en annan tjänst än deras egen?

Api:et
En fråga framkom om hur många som använder API:et idag. Johan C sa att det används i begränsad utsträckning och framför allt av institutionerna själva (klicka här för exempel). Det är en utmaning att nå ut med information om att API:et finns. Att säkerställa rättigheter till datan i K-samsök kan ses som ett första steg mot att mer offensivt jobba med detta. Det diskuterades vad API:et som kan göras om API:et används i olaglig verksamhet. Johan C sa att det går att begränsa tillgången till enskilda API-nycklar och att det hanteras på samma sätt som om annat material från institutionerna används i olagliga sammanhang.

Enkät
Johan C gick igenom enkäten som skickades ut i oktober. Den låga svarsfrekvensen gör att representativiteten kan ifrågasättas men ger ändå en hyffsad bild. Resultatet kan sammanfattas i:

  • 13 av de 32 institutioner som fick enkäten har svarat
  • De som svarade använder Primus, Carlotta, Sofie, MuseumPlus, Collective Access och egenutvecklade system.
  • 9/13 levererar data till K-samsök idag.

Svar från de som inte levererar idag (4 svar)

  • Samtliga kommer att leverera under 2013.
  • Samtliga använder eller är på gång att använda Creative Commons.
  • VIAF/Libris och Geonames används.

Svar från de som levererar idag (9 svar)

  • Använder allt ifrån version 0.98 till 1.1.
  • Mappning mot version 1.1 av protokollet är på gång, systembyte ”ställer till” det för några.
  • 6/9 använder Creative Commons mm helt eller delvis På gång hos resten med ett undantag.
  • 2/9 använder auktoritetsposter.
  • SMVK, Tekniska museet, SHM och Västarvet använder K-samsök för sök på egna webben.

Önskemål om utveckling

  • Önskemål kring bättre exempel och instruktioner för mappning.
  • Rensa parametrar.
  • Riktlinjer för hur institutioner kan jobba med Länkade öppna data inom ramen för K-samsök.
  • Samordning kring UGC (se ovan)
  • Gemensamma auktoriteter och ordlistor
  • Bättre mappning mot Europeana (se ovan)
  • Önskemål kring LIDO (se nedan)

Auktoriteter
Publika auktoriteter diskuterades. Hur fungerar det t ex i K-samsök som det finns flera poster som beskriver samma person? Johan C menade att det på den semantiska webben alltid kommer att finnas flera objekt som beskriver samma sak och vad man kan göra är att peka ihop dessa med en sameAs-relation. Fördelaktigt skulle det givetvis vara om flera kunde samarbeta och besluta vilka auktoriteter man ska peka på. Digisam har fått pengar av Vinnova för att kartlägga auktoriteter inom kulturarvsområdet.

Riksantikvarieämbetet avvaktar och ser vad som händer på Digisam men jobbar samtidigt vidare med sina egna databaser och använder t ex Libris person auth i Bebyggelseregistrets person-databas.

LIDO
Önskemål har framkommit från institutioner som använder Museum Plus och Collective Access att K-samsök kan leverera LIDO, t ex till Europeana. Att leverera LIDO direkt till K-samsök skulle även vara ett sätt för mindre institutioner som använder Museum Plus att kunna leverera data till K-samsök och Europeana. Det finns idag möjlighet att leverera LIDO direkt till Europeana. Riksantikvarieämbetet behöver diskutera hur K-samsök ska förhålla sig till LIDO. Ett statement kommer i början av 2013.

Ann-Sofie N sa att det även pågår ett projekt där representanter från Norge, Sverige och Finland ska översätta Spectrum till en nordisk version som kan vara intressant att följa.

Deltagare
Johan Carlström – Riksantikvarieämbetet
Karin Glasemann – Nationalmuseum
Julie Melin – Statens historiska museer
Per Lekholm – Västarvet
Lars Kennerstedt – Riksantikvarieämbetet
Börje Lewin – Riksantikvarieämbetet
Fredrik Andersson – Livrustkammaren, Skoklosters slott och Hallwylska museet
Matts Ramberg – Tekniska museet
Magnus Johansson – Statens museer för världskultur
Johan Behrenfeldt – Decerno
Kristina Berg – Arkitekturmuseet
Pernilla Karlsson – Göteborgs stadsmuseum
Ann-Sofie Nygren – Stockholms länsmuseum
Ingrid Severin – Stockhoms stadsmuseum

Gästblogg: Fornminnen för iPad och iPhone

Per Gustås gästbloggar här om en app som de (IT-bolaget Per & Per) utvecklat baserat på fornminnesdata i K-samsök. Vi på Riksantikvarieämbetet har bidragit med support kring hur man använder K-samsöks API men är inte inblandade i appens form och funktionalitet.
>>Johan Carlström, Riksantikvarieämbetet

Minnesstenen över slaget vid Lena 1208

 

Appen Fornminnen för iPad och iPhone använder K-samsök för att visa information om fornminnen på en karta eller ett flygfoto. Fornminnen är utvecklad av IT-Bolaget Per & Per.

Vårt mål har varit att göra en lättanvänd app som gör det enkelt för den historieintresserade att hitta information om fornminnen. Informationen laddas in löpande när man panorerar över kartan. Många typer av fornminnen har unika ikoner så att man snabbt får en översikt. I appen kan man se en kortfattad beskrivning av fornminnet. Vill man, är det enkelt att hoppa vidare till Riksantikvarieämbetets Fornsök för att se all registrerad information.
Vidare:

  • Det finns stöd för GPS för att göra det lätt att hitta om man är ute och går.
  • Bokmärken gör det lätt att spara ”fynd”.
  • Delning på sociala medier gör det enkelt att tipsa bekanta ifall man hittat något man vill dela med sig av.

Redan visade fornminnen lagras i telefonen/plattan så att de kan visas även när det inte finns bra mobiltäckning, vilket i praktiken inte är så ovanligt när man rör sig ute i naturen. Dessutom sparar det pengar då man inte laddar ner data i onödan via mobilabonnemanget.

Bakom appen ligger K-samsök. Vi upplever tjänsten som snabb och enkelt att komma igång med. Det finns en hel del riktigt kraftfulla funktioner som gör att man kan bygga olika typer av tjänster. Den kartfokuserade appen vi har tagit fram är bara en approach av många som är möjlig att ta. Det är också mycket värdefullt att kunna filtrera vad man hämtar ner och därigenom hålla ner mängden data som hämtas.
Informationen är delvis ostrukturerad och kanske inte alltid enhetlig. Ett slott kan vara en anteckning, samtidigt som en enda utgrävning kan resultera i hundratals anteckningar där varje liten benbit är registrerad. Samtidigt får man komma ihåg att detta är ett register som används av yrkesmän/kvinnor och har byggts upp under årtionden. Det är säkert värt att jobba en del med datakvalitén i registret, samtidigt är det lite av charmen med det, att man verkligen kommer inpå källan.

Ett stor tack till Riksantikvarieämbetet för att man tillhandahåller all den här informationen på ett lätttillgängligt sätt för alla som vill lära sig mer om Sveriges historia.

Appen Fornminnen finns för nedladdning från Apple App Store

>> Per Gustås

Gästblogg: Agenter från Bebyggelseregistret i K-samsök

Byggmästare, arkitekter och andra upphovspersoner ur Bebyggelseregistret skördas nu till K-samsök, och är följaktligen sökbara via Kringla. Det är särskilt roligt för oss att kunna introducera en sökmöjlighet i Kringla som inte ens finns i Bebyggelseregistrets egen sökapplikation ännu.

Den information som finns om personerna i databasen är inte särskilt utförlig, det rör sig huvudsakligen om olika namnformer och levnadsdatum, men tillsammans med kopplingen till byggnaderna ger det en mycket bra överblick över en persons verksamhet.

För oss är detta ett stort steg framåt i vårt arbete med kvalitetssäkring av informationen i databasen, där personauktoriteter är en viktig del. Genom K-samsök/Kringla kan vi nu bland annat göra länkningar till auktoritetsregister och Wikipediaartiklar, jämföra andra institutioners personposter med våra egna och länka in bilder från Wikimedia Commons, i den mån det saknas bilder av objekt i Bebyggelseregistret.

Vi har redan förberett för de kommande stegen i kvalitetssäkringsarbetet. Ett underlag för rensning av dubbletter i personregistret ligger klart för implementering och uppgifter som underlättar identifiering av personerna har lagts till. Vi håller också på att utarbeta en plan för utökning av sök- och registreringsmöjligheterna, bland annat när det gäller länkningar till auktoriteter och andra källor.

Även organisationer (t ex arkitektkontor) är skördade till K-samsök.

Exempel:

>>Jonas Malmdal jobbar med Bebyggelseregistret på Riksantikvarieämbetet

Teknisk review av K-samsök


Foto: Alfred T Palmer, 1942 (Library of Congress)

K-samsök är en viktig del av infrastrukturen kring kulturavsdata i Sverige. För att säkerställa prestanda och  stabilitet har vi anlitat en konsult som under slutet av året kommer att göra en teknisk review av K-samsöks arkitektur, tekniska lösningar och kodkvalitet samt ge råd och förslag. Exempel på frågor som konsulten ska jobba med är:

  • Finns det andra sätt att lösa det som K-samsök gör idag?
  • Hur ser kvalitén på dokumentationen ut?
  • Finns det något hindrar att vi släpper K-samsök som öppen källkod (properitära delar/rutiner/kodpaket)?
  • Hur fungerar strukturen på den semantiska webben?
  • Finns det delar i koden som innehåller lösningar som idag kan lösas på ett bättre sätt?
  • Är koden/strukturen/dokumentationen tillräcklig för utvecklare som vill göra applikationer ovanpå datan i K-samsök?

>> Johan Carlström – systemförvaltare

Ny API-medtod: Välj vilka element du får i svaret

Vi har fått önskemål om att, i ett API-anrop, kunna definiera vilka element man får tillbaka i svaret. Övriga metoder fungerar som de gjorde före denna uppdatering. Såhär går det till:

recordschema

Recordschema anger vilket record-schema som skall användas för söksvaret, dvs vilket
(XML-)format svarsposterna ska ha. Du kan antingen begära en posts hela
RDF, dess presentationsdata eller valfria fält.
Default är att postens RDF returneras om parametern utelämnas.
Möjliga värden är: rdf, presentation, xml

Exempel: recordSchema=xml

http://www.kulturarvsdata.se/ksamsok/api?x-api=test&method=search&query=geoDataExists=j&recordSchema=xml&fields=itemDescription,itemLabel,lon,lat

PARAMETRAR

fields (obligatorisk om recordSchema=xml, annars oanvänd, se ovan)
Anger vilka fält du önskar i svaret. Nästan alla index man kan söka på
kan anges här i en kommaseparerad lista. Utöver dem även vissa extrafält
som tex thumbnail för att få en posts tumnagel. Fältet itemId läggs
också alltid till i svaret även om den inte finns angiven.
Möjliga värden är: kommaseparerad lista av nästan alla sökbara index
samt thumbnail, url, lon (longitud) och lat (latitud).

Exempel: recordSchema=xml&fields=itemId,itemLabel

http://www.kulturarvsdata.se/ksamsok/api?x-api=test&method=search&query=text=yxa&recordSchema=xml&fields=itemLabel,itemDescription,thumbnail,url

http://www.kulturarvsdata.se/ksamsok/api?x-api=test&method=search&query=geoDataExists=j&recordSchema=xml&fields=itemLabel,itemDescription,lon,lat

>>Johan Carlström – systemförvaltare

Avtal/överenskommelse för leverans till K-samsök – ny version

Efter feedback och en vända med våra verksjurister har vi tagit fram ett nytt utkast av avtalet/överenskommelsen mellan Riksantikvarieämbetet och de som levererar data till K-samsök. Vad som är nytt är strukturen, vi har slagit ihop vissa delar och skurit ner på mängden text. Viss information med sådant som är bra att veta för informationsförvaltare har flyttats till ett separat dokument. Vi tar emot ytterligare feedback fram t o m 2012-11-15.

Avtalet/överenskommelsen (pdf)

Ytterligare information för informationsförvaltare (pdf)

Bilaga 1 – CC0

Bilaga 2 – K-samsöks rättighetsmodell (pdf)

>>Johan Carlström – systemansvarig för K-samsök på Riksantikvarieämbetet

Sammanfattning av K-samöksmöte 11/9-2012

Mötet ägde rum i Stora Sessionssalen på Riksantikvarieämbetet i Stockholm. Efter en kort presentationsrunda gick vi varvet runt där företrädare för olika institutioner och system fick berätta om vad som är på gång i respektive verksamhet.

Tekniska museet (Matts Ramberg) levererar idag all sin data till K-samsök. De har planerat ommappning mot version 1.1 men är inte riktigt där än. De använder K-samsök i sitt lokala sök (samma tekniska lösning som även används av Västarvet, Historiska museet, Kulturarv Östergötland och Kulturarv Blekinge).

Världskulturmuseerna (Magnus Johansson) har nyligen uppdaterat sina databaser till senaste versionen av Carlotta (3.2) och har då mappat om mot version 1.1 av K-samsök. De då även levererat händelser och är på gång med Agenter. De kommer att peka på Libris personauktoritet där det är möjligt. En diskussion uppstod om vilka auktoritetsposter som är bäst att pekas och i dagsläget är VIAF eller Libris de som funkar bäst. Det diskuterades även att det skulle vara bra med ett dedicerat element för länkar till Wikipedia.

Svenska Hällristningsforskningsarkiv (SHFA, Ulf Bertilsson) är en forskningsinfrastruktur som långtidslagras hos SND (svensk nationell datatjänst). De har inte planerat in en ommappning mot version 1.1 av K-samsök. De kommer att jobba med att lägga in danskt hällristningsmaterial och kommer även att lägga in poster om personer som sedan kommer att kunna skördas som agenter av K-samsök.

Dramawebben (Marika Lagerkrantz) jobbar för närvarande med handskrivet material som scannas och metadatasätts. De håller på och kikar på Creative Commons etc. XML-kodar alla texter utifrån TEI-standard. De ska mappa om och undersöker för närvarande hur omfattande arbete det skulle kunna vara.

Västarvet (Per Lekholm) driver för närvarande ett digitaliseringsprojetk men det scannade materialet läggs inte ut då man håller på och byter system till Primus. De kommer även att använda Primus arkeologi-modul. Västarvet jobbar med rättigheterna till bilder, har tagit beslut om att de bilder de själva äger upphovsrätten till ska märkas med CC-by-sa.

Nordiska museet (Ulrika Sundberg) levererar via Primus. Deltar i Europeana Fashion. De jobbar med rättigheter, ambitionen är att börja med att sätta CC by på föremålsbilder som de själva har upphovsrätten till.

Riksantikvarieämbetet/FMIS (Antonia Baumert/Mia Carlsson) planerar migrering till ny plattform, efter det mappa FMIS om till version 1.1. De jobbar med att reda ut rättigheter till bildmaterialet (utöver scannade bokuppslag) där det finns många olika typer av material, t ex sonar och bilder som är ett resultat av ett KML-beslut. Bilder kopplade till KML-beslut tillhör staten om de inte är tagna av professionella fotografer. Ambitionen är att använda CC-by så långt det är möjligt.

Riksantikvarieämbetet/BBR (Jonas Malmdal) har under våren utvecklat en ny port mot K-samsök och då mappat om mot version 1.1. Närmast i tid man vill fokusera på är agenter. De har samma problem med bilder som FMIS.

Arkitekturmuseet (Kristina Berg) jobbar med rättigheter, foton som de äger rättigheterna till kommer att få Public Domain Mark och CC-by. Poster för scannade ritningar kommer att läggas ut men utan bild till att börja med.

Primus Sverige (Kristina Berg): Det finns totalt 16 svenska institutioner som använder Primus och ommappning mot version 1.1 görs centralt. Det är lite oklart varför det tar tid men förhoppningsvis bör det vara klart före slutet av oktober. Primus jobbar med att införa auktoritetsposter (KulturNav) som de även kommer att tillgängliggöra så att andra än Primus-institutioner kan använda sig av detta.

Collective Access (Ann-Sofie Bygren) har haft personalomsättning men planerar att kunna göra ett test mot K-samsök före årsskiftet. De kommer att använda sig av standarden Spectrum.

Stockholms Stadsmuseum (Ingrid Severin) planerar att kunna leverera till K-samsök under 2013.

På gång i K-samsök
Det gicks igenom vad som gjorts inom K-samsök under året samt vad som planeras under hösten.

  • Labb kring att koppla ihop K-samsöks-objekt med Wikipedia-artiklar. Har koppling till Riksantikvarieämbetets projekt med Wikipedian in Residence. (pågående)
  • Säkring av stabilitet och drift (utfört).
  • Labb med databas för användargenererat innehåll kopplat till K-samöksobjekt. (pågående)
  • Funderingar kring att koppla ihop K-samsök med Libris på samma sätt som med t ex Wikipedia-artiklar. (planerat)
  • Ommappning mot Europeanas protokoll.(planerat)
  • Diskussion kring LIDO, det finns önskemål om att kunna leverera LIDO till K-samsök som K-samsök sedan kan ”skicka vidare”. Genom att mappa K-samsök mot LIDO skulle vi öppna upp mot flera standarder och underlätta mappning mot t ex Europeana. (planerat)
  • Utveckling av API:et så att man kan definiera vilka element man vill få i svaret när man skickar en fråga. (planerat)

Vi diskuterade om syftet med att leverera till K-samsök. Konsensus rådde kring att ett av institutionernas syften med att leverera till K-samsök är att nå så många som möjligt, att bli en del av en digital kulturarvsallmänning. Det handlar även om utbyte mellan institutioner, dela erfarenheter och hantera problem och utmaningar gemensamt. K-samsök kan även ses som en ”katalysator” som gjort man man blivit tvungen att se utanför det egna systemet och fått en möjlighet att jämföra med andra för att se brister i den egna datan. För SHFA är K-samsök ett sätt att ta sig an forsningens/läroverkens tredje uppgift.

Att delta i arbetet kring K-samsök är även ett sätt att lära sig tänka på nytt sätt, att träna sig i att tänka annorlunda.

Något många ser som en utmaning är att det kan vara ett problem att hitta det man söker i en allt större mängd data och material. Ett större samarbete med pedagoger och verktyg skulle behövas för att skapa urval eller låta användarna skapa urval.

Unstraight
Unstraight Museum är ett projekt som går ut på att lyfta fram icke normativa perspektiv på museisamlingar. De har utvecklat en webbplats där användarna kan lägga in foton på olika saker och beskriva varför det är unstraight för dem. Potentialen finns att metoden kan användas för många fler perspektiv på samlingar. En idé från deras sida är att de som lägger in föremål i databaser på museer taggar föremål med ”unstraight” och sedan beskriver varför de anser detta. Detta kan sedan skördas av K-samsök och visas på The Unstright Museums webbplats (och andra applikationer som använder K-samsöks API). Det har även diskuterats att skörda dessa objekt via K-samsök och spara ner i The Unstraight Museums databas. De använder databasen Collective Access och ansvarar för att bygga en koppling mot K-samsök som andra museer kan använda, t ex Stockholms Läns Museum, Gotlands Museum och Murberget. Att bygga ut museernas databaser med denna funktion kan vara omfattande och behöver planeras i förväg, ett alternativ skulle vara att använda ett gemensamt tema och spara ner kommentarerna om ”varför” i UGC-databasen. Båda dessa kan sedan skördas till K-samsök som har stöd för detta redan idag.

Nytt avtal
Johan C lyfte frågan att inte skörda data till K-samsök som saknar uppmärkt innehåll (t ex bilder). Konsensus rådde att det inte är en bra väg att gå att märka upp omärkt material med t ex ”skyddat” eller ”oklart” eftersom det blir oklart vad som är korrekt uppmärkt och skapar otydlighet i hela systemet. Dessutom försvårar det leverans till Europeana. Johan kommer att diskutera uppmärkningsdelen internt och arbeta fram en ny version av avtalet.

Det  diskuterades vad som händer om en tredjepartsutvecklare lider ekonomisk skada pga att det finns felaktigheter i data. Det tydliggöras i användarvillkor för API:et att felaktigheter kan förekomma men informationsförvaltarna behöver upplysas om det också i avtalet med Riksantikvarieämbetet.

Deltagare:
Lars  Lundqvist – Riksantikvarieämbetet
Matts Ramberg – Tekniska Museet
Magnus Johansson – Statens Museer för Världskultur
Catarina Bertilsson – SHFA
Ulf Bertilsson – SHFA
Marika Lagercrantz – Dramawebben
Ulrika Lindgren – Dramawebben
Per Lekholm – Västarvet
Sanja Halling – Digisam
Ulrika Sundberg – Nordiska Museet
Antonia Baumert – Riksantikvarieämbetet
Mia Carlsson – Riksantikvarieämbetet
Jonas Malmdal – Riksantikvarieämbetet
Kristina Berg – Arkitekturmuseet/Primus Sverige
Sören Lindström  – Stockholms Stadsmuseum
Henrik Summanen – Riksantikvarieämbetet
Mikael Almehag – Stockholms Stadsmuseum
Ann-Sofie Nygren – Stockholms Läns Museum/Collective Access
Ingrid Severin – Stockholms Stadsmuseum
Johan Carlström – Riksantikvaireämbetet

>>Johan Carlström är systemförvaltare för K-samsök på Riksantikvarieämbetet.

Varför bör kulturarvsdata finnas i K-samsök?

Vilka fördelar har informationsförvaltarna – museerna och de andra leverantörerna – av K-samsök? Denna inte helt ovanliga fråga brukar normalt sett besvaras med att ”det förstås är bra att kunna samsöka i de olika samlingarna”. Jag skulle vilja besvara den på ett annat sätt och med lite andra synvinklar. Först några rader om det allmänna lilla helvete av förkortningar som man måste ta sig igenom så fort man närmar sig den något mer tekniska sidan av webben. Många, inte minst jag själv, har ryggat när texter som beskriver digital information är packade med förkortningar av teknisk art. Det är som en mur som byggts upp mellan en tekniskt bevandrad läsare, och någon från ett annat område. När en ny domän uppenbarar sig i språket är detta dock oundvikligt, och det finns mängder av exempel genom historien. Och för att göra saken lite värre tänke jag nu förklara den inledande frågan i denna post med tre förkortningar, men inte utan att också gå igenom vad begreppen betyder. De är centrala för att förstå framtidens infrastruktur för information:
  • LOD
  • API
  • UGC

Detta är vad K-samsök erbjuder. Jag vågar också säga att det med något enstaka undantag är helt omöjligt för informationsförvaltarna att erhålla detta utan just K-samsök. Det är därför K-samsök idag är så viktigt.

LOD (Linked Open Data), har säkert många hört talas om. Nu i somras startade regeringen en plats där man ska samla alla resurser, och Vinnova som fått detta uppdrag av regeringen har en egen och mycket informationsrik sida på temat. Länkade Öppna Data handlar i korthet om att publicera sin information enligt en standard som möjliggör för andra att länka till resurserna på ett strukturerat sätt, och använda resurserna utan trassel med copyrights, betalningar eller speciallösningar. I all enkelhet går det ut på att man skapar RDF:er och lägger ut på webben. Dessa är möjliga för maskiner att tolka, vilket skapar möjligheten att kombinera en mängd olika datakällor för att nå nya höjder av förståelse. Ni har kanske bilden ovan av molnet med länkade öppna data? Nästan längst till höger ser ni K-samsök, med det engelska namnet Swedish Open Cultural Heritage.
Men för att andra program ska kunna komma åt informationen behövs ett gränssnitt för detta, vilket kallas API (Application Programming Interface). Detta finns för K-samsök, och gör det möjligt för vem som helst där ute, med lite kunskaper i programmering, att bygga en tjänst som hämtar allt eller delar av den information som lagras i K-samsök. Det finns sådana tjänster idag, t ex Kringla, Fornfynd (för Iphone) och ett antal andra applikationer. Det mesta tyder på att den här typen av tjänster på sikt kommer att ersätta ”sök i våra samlingar”-tjänster på museiwebbsidor, eftersom berikandet av informationen, till exempel länkningar till andra objekt, eller till Wikipedia, sker på K-samsöks nivå. Eller så bygger man om sina egna söktjänster på museerna och hämtar informationen direkt från K-samsök, som på Världskulturmuseerna.

 

Med de mängder information som blir aktuella när man går från analogt till digitalt är det svårt för de anställda på de ansvariga institutionerna att hantera objekten. Det handlar ju om miljontals objekt och fel i dessa informationsmängder blir oundvikliga. Dessutom så finns stort behov av att länka, förändra eller på andra sätt berika objektinformationen. Detta kan man lösa genom att låta användarna själva korrigera, kommentera och länka materialet. Det är dock viktigt ur juridisk synvinkel att skilja detta material från det som verifierats eller på andra sätt kontrollerats av institutionerna. UGC (User Generated Content) står för all denna informationsberikning. Möjligheten att använda användare för att berika informationen är knappast ny, Wikipedia har till exempel mer än tio år på nacken. Men den är stadigt växande. I Kringla finns det nu möjlighet att lägga in länkar till Wikipedia, och till andra K-samsökobjekt. Dessa sparas i en speciell databas och kommer att finnas tillgänglig för alla som vill bygga applikationer på den information som K-samsök tillhandahåller.

 

Sammantaget hoppas jag att denna lilla genomgång gör det möjligt att få en bättre förståelse för varför K-samsök finns, och varför en stor mängd av fördelarna med digital information idag inte blir möjliga att utnyttja om man som institution inte har med sin information i K-samsök.

 

>> Henrik Summanen jobbar med bl a K-samsök på Riksantikvarieämbetet.

Hur många objekt använder CC i K-samsök?

Vår Wikipedian in Residence, Lennart Guldbrandsson, frågade hur mycket av datan i K-samsök som använder Creative Commons eller Public Domain Mark. Det finns inget enkelt sätt få fram informationen men efter lite URL-hackande i Kringla så fick jag fram att av de objekt som har en tumnagel (exklusive inventeringsböcker i FMIS) använder 1 025 279 st (av 2 071 826 st) objekt elementet mediaLicense för att ange hur bilden får återanvändas (med ffa Creative Commons och Public Domain Mark).

Många av bilderna är märkta med de mer restriktiva varianterna av Creative Commons (t ex Creative Commons Erkännande Ickekommersiell IngaBearbetningar (CC-by-nc-nd)) vilket försvårar återanvändning då användaren t ex inte får förändra bilden eller använda den kommersiellt (vilket i sig ibland kan vara svårt att definiera). Det omöjliggör dessutom användning i Wikipedia som endast tillåter de två friaste licenserna Creative Commons Erkänannde (CC-by) och Creative Commons Erkännande DelaLika (CC-by-sa).

Siffran är ganska imponerande men det är inte fler än ca 50% av objekten med bild som är uppmärkta idag vilket försvårar användning av dem via API:et. Målet är att all media (bilder, pdf:er, ljud osv) ska vara uppmärkta. Detta är även något som institutioner som levererar data till K-samsök förbinder sig att göra i o m att de skriver på avtalet/överenskommelsen. Även Europeana ställer krav att allt content/innehåll som levereras ska vara uppmärkt. Det finns i princip två sätt att lösa detta:

  • Dölja de objekt som har media men som inte använder mediaLicense samt att inte leverera objekten vidare till Europeana.
  • Märka upp dessa o-märkta objekt med ”Rights reserved – free access” enligt den kommande rättighetsmodellen vilket innebär att den som vill använda bilden måste kontakta respektive institution. Detta kommer även att innebära att innehåll som inte längre skyddas av upphovsrätt felaktigt får en märkning som kraftigt försvårar möjligheten till återanvändning.
I förslaget till nytt avtal för leverans till K-samsök är det punkt två som står utskriven men vi har inte beslutat exakt hur vi ska göra än. Skriv gärna en kommentar om du har något att tillägga!
>> Johan Carlström – systemansvarig för K-samsök