Persistenta identifierare, versionshantering måste finnas i dataset som kallas Öppen data

Jag har nu testat Stockholms stad Öppna data och får en känsla av att man bara ställer ut en påse data och hoppas det är ok… jag saknar massa komponenter.

  • jag saknar Persistenta Identifierare till dataset

  • tydlig versionshantering

  • enkelt att diskutera data, ställa frågor eller pinga någon

  • skickar man in en fråga vill man ha unika helpdesk id

  • skall jag återanvända datat så måste jag på ett tydligt sätt kunna peka på datat som källa då behövs persistenta identifierare för dataset, även kunna peka på en post och helst även en version av posten

  • Dataset jag testat Utegym Sthlm

  • Exempel

A) Exempel hur jag försöker ange källa i WIkidata till ett dataset med en version
image

A-1) hur vet jag att cf2effb7-8e1e-41ab-90b4-d09fd383f0fd är persistent?

A-2) vi har hittat fel i koordinat för post 0180_Utegym_00001 hur kommunicerar vi det tillbaka och hur ser vi när datat blivit uppdaterat

A-3) var skall saker som detta diskuteras… jag har försökt skicka in fel email och på twitter men inga helpdeskid eller reaktioner… ser heller ingen versionshantering jmf Wikidata objektet

image

där vi tydligt kan se skillnad mellan 2 versioner exempel

image

B) “Datakällan är temporär för projekt ÖDIS” vad menas … trovärdighet skapas inte med att gissa…
image

Mer frågor och tankar finns denna arbetsarea i Jupyter Notebook

@Magnus_Salgo Bra att du testat! Och tråkigt att höra att det är känslan efteråt. Vad jag hört så är det plattformen CKAN som levererar tekniken till ÖDIS-projektet som du länkar till.

Har du tagit kontakt med ÖDIS-projektet som driver plattformen kring dina synpunkter? Jag tycker du har många bra poänger och hittade detta om att de uppmuntrar kontakt om deras öppna data:

Kommunerna vill att publicerad data också används. Har du som besökare därför funderingar, frågor eller önskemål kring ny eller redan öppnad data? Hör då gärna av dig till odis@storsthlm.se.

Såvitt jag vet är ingen i ÖDIS-projetet registrerad här. Vore väldigt kul att kunna kommunicera offentligt med ÖDIS-projektet och lära sig av och med dem. Alla deltagare där är självklart varmt välkomna hit!

Håller med har dock inte hittat sätt att kommunicera med varken ÖDIS eller DIGG. Alla verkar sakna tydlighet med helpdesknummer eller att dom har publika backlogs

  • Södertälje kommun - telefon/email och skrivit blog om detta
  • Uppsala kommun - deras Öppen data portal fungerade inte - fick email
  • Malmö kommun - facebook och en person är med i vår Telegramgrupp “Öppen Data - Sverige
  • Stockholms stad - försökt på twitter och email stadsbyggnadskontoret svar men inget ärendenummer

Har hållit på de senaste åren med kulturdata och där har DIGISAM försökt att digitalisera museerna sedan 2012 och det syns knappt… senaste grejen jag upptäckte var då jag kopplade ihop 160 000 personer i ett projekt med Europeana och museerna lyckas inte leverera sina objekt utan att det blir en röra där Europeana sitter och gissar att alla personer med samma text strängar är samma person ex. “Carl Larsson”

Kommer inte dialogen igång med Öppen data med tydliga helpdesknummer så blir vi nog kvar på sista platsen i Öppen data är jag säker på… vi ger kommunerna några månader att skaka fram vindskyddsdata :wink:

Jag förstår. Ja såvitt jag vet finns det inga myndigheter som använder system för att öppna upp publika backlogs, även om registratur och diariet är en bra förutsättning för att registrera alla ärenden som för en backlog som kan vara offentlig och publiceras som realtidsdata.

Tack för bra översikt! ÖDIS har som sagt e-postadressen odis@storsthlm.se jag nämnde ovan, har du provat den?

Intressant med DIGISAM. Gäller att kommunicera det man gör, enklast vore kanske öppet arbetsflöde, inkl. backlog.

Ja ärendenummer för support är en viktig sak. Vissa diarier har det om du testar kommunicera den vägen, bland annat Skellefteå Kommun som kallar sin registrators e-postadress för Kundtjänst. De tilldelade ett kundtjänstnummer för varje ärende sist jag kollade.

1 Like

Skrev denna önskan på GITHUB DCAT-AP-SE

skrik till om jag är ute och cyklar eller det är andra som skall diskutera detta

Bra ärende med rimliga önskemål tycker jag. Tror att det blir så att DIGG eller @matthias svarar där.

Utan att kunna peka unikt på datat fungerar det inte att ha data som källa dvs. kommuner, myndigheter som bara ställer ut en kasse data i skogen som ingen kan hitta blir fel… kan inte vara en trovärdig citerbar källa

Frågan är hur det funkar i dataportalen.se ser länk

där finns en identifierare

image

  • Identifierare HBSutgift11D som jag hoppas är unik hos både dataportalen.se och leverantören av data

Fråga A: kan man enkelt ställa fråga vilka dataset som har Identifierare eller finns det ett API till dataportal.se ?

Det jag skulle vilja helst se är DOI typ 10.1010/HBSutgift11D där första delen prefixet pekar på organisationen och andra delen suffixet är den för organisationen unika löpnumret.

Kunskapsgrafer med dataset som är unika
Om data settet identifieras unikt kan vi sedan skapa kunskapsgrafer vilka som hänger ihop och vilka områden som olika dataset tillhör, vilka svenska dataset som är kompatibla med utländska etc…

Jag beskriver lite hur detta gjorts med vetenskapliga publikationer se länk

Exempel nedan en kunskapsgraf för författare av vetenskapliga publikationer om nucleic acid sequence analysis och vilka som skrivit artiklar ihop eller citerar varandra se graf eller ett verktyg Scholia
image

Skall Öppen data lyfta bör dataseten beskrivas liknande annars blir det bara datakassar i skogen

Föreslog nu en Wikidata egenskap så vi kan koppla ihop organisationen med sin Öppen Data portal

Wikidata:Property_proposal/Generic#Open_Data_portal

image

Nästa steg är att peka ut de olika data seten med #DOI och sedan koppla ihop dataseten ung,. som vi idag kopplar ihop vetenskapliga dokument ex. ämnet "nucleic acid sequence analysis

https://w.wiki/UN2 visar vilka som skriver om ämnet…

jag ser framför mig att vi skall presentera öppna dataset på samma sätt och att då kan AI utvecklare enkelt se att det data som finns om brott i Chicago som används för ML kan appliceras även på Svenska polisens datamängder eller få en alert att nu har Säffle kommun publicerat data som är användbart… med samma ML teknik

1 Like

Fråga A: Det här kan vara det API du frågar om? https://www.dataportal.se/sv/datasets/760_44/status-for-sveriges-dataportal

@mattias Förstår inte hur det API:et fungerar kan jag få ut Öppna data portaler . Finns det ett exempel URL som ger det i JSON …

Jag skapade nyss följande sidor

Vi har en diskussion om att lägga in öppen data portalens URL i infoboxen på Wikidata sidorna för kommunerna

Fråga A: Jag gissar att ni identifierar organisationer som laddar upp data med ett unikt id. Skall vi skapa en Wikidata egenskap för Organisationens id i Sveriges Dataportal i WIkidata ? Kan man länka portalen med detta ID och se alla dataset som lagts upp så vore det smidigt…

Exempel på andra “svenska egenskaper

Lite exempel behövs så kan jag skriva ihop ett egenskaps förslag, du kanske har fler ideer

1 Like

Förstår inte riktigt hur du menar med frågan innan om exempel-URL kring dataportaler. Menar du att du vill ha tillgång till ett API som t.ex. ger status för följande dataportaler i Sverige och fler?

Fråga A: Jag tror att @matthias kan svara bättre på detta än vad jag kan, men vi får se.

Min tanke var att ni kunde vara en källa om att hitta vilka myndigheter/kommuner etc. som har en fungerande dataportal dvs få ordning på denna lista för kommuner. När det gäller Nobelprize.org så kör vi Notebooks som synkar länk

Det intressanta är om vi skall skapa en egenskap i Wikidata som pekar på era organisationer och kan se vilka dataset dom har? Gissar att även där krävs att vi stämmer av för att se om organisationen fortfarande underhåller sitt data… det var lite si och så med det då jag kontaktade SKBL om deras data set se jupyter notebook och det svar jag fick dvs, data utan licens funkar inte,

Hör gärna av er om ni vill ha en egenskap för Öppen data portalen… Fördelen med Wikipedia är det WHO pekar på att vi har stort antal läsare

Jag nås på
Magnus Sälgö
0705937579
salgo60@msn.com

Ps. stort underbetyg till status Öppen data känns det som att det är fler kommuner som har /corona jmf med /psidata

1 Like

Kan vara att detta github DCAT-AP-SE/issues/15 är det som skall finnas i WIkidata som en egenskap för organisationer

Bra fråga! Du är välkommen att testa när det finns i produktion. :slight_smile:

Vet inte om vi varken har resurser till detta eller är lämplig aktör att vara sådan källa. Vad är syftet med att ha en manuell lista? Eller hur skulle den göras automatiskt föreslår du?

Det vore väl rimligt att DIGG publicerar en status-datamängd per portal likt hur de gjort med sin egen. De som inte har en sån datamängd publicerad skulle då kunna betraktas som att inte ha fungerande dataportal, t.ex. PSI-datasida. Den som vill att det ska finnas i Wikidata får nog lösa det, går inte att kräva att någon annan ska publicera eller anpassa sig till Wikidata även om det vore fördelaktigt i flera fall.

Såg inte detta svar men är ni intresserade så ring 0705937579… eller startar ni detta själva

Min tanke på sikt är att det för en organisation i Öppen data portalen som finns på Wikipedia så skall det synas i Wikipedias Infobox att dom finns med data på “Öppen data portalen” och att det finns en länk… men men det tar tid att införa ändringar i svenska Wikipedia alla skall tycka till…

  1. Finns unik id för en organisation hos er som vi kan länka till
  2. Om Ja skapa en Wikidata egenskap tar flera veckor och kan bli nej men borde inte vara problem
  3. sedan skall Infoboxen ändras om ingen protesterar… se tanke bild nedan

Exempel hur en Infobox ser ut för Naturvårdsverket där man skulle kunna tänka sig finnas en koppling till deras dataset i denna portal ex. länk men gärna med ett ID som argument

Fördelen med Wikipedia att många hittar dit…och att det finns stöd för > 200 språk. Finns egenskapen Öppna dataportalen i Wikidata så kan den användas på alla språk i mallar…

Naturvårdsverket finns som artikel på 10 språk som hade 2020 10000 visningar

2 inlägg delades upp till ett nytt ämne: Datamängd med kontaktuppgifter för alla svenska myndigheter

Se mitt svar ovan. Vi har inte planerna på att göra detta själva i dagsläget och jag har inte hunnit kolla hur andra ser på idén men låter rimligt.