Vår data uttrycks i format X enligt specifikation Y, är det ok?

Ja, DCAT-AP-SE gör det möjligt att tala om i vilket format och i enlighet med vilken specifikation din data uttrycks och tar inte ställning för eller emot enskilda format eller specifikationer. Med detta sagt finns det starka skäl för att hålla sig till öppna (och välkända) format och specifikationer när så är möjligt.

Var finns det mer att läsa om dessa tankar? att bara ställa ut en kasse data blir inte bra… :wink:

Inom Wikidata har vi stora problem med att beskriva data och förstå datats kvalitet. Vi har nu implementerat Shape expression för att beskriva och validera datat…

Jag gissar att det är specifikationen på hur en viss datamängd levereras som är det viktiga och att man förstår vilken kvalitet visst data har inte leverans format som XML, JSON utan mer hur olika informationsmängder byggts upp som måste finnas och kunna diskuteras

Jmf hur svenska polisen rapporterar brott och jmf hur man i New York kan skapa statistik… Skall Öppen Data lyfta så måste man kunna jmf datat från olika delar av världen och hitta sätt att informationsmängder publiceras med tydlighegt om innehållet och kvalitet jmf hur otydligt Coronaviruste statistiken är där det är mväldigt svårt att förstå hur dödstalen rapporteras in i olika länder

image

image

I Sverige rapporteras Stockholm som plats för brottet hur skall man veta om det är

  • Stockholms kommun
  • Stockholms Län

  • dvs. det är svårt att jämföra datamängder som inte är tydliga med vad dom innehåller och hur saker och ting klassificeras
1 Like

@Magnus_Salgo Denna fråga har jag lånat in som innehåll från DIGGs specifikation DCAT-AP-SE på GitHub men som inte går att diskutera där. Kanske @matthias eller DIGG vet mer om vart det går att läsa mer om dessa tankar.

Du har helt rätt, och jag minns att vi pratade om detta förra året. Det är därför vi försöker skapa möjligheter att lära sig göra mycket mer när man är på gång första gången att “ställa ut en kasse”.

Självklart, men det är kanske inte jämförelsen av data från olika delar av världen som man kan börja med när olika börjar lägga ut sin första datamängd. Det är helt klart så att datamängderna blir mindre värdefulla när de inte går att jämföra men samtidigt bör en fråga sig om det har ett värde i sig att jämföra eller om det görs för jämförandets skull? Oavsett om den ena eller andra organisationen gör bättre i jämförelsen så är det till syvende och sist varje enskild organisation som måste utvecklas, oavsett jämförelsen.

Ja helt klart. Det är därför vi förespråkar och hjälper till för att få organisationer att beskriva och klassificera sin datamängd mer detaljerat än att bara skriva t.ex. “Stockholm”. Bra poänger @Magnus_Salgo, tack!