Vår data uttrycks i format X enligt specifikation Y, är det ok?

Var finns det mer att läsa om dessa tankar? att bara ställa ut en kasse data blir inte bra… :wink:

Inom Wikidata har vi stora problem med att beskriva data och förstå datats kvalitet. Vi har nu implementerat Shape expression för att beskriva och validera datat…

Jag gissar att det är specifikationen på hur en viss datamängd levereras som är det viktiga och att man förstår vilken kvalitet visst data har inte leverans format som XML, JSON utan mer hur olika informationsmängder byggts upp som måste finnas och kunna diskuteras

Jmf hur svenska polisen rapporterar brott och jmf hur man i New York kan skapa statistik… Skall Öppen Data lyfta så måste man kunna jmf datat från olika delar av världen och hitta sätt att informationsmängder publiceras med tydlighegt om innehållet och kvalitet jmf hur otydligt Coronaviruste statistiken är där det är mväldigt svårt att förstå hur dödstalen rapporteras in i olika länder

image

image

I Sverige rapporteras Stockholm som plats för brottet hur skall man veta om det är

  • Stockholms kommun
  • Stockholms Län

  • dvs. det är svårt att jämföra datamängder som inte är tydliga med vad dom innehåller och hur saker och ting klassificeras
1 Like