När och hur ska jag publicera datamängder årligen och hur vet jag när jag ska separera datamängder per år?

Om du har en datamängd som du publicerar årligen t.ex. när du har sammanställt statistiken med månatliga filer så lämpar det sig att göra en datamängd per år. Detta är speciellt bra om det är mycket data per månad eller om du vet att data följer samma datamodell t.ex. leverantörsreskontra enligt specifikation.

Ifall det inte är så mycket data i den månatliga filen du laddar upp i EntryScape så kan du ha en datamängd som omfattar flera år t.ex. 2019-2021. Så länge distributionen har samma datamodell och filerna per månad inte är flera mb så räcker det.

Skapa separat datamängd när datamodellen i data förändras

Om datamodellen däremot förändras mellan 2021 och 2022 eller t.ex. mängden data per månatlig fil ökar mycket så är det viktigt att göra en separat datamängd. Därför blir det viktigt att ha en datamängd per år även om det är månatliga filer, t.ex. CSV uppladdade i distributionen.

Så om du delat upp datamängder “Leverantörsreskontra 2020” och “Leverantörsreskontra 2021 och framåt” så jobbar du inte vidare på den från 2020 men du kan fortsätta med den senare. Kring just Leverantörsreskontra kan det vara bra att ha en per år då det kan bli många rader.

Hur kan jag beskriva en datamängd som är färdig?

När du är klar med en datamängd som exempelvis “Leverantörsreskontra 2020” och data inte uppdateras vidare kan du beskriva den med fältet “Status” som “Färdig” och fortsätta arbeta i den andra datamängden som fortfarande uppdateras. Det är alltså oftast säkrare att bryta av en datamängd per år om det är mycket data i distributionerna.

Hur kan jag förtydliga status?

Datamängd - Beskriv med fältet Tidsperiod som metadata för att förtydliga vilken tidsperiod data gäller.
Distribution - Beskriv med fältet Status.

1 gillning

Hej,
Toppen tack för superbra information för hur man ska strukturera upp år och datamängder. :slight_smile: Och det är under varje distribution som man ändrar status, eller kan man göra det under datamängd också? Kunde inte se någon där nämligen. :slight_smile:

@UlrikaS Toppen, tack, jag kommer uppdatera första inlägget baserat på återkoppling i tråden. :slight_smile: Finns inte fältet så går det inte på den nivån enligt DCAT-AP. Rekommenderar följande:
Datamängd - Beskriv med fältet Tidsperiod som metadata för att förtydliga vilken tidsperiod data gäller.
Distribution - Beskriv med fältet Status.

1 gillning