En bra datamängd utmärks av att den:
- är välbeskriven så man vet var den innehåller
- är lätt att komma åt - dump om möjligt, API om den är för stor eller uppdateras ofta
- är enkel att återanvända maskinellt
- kan underhållas enkelt av dataägaren
En bra datamängd utmärks av att den: