Éléments d’information, souvent numériques, qui servent de point de départ à une étude statistique.
Les données statistiques peuvent être des données numériques ou des données alphanumériques.
- Des données brutes sont des données non encore classées.
- Dans une distribution statistique, une donnée aberrante est une valeur qui s’écarte de manière significative du groupe de données principal (ou grappe). Une donnée aberrante est non représentative de l’ensemble des données de la distribution.
- L’analyse des données est une branche de la statistique développée depuis plusieurs années grâce aux progrès de l’informatique. Ses méthodes visent à dégager les paramètres caractéristiques d’un très grand nombre de données recueillies, par exemple lors d’enquêtes statistiques tels que les recensements et les sondages auprès des populations, ou encore suite à la cueillette de données météorologiques sur une très longue période et un très vaste territoire.
Exemple
- On a demandé aux 30 élèves d’une classe le nombre d’enfants actuellement vivants dans leur famille. Les données brutes recueillies sont : 2, 3, 1, 1, 2, 1, 4, 2, 3, 1, 2, 2, 3, 1, 1, 4, 20, 2, 1, 3, 2, 2 ,3, 1, 1, 2, 1, 2, 3, 3, 1.
- Dans l’ensemble des données brutes précédentes, la donnée 20 est une donnée aberrante.