L’analyse statistique sert à décrire, analyser ou à estimer les informations de l’étude de marché. Elle constitue une aide à la prise de décision.
Les différentes variables statistiques et leur représentation
1. Distinction entre variable discrète et variable continue
Une variable est la propriété étudiée d’un individu. Un individu est l’élément de base qui constitue la population. La population correspond au phénomène étudié et l’effectif est le nombre d’entités correspondant à chaque variable.
a) La variable discrète
Une variable discrète est représentée par un nombre fini sur le plan quantitatif ou par une catégorie sur le plan qualitatif (ex. : les succursales). La représentation graphique d’une variable discrète prend généralement deux formes :
- Le diagramme circulaire : l’angle d’un secteur correspond au pourcentage de chaque variable multiplié par 360°. I faut ensuite les cumuler pour les autres secteurs.
- Le diagramme en bâton : son principe est de raisonner sur la hauteur des bâtons en fonction des effectifs des différentes variables. Les bâtons sont séparés et distincts.
b) La variable continue
Une variable continue est définie dans un intervalle car elle put prendre une infinité de valeurs à l’intérieur de celui-ci. Sa représentation graphique est l’histogramme, dont le principe de construction consiste à raisonner sur l’aire du rectangle et non sur sa hauteur.
2. Les séries chronologiques
Elles représentent l’évolution des effectifs d’une variable dans le temps. La représentation graphique d’une série chronologique est une courbe.
La tendance centrale et la dispersion d’une série statistique
L’objectif est de disposer d’outils qui permettent de mieux comprendre la série étudiée. Une tendance centrale permet de positionner un
point central représentatif de la série. La dispersion permet d’envisager l’homogénéité (dispersion faible) ou l’hétérogénéité (dispersion forte) de la variable étudiée par rapport à la tendance centrale.
1. Le mode et l’étendue
Le mode correspond à la valeur de la variable qui se répète le plus souvent dans la série. Pour une variable continue, il faut identifier la classe modale (100 ; 200) et, par convention, prendre le milieu de la classe pour déterminer le mode (soit 150 000 euros dans l’exemple). L’étendue est la différence entre la valeur la plus basse de la variable et la valeur la plus élevée (soit ici 500 – 0 = 500). Afin d’affiner la dispersion de cette série, il faut cependant savoir si le fait de prendre en considération un chiffre d’affaires de 0 pour un agent est pertinent. Il conviendra alors d’affiner la dispersion par le chiffre d’affaires le plus faible dans les faits.
2. La médiane
La médiane est la valeur de la variable qui divise une série statistique en deux parties égales. Afin de la déterminer, il faut calculer les effectifs cumulés croissants (ECC). Les ECC représentent le cumul des effectifs pour chaque valeur de la variable.
Exemple : l’ECC 77 exprime que 77 agents (25 + 52) ont un chiffre d’affaires inférieur à 200 K€.
Attention, pour la lecture et ‘interprétation des résultats des ECC, il faut toujours raisonner sur la tranche supérieure de l’intervalle. (par exemple, dans l’intervalle [100 200], la tranche supérieure est 200 K€). Les effectifs cumulés décroissants (ECD) sont, en tout point, la logique inverse des ECC. Le raisonnement s’effectue donc sur la tranche inférieure de l’intervalle. À noter que, graphiquement, le point d’intersection des ECC et des ECD représente la médiane. Le rang de la médiane est la moitié de l’effectif total (N).
La moyenne et l’écart type
La moyenne est définie comme la somme des valeurs de la variable pondérée des effectifs sur l’effectif total. Elle est notée x. Si l’étude porte sur une variable continue, il faut, par simplification, prendre le centre des classes de la variable.
L’écart type, noté o, est la racine carrée de la variance. La variance, notée o, (V(x), n’exprime rien. Elle n’est qu’une étape mathématique afin d’aboutir à l’écart type.
La prévision de la demande
L’entreprise doit parfois s’interroger sur l’évolution de la demande dans l’avenir, sur le marché visé. Se baser sur les ventes antérieures peut parfois être dangereux, notamment si la concurrence est exacerbée. La demande apparente (en valeur ou en volume) put être une donnée plus intéressante à étudier. Il convient aussi de prendre en considération le cycle de vie de certains produits afin d’anticiper éventuellement une rupture dans la tendance, qui ne permettra donc pas un ajustement linéaire.
L’ajustement linéaire permet de formaliser la tendance ultérieure de la demande par une droite (soit une équation de la forme y = ax + b). Une fois celle-ci déterminée, il suffit de modifier la valeur de la variable x pour estimer les données futures.
Nous constatons graphiquement la possibilité d’un ajustement linéaire de cette série. Le principe sera alors d’estimer la demande pour les années postérieures à 2018 (pointillés en rouge). Deux méthodes sont généralement utilisées.
1. La méthode de Mayer ou méthode
des points moyens
Elle consiste à diviser la série chronologique en deux groupes et à déterminer pour chacun les coordonnées d’un point moyen. L’équation de la droite passera par ces deux points.
2. La méthode des moindres carrés
Il s’agit de déterminer le coefficient directeur (a), dans un premier temps, et ensuite la constante (b) afin de déterminer l’équation de la droite.
La prise en compte d’un phénomène saisonnier
1. Le postulat de départ
Certaines activités peuvent rester saisonnières : les ventes subissent l’influence soit des saisons, soit d’un événement culturel. Celui-ci affecte la demande d’un marché. La détermination des coefficients saisonniers permettra l’actualisation de la prévision : soit en extrapolant le phénomène, soit en le « gommant ».
L’activité de l’entreprise peut reposer sur une activité saisonnière, qu’elle essayera généralement de lisser par une activité complémentaire en relation avec sa compétence métier. Ainsi, Salomon, vendeur de matériel de ski, a transposé son activité hivernale vers les rollers et les randonnées de montagne.
2. La méthodologie en 4 points
a) La détermination du trend et du calcul des points (Y*)
Grâce aux méthodes de prévision de la demande, il s’agit de réutiliser l’équation de la droite afin de recalculer l’ensemble des points de la droite pour toutes les valeurs de x, que l’on notera Y*. Cette phase de calcul préparatoire permettra de passer à l’étape suivante.
b) La détermination des coefficients saisonniers
Le calcul de y/Y*, permet de déterminer un coefficient entre les données réelles et les points de l’équation de la droite de tendance. Si le coefficient est supérieur à 1, cela signifie que la droite est en dessous des données réelles, ce qui caractérise ici le phénomène saisonnier, et inversement.
Il suffît alors de déterminer le coefficient moyen en fonction de la périodicité, soit ici le trimestre : T1 = (0,71 + 0,79 + 0,76 + 0,75) / 4 = 0,75.
La méthodologie est identique pour les autres coefficients.
T1 = 0,75 T2 = 1,17 T3 = 1,33 T4 = 0,75
c) L’évolution future
Comme dans l’évolution de la demande, il faut déterminer, grâce à la droite de tendance, la prévision pour les années futures. La prévision est réalisée grâce à l’incrémentation des valeurs de x, pour les périodes à prévoir. Dans le cas présent, pour les trimestres de l’année 2019, les valeurs de x, seront les suivantes Y* 2019 :

d) L’actualisation de l’évolution
L’actualisation des valeurs en fonction de la prise en compte du phénomène saisonnier se réalise grâce à la multiplication des valeurs futures (Y* 2019) par le coefficient saisonnier correspondant à la période. Ces valeurs sont ici notées Y**.