MoyenneEn mathématiques, la moyenne est un outil de calcul permettant de résumer une liste de valeurs numériques en un seul nombre réel, indépendamment de l’ordre dans lequel la liste est donnée. Par défaut, il s’agit de la moyenne arithmétique, qui se calcule comme la somme des termes de la liste, divisée par le nombre de termes[2]. D’autres moyennes peuvent être plus adaptées selon les contextes. La moyenne est un des premiers indicateurs statistiques pour une série de nombres. Lorsque ces nombres représentent une quantité partagée entre des individus, la moyenne exprime la valeur qu’aurait chacun si le partage était équitable. La notion de moyenne s’étend aux fonctions avec la valeur moyenne, en géométrie classique avec le barycentre et en théorie des probabilités avec l’espérance d’une variable aléatoire. MotivationValeur intermédiaireLa notion de moyenne est historiquement reliée à celle de valeur intermédiaire, appelée aussi médiété[3]. Étant donnés deux nombres a et b, comment choisir une valeur c pour que a soit à c ce que c soit à b ? La réponse diffère selon l’opération choisie pour aller d’un nombre à l’autre. Par exemple, pour aller de 2 à 18, on peut ajouter deux fois 8, avec une étape en 10, ou multiplier deux fois par 3, avec une étape en 6. Le premier cas décrit une moyenne arithmétique, qui s’obtient par la fraction . Le second cas est une moyenne géométrique, qui s’obtient avec la racine carrée . Les identités remarquables usuelles permettent de montrer rapidement que la moyenne géométrique de deux nombres positifs est toujours inférieure à leur moyenne arithmétique. ÉgalisationUne autre manière de définir ces moyennes est de cumuler les nombres choisis puis de chercher comment on peut obtenir le même résultat en cumulant plusieurs fois la même valeur. Tout dépend alors de la procédure de cumul. Avec une addition, on trouve 2+18=20, qu’on aurait pu obtenir en posant 10+10=20. Avec une multiplication, on trouve 2×18=36, qu’on aurait pu obtenir avec 6×6=36. D’autres procédures de cumul sur deux nombres a et b permettent de définir la moyenne harmonique et la moyenne quadratique . Cette approche permet de définir les moyennes pour des listes de plus de deux nombres. Position d'équilibreLa moyenne peut aussi être concrétisée par le point d'équilibre d’un ensemble fini de masses ponctuelles positionnées le long de la droite numérique, comme sur un mobile. Cette approche permet d’introduire naturellement la notion de moyenne pondérée. Par exemple, on peut souhaiter que la moyenne soit trois fois plus proche de la première valeur que de la deuxième. Entre 7 et 19, le nombre 10 est bien trois fois plus proche de 7 (avec un écart de 3) que de 19 (avec un écart de 9). On dit alors que 10 est la moyenne pondérée des nombres 7 et 19 avec les coefficients 3 et 1. On le trouve en calculant la somme pondérée que l’on divise par la somme des coefficients . Moyenne comme meilleure approximationDans le cas où on cherche à évaluer une moyenne de plusieurs points, il vient naturellement de s'intéresser aux distances. La moyenne d'un n-uplet de points (x1, ... ,xn) dans un ensemble de réels X devient alors la valeur qui minimise[4],[5] pour une distance d définie sur X. Le problème est que cette valeur minimale peut être atteinte en plusieurs points, voire ne pas être atteinte du tout. Plusieurs moyennes sont induites par un problème de distance minimale :
En revanche, la mesure basée sur le symétrique du symbole delta de Kronecker ne donnera pas une valeur moyenne du n-uplet mais son mode, et la distance usuelle d(x,y) = |x – y| renvoie la médiane. Pour d'autres moyennes, comme la moyenne logarithmique, le problème reste ouvert car aucune distance associée n'a été déterminée. On peut aussi évoquer la moyenne de Fréchet dans le cas où la fonctionnelle à minimiser est la variance de Fréchet[6]: On parlera de moyenne de Karcher quand le minimum n'est pas atteint en un unique point, et de moyenne de Fréchet quand ce minimum est en un unique point. DéfinitionOn appelle moyenne de deux nombres x et y, une fonctionnelle continue vérifiant les propriétés suivantes : Oscar Chisini donne une définition moins restrictive (en) d'une moyenne « substitutive », où la moyenne de x et y par rapport à m est la valeur t telle que[7],[8]: PropriétésPour qu'une fonction xm = m(x1, ... ,xn) d'un n-uplet de réels x = (x1, ... ,xn) pris dans un ensemble X, puisse être utilisée comme moyenne de x :
On peut ajouter d'autres propriétés, comme l'homogénéité de degré 1 : ou la symétrie : toute permutation des coefficients du n-uplet ne change pas la valeur moyenne ou encore la croissance, pour :
FormulationsMoyenne arithmétiquePour toute liste (x1, ..., xn) de réels, on définit sa moyenne arithmétique par la formule , qui ne dépend pas de l’ordre des termes et est toujours comprise entre les valeurs minimale et maximale de la liste. Cette moyenne est linéaire, c’est-à-dire que l’addition ou la multiplication par une constante sur les valeurs de la liste se traduit par la même opération sur la moyenne. Pour calculer une moyenne sur une liste dans laquelle beaucoup de valeurs sont répétées, on peut noter (x1, ..., xk) la liste des valeurs (sans répétition) et (n1, ..., nk) la liste des effectifs (le nombre de fois qu’apparait chaque valeur dans la liste initiale). La moyenne s’écrit alors . On retrouve la notion de moyenne pondérée, dans laquelle les facteurs ni ne représentent pas nécessairement des effectifs, mais des coefficients appelés poids, par exemple pour calculer la moyenne de notes sur un bulletin scolaire dans lequel on souhaite accorder plus d’importance à certaines disciplines ou à certains devoirs, en leur attribuant un coefficient plus grand que les autres. La moyenne arithmétique est aussi cumulative, c’est-à-dire que si la liste est partagée en plusieurs sous-listes, la moyenne de la liste globale est la moyenne pondérée des moyennes des sous-listes, avec pour coefficients de chaque sous-liste le nombre de termes concernés. Moyennes généraliséesMoyenne d'ordre pÉtant donnée une liste (x1, ..., xn) de réels positifs (voire strictement positifs pour la moyenne harmonique), avec éventuellement une liste (m1, ..., mn) de poids associés, positifs et non tous nuls, on définit les moyennes usuelles suivantes.
Ces moyennes reprennent certaines propriétés de la moyenne arithmétique :
En outre, ces moyennes sont toujours ordonnées par les inégalités suivantes qui prolongent l’inégalité arithmético-géométrique : Toutes ces moyennes s’obtiennent sous la forme ou comme limite d’expressions sous cette forme, et entrent dans la définition de la moyenne d'ordre p. Plus précisément, on retrouve :
Autres moyennesParmi les autres moyennes de deux réels strictement positifs, on trouve :
Moyennes quasi-arithmétiquesOn peut définir la moyenne énergétique de la manière suivante : C'est la moyenne de valeurs données en décibels, utilisées par exemple en acoustique. Cette moyenne n’est pas homogène, mais elle reste cumulative, encadrée par le maximum et le minimum. Elle fait partie de la famille des moyennes quasi-arithmétiques qui s’écrivent sous la forme , où f est une fonction réelle continue et strictement croissante sur un intervalle contenant les valeurs de la liste, et f −1 est sa fonction réciproque. On retrouve en particulier les moyennes d'ordre p avec les fonctions puissances ou avec la fonction logarithme. La moyenne énergétique s’obtient avec la fonction . Moyenne arithmético-géométriqueÀ partir de deux nombres a et b, la moyenne arithmétique et la moyenne géométrique fournissant deux nouveaux nombres, et l’on peut itérer le processus pour obtenir deux suites adjacentes qui convergent vers un réel intermédiaire (parfois noté M(a,b)) appelé moyenne arithmético-géométrique et qui est relié à la longueur d’une ellipse. Cette définition n’est cependant pas cumulative, et ne s’étend donc pas à plus de deux valeurs. Autres familles de moyennesOn peut évoquer, pour deux réels strictement positifs :
Moyenne de MuirheadÉtant donnée une liste (a1, … , an) de réels et une liste (x1, … , xn) de réels strictement positifs, la a-moyenne de x est égale à la moyenne arithmétique des monômes de la forme x1aσ(1) × ⋯ × xnaσ(n) lorsque σ décrit l’ensemble des permutations de ⟦1, n⟧. Cette moyenne est homogène lorsque la somme des exposants ai est égale à 1, et appelée dans ce cas moyenne de Muirhead. Dans le cas particulier n = 2, cette moyenne est appelée moyenne de Heinz. Moyennes comme une intégralePour deux nombres réels a et b, Eves et Chen ont remarqué qu'on pouvait définir plusieurs moyennes par une fonction définie comme le rapport de deux intégrales similaires[15]. Plus précisément, pour une fonction f positive, continue, strictement croissante sur ]0;1] et telle que , alors est bien une moyenne. De plus, en posant, pour une fonction φ positive, continue, strictement croissante sur ]0;1], alors : permet de définir une moyenne sur le modèle précédent. Par exemple, φ(x) := φt(x) = xt, on peut retrouver plusieurs moyennes définies plus haut :
De plus, la monotonie de f permet de retrouver les résultats d'inégalité entre les différentes moyennes. UtilisationsÉvaluation globaleLa moyenne est beaucoup utilisée en évaluation scolaire. Dans de nombreux systèmes scolaires, une partie de l'évaluation des élèves débouche sur une note chiffrée, par exemple
On peut alors calculer la moyenne des notes d'une classe dans une matière, ou la moyenne des notes d'un élève dans une matière. Ces moyennes ont des sens différents :
Dans ces exemples, la moyenne est un lissage des valeurs. On peut bien sûr se demander si la moyenne est un critère pertinent de sélection (voir Évaluation sommative) ; en général, ce n'est pas le seul critère qui entre en compte, à l'exception de certains examens et concours. StatistiqueLa moyenne est la valeur unique que devraient avoir tous les individus d'une population (ou d'un échantillon) pour que leur total soit inchangé. C'est un critère de position. Dans la plupart des cas, le total formé par les individus d'une population est la somme de leurs valeurs. La moyenne est alors la moyenne arithmétique. Mais si le total représenté par une population ou un échantillon n'est pas la somme de leurs valeurs, la moyenne pertinente ne sera plus la moyenne arithmétique. Si, par exemple, le total d'un ensemble d'individus est le produit de leurs valeurs, il convient de calculer leur moyenne géométrique. La moyenne ne peut donc se concevoir que pour une variable quantitative. On ne peut pas faire le total des valeurs d'une variable qualitative. Quand la variable est ordinale, on lui préférera la médiane. GéométrieLe barycentre d’un ensemble fini de points du plan ou de l’espace affine (éventuellement munis de poids positifs ou négatifs) est défini par une relation vectorielle et correspond essentiellement à la notion physique de centre de masse. Les coordonnées cartésiennes de ce barycentre dans un repère sont alors données par la moyenne arithmétique pondérée des coordonnées des différents points. AnalyseLe lemme de Cesàro assure que pour toute suite u convergente, la suite des moyennes partielles converge également vers la même limite. Ce résultat permet d’étendre la notion de limite à des suites divergentes mais pour lesquelles la suite des moyennes partielles converge, comme la suite ((−1)n)n⩾0, dont les moyennes partielles tendent vers 0, ou la série associée, appelée série de Grandi, à laquelle on attribue alors la limite 1/2. Ce procédé est utilisé par exemple dans la définition de somme de Fejér. ProbabilitésLa moyenne empirique d’un échantillon de variables aléatoires réelles (X1, … , Xn) est simplement la moyenne arithmétique de ces variables, notée ou . C’est une variable qui a la même espérance que les variables Xi mais une variance divisée par n (sous condition d'existence). Elle sert notamment comme estimateur (statistique) de l’espérance. PhysiqueLes règles de conservation sur les différentes grandeurs physiques mènent à l’usage de moyennes différentes. Ainsi, la capacité électrique moyenne de condensateurs en série est la moyenne harmonique de leurs capacités, comme la résistance (électricité) moyenne de conducteurs ohmiques en parallèle. L’énergie cinétique dépendant linéairement du carré de la vitesse, la vitesse moyenne d’un ensemble de particules en agitation thermique est la moyenne quadratique des vitesses individuelles. Extensions de la notion de moyenneAu-delà des définitions précédentes de moyenne, il existe d'autres approches plus étendues pour cette notion : Moyenne glissante (ou « mobile »)La moyenne glissante est une notion statistique, où la moyenne au lieu d'être calculée sur n valeurs fixes, est calculée sur n valeurs consécutives « glissantes ». Ce type de calcul est aussi utilisé en informatique pour minimiser la taille mémoire nécessaire au stockage des valeurs intermédiaires. Différentes formules de moyennes glissantes existent, par exemple pour une moyenne glissante de période n :
Moyenne tronquée (ou « réduite »)Une moyenne tronquée est un calcul de moyenne arithmétique qui est appliqué après avoir ignoré les valeurs les plus extrêmes des données. L'idée de la troncation, opération dont le résultat s'appelle une troncature de l'ensemble des données, est de ne pas tenir compte des valeurs les plus éloignées, considérées alors comme aberrantes, et ainsi, dans le cas de la moyenne dite tronquée, de ne la calculer que sur un sous-ensemble « central » des données, la troncature. Notons que cette procédure est généralisable à d'autres estimateurs centraux. Les statistiques tronquées, en anglais trimmed estimators (en), ont été inventées pour pallier la sensibilité des statistiques aux valeurs aberrantes, ce qu'on appelle la robustesse statistique. Leur avantage sur la médiane et sur la moyenne arithmétique est d'allier la robustesse de la médiane, à la définition « collective » de la moyenne arithmétique, la formule de calcul ressemblant fort à celle de cette moyenne arithmétique, lui conférant un avantage psychologique sur la médiane dont le défaut majeur (!) est de ne pas s'écrire avec une formule simplement arithmétique. Historiquement, cette technique a eu son heure de gloire dans la première moitié du XXe siècle comme méthode de « correction » des valeurs aberrantes, et avec l'apparition des premiers calculateurs, notamment, jusqu'aux travaux plus récents pour mieux cerner la notion de robustesse (Peter Rousseeuw (en)). Moyenne pondéréeLa moyenne pondérée est utilisée, en géométrie pour localiser le barycentre d'un polygone, en physique pour déterminer le centre de gravité ou en statistique et probabilité pour calculer une espérance. On la calcule ainsi : Dans le cas général le poids mi représente l'influence de l'élément xi par rapport aux autres. À noter qu'il s'agit ici de la moyenne pondérée arithmétique. Il existe aussi des versions pondérées des autres moyennes, comme la moyenne géométrique pondérée et la moyenne harmonique pondérée. Valeur moyenne d'une fonctionPour toute fonction f continue sur un segment [a, b] non dégénéré (i. e. b > a) ou plus généralement intégrable sur ]a, b[, la valeur moyenne de f sur [a, b] est le réel défini par :
L’inégalité de la moyenne permet d’encadrer cette valeur moyenne par des bornes de la fonction. Si la fonction est continue, le théorème de la moyenne assure même l’existence d’un réel c ∈ ]a, b[ tel que m = f(c). Cette notion généralise celle de moyenne d'un nombre fini de réels en l'appliquant à un nombre infini de valeurs prises par une fonction intégrable. Elle sert par exemple dans la décomposition en série de Fourier d'une fonction périodique : c'est la composante constante. En traitement du signal, pour les signaux périodiques, il s'agit de la composante continue (offset). On peut aussi, par analogie avec les moyennes pondérées d'un nombre fini de réels, affecter « à chacune des valeurs prises par la fonction » un coefficient strictement positif. On utilise alors ce que l'on appelle une fonction poids (w pour l'initiale de weight, « poids » en anglais) :
Ce procédé peut aussi s'utiliser sur un intervalle ouvert ou semi-ouvert mais borné (i. e. aucune de ses bornes n'est infinie) où la fonction ƒ×w est intégrable. On peut citer l'exemple classique servant à montrer l'orthogonalité de la famille des polynômes de Tchebychev : où la fonction Tn×Tp est continue sur le fermé [0,1] et où la fonction poids est est intégrable sur [0;1[, et dont l'intégrale vaut . Nota : Lorsque la fonction est périodique de période T, elle a la même valeur moyenne sur toute période [a, a + T]. Cette valeur commune est appelée valeur moyenne de la fonction. Ainsi la fonction cosinus est de moyenne nulle, son carré de moyenne 1/2. Notes et références
Voir aussiBibliographie
Articles connexes
|