Test de Banerji (statistiques)Test de Banerji
Le test de Banerji[1] est un test statistique utilisé en économie pour déterminer si une série économique possède une avance ou un retard significatif sur une autre série, du point de vue des points de retournement. ContexteUne série économique est un ensemble de valeurs économiques dépendant du temps, comme la quantité produite d'un bien, le volume d'échange de valeurs, ou bien des indicateurs économiques (comme le produit intérieur brut)… Une série présente en général des cycles alternés de croissance et de décroissance ; un point de retournement est la transition entre croissance et décroissance — il s'agit alors d'un maximum local de la série (point haut) — ou bien entre décroissance et croissance — il s'agit alors d'un minimum local de la série (point bas). Un phénomène économique a souvent des répercussions sur d'autres. On va alors observer des parallèles sur les formes des séries. Naïvement, on peut dire que :
Banerji considère en particulier les indicateurs économique avancés — c'est-à-dire dont les points de retournement sont en avance par rapport aux autres indicateurs —, comme le LEI (leading economic index (en)), établi par The Conference Board (en), et composé à partir de 10 valeurs. Cet indice est censé pouvoir indiquer les points de retournement de l'économie, mais rien d'autre, et en particulier pas l'intensité des phénomènes ni ce qui se passe entre les points de retournement. Notons que pour être pertinent, un indicateur économique avancé doit être :
On peut difficilement faire une hypothèse sur la loi statistique que suit le point de retournement d'un indicateur. On s'oriente donc vers un test non paramétrique (qui n'est pas basé sur une loi). Par ailleurs, comme il s'agit de comparer des points deux à deux (les points de retournement de deux séries), on s'intéresse aux tests de comparaison par paires. Les tests les plus intéressants considèrent que les échelles de valeur sont uniformes, c'est-à-dire qu'un intervalle donné correspond à la même différence quel que soit l'endroit où l'on se trouve ; c'est le cas des indicateurs, puisqu'ils sont relevés à intervalles réguliers (tous les mois ou tous les trimestres). Hypothèse testéeL'hypothèse nulle du test de Banerji est l'absence d'avance. Tests utilisésTest de casualisation des pairesLe test de casualisation (randomisation) des paires est fondé sur la considération suivante :
La première étape consiste donc à calculer les écarts entre les dates des points de retournement. Supposons que l'on ait n points, donc n écarts entre les deux séries, n différences. Si l'hypothèse nulle est vérifiée, alors chaque différence a une chance sur deux d'être positive, et réciproquement 1/2 d'être négative. Il y a deux possibilités de signe pour chacun des n écarts, donc 2n possibilités. La deuxième étape consiste à calculer la somme des écarts S, puis à calculer toutes les sommes possibles en changeant les signes des écarts :
On calcule donc les sommes Sj :
où (eji)1 ≤ i ≤ n est une suite dans {–1 ; 1}. Il y a donc card{–1 ; 1}n = 2n sommes (S fait partie de ces sommes). On compte le nombre de sommes qui sont supérieures ou égales à S ; soir R ce nombre. Parmi les 2n possibilités, la probabilité, sous l'hypothèse nulle, que l'on ait le cas présent ou un cas plus éloigné de 0 est R/2n :
On peut donc rejeter l'hypothèse nulle avec un niveau de confiance de 1 – P(Sj ≥ S sous H0) = 1 – R/2n, ou, en pourcentages, 100 × (1 – R/2n) % :
Ce test peut se faire à la main jusqu'à environ 10 points de retournement (soit 1 024 sommes à calculer). Au-delà, il faut avoir recours à un programme, l'algorithme a une complexité en O(2n). Si l'hypothèse nulle est rejetée, cela signifie qu'une des séries est en avance sur l'autre. On peut déterminer l'avance en enlevant un pas (un mois, un trimestre) à toutes les sommes déjà calculées, jusqu'à ce que l'on tombe dans l'hypothèse nulle. Avec la même démarche, on peut valider l'hypothèse « les deux séries sont décalées de m mois ». On peut par ailleurs calculer le niveau de confiance pour un décalage de m mois, et ainsi obtenir le « profil d'avance »
Test des différences extrêmes de MosesLe test de Moses permet de comparer l'avance de deux séries par rapport à l'indicateur avancé, dans le cas où il n'y a pas de différence significative dans la tendance centrale des avances, mais une différence dans la dispersion. Considérons une série C, dont l'avance sur l'indicateur avancé est réputée concentrée ; et une série E, dont l'avance sur l'indicateur avancé est réputée étendue. Il y a nC points de retournement pour C, et nE points de retournement pour E. Les avances sont notées respectivement uCi et uEi. On classe les uCi et les uEi dans une même liste, par ordre croissant ; cette liste contient nC + nE éléments. L'hypothèse nulle est que les deux indicateurs E et C proviennent de la même population. Si c'est le cas, les éléments uCi et les uEi doivent être bien répartis dans la liste unique ordonnée. Dans l'hypothèse alternative :
On appelle s (pour span) l'étendue de C, c'est-à-dire le nombre d'éléments de la liste unique ordonnée compris entre le plus petit et le plus grand élément de C (inclus). Il y a donc une suite de s éléments consécutifs de la liste unique ordonnée qui contient tous les uCi, et cette suite est la plus petite. Cette suite contient un nombre g d'éléments de E :
Pour des raisons de stabilité, on exclut les h éléments extrêmes de C (typiquement h = 1 ou 2), et l'on définit l'étendue sh de ces nC – 2h éléments de C. Et ainsi :
La probabilité sous hypothèse nulle que sh ait la valeur observée vaut : où est la combinaison de p parmi n. Si cette probabilité est inférieure ou égale à un niveau de confiance donné, alors on rejette l'hypothèse nulle en faveur de l'hypothèse alternative : E est plus étendu que C. Notes et références
Voir aussiArticles connexesLiens externes
Information related to Test de Banerji (statistiques) |