La médiane et la moyenne sont des outils statistiques couramment utilisés pour les comparaisons de salaires. Ces deux outils, qui ont chacun leurs avantages et leurs inconvénients, devraient être employés de manière complémentaire selon le cadre de l'étude.
La médiane est généralement plus représentative pour l'analyse des petits groupes, car la présence de quelques cas extrêmes peut tirer fortement la moyenne vers le haut ou vers le bas et donner ainsi une image qui n'est pas représentative de la grande majorité des données. Prenons un exemple simple pour illustrer le phénomène : un groupe de 10 salaires, dont 8 de 5'000 francs et 2 de 10'000 francs. La moyenne est 6'000 et la médiane de 5'000. La moyenne est tirée fortement vers le haut, dans une zone où il n'y a justement pas de salaires. La médiane est par contre représentative de la majorité des salaires analysés.
Dans les grands groupes, de plusieurs dizaines ou centaines de données analysées, la médiane et la moyenne tendent à se confondre. Les dispersions vers le haut et vers le bas tendent à se compenser et d'autre part les cas extrêmes isolés ont peu d'influence sur la moyenne.
Dans les grands groupes, c'est toutefois la médiane qui peut donner une image peu représentative de la réalité. C'est le cas lorsque les groupes analysés sont formés de sous-groupes eux-mêmes assez homogènes, mais bien distincts les uns des autres. Pour illustrer ce phénomène, prenons à nouveau un cas simple avec deux groupes de 100 salaires. Dans chacun des deux groupes, il y a un sous-groupe de bas salaires de 4'000 francs et un sous-groupe de hauts salaires de 6'000 francs. La proportion des deux sous-groupes est différente entre les deux groupes. Dans le premier, il y a 60% de bas salaires et 40% de hauts salaires. Dans le second groupe, la proportion est inversée. Dans cet exemple, la moyenne est de 4'800 pour le premier groupe et de 5'200 pour le second, soit un écart de 400, correspondant à 8% de la moyenne globale des deux groupes. Les médianes donnent par contre une image très différente, avec une valeur de 4'000 pour le premier groupe et de 6'000 pour le second. L'écart est alors de 2'000, soit 40% de la moyenne globale. Dans cet exemple, l'écart calculé sur la base des médianes donne manifestement une image fortement biaisée de la réalité, alors que les moyennes permettent une bonne représentation de cette réalité.
L'exemple ci-dessus est évidemment simpliste. Dans son principe, il correspond toutefois bien à certaines analyses statistiques basées sur les médianes, qui sont publiées par des organismes officiels. Ainsi par exemple, l'Office fédéral de la statistique publie une statistique des salaires selon le niveau des qualifications requises pour le poste de travail, en comparant les salaires des femmes et des hommes. Cette statistique distingue 4 niveaux de qualifications, des plus exigeantes aux plus simples. Les deux niveaux les plus élevés sont présentés de manière regroupée. Dans la mesure où les proportions de femmes et d'hommes sont probablement inversées entre les deux niveaux de qualifications, il est probable que l'écart calculé sur la base de médianes biaise l'image de la réalité, alors que les moyennes seraient plus représentatives. Cette même critique s'applique encore plus nettement aux comparaisons des salaires médians pour l'ensemble des 4 niveaux de qualifications.
Autre exemple : l'analyse comparative publiée conjointement par l'Office de la statistique et le Bureau de l'égalité, avec notamment une comparaison selon le niveau hiérarchique. Cette notion de niveau hiérarchique distingue plusieurs niveaux de cadres et un niveau dit de non-cadres. Ce groupe des non-cadres englobe une large majorité de la population étudiée. Il est très hétérogène en termes de fonctions et de salaires, avec toute une série de zones de salaires, élevées, moyennes et basses. Comme les proportions de femmes et d'hommes dans ces zones sont différentes, avec tendanciellement des proportions plus élevées de femmes dans les zones de bas salaires, la comparaison basée sur les médianes des groupes tend à donner une image biaisée de la réalité, alors que les moyennes seraient plus représentatives.
La moyenne (arithmétique, simple) est le résultat de la somme des données individuelles divisée par le nombre de données individuelles.
La médiane est la valeur qui se situe au milieu des données individuelles, avec une moitié en dessus et une moitié en dessous. Lorsque le groupe étudié a un nombre impair de données individuelles, la médiane correspond exactement à la donnée individuelle située au milieu du groupe. Ainsi par exemple avec 11 données classées dans l'ordre ascendant, la médiane correspond à la sixième donnée, avec les 5 premières en dessous et les 5 dernières en dessus. Lorsque le groupe étudié a un nombre pair de données, la médiane est la moyenne entre la donnée la plus élevée dans la moitié basse des données et la donnée la plus basse dans la moitié haute des données. Ainsi par exemple avec 10 données classées dans l'ordre ascendant, la médiane est la moyenne entre la cinquième et la sixième donnée.
Article 7.3 du manuel Cepec de gestion des salaires Visualisation des salaires: Benchmarking et gestion.