V VIDYALAYA · Soutien scolaire
MathématiquesTerminaleProbabilitesFiche de cours

Concentration et estimation

Majorer les fluctuations d'une fréquence et construire un intervalle de confiance à 95 %.
1 L'idée

On cherche à estimer une proportion $p$ inconnue à partir d'un échantillon de taille $n$. La fréquence empirique $f_n$ fluctue d'un échantillon à l'autre. L'inégalité de concentration (Bienaymé-Tchebychev) borne la probabilité que $f_n$ s'écarte de $p$ de plus de $\varepsilon$. Pour $n \ge 30$, l'intervalle de confiance à 95 % donne une fourchette contenant $p$ dans 95 % des sondages répétés.

2 Les formules essentielles
Bienaymé-Tchebychev
\(P(|X-\mu|\ge\varepsilon)\le\dfrac{\sigma^2}{\varepsilon^2}\)
Concentration (fréquence)
\(P(|f_n-p|\ge\varepsilon)\le\dfrac{1}{4n\varepsilon^2}\)
IC à 95 %
\(\text{IC}_{95\%}=\left[f-\dfrac{1}{\sqrt{n}}\,;\,f+\dfrac{1}{\sqrt{n}}\right]\)
3 Démonstration de l'inégalité de concentration

Soient $X_1,\ldots,X_n$ des variables de Bernoulli$(p)$ indépendantes et $f_n=\dfrac{X_1+\cdots+X_n}{n}$.

Bienaymé-Tchebychev donne alors : $P(|f_n-p|\ge\varepsilon)\le\dfrac{\text{Var}(f_n)}{\varepsilon^2}\le\dfrac{1}{4n\varepsilon^2}$

4 Exemples numériques
Exemple A — Majorer une probabilité
Données : $n=400$, $\varepsilon=0{,}1$.
$P(|f_{400}-p|\ge 0{,}1)\le\dfrac{1}{4\times 400\times(0{,}1)^2}=\dfrac{1}{16}=0{,}0625$
La probabilité d'un écart supérieur à 10 % est majorée par 6,25 %.
Exemple B — Construire un IC à 95 %
Données : $f=0{,}62$, $n=400$.
$\dfrac{1}{\sqrt{400}}=\dfrac{1}{20}=0{,}05$
$\text{IC}_{95\%}=[0{,}62-0{,}05\,;\,0{,}62+0{,}05]=[0{,}57\,;\,0{,}67]$
On estime au niveau 95 % que $p\in[0{,}57\,;\,0{,}67]$.
Méthode — Construire un IC à 95 %
  • Calculer $f=\dfrac{\text{effectif favorable}}{n}$.
  • Calculer $\delta=\dfrac{1}{\sqrt{n}}$.
  • Écrire $\text{IC}_{95\%}=[f-\delta\,;\,f+\delta]$.
  • Conclure : « On estime au niveau 95 % que $p\in[f-\delta\,;\,f+\delta]$. »
Erreurs fréquentes
  • Confondre IC à 95 % et certitude : $p\notin\text{IC}$ arrive dans 5 % des sondages — ce n'est pas une contradiction.
  • Ne pas vérifier $n\ge 30$ avant d'appliquer la formule de l'IC.
  • Écrire $\dfrac{1}{4n^2\varepsilon^2}$ au lieu de $\dfrac{1}{4n\varepsilon^2}$ : $n$ n'est pas au carré.
  • Confondre intervalle de fluctuation ($p$ connu) et intervalle de confiance ($p$ inconnu, estimé par $f$).