MathématiquesTerminaleProbabilitesFiche de cours
Concentration et estimation
Majorer les fluctuations d'une fréquence et construire un intervalle de confiance à 95 %.
1 L'idée
On cherche à estimer une proportion $p$ inconnue à partir d'un échantillon de taille $n$. La fréquence empirique $f_n$ fluctue d'un échantillon à l'autre. L'inégalité de concentration (Bienaymé-Tchebychev) borne la probabilité que $f_n$ s'écarte de $p$ de plus de $\varepsilon$. Pour $n \ge 30$, l'intervalle de confiance à 95 % donne une fourchette contenant $p$ dans 95 % des sondages répétés.
2 Les formules essentielles
Bienaymé-Tchebychev
\(P(|X-\mu|\ge\varepsilon)\le\dfrac{\sigma^2}{\varepsilon^2}\)
Concentration (fréquence)
\(P(|f_n-p|\ge\varepsilon)\le\dfrac{1}{4n\varepsilon^2}\)
IC à 95 %
\(\text{IC}_{95\%}=\left[f-\dfrac{1}{\sqrt{n}}\,;\,f+\dfrac{1}{\sqrt{n}}\right]\)
3 Démonstration de l'inégalité de concentration
Soient $X_1,\ldots,X_n$ des variables de Bernoulli$(p)$ indépendantes et $f_n=\dfrac{X_1+\cdots+X_n}{n}$.
- $E(f_n)=p$
- $\text{Var}(f_n)=\dfrac{p(1-p)}{n}\le\dfrac{1}{4n}$, car $p(1-p)\le\dfrac{1}{4}$ pour tout $p\in[0,1]$ (maximum en $p=\dfrac{1}{2}$).
Bienaymé-Tchebychev donne alors : $P(|f_n-p|\ge\varepsilon)\le\dfrac{\text{Var}(f_n)}{\varepsilon^2}\le\dfrac{1}{4n\varepsilon^2}$
4 Exemples numériques
Exemple A — Majorer une probabilité
Données : $n=400$, $\varepsilon=0{,}1$.
$P(|f_{400}-p|\ge 0{,}1)\le\dfrac{1}{4\times 400\times(0{,}1)^2}=\dfrac{1}{16}=0{,}0625$
La probabilité d'un écart supérieur à 10 % est majorée par 6,25 %.
Exemple B — Construire un IC à 95 %
Données : $f=0{,}62$, $n=400$.
$\dfrac{1}{\sqrt{400}}=\dfrac{1}{20}=0{,}05$
$\text{IC}_{95\%}=[0{,}62-0{,}05\,;\,0{,}62+0{,}05]=[0{,}57\,;\,0{,}67]$
On estime au niveau 95 % que $p\in[0{,}57\,;\,0{,}67]$.
Méthode — Construire un IC à 95 %
- Calculer $f=\dfrac{\text{effectif favorable}}{n}$.
- Calculer $\delta=\dfrac{1}{\sqrt{n}}$.
- Écrire $\text{IC}_{95\%}=[f-\delta\,;\,f+\delta]$.
- Conclure : « On estime au niveau 95 % que $p\in[f-\delta\,;\,f+\delta]$. »
Erreurs fréquentes
- Confondre IC à 95 % et certitude : $p\notin\text{IC}$ arrive dans 5 % des sondages — ce n'est pas une contradiction.
- Ne pas vérifier $n\ge 30$ avant d'appliquer la formule de l'IC.
- Écrire $\dfrac{1}{4n^2\varepsilon^2}$ au lieu de $\dfrac{1}{4n\varepsilon^2}$ : $n$ n'est pas au carré.
- Confondre intervalle de fluctuation ($p$ connu) et intervalle de confiance ($p$ inconnu, estimé par $f$).