Exos Estimation Correction
Exos Estimation Correction
Exos Estimation Correction
Estimation ponctuelle
Exercice 1. (☀)
1
La durée de vie d’une lampe est une v.a.r. qui suit une loi exponentielle de paramètre m inconnu.
On cherche à estimer la durée de vie moyenne m de la lampe.
On prélève un échantillon de n lampes et on note X1 , X2 , . . . , Xn leurs durées de vie. On pose
1P n
Xn = Xk .
n k=1
1. a) Montrer que X n est un estimateur sans biais de m.
b) Calculer son risque quadratique.
2. On pose Yn = min(X1 , . . . , Xn ).
a) Déterminer la loi de Yn .
b) En déduire que Zn = nYn est un estimateur sans biais de m.
c) Calculer son risque quadratique.
3. Comparer les deux estimateurs.
Exercice 2. (☆)
Le second tour d’une élection met en présence deux candidats A et B.
On souhaite réaliser un sondage afin de connaître, avec un niveau de confiance de 0, 95, le futur
vainqueur. Sachant par ailleurs que les deux candidats sont au coude à coude, on veut réduire la marge
d’erreur à 0, 01.
1. Donner le nombre minimal d’électeurs à interroger si on se fie à l’inégalité de Bienaymé-Tchebychev
pour faire le calcul.
2. Même question en utilisant le théorème de la limite centrée.
Exercice 3. (☀)
Soit X une v.a.r. suivant la loi uniforme sur [0, θ], où θ > 0 est un paramètre inconnu. On considère
un n-échantillon (X1 , X2 , . . . , Xn ) de la v.a.r. X.
On considère les estimateurs suivants :
n+1 0
Tn = 2Xn , Tn0 = max(X1 , X2 , ..., Xn ) et Tn00 = Tn
n
1 Pn
où Xn = Xk est la moyenne empirique du n-échantillon.
n k=1
1. a) Montrer que Tn est un estimateur sans biais de θ.
b) Déterminer le risque quadratique de Tn .
c) Tn est-il un estimateur convergent de θ ?
2. a) Déterminer les biais et risque quadratique de Tn0 .
b) Donner un équivalent simple en +∞ de rθ (Tn0 ).
3. Mêmes questions pour Tn00 .
Quel est le meilleur des trois estimateurs ?
4. Écrire un programme Scilab simulant ces trois estimateurs.
1
ECE2 Mathématiques
Exercice 4. (☀)
Soient X1 , . . . , Xn , Y1 , . . . , Ym , n + m variables aléatoires indépendantes suivant une loi de Bernoulli
de paramètre inconnu p.
On se propose d’estimer p. On suppose dans la suite que n > m.
On considère les estimateurs de p suivants :
1 Pn 1 Pm M1 + M2
M1 = Xk , M2 = Yk et N =
n k=1 m k=1 2
Exercice 5. (☀☀)
Un jeu télévisé consiste à poser à un candidat une succession de questions à choix multiples. Les
questions sont posées dans un ordre de difficulté croissant et rapportent de plus en plus d’argent au
candidat.
L’équipe qui conçoit les questions décide de tester la difficulté d’une d’entre elles pour savoir à quel
moment du jeu il serait préférable de la poser. Pour ce faire, on se propose de réaliser un sondage dans
la population.
Modélisation du problème
• On propose à chaque personne interrogée 3 réponses, la réponse correcte étant la réponse 1.
• Le comportement d’une personne interrogée est le suivant :
× si elle connaît la réponse correcte, elle la donne.
× sinon elle choisit au hasard une des trois réponses proposées.
On prend ainsi en compte la possibilité qu’une personne interrogée donne la réponse correcte par
chance.
• On note X la v.a.r. égale à la réponse donnée par la personne interrogée.
On note Y la v.a.r. égale à :
× 1 si la personne interrogée connaît la bonne réponse,
× 0 sinon.
Enfin, on note θ (paramètre que l’on cherche à estimer) la probabilité qu’une personne de la popu-
lation connaisse la réponse correcte.
1. a) Reconnaître la loi de Y .
b) Déterminer, en fonction de θ, la loi de X. On note p = P([X = 1]).
Exprimer alors θ en fonction de p.
c) Quelle est, en fonction de θ, la probabilité qu’une personne ayant choisi la réponse 1 l’ait fait
car elle connaissait réellement la réponse ?
2. Afin d’estimer θ, on constitue dans la population n groupes de 30 personnes qui seront interrogées
par un enquêteur.
Pour 1 6 i 6 n, on note Vi la variable égale au nombre de réponses 1 obtenues dans le groupe i.
V1 + · · · + Vn
Les v.a.r. Vi sont supposées mutuellement indépendantes. On note enfin Zn = .
30n
2
ECE2 Mathématiques
L est une fonction appelée vraisemblance. Elle permet de mesurer la probabilité que notre modèle
ait donné lieu à l’observation (v1 , . . . , vn ).
Le principe du maximum de vraisemblance est de choisir comme estimation de p la valeur qui
maximise la vraisemblance de modèle par rapport à la donnée (v1 , . . . , vn ).
a) Expliciter, en fonction de p, la valeur de L(p).
b) Étudier les variations de la fonction f : p 7→ ln(L(p)).
c) Montrer que f et donc L admet un maximum.
On note pb le point en lequel f atteint ce maximum.
Remarque
La quantité pb s’écrit sous la forme :
pb = h(v1 , . . . , vn )
Elle est choisie comme estimation du paramètre p.
On définit alors L’estimateur Zn du maximum de vraisemblance par :
Zn = h(V1 , . . . , Vn )
1. a) Étudier la continuité de f .
b) Montrer que f est une densité de probabilité.
On note dans toute la suite X une v.a.r. réelle de densité f .
FX désigne sa fonction de répartition.
2. a) Déterminer la valeur FX (x) lorsque x < 0, puis lorsque x > r.
x2
b) Montrer que pour tout réel x de [0, r], FX (x) = 2 .
r
2r
3. a) Montrer que X admet une espérance et que E (X) = .
3
3
ECE2 Mathématiques
r2
b) Montrer que X admet une variance et que V (X) = .
18
Dans toute la suite n désigne un entier naturel non nul et (X1 , X2 , . . . , Xn ) un n-échantillon de la
v.a.r. X. On cherche alors à estimer le réel r.
3 Pn
4. On note Tn = Xk et on cherche à estimer r avec Tn .
2n k=1
a) Montrer que Tn est un estimateur sans biais de r.
b) Calculer le risque quadratique de Tn (noté r(Tn )).
5. On note Mn la v.a.r. prenant pour valeur le maximum des valeurs prises par les variables X1 , X2 , . . . , Xn ,
de sorte que, pour tout réel x :
2n n 2
E (Mn ) = r et V (Mn ) = 2r
2n + 1 (n + 1) (2n + 1)
4
ECE2 Mathématiques
L
11. Montrer que : Mn −→ r.
n→+∞
Exercice 7. (☀)
Soit X une v.a.r. réelle admettant une espérance est m et une variance σ 2 .
Soit (X1 , X2 , . . . , Xn ) un n-échantillon de la v.a.r. X.
1P n
1. Montrer que Tn = Xk est un estimateur sans biais de m.
n k=1
1 P n
2. On pose Vn = (Xk − Tn )2 .
n k=1
n
1
X − (Tn )2 .
P 2
a) Montrer que : Vn =
n k=1 k
n
1
(Xk − m) − (Tn − m)2 .
2
P
b) Montrer que : Vn =
n k=1
n−1 2
c) Montrer que E(Vn ) = σ .
n
d) Construire, à partir de Vn , un estimateur sans biais V cn de σ 2 .
e) On dispose d’un échantillon de n observations (x1 , x2 , . . . , xn ) de la v.a.r. X. Donner une méthode
pour obtenir une estimation ponctuelle de σ 2 à partir de ces observations.
5
ECE2 Mathématiques
1 j
Montrer que, pour tout j ∈ N, ϕ(j) = 1 − .
n
On a donc ϕ(j) indépendant du paramètre θ inconnu.
4. a) Montrer que ϕ(Sn ) est un estimateur sans biais de e−θ .
b) Calculer le risque quadratique de ϕ(Sn ).
c) Montrer que ϕ(Sn ) est un estimateur convergent de e−θ .
5. a) En utilisant le théorème des accroissements finis, démontrer que :
exp(θ) − 1
16 6 exp(θ)
θ
6
ECE2 Mathématiques
I. Préliminaires
Dans cette partie I., λ désigne un réel strictement positif.
1. Soit X une variable aléatoire suivant la loi exponentielle de paramètre λ.
a) Déterminer la fonction : x 7→ P([X > x]) (appelée fonction de survie de X).
Démonstration.
• Comme X ,→ E (λ), sa fonction de répartition est donnée par :
(
0 si x < 0
FX : x 7→
1 − e−λx si x > 0
• Soit x ∈ R. Deux cas se présentent alors :
× si x < 0 :
P([X > x]) = 1 − P([X 6 x]) = 1 − FX (x) = 1 − 0 = 1
× si x > 0 :
P([X > x]) = 1 − FX (x) = 1 − 1 − e−λx = e−λx
(
1 si x < 0
Finalement, la fonction de survie est : x 7→ .
e−λx si x > 0
b) Pour tous nombres réels strictement positifs x et y, calculer la probabilité conditionnelle
P[X>x] ([X > x + y]) ; justifier alors que, si X modélise la durée de vie d’un phénomène, on dise
de ce dernier qu’il est « sans vieillissement ».
Démonstration.
Soient x > 0 et y > 0.
• D’après la question précédente, P([X > x]) > 0.
e−λ(x+y)
= (car x + y > 0 et x > 0)
e−λx
e−λx e−λy
=
e−λx
La probabilité que le phénomène ait encore lieu après x + y « heures » sachant qu’il a déjà
eut lieu durant x heures ne dépend que de la durée supplémentaire x + y − x = y ajoutée.
Il est donc sans vieillissement.
7
ECE2 Mathématiques
Commentaire
Soit (x, y) ∈ ]0, +∞[2 . Démontrons l’inclusion : [X > x + y] ⊂ [X > x].
Soit ω ∈ [X > x + y], alors : X(ω) > x + y.
Par transitivité, on obtient :
2. Soit (Xn )n>1 une suite de variables aléatoires indépendantes, de même loi exponentielle de paramètre
λ. Pour tout entier naturel n non nul, on pose :
n
P
Sn = Xk .
k=1
Démonstration.
Soit n ∈ N∗ .
• La v.a.r. Sn admet une espérance en tant que somme de variables aléatoires qui admettent
toutes une espérance.
n
P
E(Sn ) = E Xk
k=1
n
P
= E(Xk ) (par linéarité de l’espérance)
k=1
Pn 1 (car X1 , . . ., Xn ont
=
k=1 λ même loi E (λ))
1
= n
λ
n
E(Sn ) =
λ
• La v.a.r. Sn admet une variance en tant que somme de variables aléatoires qui admettent
toutes une variance.
n
P
V(Sn ) = V Xk
k=1
n
P (car X1 , . . ., Xn sont
= V(Xk )
k=1 indépendantes)
Pn 1 (car X1 , . . ., Xn ont
=
k=1 λ
2 même loi E (λ))
1
= n
λ2
n
V(Sn ) =
λ2
8
ECE2 Mathématiques
b) Démontrer par récurrence que, pour tout n de N∗ , la variable aléatoire Sn admet pour densité
la fonction fn :
0 si t < 0 ;
t 7−→ λn
e−λt tn−1 si t > 0.
(n − 1)!
Pour cela, on admettra que, si U et V sont des variables aléatoires indépendantes admettant
respectivement pour densité les fonctions fU et fV , alors la variable aléatoire U + V admet pour
densité la fonction fU +V définie sur R par :
Z +∞
fU +V (t) = fU (x)fV (t − x) dx.
−∞
Démonstration.
Démontrons par récurrence que : ∀n ∈ N∗ , P(n)
où P(n) : Sn est une variable à densité, de densité fn .
I Initialisation :
0 si t < 0 ;
• D’une part, par définition : f1 : t 7→ λ −λt 0
e t si t > 0.
0!
Or, pour tout t > 0 :
λ −λt 0
e t = λ e−λt
0!
(
0 si t < 0 ;
Ainsi : f1 : t 7→ −λt .
λe si t > 0.
On reconnaît une densité d’une variable aléatoire de loi E (λ).
• D’autre part : S1 = X1 . Donc : S1 ,→ E (λ).
D’où P(1).
I Hérédité : soit n ∈ N∗ .
Supposons P(n) et démontrons P(n + 1)
(i.e. Sn+1 est une variable à densité, de densité fn+1 ).
• Remarquons tout d’abord : Sn+1 (Ω) ⊂ [0, +∞[.
En effet, pour tout i ∈ J1, n + 1K, Xi = [0, +∞[.
• De plus :
n+1 n
P P
Sn+1 = Xk = Xk + Xn+1 = Sn + Xn+1
k=1 k=1
9
ECE2 Mathématiques
Ainsi : Z t
fn+1 (t) = fn (x) f1 (t − x) dx
0
On obtient :
t
λn
Z
fSn+1 (t) = e−λx xn−1 λ e−λ(t−x) dx
0 (n − 1)!
Z t
λn+1
= e−λx xn−1 e−λt eλx dx
(n − 1)! 0
Z t
λn+1
= e −λt xn−1 dx
(n − 1)! 0
t
λn+1 xn
= e−λt
(n − 1)! n 0
λn+1 −λt n
= e t
n!
0 si t < 0
Finalement : fSn+1 : t 7→ λn .
e−λt tn−1 si t > 0
(n − 1)!
D’où P(n + 1).
Par principe de récurrence, pour tout n ∈ N∗ , Sn est une variable à densité de densité fn .
10
ECE2 Mathématiques
Commentaire
Pour bien comprendre la présentation du cas « t > 0 », remarquons qu’on cherche,
comme annoncé, l’ensemble sur lequel produit fn (x) f (t − x) est non nul. Soit x ∈ R.
fn (x) f1 (t − x) 6= 0 ⇔ fn (x) 6= 0 et f1 (t − x) 6= 0
( (
x ∈ [0, +∞[ x>0
⇔ ⇔
(t − x) ∈ [0, +∞[ t−x>0
(
x>0
⇔ ⇔ 06x6t
x6t
Cette présentation est d’ailleurs tout aussi acceptable, mais elle sort un peu des pré-
sentations usuelles. C’est pourquoi on lui a préféré la précédente.
Démonstration.
• Tout d’abord, comme f est nulle en dehors de [b, +∞[ :
Z +∞ Z +∞
f (t) dt = f (t) dt
−∞ b
11
ECE2 Mathématiques
Commentaire
• La question demande de démontrer la convergence d’une intégrale impropre mais
exige aussi la valeur de cette intégrale. Dans ce cas, comme rédigé ici, la convergence
est une conséquence du résultat obtenu par calcul.
Z +∞
1
• La démonstration de la convergence était simple puisque a+1
dt est une
b t
intégrale de Riemann, impropre en +∞ (b > 0) et d’exposant a + 1 > 1.
Elle est donc convergente.
Z +∞
• La v.a.r. X admet une espérance si et seulement si l’intégrale t f (t) dt est absolument
−∞
convergente,
Z +∞ ce qui équivaut à démontrer sa convergence pour des calculs de moments du type
tm f (t) dt.
−∞
× Comme f est nulle en dehors de [b, +∞[ :
Z +∞ Z +∞
t f (t) dt = t f (t) dt
−∞ b
ba
a 1 1
= − −
a−1 Aa−1 ba−1
a ba
1
−→ − 0 − a−1 (car a − 1 > 0)
A→+∞ a−1 b
Enfin :
a ba a ba
1 ab
− − a−1 = =
a−1 b (a − 1)ba b−1 a−1
ab
Ainsi, si a > 1 : E(X) = .
a−1
12
ECE2 Mathématiques
Commentaire
Insistons sur le fait que les limites :
1
lim Aa−1 = +∞ et donc lim =0
A→+∞ A→+∞ Aa−1
a ba 1
t2 f (t) = t2 a+1
= a ba a−1
t t
Z +∞
1
× Or dt est une intégrale de Riemann, impropre en +∞ (b > 0), d’exposant a − 1.
b ta−1
Elle est donc convergente si et seulement si a − 1 > 1.
a ba
1 1
= − −
a−2 Aa−2 ba−2
a ba
1
−→ − 0− (car a − 2 > 0)
A→+∞ a−2 ba−2
Enfin :
a ba a ba a b2
1
− − a−2 = =
a−2 b (a − 2)ba b−2 a−2
a b2
Ainsi, si a > 2 : E(X 2 ) = .
a−2
13
ECE2 Mathématiques
a b2 ab 2
= −
a−2 a−1
2 1 a
= ab −
a − 2 (a − 1)2
(a − 1)2 − a(a − 2)
= ab2
(a − 2) (a − 1)2
2
(a − 2a + 1) − (a2 − 2a)
= ab2
(a − 2) (a − 1)2
1
= ab2
(a − 2) (a − 1)2
a b2
Ainsi, si a > 2 : V(X) = .
(a − 2) (a − 1)2
Démonstration.
Soit x ∈ R. Deux cas se présentent :
× si x ∈ ] − ∞, b[. Comme f est nulle en dehors de [b, +∞[ :
Z x
FX (x) = P([X 6 x]) = f (t) dt = 0
−∞
× si x ∈ [b, +∞[ :
Z x
FX (x) = f (t) dt
−∞
Z x
(car f est nulle en
= f (t) dt
b dehors de [b, +∞[)
x
ba
Z
= a dt
b ta+1
Z x
= a ba t−a−1 dt
b
x
t−a
= a ba (car a 6= 0)
−a
b
a
1 1 b
= −ba a
− a = 1−
x b x
0 si x < b
Finalement : FX : x 7→
b a
1−
si x > b
x
14
ECE2 Mathématiques
× si x ∈ [b, +∞[ :
a a
b b
P([X > x]) = 1 − FX (x) = 1 − 1 − =
x x
Ainsi, la fonction
de survie de X est :
1 si x < b
x 7→
b a
si x > b
x
5. Démontrer que, pour tout réel y positif ou nul, la probabilité conditionnelle P[X>x] ([X > x + y])
tend vers 1 quand x tend vers +∞. De façon analogue à la question I.1.b) , que peut-on dire d’un
phénomène dont la durée de vie est modélisée par X ?
Démonstration.
Soit y > 0 et soit x ∈ [b, +∞[.
• Comme P([X > x]) 6= 0, on a (d’après I.1.b) ) :
P([X > x + y] ∩ [X > x])
P[X>x] ([X > x + y]) =
P([X > x])
Commentaire
On cherche dans cette question à déterminer la limite de l’expression P[X>x] ([X > x + y])
lorsque x tend vers +∞. Il suffit donc de déterminer une expression de P[X>x] ([X > x + y])
pour x assez grand. C’est pourquoi on choisit ici en début de preuve : x ∈ [b, +∞[.
15
ECE2 Mathématiques
X
6. On pose dans cette question : Y = ln .
b
Démontrer que Y suit une loi exponentielle dont on précisera le paramètre.
Démonstration.
• Commençons par déterminer
x Y (Ω).
Notons h : x 7→ ln , de telle sorte que Y = h(X).
b
On considère ici X(Ω) ⊂ [b, +∞[. On en déduit :
Y (Ω) = h(X) (Ω) = h X(Ω)
= h([b, +∞[)
(car la fonction h est continue et
= [h(b), lim h(x)[
x→+∞ strictement croissante sur [b, +∞[)
= [0, +∞[
× si x > 0 alors :
b a
(car, comme x > 0,
= 1−
b ex b ex > b)
a
= 1 − (e−x ) = 1 − e−ax
0 si x < 0
On obtient finalement : FY : x 7→ −ax .
1−e si x > 0
• On reconnaît la fonction de répartition d’une v.a.r. qui suit une loi E (a). Or la fonction de
répartition caractérise la loi.
On en déduit : X ,→ E (a)
16
ECE2 Mathématiques
Commentaire
Cette question amène une remarque sur la notation X(Ω) lorsque X est une v.a.r. .
• Rappelons qu’une v.a.r. X est une application X : Ω → R.
Comme la notation le suggère, X(Ω) est l’image de Ω par l’application X.
Ainsi, X(Ω) n’est rien d’autre que l’ensemble des valeurs prises par la v.a.r. X :
X(Ω) = {X(ω) | ω ∈ Ω}
= {x ∈ R | ∃ω ∈ Ω, X(ω) = x}
Il faut bien noter que dans cette définition aucune application probabilité P n’apparaît.
• Il est toujours correct d’écrire : X(Ω) ⊆ ] − ∞, +∞[.
En effet, cette propriété signifie que toute v.a.r. X est à valeurs dans R, ce qui est toujours
le cas par définition de la notion de variable aléatoire.
• Dans le cas des v.a.r. discrètes, il est d’usage relativement courant de confondre :
× l’ensemble de valeurs possibles de la v.a.r. X (i.e. l’ensemble X(Ω)),
× l’ensemble {x ∈ R | P [X = x] 6= 0}, ensemble des valeurs que X prend avec probabilité
non nulle. Dans le cas qui nous intéresse ici, à savoir X est une v.a.r. discrète, cet ensemble
est appelé support de X et est noté Supp(X).
• Dans le cas des v.a.r. à densité, la détermination de l’ensemble image est plus techniue.
Dans certains sujets, l’ensemble image des v.a.r. étudiées sera précisé (« On considère une
v.a.r. à valeurs strictement positives »). Si ce n’est pas le cas :
× si X suit une loi usuelle, on peut se référer à l’ensemble image donné en cours. Par
exemple, si X ,→ U([0, 1]), on se permet d’écrire :
× si X ne suit pas une loi usuelle, on étudie l’ensemble : I = {x ∈ R | fX (x) > 0}.
On se permet alors d’écrire :
En décrétant la valeur de X(Ω), on ne commet pas une erreur mais on décide d’ajouter
une hypothèse qui ne fait pas partie de l’énoncé. Cette audace permet de travailler avec un
ensemble image connu, ce qui permet de structurer certaines démonstrations (l’ensemble
image étant connu, on se rappelle que la fonction de répartition, par exemple, s’obtient par
une disjonction de cas).
• Ici, on s’est permis de considérer : X(Ω) = [b, +∞[ conformément à ce qui est dit au-dessus.
Une telle hypothèse assure la bonne définition de la v.a.r. Y = ln( Xb ). Sans précision sur
X(Ω), la v.a.r. Y est seulement presque sûrement bien définie (on a : P Xb > 0 = 1).
17
ECE2 Mathématiques
Pour cela, n désignant un entier naturel non nul et x1 , ..., xn des réels supérieurs ou égaux à β, on
introduit la fonction L, à valeurs dans R et définie sur ]0, +∞[ par :
n
Q
L(a) = fa (x1 ) × · · · × fa (xn ) = fa (xk ),
k=1
Démonstration.
• Soit a ∈ ]0, +∞[. Comme x1 , . . . , xn sont supérieurs ou égaux à β :
(a β a )n
∀a ∈ ]0, +∞[, L(a) =
(x1 · · · xn )a+1
• Soit a ∈ ]0, +∞[. Comme L(a) > 0, on peut déterminer ln(L(a)) :
(a β a )n
ln(L(a)) = ln
(x1 · · · xn )a+1
= ln((a β a )n ) − ln((x1 · · · xn )a+1 )
= n ln(a β a ) − (a + 1) ln(x1 · · · xn )
n
= n ln(a) + n ln(β a ) − (a + 1)
P
ln(xk )
k=1
n
P
∀a ∈ ]0, +∞[, ln(L(a)) = n ln(a) + n a ln(β) − (a + 1) ln(xk )
k=1
(i) Démontrer que la fonction ϕ admet un maximum, atteint en un seul réel que l’on notera w.
Démonstration.
1
• La fonction ϕ est de classe C sur ]0, +∞[ comme somme des fonctions :
18
ECE2 Mathématiques
• Déterminons le signe ϕ0 .
n
n xk
ϕ0 (a) > 0 ⇔
P
− ln >0
a k=1 β
n
n P xk
⇔ > ln
a k=1 β
n
• En notant w = n
, on en déduit le tableau de variations de ϕ.
P xk
ln
k=1 β
x 0 w +∞
Signe de ϕ0 (x) + 0 −
ϕ(w)
Variations de ϕ
−∞ −∞
n
On en déduit que ϕ admet un maximum atteint en un seul point w = n ∈ ]0, +∞[.
ln xβk
P
k=1
Commentaire
• Il faudrait
préciser que (x1 , . . . , xk ) 6= (β, . . . , β). Si tel n’est pas le cas,
xk
ln = 0 et l’écriture de w précédente n’est pas valide.
β
• Il s’agit certainement d’un petit oubli du concepteur de sujet.
a
En effet, si (x1 , . . . , xk ) = (β, . . . , β), alors ϕ : a 7→ n ln et dans ce cas, la
β
fonction ϕ n’admet pas de maximum.
Démonstration.
n
D’après la question précédente, w = n .
ln xβk
P
k=1
19
ECE2 Mathématiques
Démonstration.
Soit t ∈ ]0, +∞[ tel que t 6= w.
Démonstration.
• Par définition, pour tout k ∈ J1, nK, Xk suit la loi de Pareto de paramètres α et β.
Xk
• D’après la question II.4 , la v.a.r. ln suit la loi exponentielle de paramètre α.
β
• Les v.a.r. X1 , . . . , Xn sont indépendantes.
X1 Xn
Par lemme des coalitions, on en déduit que les v.a.r. ln , . . . , ln sont elles
β β
aussi indépendantes.
n
P Xk
Ainsi, d’après la question I.2.b) , ln admet pour densité fn en prenant λ = α.
k=1 β
nα
(ii) À l’aide du théorème de transfert, en déduire que Wn admet pour espérance lorsque
n−1
n > 2, puis proposer un estimateur sans biais de α construit sur Wn .
Démonstration.
Soit n > 2.
• Wn s’écrit sous la forme g(Un ) où :
n
P Xk
× Un = ln est une v.a.r. de densité fn (en prenant λ = α),
k=1 β
n
× g : t 7→ .
t
20
ECE2 Mathématiques
Z +∞
• D’après le théorème de transfert, Wn admet une espérance si et seulement si g(t) fn (t) dt
−∞
est absolument convergente. Z +∞
Or : ∀t ∈ R, g(t) fn (t) > 0. Donc, cela revient à montrer que l’intégrale g(t) fn (t) dt
−∞
converge.
• La fonction fn étant nulle en dehors de [0, +∞[ :
Z +∞ Z +∞
g(t) fn (t) dt = g(t) fn (t) dt
−∞ 0
n αn
g(t) fn (t) = e−αt tn−1
t (n − 1)!
n α αn−1
= e−αt tn−2
(n − 1) (n − 2)!
• On reconnaît
Z +∞ une densité de probabilité, à multiplication par une constante près.
Ainsi, g(t) fn (t) dt est convergente et :
0
Z +∞ Z +∞
n n
g(t) fn (t) dt = α fn−1 (t) dt = α
0 n−1 0 n−1
n
On en déduit : E(Wn ) = α.
n−1
• Or :
n n−1 n−1
E(Wn ) = α ⇔ E(Wn ) = α ⇔ E Wn = α (par linéarité de l’espérance)
n−1 n n
n−1
Wn est un estimateur sans biais de α.
n
21
ECE2 Mathématiques
Démonstration.
Soit n > 3.
• On suppose que Wn0 admet un moment d’ordre 2. Par la formule de Kœnig-Huygens :
α2
V(Wn0 ) =
n−2
• Soit ε > 0. Comme Wn0 admet un moment d’ordre 2, l’inégalité de Bienaymé-Tchebychev
permet d’affirmer :
α2
n−2
P(|Wn0 − E(Wn0 )| > ε) 6
ε2
α2
d’où −P(|Wn0 − α| > ε) > −
(n − 2) ε2
α2
et 1 − P(|Wn0 − α| > ε) > 1 −
(n − 2) ε2
α2 (probabilité de
ainsi P(|Wn0 − α| < ε) > 1 −
(n − 2) ε2 l’événement contraire)
|Wn0 (ω) − α| < ε ⇔ −ε < Wn0 (ω) − α < ε ⇔ Wn0 (ω) − ε < α < Wn0 (ω) − ε
α2
On en déduit : P ([Wn0 − ε < α < Wn0 + ε]) > 1 − .
ε2 (n − 2)
22
ECE2 Mathématiques
(ii) On suppose dans cette question (et elle seule) que α est strictement compris entre 1 et 2.
Déterminer
naturel N tel que, pour tout entier n supérieur ou égal à N ,
un entier
1 1
Wn0 − , Wn0 + soit un intervalle de confiance du paramètre réel α au niveau de
10 10
confiance 0,95.
Démonstration.
1
• Soit α ∈ R tel que : 1 < α < 2. On considère ε = . D’après la question précédente :
10
α2
1 1
P Wn0 − < α < Wn0 + >1− 2
10 10 1
10 (n − 2)
0 1 0 1
• Pour que Wn − , Wn + soit un intervalle de confiance au niveau de confiance 0, 95,
10 10
il suffit de choisir n tel que :
α2
1− > 0, 95
1 2
10 (n − 2)
α2
⇔ 0, 05 >
1 2
10 (n − 2)
⇔ 0, 05 (n − 2) > 102 α2
102 2
⇔ n−2 > α
0, 05
102 2
⇔ n > α +2
0, 05
De plus, comme α < 2 :
102 2
Donc, par transitivité, si n > 8002, alors n > α + 2.
0, 05
α2
D’où : 1 − > 0, 95
1 2
10 (n − 2)
1 1
Pour tout n > 8002, Wn0 − , Wn0 + est un intervalle de confiance au
10 10
niveau de confiance 0, 95.
8. On suppose maintenant que seul le paramètre α est déjà identifié et qu’il vérifie : α > 2.
où le réel cn est choisi de sorte que (Yn )n>1 soit un estimateur sans biais de β.
23
ECE2 Mathématiques
(i) Calculer cn .
Démonstration.
La v.a.r. Yn admet une espérance en tant que combinaison linéaire de v.a.r. qui admettent
une espérance. De plus, par linéarité de l’espérance :
n n n
P P P
E(Yn ) = E cn Xk = cn E(Xk ) = cn E(X1 ) = cn n E(X1 )
k=1 k=1 k=1
αβ α
Enfin, d’après la question II.1 , E(X1 ) = et ainsi : E(Yn ) = cn n β.
α−1 α−1
α−1
En choisissant cn = , on obtient E(Yn ) = β.
αn
Démonstration.
La v.a.r. Yn admet une variance comme somme de v.a.r. indépendantes qui admettent des
variances. De plus :
n n (par propriété de
Xk ) = c2n V(
P P
V(Yn ) = V(cn Xk )
k=1 k=1 la variance)
n (par indépendance
c2n
P
= V(Xk )
k=1 de X1 , . . ., Xn )
n
c2n V(X) = c2n n V(X)
P
=
k=1
(α − 1)2 α β2
= n
α2 n2 (α − 1)2 (α − 2)
β2 1
=
α (α − 2) n
−→ 0
n→+∞
(i) Déterminer la fonction de répartition de Zn , puis reconnaître sa loi et préciser son espérance.
Quelle est la limite de cette dernière quand n tend vers +∞ ?
Démonstration.
• On a déjà considéré, pour tout k ∈ J1, nK : Xk (Ω) ⊂ [β, +∞[.
On en déduit : Zn (Ω) ⊂ [β, +∞[.
• Soit x ∈ R. Deux cas se présentent :
× si x < β, alors [Zn 6 x] = ∅ car Zn (Ω) ⊂ [β, +∞[. Donc :
24
ECE2 Mathématiques
× si x > β alors :
On reconnaît (d’après II.2.) la fonction de répartition d’une v.a.r. qui suit la loi de
Pareto de paramètres αn et β.
αn β
Ainsi, Zn admet une espérance et E(Zn ) = (d’après II.1.)
αn − 1
• Enfin, comme α > 0 et β > 0 :
αn β αn β
E(Zn ) = ∼ = β −→ β
αn − 1 n→+∞ αn n→+∞
En conclusion : E(Zn ) −→ β.
n→+∞
L’estimateur Zn est donc asymptotiquement sans biais.
(ii) Pour tout entier strictement positif n, on pose : Zn0 = dn Zn , où le réel dn est choisi de telle
sorte que (Zn0 )n>1 soit un estimateur sans biais de β.
Quelle est la limite de la variance de Zn0 quand n tend vers +∞ ?
Démonstration.
αn β
• D’après la question précédente : E(Zn ) = . Or :
αn − 1
αn β αn − 1 αn − 1
E(Zn ) = ⇔ E(Zn ) = β ⇔ E Zn = β (par linéarité de l’espérance)
αn − 1 αn αn
nα − 1 αn − 1
Donc Zn0 = Zn est un estimateur sans biais de β (dn = ).
nα αn
• La v.a.r. Zn0 = dn Zn admet une variance en tant que transformée affine de Zn , et :
(nα − 1)2 nα β 2
V(Zn0 ) = V(dn Zn ) = d2n V(Zn ) =
(nα) 2 (nα − 2) (nα − 1)2
1
= β2 −→ 0
nα (nα − 2) n→+∞
V(Zn0 ) −→ 0
n→+∞
25
ECE2 Mathématiques
(iii) Démontrer que l’estimateur (Zn0 )n>1 est plus efficace que l’estimateur (Yn )n>1 , c’est-à-dire,
qu’à partir d’un certain rang, la variance de Zn0 est inférieure à celle de Yn .
Démonstration.
Raisonnons par équivalence.
V(Zn0 ) 6 V(Yn )
β2 β2 1
⇔ 6
nα (nα − 2) α (α − 2) n
1 1 β2
⇔ 6 (car > 0)
nα − 2 α−2 nα
(par stricte décroissance de la
⇔ nα − 2 > α−2
fonction inverse sur ]0, +∞[)
⇔ nα > α
⇔ n > 1 (car α > 0)
À partir du rang n = 1, V(Zn0 ) 6 V(Yn ) et l’estimateur Zn0 est donc plus efficace
que l’estimateur Yn .
Commentaire
• La loi présentée dans la question II.2.b) est appelée loi d’Erlang (hors programme) de
paramètres n et λ. Cette loi est liée à des lois de probabilité classiques :
× lorsque n = 1 (cf initialisation de la récurrence du II.2.b) ), on reconnaît la loi expo-
nentielle de paramètre λ.
× de manière générale, la loi d’Erlang est un cas spécial de la loi Gamma (qui admet deux
paramètres notés généralement α et β) dont une densité est donnée par :
0 si t < 0 ;
t 7→ β α −βt α−1
e t si t > 0.
Γ(α)
26
ECE2 Mathématiques
Commentaire
Enfin, la partie estimation portait sur l’estimateur du maximum de vraisemblance.
Détaillons ce point.
• On dispose d’un échantillon (x1 , . . . , xn ) d’observations.
• On suppose que ces observations proviennent d’un n-échantillon (X1 , . . . , Xn ) d’une v.a.r.
X dont la loi dépend d’un paramètre α, a priori inconnu et qu’on cherche à déterminer.
Pour ce faire, une idée naturelle consiste à considérer que la valeur de α qui a permis de
générer les observations est celle qui avait la plus grande probabilité de les générer. C’est
cette idée qui guide la méthode dite du maximum de vraisemblance.
• Le réel w est précisément la valeur du paramètre α maximisant la réalisation des observa-
tions initiales.
• La méthode du maximum de vraisemblance conduit à considérer la variable aléatoire
construite à l’aide de ce maximum : Wn .
• Plaçons-nous dans le cas où X est une v.a.r. discrète (la méthode est plus simple à ap-
préhender dans ce cas). L’idée est de choisir comme estimation de α le réel w tel que la
vraisemblance d’avoir obtenu l’échantillon utilisé soit maximisée.
Autrement dit, le réel w tel que la probabilité :
soit maximale. L’énoncé portait sur le cas de v.a.r. à densité, que l’on comprend aisément
par analogie avec le cas des v.a.r. discrètes.
Intervalles de confiance
Exercice 9. (☀) (d’après ESSEC - Maths II - 2005)
Une entreprise souhaite acquérir une machine qui fabrique un certain type d’objets et qui, en fonction-
nement normal, produit une proportion p (0 < p < 1) d’objets défectueux. Le directeur veut connaître
la valeur de p.
Pour cela, il teste la machine et prélève un échantillon de n objets qu’il analyse, avec n > 1.
Pour tout i ∈ J1, nK, soit Xi la v.a.r. de Bernoulli définie par :
On suppose que dans les conditions de prélèvement, les variables aléatoires X1 , . . . , Xn sont indépen-
Pn
dantes. On pose Sn = Xk .
k=1
Sn
1. a) Montrer que Fn = est un estimateur sans biais de p.
n
b) Calculer le risque quadratique rn de Fn . Déterminer lim rn .
n→+∞
2. Soit α un réel de ]0, 1[. On souhaite déterminer dans cette question un intervalle de confiance du
paramètre p inconnu, au niveau de confiance 1 − α, à partir de l’échantillon (X1 , . . . , Xn ).
!
√ Fn − p
a) Quelle est la limite en loi de la suite np ?
p(1 − p) n∈N∗
27
ECE2 Mathématiques
Un
Vn = 1
1+ n ln(α)
1 n = input('Valeur de n ?')
2 theta = 5?rand()
3 for i=1:n
4 disp(grand(1,1,'unf',0,theta))
5 end
28
ECE2 Mathématiques
b) Montrer que si T est une v.a.r. discrète finie à valeurs positives d’espérance E(T ), et a un réel
strictement positif, on a l’inégalité :
E(T )
P([T > a]) 6
a
d) Montrer que la fonction g est de classe C 2 sur R+ et vérifie, pour tout x de R+ , l’inégalité :
1
|g 00 (x)| 6 .
4
θ2
e) En déduire l’inégalité suivante : g(θ) 6 θp + .
8
29
ECE2 Mathématiques
x2
f ) Étudier les variations de la fonction h : x 7→ − εx sur R+ .
8 2
En déduire l’inégalité : P([Ym − p > ε]) 6 e−2mε .
1 P m
3. On pose Wm = (1 − Yk ).
m k=1
2
Établir l’inégalité : P([Wm − q > ε]) 6 e−2mε .
4. a) Déduire des questions 2.f ) et 3 , l’inégalité suivante :
2
P([Ym − p > ε]) 6 2e−2mε
r
2 1.844
b) Sachant ln(0.025) ' −3.688, calculer 2e−2mε pour ε = .
m
En déduire un nouvel intervalle de confiance de p au niveau de confiance 0.95. Comparer cet
intervalle de confiance avec celui obtenu à la question 1.b) . Conclure.
Partie I
On choisit successivement au hasard, avec remise, n oiseaux dans la population. On appelle In le
nombre d’oiseaux bagués obtenus lors de ces n choix.
1. Quelle est la loi de In ?
Donner son espérance et sa variance en fonction de n et de p.
1 1
2. Justifier que In est un estimateur sans biais de ·
nm N
1 1 1
3. Montrer que In est convergent, c’est-à-dire que pour tout ε > 0, lim P In − > ε =
nm n→+∞ nm N
0.
4. Dans cette question, on suppose que n = 1 600 et que l’on a eu 400 oiseaux bagués pami les 1 600
choisis.
a) Déterminer, à l’aide de l’estimateur In , un estimateur sans biais de p.
b) Déterminer un intervalle de confiance de p au taux de confiance de 0, 95. On donne Φ(2) = 0, 975.
c) Sachant que l’on a marqué 990 oiseaux, en déduire un intervalle de confiance de N avec un risque
d’erreur d’au plus 5%.
m(n + 1)
5. On pose Yn = .
In + 1
nm
(on ne peut pas prendre car In peut prendre la valeur 0)
In
a) Montrer que E(Yn ) = N 1 − (1 − p)n+1 .
1 n 1 n+1
On pourra utiliser l’égalité : = .
k+1 k n+1 k+1
b) Yn est-il un estimateur sans biais de N ?
c) Montrer que l’estimateur Yn est asymptotiquement sans biais.
30
ECE2 Mathématiques
Partie II
On choisit au hasard et avec remise des oiseaux de la population.
On appelle Rn le nombre de choix effectués pour obtenir n oiseaux bagués.
Ainsi, Rn est la rang de sortie du nième oiseau bagué dans la suite des choix.
1. Quelle est la loi de R1 ?
Donner l’expression de P([R1 = k]), en fonction de k et de p.
Donner l’espérance de R1 et sa variance.
2. On pose D1 = R1 et pour tout entier k tel que k > 2, Dk = Rk − Rk−1 . Ainsi, Dk est le nombre de
choix effectués après l’obtention du (k − 1)ième oiseau bagué pour obtenir le k ième .
a) Justifier que les variables D1 , D2 , . . . , Dk , . . . sont mutuellement indépendantes, et suivent la
même loi que R1 .
b) Soit n un entier supérieur ou égal à 2.
Calculer Rn en fonction de Dk , pour 1 6 k 6 n.
En déduire l’espérance et la variance de Rn en fonction de n et de p.
m
3. On pose Xn = Rn .
n
Montrer que Xn est un estimateur sans biais convergent de N .
p Rn − n
4. a) À l’aide de quel théorème peut-on affirmer que l’on peut approcher la loi de p par la
n (1 − p)
loi normale centrée réduite, pour n suffisamment grand ?
Montrer qu’alors la loi de Xn peut, elle aussi, être approchée par une loi normale dont on donnera
les valeurs des paramètres.
b) On suppose dans cette question que Xn suit une loi normale, que m = 1000 et que p > 0, 2.
Déterminer une valeur de n à partir de laquelle on peut affirmer que l’on connaît N à 500 près
avec une probabilité d’au moins 0, 95.
On utilisera l’approximation Φ(2) ' 0, 975.
5. Posons Ck l’événement : « le k ième choix est celui d’un oiseau bagué ».
Exprimer [Rn = k] à l’aide de la variable Ik−1 définie dans la partie I et de l’événement Ck . Puis
en déduire la loi de Rn .
P n+i i
6. En déduire que si x ∈ ]0, 1[, alors la série n x est convergente, et calculer sa somme.
i
31