Exos Estimation Correction

ECE2 Mathématiques
Feuille d’exercices n°15 : Estimation
Estimation ponctuelle
Exercice 1. (☀)
1
La durée de vie d’une lampe est une v.a.r. qui suit une loi exponentielle de paramètre m inconnu.
On cherche à estimer la durée de vie moyenne m de la lampe.
On prélève un échantillon de n lampes et on note X1 , X2 , . . . , Xn leurs durées de vie. On pose
1P n
Xn = Xk .
n k=1
1. a) Montrer que X n est un estimateur sans biais de m.
b) Calculer son risque quadratique.
2. On pose Yn = min(X1 , . . . , Xn ).
a) Déterminer la loi de Yn .
b) En déduire que Zn = nYn est un estimateur sans biais de m.
c) Calculer son risque quadratique.
3. Comparer les deux estimateurs.
Exercice 2. (☆)
Le second tour d’une élection met en présence deux candidats A et B.
On souhaite réaliser un sondage afin de connaître, avec un niveau de confiance de 0, 95, le futur
vainqueur. Sachant par ailleurs que les deux candidats sont au coude à coude, on veut réduire la marge
d’erreur à 0, 01.
1. Donner le nombre minimal d’électeurs à interroger si on se fie à l’inégalité de Bienaymé-Tchebychev
pour faire le calcul.
2. Même question en utilisant le théorème de la limite centrée.
Exercice 3. (☀)
Soit X une v.a.r. suivant la loi uniforme sur [0, θ], où θ > 0 est un paramètre inconnu. On considère
un n-échantillon (X1 , X2 , . . . , Xn ) de la v.a.r. X.
On considère les estimateurs suivants :
n+1 0
Tn = 2Xn , Tn0 = max(X1 , X2 , ..., Xn ) et Tn00 = Tn
n
1 Pn
où Xn = Xk est la moyenne empirique du n-échantillon.
n k=1
1. a) Montrer que Tn est un estimateur sans biais de θ.
b) Déterminer le risque quadratique de Tn .
c) Tn est-il un estimateur convergent de θ ?
2. a) Déterminer les biais et risque quadratique de Tn0 .
b) Donner un équivalent simple en +∞ de rθ (Tn0 ).
3. Mêmes questions pour Tn00 .
Quel est le meilleur des trois estimateurs ?
4. Écrire un programme Scilab simulant ces trois estimateurs.
1
ECE2 Mathématiques
Exercice 4. (☀)
Soient X1 , . . . , Xn , Y1 , . . . , Ym , n + m variables aléatoires indépendantes suivant une loi de Bernoulli
de paramètre inconnu p.
On se propose d’estimer p. On suppose dans la suite que n > m.
On considère les estimateurs de p suivants :
1 Pn 1 Pm M1 + M2
M1 = Xk , M2 = Yk et N =
n k=1 m k=1 2
1. a) Déterminer le biais des estimateurs M1 , M2 et N .

b) Démontrer que ces 3 estimateurs sont convergents ?
c) Quel est le meilleur des trois estimateurs ?
On discutera suivant les valeurs de n et m.
2. On considère des estimateurs de p de la forme aM1 + bM2 avec (a, b) ∈ R2 .
a) Parmi ces estimateurs, lequel est le meilleur estimateur sans biais ?
b) Quel est son risque quadratique ?
Exercice 5. (☀☀)
Un jeu télévisé consiste à poser à un candidat une succession de questions à choix multiples. Les
questions sont posées dans un ordre de difficulté croissant et rapportent de plus en plus d’argent au
candidat.
L’équipe qui conçoit les questions décide de tester la difficulté d’une d’entre elles pour savoir à quel
moment du jeu il serait préférable de la poser. Pour ce faire, on se propose de réaliser un sondage dans
la population.
Modélisation du problème
• On propose à chaque personne interrogée 3 réponses, la réponse correcte étant la réponse 1.
• Le comportement d’une personne interrogée est le suivant :
× si elle connaît la réponse correcte, elle la donne.
× sinon elle choisit au hasard une des trois réponses proposées.
On prend ainsi en compte la possibilité qu’une personne interrogée donne la réponse correcte par
chance.
• On note X la v.a.r. égale à la réponse donnée par la personne interrogée.
On note Y la v.a.r. égale à :
× 1 si la personne interrogée connaît la bonne réponse,
× 0 sinon.
Enfin, on note θ (paramètre que l’on cherche à estimer) la probabilité qu’une personne de la popu-
lation connaisse la réponse correcte.
1. a) Reconnaître la loi de Y .
b) Déterminer, en fonction de θ, la loi de X. On note p = P([X = 1]).
Exprimer alors θ en fonction de p.
c) Quelle est, en fonction de θ, la probabilité qu’une personne ayant choisi la réponse 1 l’ait fait
car elle connaissait réellement la réponse ?
2. Afin d’estimer θ, on constitue dans la population n groupes de 30 personnes qui seront interrogées
par un enquêteur.
Pour 1 6 i 6 n, on note Vi la variable égale au nombre de réponses 1 obtenues dans le groupe i.
V1 + · · · + Vn
Les v.a.r. Vi sont supposées mutuellement indépendantes. On note enfin Zn = .
30n
2
ECE2 Mathématiques
a) Déterminer l’espérance de Zn , et sa variance.

b) Déterminer, à partir de Zn , un estimateur sans biais Tn de θ.
c) Déterminer le risque quadratique de Tn .
1
d) Montrer : ∀ε > 0, P([|Tn − θ| > ε]) 6 .
20 n ε2
Que peut-on en déduire sur l’estimateur Tn ?
3. Dans la question précédente, on a proposé un estimateur Tn de θ. L’estimateur initial Zn , biaisé,
n’a pas été retenu mais a permis de construire l’estimateur sans biais Tn . Une estimation θb de θ est
alors fournie par une réalisation de Tn .
Dans cette question, on cherche à obtenir une estimation pb de p.
Pour ce faire, on va raisonner comme suit : on part d’une réalisation (v1 , v2 , . . . , vn ) de l’échantillon
(V1 , V2 , . . . , Vn ) et on cherche à obtenir, grâce à cette donnée, le meilleur estimateur pour p.
On s’intéresse alors à la quantité L(p) suivante :
L(p) = Pp ([V1 = v1 ] ∩ . . . ∩ [Vn = vn ])
L est une fonction appelée vraisemblance. Elle permet de mesurer la probabilité que notre modèle
ait donné lieu à l’observation (v1 , . . . , vn ).
Le principe du maximum de vraisemblance est de choisir comme estimation de p la valeur qui
maximise la vraisemblance de modèle par rapport à la donnée (v1 , . . . , vn ).
a) Expliciter, en fonction de p, la valeur de L(p).
b) Étudier les variations de la fonction f : p 7→ ln(L(p)).
c) Montrer que f et donc L admet un maximum.
On note pb le point en lequel f atteint ce maximum.
Remarque
La quantité pb s’écrit sous la forme :
pb = h(v1 , . . . , vn )
Elle est choisie comme estimation du paramètre p.
On définit alors L’estimateur Zn du maximum de vraisemblance par :
Zn = h(V1 , . . . , Vn )
Exercice 6. (☀) (d’après ESC 2006)

Dans cet exercice, on considère r > 0 et la fonction f suivante :
 2t
 si t ∈ [0, r]
f : t 7→ r2

0 si t ∈ / [0, r]
1. a) Étudier la continuité de f .
b) Montrer que f est une densité de probabilité.
On note dans toute la suite X une v.a.r. réelle de densité f .
FX désigne sa fonction de répartition.
2. a) Déterminer la valeur FX (x) lorsque x < 0, puis lorsque x > r.
x2
b) Montrer que pour tout réel x de [0, r], FX (x) = 2 .
r
2r
3. a) Montrer que X admet une espérance et que E (X) = .
3
3
ECE2 Mathématiques
r2
b) Montrer que X admet une variance et que V (X) = .
18
Dans toute la suite n désigne un entier naturel non nul et (X1 , X2 , . . . , Xn ) un n-échantillon de la
v.a.r. X. On cherche alors à estimer le réel r.
3 Pn
4. On note Tn = Xk et on cherche à estimer r avec Tn .
2n k=1
a) Montrer que Tn est un estimateur sans biais de r.
b) Calculer le risque quadratique de Tn (noté r(Tn )).
5. On note Mn la v.a.r. prenant pour valeur le maximum des valeurs prises par les variables X1 , X2 , . . . , Xn ,
de sorte que, pour tout réel x :
[Mn 6 x] = [X1 6 x] ∩ [X2 6 x] ∩ . . . ∩ [Xn 6 x]

n
a) Montrer que : ∀x ∈ R, P ([Mn 6 x]) = (FX (x)) .
En déduire la fonction de répartition de Mn .
Puis montrer que Mn est une v.a.r. à densité.
b) Montrer qu’une densité possible de Mn est la fonction gn définie par :
 2n−1
 2n t

si t ∈ [0, r]
gn : t 7→ r2n

0 si t ∈
/ [0, r]

c) Montrer que Mn admet une espérance et une variance, et que :
2n n 2
E (Mn ) = r et V (Mn ) = 2r
2n + 1 (n + 1) (2n + 1)
d) On cherche à estimer r avec Mn .

Calculer le biais de Mn , noté b(Mn ), et son risque quadratique r(Mn ).
6. a) Déterminer un équivalent simple (lorsque n → +∞ de b(Mn ) et r(Mn ).
b) Quels sont les avantages et les inconvénients réciproques des estimateurs Tn et Mn ?
7. Déduire de Mn un estimateur Un sans biais de r.
Entre Tn et Un , quel estimateur de r choisissez-vous ?
8. Montrer que Tn est un estimateur convergent de r.
9. a) Montrer que, pour tout ε ∈ ]0, r[ : [|Mn − r| > ε] = [Mn − r < −ε].
b) En déduire que, pour tout ε ∈ ]0, r[ :
lim P ([|Mn − r| > ε]) = 0

n→+∞
Puis montrer que Mn est un estimateur convergent.

10. a) Montrer que, pour tout ε ∈ ]0, r[ :

2n(r + ε) 2n(r − ε)
[|Un − r| > ε] = Mn > ∪ Mn <
2n + 1 2n + 1
b) En déduire que, pour tout ε ∈ ]0, r[ :

2n
2n(r + ε) 2n ε 2n
P ([|Un − r| > ε]) = P Mn > + 1−
2n + 1 2n + 1 r
c) En déduire que, pour tout ε ∈]0, r[ : lim P ([|Un − r| > ε]) = 0.

n→+∞
Puis montrer que Un est un estimateur convergent.
4
ECE2 Mathématiques
L
11. Montrer que : Mn −→ r.
n→+∞
Exercice 7. (☀)
Soit X une v.a.r. réelle admettant une espérance est m et une variance σ 2 .
Soit (X1 , X2 , . . . , Xn ) un n-échantillon de la v.a.r. X.
1P n
1. Montrer que Tn = Xk est un estimateur sans biais de m.
n k=1
1 P n
2. On pose Vn = (Xk − Tn )2 .
n k=1
n
1
X − (Tn )2 .
P 2
a) Montrer que : Vn =
n k=1 k
n
1
(Xk − m) − (Tn − m)2 .
2
P
b) Montrer que : Vn =
n k=1
n−1 2
c) Montrer que E(Vn ) = σ .
n
d) Construire, à partir de Vn , un estimateur sans biais V cn de σ 2 .
e) On dispose d’un échantillon de n observations (x1 , x2 , . . . , xn ) de la v.a.r. X. Donner une méthode
pour obtenir une estimation ponctuelle de σ 2 à partir de ces observations.
Exercice 8. (☀☀) (adapté de ESSEC 2009 - Maths II)

La sécurité routière fait une enquête sur le nombre d’accidents survenus par semaine sur un tronçon
d’autoroute.
Soit X la v.a.r. égale au nombre d’accidents par semaine. On suppose que X suit une loi de Poisson
de paramètre θ inconnu (θ ∈ ]0, +∞[).
On se propose d’évaluer le paramètre e−θ = P([X = 0]).
On note X1 , X2 , . . . , Xn les résultats des observations faites pendant n semaines. On suppose X1 , . . . , Xn
indépendantes et de même loi que X.
1. Pour tout i ∈ J1, nK, on définit Yi par : Yi = 1 si Xi = 0, et Yi = 0 sinon.
1 P n
On note aussi : Yn = Yi .
n i=1
a) Pour tout i ∈ J1, nK, donner la loi de Yi .
b) Montrer que Yn est un estimateur sans biais de e−θ .
c) Calculer le risque quadratique de Yn .
d) Montrer que Yn est un estimateur convergent de e−θ .
e) Expliquer pourquoi Yn est un estimateur « naturel » de e−θ .
Cet estimateur ne tient pas compte du fait que X suit une loi de Poisson. On peut donc espérer
trouver un meilleur estimateur sans biais convergent de e−θ .
Pn
2. On pose Sn = Xi .
i=1
a) Quelle est la loi de Sn ?
Sn
b) Calculer l’espérance de e− n à l’aide du théorème de transfert.
Sn
c) Montrer que e− n est un estimateur biaisé de e−θ .
Sn
Sn
d) Montrer que e− n est asymptotiquement sans biais, c’est-à-dire que lim E e− n = e−θ .
n→+∞
5
ECE2 Mathématiques
3. Pour tout entier naturel j, on définit la probabilité conditionnelle :
ϕ(j) = P[Sn =j] ([X1 = 0])
1 j

Montrer que, pour tout j ∈ N, ϕ(j) = 1 − .
n
On a donc ϕ(j) indépendant du paramètre θ inconnu.
4. a) Montrer que ϕ(Sn ) est un estimateur sans biais de e−θ .
b) Calculer le risque quadratique de ϕ(Sn ).
c) Montrer que ϕ(Sn ) est un estimateur convergent de e−θ .
5. a) En utilisant le théorème des accroissements finis, démontrer que :
exp(θ) − 1
16 6 exp(θ)
θ
b) Soit h la fonction définie sur [0, 1] par h(t) = t exp(θ) + (1 − t) − exp(tθ).

h.
Étudier les variationsde
θ exp(θ) n − 1
c) En déduire que : exp 6 + .
n n n
d) Quel est le meilleur estimateur de e−θ entre ϕ(Sn ) et Yn ?
6
ECE2 Mathématiques
Problème (ESSEC I 2007)

Dans tout l’exercice, les variables aléatoires sont définies sur un même espace probabilisé (Ω, T , P).
I. Préliminaires
Dans cette partie I., λ désigne un réel strictement positif.
1. Soit X une variable aléatoire suivant la loi exponentielle de paramètre λ.
a) Déterminer la fonction : x 7→ P([X > x]) (appelée fonction de survie de X).
Démonstration.
• Comme X ,→ E (λ), sa fonction de répartition est donnée par :
(
0 si x < 0
FX : x 7→
1 − e−λx si x > 0
• Soit x ∈ R. Deux cas se présentent alors :
× si x < 0 :
P([X > x]) = 1 − P([X 6 x]) = 1 − FX (x) = 1 − 0 = 1
× si x > 0 :
P([X > x]) = 1 − FX (x) = 1 − 1 − e−λx = e−λx
(
1 si x < 0
Finalement, la fonction de survie est : x 7→ .
e−λx si x > 0
b) Pour tous nombres réels strictement positifs x et y, calculer la probabilité conditionnelle
P[X>x] ([X > x + y]) ; justifier alors que, si X modélise la durée de vie d’un phénomène, on dise
de ce dernier qu’il est « sans vieillissement ».
Démonstration.
Soient x > 0 et y > 0.
• D’après la question précédente, P([X > x]) > 0.
• On peut donc calculer la probabilité conditionnelle suivante :
P([X > x] ∩ [X > x + y])

P[X>x] ([X > x + y]) =
P([X > x])
P([X > x + y]) (car, comme y > 0,

=
P([X > x]) [X > x + y] ⊂ [X > x])
e−λ(x+y)
= (car x + y > 0 et x > 0)
e−λx
e−λx e−λy
=
e−λx
= e−λy = P([X > y])
P[X>x] ([X > x + y]) = P([X > y])
La probabilité que le phénomène ait encore lieu après x + y « heures » sachant qu’il a déjà
eut lieu durant x heures ne dépend que de la durée supplémentaire x + y − x = y ajoutée.
Il est donc sans vieillissement.
7
ECE2 Mathématiques
Commentaire
Soit (x, y) ∈ ]0, +∞[2 . Démontrons l’inclusion : [X > x + y] ⊂ [X > x].
Soit ω ∈ [X > x + y], alors : X(ω) > x + y.
Par transitivité, on obtient :
X(ω) > x + y > x (car y > 0)
Ainsi : X(ω) > x. Ou encore : ω ∈ [X > x].
2. Soit (Xn )n>1 une suite de variables aléatoires indépendantes, de même loi exponentielle de paramètre
λ. Pour tout entier naturel n non nul, on pose :
n
P
Sn = Xk .
k=1
a) Déterminer l’espérance et la variance de Sn .
Démonstration.
Soit n ∈ N∗ .
• La v.a.r. Sn admet une espérance en tant que somme de variables aléatoires qui admettent
toutes une espérance.
n
P
E(Sn ) = E Xk
k=1
n
P
= E(Xk ) (par linéarité de l’espérance)
k=1
Pn 1 (car X1 , . . ., Xn ont
=
k=1 λ même loi E (λ))
1
= n
λ
n
E(Sn ) =
λ
• La v.a.r. Sn admet une variance en tant que somme de variables aléatoires qui admettent
toutes une variance.
n
P
V(Sn ) = V Xk
k=1
n
P (car X1 , . . ., Xn sont
= V(Xk )
k=1 indépendantes)
Pn 1 (car X1 , . . ., Xn ont
=
k=1 λ
2 même loi E (λ))
1
= n
λ2
n
V(Sn ) =
λ2
8
ECE2 Mathématiques
b) Démontrer par récurrence que, pour tout n de N∗ , la variable aléatoire Sn admet pour densité
la fonction fn : 
 0 si t < 0 ;
t 7−→ λn
e−λt tn−1 si t > 0.
(n − 1)!

Pour cela, on admettra que, si U et V sont des variables aléatoires indépendantes admettant
respectivement pour densité les fonctions fU et fV , alors la variable aléatoire U + V admet pour
densité la fonction fU +V définie sur R par :
Z +∞
fU +V (t) = fU (x)fV (t − x) dx.
−∞
Démonstration.
Démontrons par récurrence que : ∀n ∈ N∗ , P(n)
où P(n) : Sn est une variable à densité, de densité fn .
I Initialisation : 
 0 si t < 0 ;
• D’une part, par définition : f1 : t 7→ λ −λt 0
 e t si t > 0.
0!
Or, pour tout t > 0 :
λ −λt 0
e t = λ e−λt
0!
(
0 si t < 0 ;
Ainsi : f1 : t 7→ −λt .
λe si t > 0.
On reconnaît une densité d’une variable aléatoire de loi E (λ).
• D’autre part : S1 = X1 . Donc : S1 ,→ E (λ).
D’où P(1).
I Hérédité : soit n ∈ N∗ .
Supposons P(n) et démontrons P(n + 1)
(i.e. Sn+1 est une variable à densité, de densité fn+1 ).
• Remarquons tout d’abord : Sn+1 (Ω) ⊂ [0, +∞[.
En effet, pour tout i ∈ J1, n + 1K, Xi = [0, +∞[.
• De plus :
n+1 n

P P
Sn+1 = Xk = Xk + Xn+1 = Sn + Xn+1
k=1 k=1
On est dans le cadre d’utilisation du théorème fourni par l’énoncé :

× par hypothèse de récurrence, Sn est une variable à densité, de densité fn .
× d’après l’énoncé, Xn+1 est une variable à densité de densité f1 , car Xn+1 ,→ E (λ).
× d’après le lemme des coalitions, les v.a.r. Sn et Xn+1 sont indépendantes, car les v.a.r.
X1 , . . . , Xn+1 sont indépendantes.
• On en déduit que Sn+1 est une v.a.r. à densité et, pour tout t ∈ R :
Z +∞
fSn+1 (t) = fSn +Xn+1 (t) = fn (x) f1 (t − x) dx
−∞
9
ECE2 Mathématiques
Soit t ∈ R. Deux cas se présentent :

× si t < 0, alors, comme Sn+1 (Ω) ⊂ [0, +∞[ : FSn+1 (t) = 0. On en déduit :
fSn+1 (t) = FS0 n+1 (t) = 0
× si t > 0. Cherchons d’abord à savoir sur quel ensemble la fonction x 7→ fn (x) f1 (t − x) ne

s’annule pas afin de préciser l’intervalle d’intégration.
- Comme, par hypothèse de récurrence, en particulier, fn est nulle en dehors de [0, +∞[ :
Z +∞
fSn+1 (t) = fn (x) f1 (t − x) dx
0
- De plus, pour tout x ∈ R :

( ( (
x ∈ [0, +∞[ x ∈ [0, +∞[ x>0

x>0
⇔ ⇔ ⇔ ⇔ 06x6t
f1 (t − x) 6= 0 (t − x) ∈ [0, +∞[ t−x>0 x6t
Ainsi : Z t
fn+1 (t) = fn (x) f1 (t − x) dx
0
On obtient :
t
λn
Z
fSn+1 (t) = e−λx xn−1 λ e−λ(t−x) dx
0 (n − 1)!
Z t
λn+1
= e−λx xn−1 e−λt eλx dx
(n − 1)! 0
Z t
λn+1
= e −λt xn−1 dx
(n − 1)! 0
t
λn+1 xn

= e−λt
(n − 1)! n 0
λn+1 −λt n
= e t
n!


 0 si t < 0
Finalement : fSn+1 : t 7→ λn .
 e−λt tn−1 si t > 0
(n − 1)!

D’où P(n + 1).
Par principe de récurrence, pour tout n ∈ N∗ , Sn est une variable à densité de densité fn .
10
ECE2 Mathématiques
Commentaire
Pour bien comprendre la présentation du cas « t > 0 », remarquons qu’on cherche,
comme annoncé, l’ensemble sur lequel produit fn (x) f (t − x) est non nul. Soit x ∈ R.

fn (x) f1 (t − x) 6= 0 ⇔ fn (x) 6= 0 et f1 (t − x) 6= 0
( (
x ∈ [0, +∞[ x>0
⇔ ⇔
(t − x) ∈ [0, +∞[ t−x>0
(
x>0
⇔ ⇔ 06x6t
x6t
Cette présentation est d’ailleurs tout aussi acceptable, mais elle sort un peu des pré-
sentations usuelles. C’est pourquoi on lui a préféré la précédente.
II. Loi de Pareto (Vilfredo Pareto (1848-1923), sociologue et économiste italien)

Soient a et b des réels strictement positifs. Par définition, on dit d’une variable aléatoire qu’elle suit la
loi de Pareto de paramètres a et b si elle admet pour densité la fonction f définie sur R par :

 0 si t < b ;
f (t) = a
 a b si t > b.
ta+1
Soit alors X une variable aléatoire de loi de Pareto de paramètres a et b.
Z +∞
3. Vérifier que l’égalité : f (t) dt = 1 est bien satisfaite ; calculer l’espérance et la variance de
−∞
X, en précisant à quelles conditions chacune de ces quantités existe.
Démonstration.
• Tout d’abord, comme f est nulle en dehors de [b, +∞[ :
Z +∞ Z +∞
f (t) dt = f (t) dt
−∞ b
• La fonction f est continue par morceaux sur [b, +∞[.

• Soit A ∈ [b, +∞[.
Z A A A
ba
Z Z
f (t) dt = a dt = a b a
t−a−1 dt
b b ta+1 b
A A
t−a

1
= a ba = −ba (car a 6= 0)
−a ta
b b

1 1
= −ba −
Aa ba

a 1
−→ −b 0− a = 1 (car a > 0)
A→+∞ b
Z +∞
Ainsi, l’intégrale impropre f (t) dt est convergente et vaut 1.
−∞
11
ECE2 Mathématiques
Commentaire
• La question demande de démontrer la convergence d’une intégrale impropre mais
exige aussi la valeur de cette intégrale. Dans ce cas, comme rédigé ici, la convergence
est une conséquence du résultat obtenu par calcul.
Z +∞
1
• La démonstration de la convergence était simple puisque a+1
dt est une
b t
intégrale de Riemann, impropre en +∞ (b > 0) et d’exposant a + 1 > 1.
Elle est donc convergente.
Z +∞
• La v.a.r. X admet une espérance si et seulement si l’intégrale t f (t) dt est absolument
−∞
convergente,
Z +∞ ce qui équivaut à démontrer sa convergence pour des calculs de moments du type
tm f (t) dt.
−∞
× Comme f est nulle en dehors de [b, +∞[ :
Z +∞ Z +∞
t f (t) dt = t f (t) dt
−∞ b
× De plus, pour tout t ∈ [b, +∞[ :

a ba 1
t f (t) = t = a ba a
ta+1 t
Z +∞
1
× Or dt est une intégrale de Riemann, impropre en +∞ (b > 0), d’exposant a.
b ta
Elle est donc convergente si et seulement si a > 1.
On en déduit que la v.a.r. X admet une espérance si et seulement si a > 1.
• Supposons alors a > 1.

Soit A ∈ [b, +∞[.
Z A Z A
t f (t) dt = a ba t−a dt
b b
A
t−a+1

= a ba (car a 6= 1)
−a + 1
b
A
a ba

1
= −
a−1 ta−1
b
ba

a 1 1
= − −
a−1 Aa−1 ba−1
a ba

1
−→ − 0 − a−1 (car a − 1 > 0)
A→+∞ a−1 b
Enfin :
a ba a ba

1 ab
− − a−1 = =
a−1 b (a − 1)ba b−1 a−1
ab
Ainsi, si a > 1 : E(X) = .
a−1
12
ECE2 Mathématiques
Commentaire
Insistons sur le fait que les limites :
1
lim Aa−1 = +∞ et donc lim =0
A→+∞ A→+∞ Aa−1
ne sont valables que si a − 1 > 0.
• On procède de même pour la variance. Z +∞

La v.a.r. X admet une variance si et seulement si l’intégrale t2 f (t) dt est absolument
−∞
convergente,
Z +∞ ce qui équivaut à démontrer sa convergence pour des calculs de moments du type
tm f (t) dt.
−∞
× Comme f est nulle en dehors de [b, +∞[ :
Z +∞ Z +∞
2
t f (t) dt = t2 f (t) dt
−∞ b
× De plus, pour tout t ∈ [b, +∞[ :
a ba 1
t2 f (t) = t2 a+1
= a ba a−1
t t
Z +∞
1
× Or dt est une intégrale de Riemann, impropre en +∞ (b > 0), d’exposant a − 1.
b ta−1
Elle est donc convergente si et seulement si a − 1 > 1.
On en déduit que la v.a.r. X admet une variance si et seulement si a > 2.
• Supposons alors a > 2.

Soit A ∈ [b, +∞[.
Z A Z A
t f (t) dt = a ba t−a+1 dt
b b
A
t−a+2

= a ba (car a 6= 2)
−a + 2
b
A
a ba

1
= −
a−2 ta−2
b
a ba

1 1
= − −
a−2 Aa−2 ba−2
a ba

1
−→ − 0− (car a − 2 > 0)
A→+∞ a−2 ba−2
Enfin :
a ba a ba a b2

1
− − a−2 = =
a−2 b (a − 2)ba b−2 a−2
a b2
Ainsi, si a > 2 : E(X 2 ) = .
a−2
13
ECE2 Mathématiques
• Ainsi, par la formule de Kœnig-Huygens :
V(X) = E(X 2 ) − (E(X))2
a b2 ab 2

= −
a−2 a−1

2 1 a
= ab −
a − 2 (a − 1)2
(a − 1)2 − a(a − 2)

= ab2
(a − 2) (a − 1)2
2
(a − 2a + 1) − (a2 − 2a)

= ab2
(a − 2) (a − 1)2
1
= ab2
(a − 2) (a − 1)2
a b2
Ainsi, si a > 2 : V(X) = .
(a − 2) (a − 1)2
4. Déterminer la fonction de répartition de X. Préciser la fonction de survie : x 7→ P([X > x]).
Démonstration.
Soit x ∈ R. Deux cas se présentent :
× si x ∈ ] − ∞, b[. Comme f est nulle en dehors de [b, +∞[ :
Z x
FX (x) = P([X 6 x]) = f (t) dt = 0
−∞
× si x ∈ [b, +∞[ :
Z x
FX (x) = f (t) dt
−∞
Z x
(car f est nulle en
= f (t) dt
b dehors de [b, +∞[)
x
ba
Z
= a dt
b ta+1
Z x
= a ba t−a−1 dt
b
x
t−a

= a ba (car a 6= 0)
−a
b
a
1 1 b
= −ba a
− a = 1−
x b x


 0 si x < b
Finalement : FX : x 7→
b a

 1−
 si x > b
x
14
ECE2 Mathématiques
Déterminons la fonction de survie de X.

Soit x ∈ R. Deux cas se présentent :
× si x ∈ ] − ∞, b[ :
P([X > x]) = 1 − P([X 6 x]) = 1 − FX (x) = 1 − 0 = 1
× si x ∈ [b, +∞[ :
a a
b b
P([X > x]) = 1 − FX (x) = 1 − 1 − =
x x
Ainsi, la fonction
 de survie de X est :

 1 si x < b
x 7→
b a


 si x > b
x
5. Démontrer que, pour tout réel y positif ou nul, la probabilité conditionnelle P[X>x] ([X > x + y])
tend vers 1 quand x tend vers +∞. De façon analogue à la question I.1.b) , que peut-on dire d’un
phénomène dont la durée de vie est modélisée par X ?
Démonstration.
Soit y > 0 et soit x ∈ [b, +∞[.
• Comme P([X > x]) 6= 0, on a (d’après I.1.b) ) :
P([X > x + y] ∩ [X > x])
P[X>x] ([X > x + y]) =
P([X > x])
P([X > x + y]) (car, comme y > 0 :

=
P([X > x]) [X > x + y] ⊂ [X > x])
a
b
x+y
= b a
(car x ∈ [b, +∞[ et x + y ∈ [b, +∞[)
x
a
b x a
=
x+y b
a
ba xa

x
= =
(x + y)a ba x+y
a
x x x x
• Or : ∼ = 1. On en déduit : lim = 1. Ainsi : lim = 1.
x+y x→+∞ x x→+∞ x + y x→+∞ x+y
D’où : lim P[X>x] ([X > x + y]) = 1.
x→+∞
Si on considère que X modélise la durée de vie d’un phénomène, la propriété

précédente signifie que plus le phénomène a duré longtemps (plus x est grand), plus la
probabilité que le phénomène dure encore est grande. On parle alors de rajeunissement.
Commentaire
On cherche dans cette question à déterminer la limite de l’expression P[X>x] ([X > x + y])
lorsque x tend vers +∞. Il suffit donc de déterminer une expression de P[X>x] ([X > x + y])
pour x assez grand. C’est pourquoi on choisit ici en début de preuve : x ∈ [b, +∞[.
15
ECE2 Mathématiques

X
6. On pose dans cette question : Y = ln .
b
Démontrer que Y suit une loi exponentielle dont on précisera le paramètre.
Démonstration.
• Commençons par déterminer
x Y (Ω).
Notons h : x 7→ ln , de telle sorte que Y = h(X).
b
On considère ici X(Ω) ⊂ [b, +∞[. On en déduit :

Y (Ω) = h(X) (Ω) = h X(Ω)
= h([b, +∞[)
(car la fonction h est continue et
= [h(b), lim h(x)[
x→+∞ strictement croissante sur [b, +∞[)
= [0, +∞[
Et ainsi : Y (Ω) = [0, +∞[.

• Soit x ∈ R. Deux cas se présentent :
× si x < 0, alors [Y 6 x] = ∅ car Y (Ω) = [0, +∞[. Donc :
FY (x) = P([Y 6 x]) = P(∅) = 0
× si x > 0 alors :
FY (x) = P([Y 6 x])

X
= P ln 6x
b

X x (par stricte croissance
= P 6e
b de la fonction exp sur R)
= P ([X 6 b ex ]) (car b > 0)
= FX b ex

b a

(car, comme x > 0,
= 1−
b ex b ex > b)
a
= 1 − (e−x ) = 1 − e−ax

0 si x < 0
On obtient finalement : FY : x 7→ −ax .
1−e si x > 0
• On reconnaît la fonction de répartition d’une v.a.r. qui suit une loi E (a). Or la fonction de
répartition caractérise la loi.
On en déduit : X ,→ E (a)
16
ECE2 Mathématiques
Commentaire
Cette question amène une remarque sur la notation X(Ω) lorsque X est une v.a.r. .
• Rappelons qu’une v.a.r. X est une application X : Ω → R.
Comme la notation le suggère, X(Ω) est l’image de Ω par l’application X.
Ainsi, X(Ω) n’est rien d’autre que l’ensemble des valeurs prises par la v.a.r. X :
X(Ω) = {X(ω) | ω ∈ Ω}
= {x ∈ R | ∃ω ∈ Ω, X(ω) = x}
Il faut bien noter que dans cette définition aucune application probabilité P n’apparaît.
• Il est toujours correct d’écrire : X(Ω) ⊆ ] − ∞, +∞[.
En effet, cette propriété signifie que toute v.a.r. X est à valeurs dans R, ce qui est toujours
le cas par définition de la notion de variable aléatoire.
• Dans le cas des v.a.r. discrètes, il est d’usage relativement courant de confondre :
× l’ensemble de valeurs possibles de la v.a.r. X (i.e. l’ensemble X(Ω)),

× l’ensemble {x ∈ R | P [X = x] 6= 0}, ensemble des valeurs que X prend avec probabilité
non nulle. Dans le cas qui nous intéresse ici, à savoir X est une v.a.r. discrète, cet ensemble
est appelé support de X et est noté Supp(X).
• Dans le cas des v.a.r. à densité, la détermination de l’ensemble image est plus techniue.
Dans certains sujets, l’ensemble image des v.a.r. étudiées sera précisé (« On considère une
v.a.r. à valeurs strictement positives »). Si ce n’est pas le cas :
× si X suit une loi usuelle, on peut se référer à l’ensemble image donné en cours. Par
exemple, si X ,→ U([0, 1]), on se permet d’écrire :
« Comme X ,→ U([0, 1]), on considère : X(Ω) = [0, 1]. »
× si X ne suit pas une loi usuelle, on étudie l’ensemble : I = {x ∈ R | fX (x) > 0}.
On se permet alors d’écrire :
« Dans la suite, on considère : X(Ω) = I. »
En décrétant la valeur de X(Ω), on ne commet pas une erreur mais on décide d’ajouter
une hypothèse qui ne fait pas partie de l’énoncé. Cette audace permet de travailler avec un
ensemble image connu, ce qui permet de structurer certaines démonstrations (l’ensemble
image étant connu, on se rappelle que la fonction de répartition, par exemple, s’obtient par
une disjonction de cas).
• Ici, on s’est permis de considérer : X(Ω) = [b, +∞[ conformément à ce qui est dit au-dessus.
Une telle hypothèse assure la bonne définition de la v.a.r. Y = ln( Xb ). Sans précision sur
X(Ω), la v.a.r. Y est seulement presque sûrement bien définie (on a : P Xb > 0 = 1).

III. Estimation des paramètres d’une loi de Pareto

Les instants aléatoires des arrivées de paquets (symboles binaires représentant de l’information de type
audio, vidéo, données, . . . ) dans un canal de communication sont modélisés par une variable aléatoire
X suivant une loi de Pareto de paramètres α et β (α > 0, β > 0).
Soit (Xn )n>1 une suite de variables aléatoires indépendantes, toutes de même loi que X.
7. On suppose tout d’abord que le paramètre β fait partie des caractéristiques connues du canal
de communication ; on se propose de déterminer un estimateur de α par une méthode dite du
« maximum de vraisemblance ».
17
ECE2 Mathématiques
Pour cela, n désignant un entier naturel non nul et x1 , ..., xn des réels supérieurs ou égaux à β, on
introduit la fonction L, à valeurs dans R et définie sur ]0, +∞[ par :
n
Q
L(a) = fa (x1 ) × · · · × fa (xn ) = fa (xk ),
k=1
où fa est la fonction définie sur R par :


 0 si t < β ;
fa (t) = a
 a β si t > β.
ta+1
a) Exprimer L(a), puis ln (L(a)).
Démonstration.
• Soit a ∈ ]0, +∞[. Comme x1 , . . . , xn sont supérieurs ou égaux à β :
L(a) = fa (x1 ) × · · · × fa (xn )

βa βa
= a × · · · × a
(x1 )a+1 (xn )a+1
(a β a )n
=
(x1 · · · xn )a+1
(a β a )n
∀a ∈ ]0, +∞[, L(a) =
(x1 · · · xn )a+1
• Soit a ∈ ]0, +∞[. Comme L(a) > 0, on peut déterminer ln(L(a)) :
(a β a )n

ln(L(a)) = ln
(x1 · · · xn )a+1
= ln((a β a )n ) − ln((x1 · · · xn )a+1 )
= n ln(a β a ) − (a + 1) ln(x1 · · · xn )
n
= n ln(a) + n ln(β a ) − (a + 1)
P
ln(xk )
k=1
n
P
∀a ∈ ]0, +∞[, ln(L(a)) = n ln(a) + n a ln(β) − (a + 1) ln(xk )
k=1
b) On considère la fonction ϕ de ]0, +∞[ dans R :

n
P
a 7→ n ln(a) + na ln(β) − (a + 1) ln (xk ) .
k=1
(i) Démontrer que la fonction ϕ admet un maximum, atteint en un seul réel que l’on notera w.
Démonstration.
1
• La fonction ϕ est de classe C sur ]0, +∞[ comme somme des fonctions :
× a 7→ ln(a) de classe C 1 sur ]0, +∞[,

n n

ln(xk ) de classe C 1 sur ]0, +∞[ car affine.
P P
× a 7→ n ln(β) − ln(xk ) a −
k=1 k=1
• Soit a > 0.
n n n

0 n P n P n P xk
ϕ (a) = + n ln(β) − ln(xk ) = − (ln(xk ) − ln(β)) = − ln
a k=1 a k=1 a k=1 β
18
ECE2 Mathématiques
• Déterminons le signe ϕ0 .
n

n xk
ϕ0 (a) > 0 ⇔
P
− ln >0
a k=1 β
n

n P xk
⇔ > ln
a k=1 β
a 1 (par stricte décroissance de la

⇔ 6 n
n P xk fonction inverse sur ]0, +∞[)
ln
k=1 β
n
⇔ a6 n (car n > 0)
P xk
ln
k=1 β
n
• En notant w = n
, on en déduit le tableau de variations de ϕ.
P xk
ln
k=1 β
x 0 w +∞
Signe de ϕ0 (x) + 0 −
ϕ(w)
Variations de ϕ
−∞ −∞
n
On en déduit que ϕ admet un maximum atteint en un seul point w = n ∈ ]0, +∞[.
ln xβk
P
k=1
Commentaire
• Il faudrait
préciser que (x1 , . . . , xk ) 6= (β, . . . , β). Si tel n’est pas le cas,
xk
ln = 0 et l’écriture de w précédente n’est pas valide.
β
• Il s’agit certainement d’un petit oubli du concepteur de sujet.

a
En effet, si (x1 , . . . , xk ) = (β, . . . , β), alors ϕ : a 7→ n ln et dans ce cas, la
β
fonction ϕ n’admet pas de maximum.
(ii) Exprimer w en fonction de x1 , ..., xn .
Démonstration.
n
D’après la question précédente, w = n .
ln xβk
P
k=1
19
ECE2 Mathématiques
(iii) Que peut-on dire de w pour la fonction L ?
Démonstration.
Soit t ∈ ]0, +∞[ tel que t 6= w.
(car ϕ atteint son

ϕ(t) < ϕ(w)
unique maximum en w)
⇔ ln(L(t)) < ln(L(w)) (par définition de ϕ)
(par stricte croissance de
⇔ L(t) < L(w)
la fonction exp sur R)
Ainsi, w est l’unique point en lequel L atteint un maximum.
c) On pose dorénavant, pour tout n de N∗ :

n
Wn = n

P Xk
ln
k=1 β
(La suite (Wn )n>1 est appelée estimateur du maximum de vraisemblance.)

n

P Xk
(i) Justifier que la variable aléatoire ln admet pour densité la fonction fn définie dans
k=1 β
I.2.b) en prenant λ = α.
Démonstration.
• Par définition, pour tout k ∈ J1, nK, Xk suit la loi de Pareto de paramètres α et β.

Xk
• D’après la question II.4 , la v.a.r. ln suit la loi exponentielle de paramètre α.
β
• Les v.a.r. X1 , . . . , Xn sont indépendantes.
X1 Xn
Par lemme des coalitions, on en déduit que les v.a.r. ln , . . . , ln sont elles
β β
aussi indépendantes.
n

P Xk
Ainsi, d’après la question I.2.b) , ln admet pour densité fn en prenant λ = α.
k=1 β
nα
(ii) À l’aide du théorème de transfert, en déduire que Wn admet pour espérance lorsque
n−1
n > 2, puis proposer un estimateur sans biais de α construit sur Wn .
Démonstration.
Soit n > 2.
• Wn s’écrit sous la forme g(Un ) où :
n

P Xk
× Un = ln est une v.a.r. de densité fn (en prenant λ = α),
k=1 β
n
× g : t 7→ .
t
20
ECE2 Mathématiques
Z +∞
• D’après le théorème de transfert, Wn admet une espérance si et seulement si g(t) fn (t) dt
−∞
est absolument convergente. Z +∞
Or : ∀t ∈ R, g(t) fn (t) > 0. Donc, cela revient à montrer que l’intégrale g(t) fn (t) dt
−∞
converge.
• La fonction fn étant nulle en dehors de [0, +∞[ :
Z +∞ Z +∞
g(t) fn (t) dt = g(t) fn (t) dt
−∞ 0
• Or, pour t ∈ ]0, +∞[ :
n αn
g(t) fn (t) = e−αt tn−1
t (n − 1)!
n α αn−1
= e−αt tn−2
(n − 1) (n − 2)!
n αn−1 −αt n−2

= α e t
n − 1 (n − 2)!
n
= α fn−1 (t)
n−1
• On reconnaît
Z +∞ une densité de probabilité, à multiplication par une constante près.
Ainsi, g(t) fn (t) dt est convergente et :
0
Z +∞ Z +∞
n n
g(t) fn (t) dt = α fn−1 (t) dt = α
0 n−1 0 n−1















n
On en déduit : E(Wn ) = α.
n−1
• Or :

n n−1 n−1
E(Wn ) = α ⇔ E(Wn ) = α ⇔ E Wn = α (par linéarité de l’espérance)
n−1 n n
n−1 n−1 n n−1

• De plus, la v.a.r. Wn = n
= n s’exprime :
n n P Xk P Xk
ln ln
k=1 β k=1 β
× à l’aide d’un n-échantillon (X1 , . . . , Xn ) de la v.a.r. X.
× sans mention du paramètre α.
n−1
Wn est un estimateur sans biais de α.
n
21
ECE2 Mathématiques
d) On pose, pour tout n de N∗ :

n−1
Wn0 = Wn .
n
(i) Soit n un entier supérieur ou égal à 3.
(n − 1)α2
En admettant que le moment d’ordre 2 de Wn0 est égal à , calculer la variance de Wn0
n−2
puis établir, à l’aide de l’inégalité de Bienaymé-Tchebychev, que pour tout réel ε strictement
positif, on a l’inégalité :
0 α2
Wn − ε < α < Wn0 + ε > 1 −

P .
ε2 (n − 2)
Démonstration.
Soit n > 3.
• On suppose que Wn0 admet un moment d’ordre 2. Par la formule de Kœnig-Huygens :
V(Wn0 ) = E(Wn0 2 ) − (E(Wn0 ))2

(n − 1) α2
= − α2
n−2
(n − 1) α2 − (n − 2) α2 α2
= =
n−2 n−2
α2
V(Wn0 ) =
n−2
• Soit ε > 0. Comme Wn0 admet un moment d’ordre 2, l’inégalité de Bienaymé-Tchebychev
permet d’affirmer :
α2
n−2
P(|Wn0 − E(Wn0 )| > ε) 6
ε2
α2
d’où −P(|Wn0 − α| > ε) > −
(n − 2) ε2
α2
et 1 − P(|Wn0 − α| > ε) > 1 −
(n − 2) ε2
α2 (probabilité de
ainsi P(|Wn0 − α| < ε) > 1 −
(n − 2) ε2 l’événement contraire)
Enfin, pour tout ω ∈ Ω :
|Wn0 (ω) − α| < ε ⇔ −ε < Wn0 (ω) − α < ε ⇔ Wn0 (ω) − ε < α < Wn0 (ω) − ε
Ainsi : [|Wn0 − α| < ε] = [Wn0 − ε < α < Wn0 − ε].
α2
On en déduit : P ([Wn0 − ε < α < Wn0 + ε]) > 1 − .
ε2 (n − 2)
22
ECE2 Mathématiques
(ii) On suppose dans cette question (et elle seule) que α est strictement compris entre 1 et 2.
Déterminer
naturel N tel que, pour tout entier n supérieur ou égal à N ,
un entier
1 1
Wn0 − , Wn0 + soit un intervalle de confiance du paramètre réel α au niveau de
10 10
confiance 0,95.
Démonstration.
1
• Soit α ∈ R tel que : 1 < α < 2. On considère ε = . D’après la question précédente :
10
α2

1 1
P Wn0 − < α < Wn0 + >1− 2
10 10 1

10 (n − 2)

0 1 0 1
• Pour que Wn − , Wn + soit un intervalle de confiance au niveau de confiance 0, 95,
10 10
il suffit de choisir n tel que :
α2
1− > 0, 95
1 2

10 (n − 2)
α2
⇔ 0, 05 >
1 2

10 (n − 2)
⇔ 0, 05 (n − 2) > 102 α2
102 2
⇔ n−2 > α
0, 05
102 2
⇔ n > α +2
0, 05
De plus, comme α < 2 :
102 2 102 104 2 4 × 104

α + 2 = 5 α2 + 2 = α +2 < + 2 = 4 × 2 × 103 + 2 = 8002
0, 05 100
5 5
102 2
Donc, par transitivité, si n > 8002, alors n > α + 2.
0, 05
α2
D’où : 1 − > 0, 95
1 2

10 (n − 2)

1 1
Pour tout n > 8002, Wn0 − , Wn0 + est un intervalle de confiance au
10 10
niveau de confiance 0, 95.
8. On suppose maintenant que seul le paramètre α est déjà identifié et qu’il vérifie : α > 2.
a) Pour tout entier strictement positif n, on pose :

n
P
Yn = cn Xk ,
k=1
où le réel cn est choisi de sorte que (Yn )n>1 soit un estimateur sans biais de β.
23
ECE2 Mathématiques
(i) Calculer cn .
Démonstration.
La v.a.r. Yn admet une espérance en tant que combinaison linéaire de v.a.r. qui admettent
une espérance. De plus, par linéarité de l’espérance :
n n n
P P P
E(Yn ) = E cn Xk = cn E(Xk ) = cn E(X1 ) = cn n E(X1 )
k=1 k=1 k=1
αβ α
Enfin, d’après la question II.1 , E(X1 ) = et ainsi : E(Yn ) = cn n β.
α−1 α−1
α−1
En choisissant cn = , on obtient E(Yn ) = β.
αn
(ii) Quelle est la limite de la variance de Yn quand n tend vers +∞ ?

(On dit que l’estimateur est convergent.)
Démonstration.
La v.a.r. Yn admet une variance comme somme de v.a.r. indépendantes qui admettent des
variances. De plus :
n n (par propriété de
Xk ) = c2n V(
P P
V(Yn ) = V(cn Xk )
k=1 k=1 la variance)
n (par indépendance
c2n
P
= V(Xk )
k=1 de X1 , . . ., Xn )
n
c2n V(X) = c2n n V(X)
P
=
k=1
(α − 1)2 α β2
= n
α2 n2 (α − 1)2 (α − 2)
β2 1
=
α (α − 2) n
−→ 0
n→+∞
On en déduit que : lim V(Yn ) = 0.

n→+∞
b) Pour tout entier strictement positif n, on pose : Zn = min (X1 , . . . , Xn ).
(i) Déterminer la fonction de répartition de Zn , puis reconnaître sa loi et préciser son espérance.
Quelle est la limite de cette dernière quand n tend vers +∞ ?
Démonstration.
• On a déjà considéré, pour tout k ∈ J1, nK : Xk (Ω) ⊂ [β, +∞[.
On en déduit : Zn (Ω) ⊂ [β, +∞[.
• Soit x ∈ R. Deux cas se présentent :
× si x < β, alors [Zn 6 x] = ∅ car Zn (Ω) ⊂ [β, +∞[. Donc :
FZn (x) = P([Zn 6 x]) = P(∅) = 0
24
ECE2 Mathématiques
× si x > β alors :
FZn (x) = P([Zn 6 x])

= P([min(X1 , . . . , Xn ) 6 x])
= 1 − P([min(X1 , . . . , Xn ) > x])
= 1 − P([X1 > x] ∩ . . . ∩ [Xn > x])
= 1 − P([X1 > x]) × . . . × P([Xn > x]) (par indépendance de X1 , . . ., Xn )
(car X1 , . . . , Xn ont
= 1 − P([X1 > x]) × . . . × P([X1 > x])
toutes même loi que X)
= 1 − (P([X1 > x]))n
α n αn
β β
= 1− = 1− (d’après II.2. et car x > β)
x x
On reconnaît (d’après II.2.) la fonction de répartition d’une v.a.r. qui suit la loi de
Pareto de paramètres αn et β.
αn β
Ainsi, Zn admet une espérance et E(Zn ) = (d’après II.1.)
αn − 1
• Enfin, comme α > 0 et β > 0 :
αn β αn β
E(Zn ) = ∼ = β −→ β
αn − 1 n→+∞ αn n→+∞
En conclusion : E(Zn ) −→ β.
n→+∞
L’estimateur Zn est donc asymptotiquement sans biais.
(ii) Pour tout entier strictement positif n, on pose : Zn0 = dn Zn , où le réel dn est choisi de telle
sorte que (Zn0 )n>1 soit un estimateur sans biais de β.
Quelle est la limite de la variance de Zn0 quand n tend vers +∞ ?
Démonstration.
αn β
• D’après la question précédente : E(Zn ) = . Or :
αn − 1

αn β αn − 1 αn − 1
E(Zn ) = ⇔ E(Zn ) = β ⇔ E Zn = β (par linéarité de l’espérance)
αn − 1 αn αn
nα − 1 αn − 1
Donc Zn0 = Zn est un estimateur sans biais de β (dn = ).
nα αn
• La v.a.r. Zn0 = dn Zn admet une variance en tant que transformée affine de Zn , et :
(nα − 1)2 nα β 2
V(Zn0 ) = V(dn Zn ) = d2n V(Zn ) =
(nα) 2 (nα − 2) (nα − 1)2
1
= β2 −→ 0
nα (nα − 2) n→+∞
V(Zn0 ) −→ 0
n→+∞
25
ECE2 Mathématiques
(iii) Démontrer que l’estimateur (Zn0 )n>1 est plus efficace que l’estimateur (Yn )n>1 , c’est-à-dire,
qu’à partir d’un certain rang, la variance de Zn0 est inférieure à celle de Yn .
Démonstration.
Raisonnons par équivalence.
V(Zn0 ) 6 V(Yn )
β2 β2 1
⇔ 6
nα (nα − 2) α (α − 2) n
1 1 β2
⇔ 6 (car > 0)
nα − 2 α−2 nα
(par stricte décroissance de la
⇔ nα − 2 > α−2
fonction inverse sur ]0, +∞[)
⇔ nα > α
⇔ n > 1 (car α > 0)
À partir du rang n = 1, V(Zn0 ) 6 V(Yn ) et l’estimateur Zn0 est donc plus efficace
que l’estimateur Yn .
Commentaire
• La loi présentée dans la question II.2.b) est appelée loi d’Erlang (hors programme) de
paramètres n et λ. Cette loi est liée à des lois de probabilité classiques :
× lorsque n = 1 (cf initialisation de la récurrence du II.2.b) ), on reconnaît la loi expo-
nentielle de paramètre λ.
× de manière générale, la loi d’Erlang est un cas spécial de la loi Gamma (qui admet deux
paramètres notés généralement α et β) dont une densité est donnée par :


 0 si t < 0 ;
t 7→ β α −βt α−1

 e t si t > 0.
Γ(α)
En prenant α = n, on reconnaît la densité fn de la quesiton de l’énoncé.

• Cette loi Gamma se définit à l’aide de la fonction :
Z +∞
Γ : x 7→ tx−1 e−t dt
0
que l’on peut rencontrer par exemple dans ESSEC II 2005.

Pour rappel, la fonction Γ est définie sur R+∗ et on peut démontrer (penser à une IPP) :
(
Γ(1) = 1
∀x > 0, Γ(x + 1) = xΓ(x)
de sorte que : ∀n ∈ N, Γ(n + 1) = n!.

(on peut voir la fonction Γ comme un prolongement de la fonction factorielle)
• La loi de Pareto est elle aussi très classique aux concours. Elle est elle aussi reliée à la loi
exponentielle (c’était l’objet de la question II.4.).
26
ECE2 Mathématiques
Commentaire
Enfin, la partie estimation portait sur l’estimateur du maximum de vraisemblance.
Détaillons ce point.
• On dispose d’un échantillon (x1 , . . . , xn ) d’observations.
• On suppose que ces observations proviennent d’un n-échantillon (X1 , . . . , Xn ) d’une v.a.r.
X dont la loi dépend d’un paramètre α, a priori inconnu et qu’on cherche à déterminer.
Pour ce faire, une idée naturelle consiste à considérer que la valeur de α qui a permis de
générer les observations est celle qui avait la plus grande probabilité de les générer. C’est
cette idée qui guide la méthode dite du maximum de vraisemblance.
• Le réel w est précisément la valeur du paramètre α maximisant la réalisation des observa-
tions initiales.
• La méthode du maximum de vraisemblance conduit à considérer la variable aléatoire
construite à l’aide de ce maximum : Wn .
• Plaçons-nous dans le cas où X est une v.a.r. discrète (la méthode est plus simple à ap-
préhender dans ce cas). L’idée est de choisir comme estimation de α le réel w tel que la
vraisemblance d’avoir obtenu l’échantillon utilisé soit maximisée.
Autrement dit, le réel w tel que la probabilité :
L(a) = Pa ([X1 = x1 ] ∩ . . . ∩ [Xn = xn ])

(par indépendance de
= Pa ([X1 = x1 ]) × . . . × P([Xn = xn ])
X1 , . . ., Xn )
n
Q
= Pa ([Xi = xi ])
i=1
soit maximale. L’énoncé portait sur le cas de v.a.r. à densité, que l’on comprend aisément
par analogie avec le cas des v.a.r. discrètes.
Intervalles de confiance
Exercice 9. (☀) (d’après ESSEC - Maths II - 2005)
Une entreprise souhaite acquérir une machine qui fabrique un certain type d’objets et qui, en fonction-
nement normal, produit une proportion p (0 < p < 1) d’objets défectueux. Le directeur veut connaître
la valeur de p.
Pour cela, il teste la machine et prélève un échantillon de n objets qu’il analyse, avec n > 1.
Pour tout i ∈ J1, nK, soit Xi la v.a.r. de Bernoulli définie par :
1 si le iième objet prélevé est défectueux

Xi =
0 sinon
On suppose que dans les conditions de prélèvement, les variables aléatoires X1 , . . . , Xn sont indépen-
Pn
dantes. On pose Sn = Xk .
k=1
Sn
1. a) Montrer que Fn = est un estimateur sans biais de p.
n
b) Calculer le risque quadratique rn de Fn . Déterminer lim rn .
n→+∞
2. Soit α un réel de ]0, 1[. On souhaite déterminer dans cette question un intervalle de confiance du
paramètre p inconnu, au niveau de confiance 1 − α, à partir de l’échantillon (X1 , . . . , Xn ).
!
√ Fn − p
a) Quelle est la limite en loi de la suite np ?
p(1 − p) n∈N∗
27
ECE2 Mathématiques
b) Soit fn la réalisation de Fn sur l’échantillon considéré.

α
Soit tα le réel défini par Φ(tα ) = 1 − , où Φ désigne la fonction de répartition de la loi normale
2
centrée, réduite. Montrer qu’un intervalle de confiance de p au niveau 1−α est donné par [un , vn ]
où :
tα tα
un = fn − √ et vn = fn + √
2 n 2 n
c) On suppose dans cette question qu’en fonctionnement normal la machine produit une proportion
p = 0, 05 d’objets défectueux. Le directeur analyse 10 000 objets et compte 600 objets défecteux
sur cet échantillon. Décide-t-il d’acheter la machine, au niveau de confiance de 95% ? On donne
Φ(2) ' 0, 975.
Exercice 10. (☀☀)

Soit X une v.a.r. suivant la loi uniforme sur [0, θ], où θ > 0 est un paramètre inconnu. Soit (X1 , X2 , . . . , Xn )
un n-échantillon de la v.a.r. X.
On considère les estimateurs suivants :

Un
Un = max(X1 , X2 , . . . , Xn ) et Tn = n 1 −
θ
On souhaite déterminer un intervalle de confiance asymptotique du paramètre θ de la forme [Un , Vn ],

au niveau de confiance 1 − α.
1. Tn peut-il être un estimateur de θ ?
2. Déterminer la fonction de répartition FUn de la variable Un .
En déduire la fonction de répartition FTn de la variable Tn .
3. Prouver que (Tn )n∈N∗ converge en loi vers une v.a.r. T suivant la loi E (1).

Un
4. Montrer l’égalité des événements [Un 6 θ 6 Vn ] et 0 6 Tn 6 n 1 − .
Vn
5. En déduire que l’intervalle cherché est obtenu pour :
Un
Vn = 1
1+ n ln(α)
6. On considère le programme suivant :
1 n = input('Valeur de n ?')
2 theta = 5?rand()
3 for i=1:n
4 disp(grand(1,1,'unf',0,theta))
5 end
Une réalisation de ce programme affiche les nombres suivants :
0.8608569 0.1431483 0.9570818 0.8822904 0.1341774

1.0237293 0.9650951 0.2335499 0.6681662 0.3256168
a) On considère un niveau de confiance de 0, 95 (ln(0, 05) ' −3).

Déduire des valeurs précédentes les réalisations de un et vn correspondantes. Quel est l’intervalle
de confiance observé correspondant ?
b) Quelle valeur faut-il donner à n pour avoir Vn = 1, 01 Un ?
28
ECE2 Mathématiques
Exercice 11. (☀) (extrait de HEC 2008 - Maths III)

Dans tout le problème, N désigne un entier naturel fixé supérieur ou égal à 2, et p un réel fixé de
l’intervalle ]0, 1[.
On pose q = 1 − p. Soit n un entier naturel quelconque.
Dans une population de N individus, on s’intéresse à la propagation d’un certain virus. Chaque jour, on
distingue dans cette population trois catégories d’individus : en premier lieu, les individus sains, c’est-
à-dire ceux qui ne sont pas porteur du virus, ensuite les individus qui viennent d’être contaminés et qui
sont innofensifs pour les autres, et enfin, les individus contaminés par le virus et qui sont contagieux.
Ces trois catégories évoluent jour après jour selon le modèle suivant :
× chaque jour n, chaque individu sain peut être contaminé par par n’importe lequel des individus
contagieux avec la même probabilité p, ces contaminations éventuelles étant indépendantes les unes
des autres ;
× un individu contaminé le jour n devient contagieux le jour n + 1 ;
× chaque individu contagieux le jour n redevient sain le jour n + 1.
Estimations ponctuelles et par intervalle de confiance de p

On suppose que le paramètre p, qui exprime la probabilité qu’un individu contagieux transmette le
virus à un individu sain, est inconnu, et on cherche à l’estimer. On rappelle que : q = 1 − p.
Pour m entier supérieur ou égal à 1, on considère un m-échantillon (Y1 , Y2 , . . . , Ym ) de variables aléa-
toires indépendantes, de même loi de Bernoulli de paramètre p, définies sur un même espace probabilisé
(Ω, A , P).
1 Pm
On pose : Ym = Yk .
m k=1
Dans toute cette partie, on note ε un réel strictement positif quelconque.
1. a) Montrer que Ym est un estimateur sans biais de p ; déterminer son risque quadratique.
" r r #
5 5
b) A l’aide de l’inégalité de Bienaymé-Tchebycheff, montrer que l’intervalle Ym − , Ym +
m m
est un intervalle de confiance de p au niveau de confiance 0.95.
2. Soit θ un réel strictement positif.
a) Etablir l’égalité suivante :

P [Ym − p > ε] = P [emθYm > emθ(p+ε) ]

b) Montrer que si T est une v.a.r. discrète finie à valeurs positives d’espérance E(T ), et a un réel
strictement positif, on a l’inégalité :
E(T )
P([T > a]) 6
a
c) Soit g la fonction définie sur R+ par : g(x) = ln(p ex + q).

Déduire des questions précédentes, l’inégalité suivante :
P([Ym − p > ε]) 6 em(g(θ)−θ(p+ε))
d) Montrer que la fonction g est de classe C 2 sur R+ et vérifie, pour tout x de R+ , l’inégalité :
1
|g 00 (x)| 6 .
4
θ2
e) En déduire l’inégalité suivante : g(θ) 6 θp + .
8
29
ECE2 Mathématiques
x2
f ) Étudier les variations de la fonction h : x 7→ − εx sur R+ .
8 2
En déduire l’inégalité : P([Ym − p > ε]) 6 e−2mε .
1 P m
3. On pose Wm = (1 − Yk ).
m k=1
2
Établir l’inégalité : P([Wm − q > ε]) 6 e−2mε .
4. a) Déduire des questions 2.f ) et 3 , l’inégalité suivante :
2
P([Ym − p > ε]) 6 2e−2mε

r
2 1.844
b) Sachant ln(0.025) ' −3.688, calculer 2e−2mε pour ε = .
m
En déduire un nouvel intervalle de confiance de p au niveau de confiance 0.95. Comparer cet
intervalle de confiance avec celui obtenu à la question 1.b) . Conclure.
Exercice 12. (☀)

Le but de ce problème est l’étude d’estimateurs du nombre N d’individus d’une population. Une
réserve naturelle contient N oiseaux. Le nombre N est inconnu. On capture au hasard m oiseaux dans
m
la réserve, on les bague et on les relâche. Posons p = la proportion des oiseaux de la population qui
N
sont bagués. On a : 0 < m < N , où m et N sont deux entiers.
Partie I
On choisit successivement au hasard, avec remise, n oiseaux dans la population. On appelle In le
nombre d’oiseaux bagués obtenus lors de ces n choix.
1. Quelle est la loi de In ?
Donner son espérance et sa variance en fonction de n et de p.
1 1
2. Justifier que In est un estimateur sans biais de ·
nm N
1 1 1
3. Montrer que In est convergent, c’est-à-dire que pour tout ε > 0, lim P In − > ε =
nm n→+∞ nm N
0.
4. Dans cette question, on suppose que n = 1 600 et que l’on a eu 400 oiseaux bagués pami les 1 600
choisis.
a) Déterminer, à l’aide de l’estimateur In , un estimateur sans biais de p.
b) Déterminer un intervalle de confiance de p au taux de confiance de 0, 95. On donne Φ(2) = 0, 975.
c) Sachant que l’on a marqué 990 oiseaux, en déduire un intervalle de confiance de N avec un risque
d’erreur d’au plus 5%.
m(n + 1)
5. On pose Yn = .
In + 1
nm
(on ne peut pas prendre car In peut prendre la valeur 0)
In
a) Montrer que E(Yn ) = N 1 − (1 − p)n+1 .

1 n 1 n+1
On pourra utiliser l’égalité : = .
k+1 k n+1 k+1
b) Yn est-il un estimateur sans biais de N ?
c) Montrer que l’estimateur Yn est asymptotiquement sans biais.
30
ECE2 Mathématiques
Partie II
On choisit au hasard et avec remise des oiseaux de la population.
On appelle Rn le nombre de choix effectués pour obtenir n oiseaux bagués.
Ainsi, Rn est la rang de sortie du nième oiseau bagué dans la suite des choix.
1. Quelle est la loi de R1 ?
Donner l’expression de P([R1 = k]), en fonction de k et de p.
Donner l’espérance de R1 et sa variance.
2. On pose D1 = R1 et pour tout entier k tel que k > 2, Dk = Rk − Rk−1 . Ainsi, Dk est le nombre de
choix effectués après l’obtention du (k − 1)ième oiseau bagué pour obtenir le k ième .
a) Justifier que les variables D1 , D2 , . . . , Dk , . . . sont mutuellement indépendantes, et suivent la
même loi que R1 .
b) Soit n un entier supérieur ou égal à 2.
Calculer Rn en fonction de Dk , pour 1 6 k 6 n.
En déduire l’espérance et la variance de Rn en fonction de n et de p.
m
3. On pose Xn = Rn .
n
Montrer que Xn est un estimateur sans biais convergent de N .
p Rn − n
4. a) À l’aide de quel théorème peut-on affirmer que l’on peut approcher la loi de p par la
n (1 − p)
loi normale centrée réduite, pour n suffisamment grand ?
Montrer qu’alors la loi de Xn peut, elle aussi, être approchée par une loi normale dont on donnera
les valeurs des paramètres.
b) On suppose dans cette question que Xn suit une loi normale, que m = 1000 et que p > 0, 2.
Déterminer une valeur de n à partir de laquelle on peut affirmer que l’on connaît N à 500 près
avec une probabilité d’au moins 0, 95.
On utilisera l’approximation Φ(2) ' 0, 975.
5. Posons Ck l’événement : « le k ième choix est celui d’un oiseau bagué ».
Exprimer [Rn = k] à l’aide de la variable Ik−1 définie dans la partie I et de l’événement Ck . Puis
en déduire la loi de Rn .
P n+i i
6. En déduire que si x ∈ ]0, 1[, alors la série n x est convergente, et calculer sa somme.
i
31

Exos Estimation Correction

Transféré par

Droits d'auteur :

Formats disponibles

Exos Estimation Correction

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Exos Estimation Correction

Transféré par

Droits d'auteur :

Formats disponibles

ECE2 Mathématiques

Feuille d’exercices n°15 : Estimation

1. a) Déterminer le biais des estimateurs M1 , M2 et N .

a) Déterminer l’espérance de Zn , et sa variance.

L(p) = Pp ([V1 = v1 ] ∩ . . . ∩ [Vn = vn ])

Exercice 6. (☀) (d’après ESC 2006)

[Mn 6 x] = [X1 6 x] ∩ [X2 6 x] ∩ . . . ∩ [Xn 6 x]

c) Montrer que Mn admet une espérance et une variance, et que :

d) On cherche à estimer r avec Mn .

lim P ([|Mn − r| > ε]) = 0

Puis montrer que Mn est un estimateur convergent.

b) En déduire que, pour tout ε ∈ ]0, r[ :

c) En déduire que, pour tout ε ∈]0, r[ : lim P ([|Un − r| > ε]) = 0.

Exercice 8. (☀☀) (adapté de ESSEC 2009 - Maths II)

3. Pour tout entier naturel j, on définit la probabilité conditionnelle :

ϕ(j) = P[Sn =j] ([X1 = 0])

b) Soit h la fonction définie sur [0, 1] par h(t) = t exp(θ) + (1 − t) − exp(tθ).

Problème (ESSEC I 2007)

• On peut donc calculer la probabilité conditionnelle suivante :

P([X > x] ∩ [X > x + y])

P([X > x + y]) (car, comme y > 0,

= e−λy = P([X > y])

P[X>x] ([X > x + y]) = P([X > y])

X(ω) > x + y > x (car y > 0)

Ainsi : X(ω) > x. Ou encore : ω ∈ [X > x].

a) Déterminer l’espérance et la variance de Sn .

On est dans le cadre d’utilisation du théorème fourni par l’énoncé :

Soit t ∈ R. Deux cas se présentent :

fSn+1 (t) = FS0 n+1 (t) = 0

× si t > 0. Cherchons d’abord à savoir sur quel ensemble la fonction x 7→ fn (x) f1 (t − x) ne

- De plus, pour tout x ∈ R :

II. Loi de Pareto (Vilfredo Pareto (1848-1923), sociologue et économiste italien)

• La fonction f est continue par morceaux sur [b, +∞[.

× De plus, pour tout t ∈ [b, +∞[ :

On en déduit que la v.a.r. X admet une espérance si et seulement si a > 1.

• Supposons alors a > 1.

ne sont valables que si a − 1 > 0.

• On procède de même pour la variance. Z +∞

× De plus, pour tout t ∈ [b, +∞[ :

On en déduit que la v.a.r. X admet une variance si et seulement si a > 2.

• Supposons alors a > 2.

• Ainsi, par la formule de Kœnig-Huygens :

V(X) = E(X 2 ) − (E(X))2

4. Déterminer la fonction de répartition de X. Préciser la fonction de survie : x 7→ P([X > x]).

Déterminons la fonction de survie de X.

P([X > x]) = 1 − P([X 6 x]) = 1 − FX (x) = 1 − 0 = 1

P([X > x + y]) (car, comme y > 0 :

Si on considère que X modélise la durée de vie d’un phénomène, la propriété

Et ainsi : Y (Ω) = [0, +∞[.

FY (x) = P([Y 6 x]) = P(∅) = 0

FY (x) = P([Y 6 x])

« Comme X ,→ U([0, 1]), on considère : X(Ω) = [0, 1]. »

« Dans la suite, on considère : X(Ω) = I. »

III. Estimation des paramètres d’une loi de Pareto

où fa est la fonction définie sur R par :

L(a) = fa (x1 ) × · · · × fa (xn )

b) On considère la fonction ϕ de ]0, +∞[ dans R :

× a 7→ ln(a) de classe C 1 sur ]0, +∞[,

a 1 (par stricte décroissance de la