Variable Binomial PDF
Variable Binomial PDF
Variable Binomial PDF
TESIS DOCTORAL
1. Introducción
1 Introducción ..................................................................................... 1
multinomial ...............................................................................................34
3.2 Objetivos..........................................................................................63
6. Conclusiones generales………………………………………………………………118
7. Bibliografía general……………………..………………………………………………120
8. Anexos
Esta tesis doctoral aborda la aplicación de seis enfoques estadísticos que se utilizan
para estimar tamaños de muestra en poblaciones multinomiales los que corresponden
a: Angers (1974), Tortora (1978), Thompson (1987), Cochran (1977), Bromaghin
(1993) y Fitzpatrick & Scott (1987), dichos enfoques están ampliamente discutidos
en la literatura del muestreo estadístico pero generan controversia al momento de
aplicarlos en estudios de salud dado a que no siempre permiten conjugar costos,
representatividad y tamaños de muestra adecuados para un esquema de muestreo
aleatorio simple y muestreo complejo de poblaciones en donde la variable de diseño o
estudio corresponde a una distribución de tipo multinomial.
Initially discusses how the use of a maximun variance when the design variable with
k = 2 gives estimates of prevalence categories considering a P = 0.50 for this sample
size estimate without knowing previous values of this estimator which delivers biased
estimates.
The discussion then focuses on determining which delivery method best used sample
sizes and estimates considering scenarios where the categories considered ranging
from k = 3 to k = 7, finally proposes and discusses the use of measures of
uncertainty or entropy Shannon to study the uncertainty associated with the
estimated vectors using different methods.
CAPITULO 1
INTRODUCCIÓN
1 Introducción
Entre las primeras preguntas que se realiza un investigador del área de la salud está
la de ¿cuántos individuos necesito para realizar mi estudio?. La respuesta dependerá
de los objetivos, la naturaleza y el alcance del estudio y en el resultado esperado,
todo lo cual debe ser cuidadosamente considerado en la planificación (Lwanga y
Lemeshow 1991).
1
Lo que busca el muestreo es elaborar estrategias muestrales y de medición que
permitan inferir (extrapolar) el conocimiento generado hacia el total de la población
(Hernández et al. 2000). Un proceso inductivo de tal naturaleza, que va de lo
particular a lo general, inevitablemente entraña la posibilidad de cometer errores, y
es claramente intuitivo que dichos errores están llamados a ser mayores en la medida
que la porción observada sea más reducida y, sobre todo, en la medida que ella no
refleje o <<represente>>, la realidad sobre la que recaerán las conclusiones de la
inferencia (Silva 2000a).
2
Existen dos tipos de aproximación al muestreo, el primero hace referencia al
muestreo de tipo poblacional en donde el objetivo radica en otorgar representatividad
a las unidades de análisis, el segundo privilegia el carácter aleatorio de la muestra y
el objetivo es poder hacer comparaciones mediante pruebas o contrastes de hipótesis
estadísticas (Silva 2000a). El trabajo que se presenta en esta tesis se enmarca,
fundamentalmente, en la primera aproximación.
Los sustentos teóricos del muestreo se relacionan con la ley de los grandes números
que postula que a medida que aumenta el tamaño de muestra, el parámetro
poblacional versus el estimador se diferencian lo menos posible (Knight 2000). Dicha
diferencia se conoce como “error muestral” en la teoría del muestreo y es un cierto
valor prefijado por el investigador (Gutiérrez 1995).
También hay que tener en cuenta que la mayoría de las investigaciones realizadas en
diferentes áreas del conocimiento se hace a partir de información de índole
cuantitativa, para ello es necesario definir con antelación al estudio que variables se
desean examinar y qué relaciones existen entre ellas. De ahí surge la necesidad de
estudiar colectivos de datos provenientes de “muestras” como por ejemplo personas,
familias, unidades productivas, etc… (Mirás 2000). Teniendo presente lo anterior, la
decisión de definir las variables a estudiar debe ser un paso previo y esto lleva
consigo consecuencias que podrían influir en el estudio a llevar como por ejemplo
beneficios o costos económicos, implementación de políticas públicas, intervenciones,
etc. (Mirás 2000).
3
Fortalezas:
Limitaciones:
4
Población objetivo: Es la colección completa de unidades de observación que se
desea estudiar (Lohr 2000, Pérez 2005). Es el conjunto de individuos u objetos de los
que se desea conocer algo en una determinada investigación y para el cual se
generalizaran los hallazgos encontrados (Pineda y de Alvarado 2008).
5
muestreo y análisis coinciden y eso es en el caso de un muestreo de tipo aleatorio
simple (Silva 2000a).
Los diseños muestrales se dividen en dos grandes grupos, los diseños probabilísticos y
los no probabilísticos, donde cada uno de ellos se divide en varios tipos de diseños
muestrales. Ambos tipos de diseños pueden ser aplicados para el levantamiento de
información por medio de encuestas. Pero la diferencia se encuentra en las
posibilidades de realizar inferencia estadística a partir de las muestras diseñadas y
seleccionadas, ya que este requisito lo tienen solo muestras de naturaleza aleatorias
(Quijada y Alvarado 2009). Existen diferentes estrategias de selección de muestras en
los diseños probabilísticos, entre ellas destacan el muestreo aleatorio simple,
sistemático, por conglomerados, estratificado y complejo (Lohr 2000).
6
A continuación se detallaran las principales estrategias de muestreo empleados en
estudios de salud, se comienza con el muestreo aleatorio simple (MAS), que
constituye el diseño que se trabaja en esta tesis. Con el fin de ver las diferencias
teóricas y de aplicación con los otros diseños como: sistemático (MASI),
conglomerados (MC) y estratificado (MAE), se presentará cada diseño con el objeto
de establecer las diferencias entre ellos y además poder poner en contexto el trabajo a
desarrollar en esta tesis que trata de estimación de tamaños de muestra para
variables de naturaleza multinomial mediante diseño de muestreo aleatorio simple
MAS.
Dentro del muestreo aleatorio simple existen dos variantes que corresponden al
muestreo sin reposición y con reposición (Lohr 2000, Mirás 2000), el primero hace
referencia a la elección de n unidades seleccionadas aleatoriamente de modo que cada
posible subconjunto de n unidades distintas tenga la misma probabilidad de ser
escogida en la muestra (Lohr 2000, Silva 2000a) , después de observar o medir la
característica en estudio los elementos no son devueltos a la población (Kish 1965) y
la estructura poblacional cambia de una extracción a otra (Pérez 2005). Luego
N
existen muestras posibles, de modo que la probabilidad de escoger cualquier
n
muestra M de n unidades está dada por la ecuación (1):
1 n !( N − n ) !
P( M ) = = ; (1)
N N!
n
7
Una característica importante a considerar es que el MAS sin reposición produce
muestras diferentes de la población y en cambio el MAS con reposición puede tener
menor número de elementos diferentes entre sí (ya que se podría escoger el mismo
elemento en más de una oportunidad), lo que nos lleva a concluir que el MAS sin
reposición es más eficiente que el MAS con reposición, ya que este último
procedimiento conlleva una pérdida de información (Silva 2000a).
8
cuando el marco muestral está compuesto por un listado de conglomerados y no
elementos (Quijada y Alvarado 2009). En las restantes estrategias muestrales como
por ejemplo: muestreo aleatorio simple (con y sin reposición), sistemático y
estratificado; las unidades de muestreo son las mismas que las unidades objeto de
estudio (o análisis) (Pérez 2005). Este tipo de muestreo suele confundirse con el
estratificado, y la diferencia fundamental que existe entre ambos es que en el muestro
estratificado las agrupaciones ya existen de manera natural (distritos, provincias,
escuelas, hospitales, etc…) y en el de conglomerados el investigador divide
previamente a la población en conglomerados o áreas convenientes según los
objetivos del estudio (Pineda y de Alvarado 2008, Pérez 2005).
9
Figura 1. Similitudes y diferencias entre muestreo aleatorio por
conglomerados y muestreo aleatorio estratificado para estimar un
parámetro poblacional θ (Fuente: Adaptado de Sharon, L. (2000))
10
información auxiliar para mejorar la eficiencia en la selección de elementos y mejorar
la precisión de estimaciones (Quijada y Alvarado 2009), una de esas estimaciones
corresponde a la varianza y lo que se persigue es que ella sea pequeña en cada uno de
los estratos (Mirás 2000).
11
Una vez configurada dicha partición las unidades se distribuyen en los estratos
configurando la siguiente estructura de forma matricial:
En donde la fila en recuadro indica los elementos o unidades de análisis del estrato h-
ésimo a nivel poblacional, lo que se puede escribir como {u hj }j =h1 , ahora generalizando
N
12
Figura 3. Esquema representativo de conformación de muestras (Fuente:
Elaboración propia).
13
constante k de proporcionalidad o fracción de muestreo f , según (Lohr 2000) a dicha
constante también se le conoce como “probabilidad de selección” (ecuación 2).
H H H
n
nh = N h k ⇒ ∑ n = ∑ N k = k∑ N
h =1
h
h =1
h
h =1
h ⇒ n = kN ⇒ k=
M
= f , ( 2)
Nh Sh
nh = n H
, (3)
∑N
h =1
h Sh
NhS nN h n
Si Sh = S ⇒ nh = n H
= = kN h , k= , (4)
N N
∑N S
h =1
h
Esto es, si las varianzas por estratos son la mismas S h = S , entonces el tamaño
muestral por estrato nh es igual a una constante k multiplicada por el tamaño
poblacional en el estrato, otros autores como (Levy y Lemeshow 1999) a esta técnica
le llaman afijación optima y puede causar confusión con lo que menciona (Pérez
2005) ya que la afijación optima para dicho autor no corresponde a la de Neyman.
14
El inconveniente es que a aquellos estratos que a nivel poblacional presentan un gran
tamaño o pequeño tamaño les asigna el mimo tamaño muestral, así estratos pequeños
o grandes salen perjudicados en dicha asignación muestral ya que se les asigna más o
menos unidades a muestrear (Pérez 2005).
El efecto diseño captura el cambio en la varianza muestral que ocurre debido a que
no usamos un muestreo aleatorio simple de tamaño n sino un muestreo por
conglomerado o estratos del mismo tamaño (Quijada y Alvarado 2009).
VarMAE / MC (θ )
Deff (θ ) = , (5)
VarMAS (θ )
Donde:
Este cambio en la varianza depende de cuán homogéneos sean los elementos del
clúster o estrato y de cuál sea el tamaño de este clúster o estrato. Mientras más
homogéneo es el clúster o estrato mayor efecto diseño se tiene.
1.- Deff < 1 implica que el diseño muestral utilizado es más eficiente (presenta
mayor varianza) que el muestreo aleatorio simple del mismo tamaño. En general, este
es el caso del muestreo estratificado (MAE), cuando los estratos utilizados están
relacionados a la variable bajo estudio.
2.- Deff > 1 implica que el diseño utilizado es menos eficiente (presenta mayor
varianza) que el MAS del mismo tamaño. El muestreo por conglomerados (MC) es
un ejemplo de este caso.
15
1.5 Diseños complejos (muestreo en varias etapas o multietapico)
El muestreo en varias etapas se usa a menudo en situaciones en las cuales las listas
de elementos de los marcos muestrales no son suficientes para identificar a las
unidades muestrales, es decir no se puede obtener a las unidades muestrales
directamente del marco muestral y se deben seleccionar unidades que concentran la
unidad principal de análisis y muestreo (Quijada y Alvarado 2009, Lohr 2000). Este
tipo de muestreo se utiliza bastante cuando se usa un procedimiento llamado área de
muestreo, que define áreas ya sea geográficas o por bloques de alguna característica
como unidades de muestreo.
Muchas encuestas combinan diseños muestrales, por ejemplo, usando en una primera
etapa un diseño de muestreo estratificado y, luego, un muestreo aleatorio simple o
bien sistemático. Luego la optimización del uso de varias etapas en el diseño muestral
requiere del conocimiento tanto de la variación en términos estadísticos de las
diferentes etapas y los costos asociados a ellas tales como entrenamiento, acceso a las
áreas geográficas, intentos de contactos, etc…(Quijada y Alvarado 2009, Levy y
Lemeshow 1999, Lohr 2000).
16
Luego para obtener un diseño muestral eficiente, se debe muestrear un número
suficiente de unidades del grupo de interés usando un procedimiento que asegure que
cada unidad tendrá la misma probabilidad de selección.
Cuando se estratifica por región de un país por ejemplo, tenemos que localizar la
selección en cada una de las áreas primarias de selección las que están divididas en
áreas más pequeñas. La unidad de cuenta podría ser por ejemplo subdivisiones de las
regiones en comunas y barrios los que serán estratos de selección.
17
El tamaño de muestra juega un rol importante sobre la magnitud del error muestral
de las estimaciones (Silva 2000a), así el tamaño mínimo necesario depende entre
otras características del error de muestreo máximo admisible o precisión en la
estimación. Luego el tamaño de muestra nos permite tener un número suficiente de
individuos que permita hacer estimaciones confiables del parámetro de interés, cabe
destacar que un tamaño de muestra pequeño es tan perjudicial como un tamaño de
muestra grande ya que los costos involucrados afectan directamente el estudio y
tamaños de muestras pequeños o grandes influyen en las estimaciones del parámetro.
Por otro lado, habitualmente, en el ámbito de la salud pública, las encuestas que se
realizan corresponden a propósitos múltiples y por lo tanto se requiere la estimación
de diversas estadísticas, las cuales, de manera individual, pueden conducir a tamaños
de muestra diferentes.
18
prevalencia por ejemplo) si se logra conjugar una adecuada precisión (error muestral)
y nivel de confianza.
Por una parte los especialistas del área de muestreo estadístico y además los textos
que estudian la teoría del muestreo abordan la determinación del tamaño de muestra
para investigaciones en primera instancia, como si se tratara de un problema que
involucra solo una variable, sin considerar que la mayoría de las encuestas son de
múltiples propósitos (involucran muchas variables). Además de considerar que
variables de naturaleza categórica son tratadas como binarias (Martínez y Martínez
2008), generando estimaciones de tamaños de muestra que a-posteriori entregan
errores muestrales relativos elevados una vez tabulada la información muestral para
la variable de estudio que no fue considerada.
19
En teoría del muestreo se afirma que, tomando un tamaño de muestra n
suficientemente grande, se podrá estar seguro de que dicha diferencia θˆ − θ < e se
cumpla, pero ¿qué propiedad matemática hace que se cumpla dicha característica?,
según (Gutiérrez 1994) dicha característica se referiría a la ley de los grandes
números.
Según (Mood y Graybill 1955), en un problema del mundo real solo se pueden
observar un número finito de valores de una variable aleatoria, entonces surgen las
siguientes preguntas ¿Se pueden hacer inferencias fiables de un parámetro θ
construido con un número infinito de valores de la variable X, utilizando una
muestra aleatoria finita de tamaño n?. Para estos autores la respuesta es afirmativa y
con solo una muestra finita es posible hacer dichas inferencias, para ello la ley débil
de los grandes números permite probar dicha afirmación.
S
P n − µ < e → 1 cuando n → ∞ , (6)
n
Esta versión también es conocida como ley débil de los grandes números (Roussas
1997, Knight 2000) y su demostración es mostrada en diferentes textos de estadística
matemática y hace referencia a que a medida que aumenta el número de
observaciones para la muestra la estimación se aproxima (acerca) al parámetro
poblacional (Casella y Berger 2002).
20
arbitrariamente próxima a uno como sea posible, hacerse menor que un número
arbitrariamente pequeño e (ecuación 7).
P[ Pe − Pt < e] → 1 , (7)
P[ p − P < e] = 1 − α , (8)
“Un hecho de la ciencia es un compendio estadístico de datos directos. Para que una
proposición empírica sea admitida como hecho de la ciencia es necesario que su
probabilidad estadística se diferencie lo menos posible de su probabilidad lógica o
teórica y pueda aproximarse a ella a medida que crece el número de datos”
21
Nuevamente se menciona la ley de los grandes números, pero esta vez se hace
hincapié en la naturaleza empírica de los datos, datos que se obtienen mediante
levantamiento de la información de una “única muestra” la cual debe ser de calidad y
que permita asegurar estimaciones adecuadas de los parámetros a estudiar (Silva
2000a).
2. Cada ensayo tiene solo dos resultados posibles, denotándose con E el resultado
exitoso y con F el resultado de fracaso.
22
Definición: Se dice que una variable aleatoria X, tiene distribución binomial basada
en n ensayos con probabilidad de éxito p si y solo si:
n x
p (1 − p ) n− x ; x = 0,1,...., n
p ( x; n, p ) = x , (9)
0 ; en otro caso
23
Figura 4. Relaciones de treinta y cinco distribuciones de probabilidad discretas y
continúas (Tomado de Tina (2005)).
24
1.8.2 Intervalos de Confianza para la proporción
A partir de una población finita, solo existe un número finito de muestras posibles, si
se pudieran generar todas las muestras posibles a partir de dicha población, se podría
calcular el nivel de confianza exacto o real (Lohr 2000). El intervalo de confianza
resultante es el resultado de haber realizado una experiencia aleatoria (Silva 2000a).
25
Pero el valor de e, se obtiene para el caso de poblaciones infinitas, de la ya clásica
fórmula para estimar tamaños de muestra para una proporción, según la ecuación
(12).
z12−α / 2 × pq
n= , (12)
e2
pq
e = z1−α / 2 , (13)
n
pq pq
P p − P < e = 1 − α ⇒ P p − z1−α /2 < P < p + z1−α /2 = 1−α , (14)
n n
pq
Luego el límite superior esta dado por LS = p + z1−α /2 y el límite inferior por
n
pq
LI = p − z1−α /2 .
n
z 2 × N × σ X2
n= 2 , (15)
z × σ X2 + ( N − 1) × e2
z 2 × N × σ X2
z × N ×σ
2 2
lim n = lim 2 X
= lim 2 N
N →∞ z × σ 2 + ( N − 1) × e 2
N →∞ z × σ X + ( N − 1) × e
N →∞ 2 2
X
N N , (16)
z 2 × N × σ X2
= z σX
2 2
= lim 2 N
N →∞ z × σ 2 1 e2
X
+ 1 − e 2
N N
Teniendo así:
z 2 × σ X2
n= , (17)
e2
27
variable medida como proporción, en donde se busca medir el efecto del atributo que
posee una proporción estimada o prevalencia p o p̂ . Ante este escenario el diseño
muestral que se proponga permitirá tener un tamaño muestral que cumpla dos
objetivos de gran importancia el primero es levantar una encuesta representativa a
nivel poblacional y el segundo medir un efecto (Chow et al. 2008).
n=384
380
n
375
370
28
Este valor, al ser introducido en la fórmula para el cálculo de tamaño de muestra,
nos dará un valor de n=384 bajo los supuestos estándares habitualmente usados en
investigación (confianza 95% y error de un 5% en una distribución normal), y así el
valor calculado corresponderá al “máximo tamaño de muestra” para un error del 5%
y una confianza del 95%, veamos el desarrollo maximizando la ecuación (17).
∂f ∂ z 2 × pq ∂ z 2 × p(1 − p ) ∂ z 2 × ( p − p 2 ) z 2
= = = = 2 × (1 − 2 p ) , (18)
∂p ∂p e 2 ∂p e2 ∂p e2 e
∂f 1
La función tiene su máximo en = 0 , esto es cierto si y sólo si p = = 0,50 .
∂p 2
Por ejemplo si p tomará el valor de 0,20 se tendría una varianza de 0,16 (Figura 6),
y el tamaño de muestra estimado sería de n=246 inferior al que se determinaría si
considera varianza máxima.
29
Figura 6. Gráfica que relaciona el valor del parámetro p y su
varianza. Se aprecia que la varianza para p=0,50 es mayor que para
p=0,17.
.25
.2
.15
PQ
.1
.05
0
0 .2 .4 .6 .8 1
P
Sin embargo, este valor se modifica significativamente cuando los errores muestrales
varían y p=0,50, considerando un 3% el tamaño sería n=1067 y considerando un
5% nos dará un valor de n=384 (Figura 7). Estas premisas son válidas si todos los
otros valores de las ecuaciones (15) y (17) están fijos (Silva 2000b).
30
Figura 7. Comportamiento de la función de estimación de tamaño de
muestra de la ecuación (17) en función de los valores de p y dos valores de
errores muestrales. Se aprecia un máximo absoluto (tamaño de muestra) en
cada caso (representado por los círculos) cuando p=0,50 y cuando el error
disminuye se requiere mayor muestra.
1000
n=1067
800
600
n
400
n=384
200
0
0 .2 .4 .6 .8 1
P
e=0,05 e=0,03
Sin embargo, las encuestas habitualmente son diseñadas para propósitos múltiples,
ya que se debe aprovechar los recursos humanos y económicos para obtener la mayor
información posible, y el investigador termina infiriendo a la población no solo el
atributo de interés, sino que una serie de otros atributos que se midieron y que
probablemente están totalmente sobre-representados o sub-representados en este
31
tamaño de muestra obtenido a través del supuesto de máxima indeterminación (Silva
2000a).
Considerando lo anterior esto estamos diciendo, que aquellos atributos que están
dentro del dominio de 0,5 podrán ser usados con bastante tranquilidad al momento
de inferir, pero ¿qué pasa con aquellos de menor orden, como acontece habitualmente
en los fenómenos de salud? ¿Qué me indica la lógica con respecto a un tamaño de
muestra si el atributo que quiero investigar tiene una muy baja frecuencia en la
población?, ¿el supuesto de máxima indeterminación me permitirá tener los
individuos suficientes con el atributo de interés para inferir en población?
Supongamos que hay n ensayos independientes, y cada uno los resultados de los
ensayos tienen exactamente k diferentes posibles resultados (Zwillinger y Kokoska
2000 , Santner y Duffy 1989). Para i=1,….,k ; sean pi la probabilidad de ocurrencia
k
del i-ésimo resultado con ∑p
i =1
i = 1, donde xi corresponde al número de veces que se
32
Definición: Sean los sucesos E1,E2,….,Ek , los que pueden ocurrir con frecuencias
x1,x2,…,xk si sus respectivas probabilidades de ocurrencia son p1,p2,…,pk , entonces la
probabilidad de que E1,E2,….,Ek ocurran x1,x2,…,xk veces, respectivamente es (ecuación
19):
n!
p ( x1 , x2 ,..., xk ) =
x x x
p1 1 p2 2 L pk k , (19)
x1! x2!L xk !
k
dónde ∑x
i =1
i = n.
33
1.9.2 Intervalos de confianza simultáneos para la distribución
multinomial.
Supongamos que tenemos θ i parámetros, i=1,…,k para los cuales deseamos construir
sus respectivos intervalos de confianza ICi del (1 − α ) × 100% . Definamos los
siguientes sucesos:
k
P( B1c ∪ B2c ∪ LL ∪ Bkc ) ≤ ∑ P (Bic ) , (22)
i =1
k k
P( B1 ∩ B2 ∩ LL ∩ Bk ) ≥ 1 − ∑ P (Bic ) = 1 − ∑α i , (23)
i =1 i =1
k
α
Considerando el término ∑α
i =1
i de la ecuación (23), y tomando α i =
k
, se tiene la
siguiente ecuación:
P( B1 ∩ B2 ∩ LL ∩ Bk ) ≥ 1 − α , (24)
Luego, los intervalos de confianza IC1 ,….., IC k para θ1 ,….., θ k , son intervalos de
confianza simultáneos con coeficiente de confianza no inferior a (1 − α ) (Cuadras
1999).
34
Posteriormente, Goodman (1965) mejoró el método de cálculo de Quesenberry y
Hurts y propuso otra metodología que genera intervalos de confianza más pequeños,
basados en la aproximación de la densidad binomial a la distribución normal,
utilizando la desigualdad de Bonferroni y el teorema central del límite para
determinar la probabilidad de que los intervalos sean correctos en forma simultánea.
Por su parte Goodman (1965) demostró que los estimadores propuestos se podrían
obtener a partir de la solución de una ecuación de tipo cuadrática.
Ante lo anterior y teniendo presente que en un diseño como por ejemplo de uso de
varianza máxima, o simplemente agrupando categorías lo que se está haciendo es
pensar en que una variable de k=2,3,..K categorías se le está dando un tratamiento
como si se tratara de una variable binaria, entonces es válido preguntarse ¿Qué pasa
con las categorías no consideradas?, ¿Se estarán dejando de representar categorías
asociadas a sub-poblaciones importantes para el estudio?, ¿Los errores de muestreo,
disminuyen o aumentan si se consideran o no consideran ciertas categorías?. Todas
estas interrogantes no llevan a hacernos otra pregunta: ¿Que método de estimación
de tamaño de muestra es el más apropiado cuando se trabaja con una variable de
múltiples categorías?.
35
CAPITULO 2
MÉTODOS
2. Métodos
En 1974 se presentó un método gráfico propuesto por Claude Angers, que se basa en
el método de construcción de intervalos de confianza propuesto por Goodman (1965)
el cual permite calcular el tamaño de muestra usando valores conocidos de los
parámetros de la distribución multinomial. La propuesta básicamente consiste en la
utilización de interpolaciones lineales y considera los puntos medios de los intervalos
de confianza, los que se calculan usando la siguiente ecuación:
pi (1 − pi )
ei = zαi × ; i = 1,....., k , (25)
2
n
Usando dicha ecuación (25) se pueden calcular los valores de los errores muestrales ei
para determinados niveles de confianza 1 − α i , pero el mismo autor sugiere que es un
tanto complejo y engorroso el determinar el valor optimo de n considerando todos los
errores muestrales ei para los k intervalos de confianza que contengan el valor del
k
parámetro poblacional en forma simultánea con un nivel de confianza α = ∑ α i . El
i =1
36
procedimiento de Angers sugiere que el tamaño de muestra se debe determinar de
k k
αi
forma gráfica sustituyendo ∑α
i =1
i por ∑2,
i =1
el procedimiento gráfico se explica a
continuación y se pueden ver las gráficas en las Figuras (8) y (9): “Elijase de forma
arbitraria un tamaño de muestra n y calcule posteriormente los k cocientes
nei2
, con i=1,….,k, que representan los valores en el eje de las abscisas, y en el
pi × (1 − pi )
eje de las ordenadas se representan los niveles de confianza que van desde 0,01 hasta
0,10 en incrementos de 0,01 unidades”, luego se deben buscar en la gráfica los valores
obtenidos en el eje las abscisas de tal forma de identificar los correspondientes niveles
k
de significación α i ´s y se compara la ∑α
i =1
i con el valor de α definido previamente
k
1. Si ∑α
i =1
i > α , entonces el tamaño de muestra “n” propuesto es muy pequeño.
O alternativamente
k
2. Si ∑α
i =1
i < α , entonces el tamaño de muestra “n” propuesto es grande.
37
Figura 8. Las curvas asociadas a n (tomadas de la gráfica original de Angers (1974))
muestran como determinar el tamaño de muestra para α i ≤ 0,10 y k ≥ 3 .
38
Figura 9. Las curvas asociadas a n (tomadas de la gráfica original de Angers (1974))
muestran como determinar el tamaño de muestra para α i ≤ 0,10 y k ≥ 3 .
39
3
realizando la suma de los α i ´s tenemos que ∑α
i =1
i = 0,1713 > α = 0,05 lo que indica
Luego usando la curva asociada a 2n, se tienen los siguientes valores de α i ´s (0,000
3
;0,015 ; 0,015) lo que da un total de ∑α
i =1
i = 0,03 < α = 0,05 , lo que indica que el
tamaño de muestra es muy grande, a raíz de estos dos casos se tiene que el tamaño
de muestra adecuado debería estar entre 1000 y 2000. Revisando la curva 3n/2 se
3
tiene que ∑α
i =1
i = 0,07 > α = 0,05 y esto muestra que el tamaño de muestra excede el
3
valor 1500. Dado que cuando n=1500, ∑α
i =1
i = 0,07 y cuando n=2000,
3
∑α
i =1
i = 0,03 utilizando interpolación lineal el valor de n se aproxima a 1750,
B × pi × (1 − pi )
n = min max i ; i = 1,......, k , (26)
αi i
ei2
k
tal que α i ≤ ai ≤ α ; i = 1,...., k y ∑α
i =1
i ≤ α , Bi es el límite superior de α i × 100% de
40
2.1.2 Cochran (1977)
z 2 × p × (1 − p )
n´= , (26a )
e2
Pensemos en este ejemplo hipotético mostrado por Tortora (1978) para ejemplificar
la propuesta de Cochran. Suponga que un antropólogo desea estimar la proporción de
habitantes de una isla en donde existen cuatro tipos de grupos sanguíneos A, O, B y
AB. El antropólogo conoce por trabajos previos en islas similares que
aproximadamente el 27% posee sangre tipo A, el 43% posee sangre tipo O, 19% tipo
B y 11% tipo AB. Con una precisión o error muestral del 5% para cada proporción y
un nivel de confianza del 95%. Luego se tiene que los tamaños requeridos para los
tipos de sangre A, O, B y AB corresponden a nA=303, nO=377, nB=236 y nAB=150.
Luego el procedimiento consiste en escoger el n más grande que en este caso
corresponde nO=377. Un propuesta adicional hecha por Cochran consiste en el uso de
la máxima varianza la que está dada por PQ=0,25; valor que se obtiene al considerar
P=0,50. Para este autor la utilización de dicho valor entrega tamaños de muestra
conservadores. Dicha estrategia es la más utilizada actualmente en estudios de salud
pública y se aplica tanto en los casos en donde la variable que se estudia es de
naturaleza binaria o cuando el número de categorías es superior a dos. Entonces,
Cochran lo que propone es trabajar con un error de muestreo absoluto idéntico para
cada categoría, esto llevaría a estimar tamaños de muestra por categoría
representando adecuadamente a aquellas prevalencias cercanas a P=0,50 ya que este
autor propone la utilización del peor caso.
41
2.1.3 Tortora (1978)
Robert Tortora en el año 1978, introduce la idea del peor caso para distribuciones
multinomiales, análogamente a lo propuesto con el peor caso las distribuciones
binomiales. Tortora analiza como Cochran (1977) aborda la determinación del
tamaño de muestra para estimar una proporción aplicando una estrategia de
muestreo aleatorio simple y considerando además el caso univariado.
El método de Tortora fue criticado por Angers quien estableció que dicho método era
más conservador de lo necesario y propuso revisarlo usando un valor de 0,5 para cada
parámetro.
k
Pr ∩(Pi ∈I i ) ≥1−α ; (27)
i =1
Pi − ≤ Pi ≤ Pi +
donde:
B × pi × (1 − pi )
Pi − = pi − ; (28)
n
B × pi × (1 − pi )
Pi + = pi + ; (29)
n
α
Siendo B es el percentil superior × 100 de una distribución Ji-Cuadrado con un
k
pi × (1 − pi )
grado de libertad. Examinando las ecuaciones (28) y (29) se tiene que
n
42
es la desviación estándar de la i-ésima categoría de una población multinomial, en
donde cada probabilidad marginal corresponde a la función de densidad de una
distribución binomial. Si N es el tamaño de la población y usando la corrección por
población finita y la varianza para cada pi se tiene según (Cochran 1977) el intervalo
de confianza:
B × ( N − n) × pi × (1 − pi )
Pi − = pi − ; (30)
( N − 1) × n
B × ( N − n) × pi × (1 − pi )
Pi + = pi + ; (31)
( N − 1) × n
Hay que notar que si N → ∞ las ecuaciones (30) y (31) tienden a (28) y (29)
respectivamente.
B × pi × (1 − pi )
Pi − − ei = pi − ; (32)
n
B × pi × (1 − pi )
Pi + + ei = pi + ; (33)
n
B × pi × (1 − pi )
ei = ; (34)
n
B × pi × (1 − pi )
n= , (35)
ei 2
43
Usando corrección por población finita, se tiene:
B × N × pi × (1 − pi )
n= , (36)
ei × ( N − 1) + B × pi × (1 − pi )
2
Para definir qué tamaño de muestra es el apropiado, lo que se debe hacer es calcular
los k-pares (ei,pi), con i=1,…,k y seleccionar el mayor tamaño de muestra , así la
expresión (36) se transforma en:
B × N × pi × (1 − pi )
n* = max f (ei , pi ) = max 2 , (37)
i i
ei × ( N − 1) + B × pi × (1 − pi )
1
Tanto para la ecuación (35) y (36), se puede probar fácilmente que si pi → o si
2
ei → 0 entonces el tamaño muestral n se incrementa.
B
n= , (38)
4e 2
B × (1 − pi )
n= , (39)
e´i 2 × pi
44
También se puede considerar la corrección por población finita y la ecuación (39) se
transforma en:
B × (1 − pi ) × N
n= , (40)
e´i × pi × ( N − 1) + ( B × (1 − pi ))
2
B × (1 − p )
n= , (41)
e´i 2 × p
n / n´= B / z 2 , (42)
z 2 × p × (1 − p)
Siendo n´= y z el valor correspondiente a la curva normal asociado al
e2
α
percentil 1 − × 100% .
2
45
Cuyo cálculo se detalla para algunos casos específicos de valores de k y α para la
misma precisión.
k
alfa 3 4 5 10
0,1 1,71 1,84 2,04 2,44
0,05 1,53 1,66 1,73 2,05
Ahora si suponemos que deseamos estimar las proporciones asociadas con cuatro
parámetros de una distribución multinomial y si el tamaño requerido para el enfoque
binomial es de 100, para el enfoque multinomial seria de 166 con un nivel de
confianza del 95%.
Thompson (1987) hace una revisión de los trabajos publicados y propone que el
método mostrado por Angers (1974) es la propuesta que mejor se aproxima a la
estimación de las proporciones poblacionales, pero afirma que dicha propuesta es
compleja en la práctica ya que su aplicación requiere mucho cálculo tedioso.
Thompson propone la estimación de tamaños muestrales para una distribución
multinomial de manera tal que la probabilidad de que todas las estimaciones de las k
proporciones estén contenidas en un intervalo de confianza del (1 − α ) × 100% este
dada por la expresión:
k
Pr ∩ pi − Pi ≤ei ≥ 1− α , (43)
i =1
Así, propone una manera de determinar el peor de los casos para un vector de
parámetros multinomiales cuando se desean obtener intervalos de confianza
simultáneos en donde todos sean de igual longitud para cada uno de los componentes
r
del vector de parámetros P = ( P1 , P2 ,...., Pk ) .
46
La propuesta comprende una serie de pasos de un procedimiento que consiste en
encontrar la “n” más pequeña en donde se debe cumplir con la siguiente restricción
dada por la desigualdad:
m
∑α
i =1
i <α
r
para todos los posibles valores del vector de proporciones P = ( P1 , P2 ,...., Pk ) en donde
α i con i=1,…,k , es el nivel de significación para cada parámetro, dichos valores se
asumen iguales.
i) Para cada posible valor de los parámetros del vector se debe escoger un
m
ei n
valor de n y calcular ∑α
i =1
i donde α i = 2 × ( 1 − Φ( z i )) en donde zi =
Pi (1 − ei )
, y ei
m
corresponde al error muestral absoluto de la i-ésima categoría. Si ∑α
i =1
i < α , entonces
ii) Se repite el paso anterior con todos los posibles valores que toma el vector
r r
P = ( P1 , P2 ,...., Pk ) para determinar el vector de parámetros P0 , el cual corresponde al
peor caso que permite obtener el mayor valor de n.
2 1 1
(z (1 − )
k0 k0
n* = max ; (44)
k0 e2
47
α
Donde z es el percentil superior correspondiente a ( 100 × )% bajo una distribución
2k
normal estándar, e es un valor común a todos los ei y k0 un numero entero menor o
igual a k que corresponde al número de categorías.
n * ×N
n= (45)
n * + ( N − 1)
N × z 2 × (k0 − 1 )
n= , (46)
(N − 1 ) × e 2 × k0 + z 2 × (k0 − 1 )
De esta forma, los tamaños de muestra estimados por Thompson son los mismos para
variables que presenten distinto número de categorías ya que siempre considera el
peor de los casos.
En 1993 Jeffrey Bromaghin hace una revisión de las propuestas de Tortora (1978) y
Thompson (1987), dichas propuestas están basadas en uno de los dos métodos de
Goodman (1965) que presentó para la construcción de intervalos de confianza
simultáneos como modificación a la propuesta de Queensberry y Hurst (1964). El
procedimiento presentado por Bromaghin está basado en intervalos de confianza que
son asintóticamente equivalentes.
48
Donde Pi − y Pi + son los límites inferior y superior del intervalo de confianza de la i-
ésima probabilidad de una distribución multinomial y R+ es el conjunto de los reales
positivos. En la práctica, la evaluación de (47) es dificultosa y se trabaja con una
variable aleatoria discreta, lo anterior se modifica si se considera:
n = min ∋ ∑ α i ≤ α
k
, (48)
n∈ I i =1
+
Bromaghin hace hincapié en que tanto Tortora (1978) como Thompson (1987)
construyen los intervalos de confianza considerando los límites del intervalo de
confianza de la manera usual:
pi × (1 − pi )
Pi − = pi − z αi
(1−
2
) n −1
, (49)
pi × (1 − pi )
Pi + = pi + z αi
(1−
2
) n −1
ni
En donde pi = es el estimador de máxima verosimilitud de Pi y zx es la desviación
n
de una normal estándar con probabilidad 1-x. Goodman demuestra que las
propiedades del intervalo en (50) son mucho mejores, especialmente en lo que
concierne a su amplitud ya que (50) es más angosto que (49).
n − ni
z2 αi + 2ni − z 2 αi z2 αi + 4ni
(1− ) (1− ) (1− ) n
P −i = 2 2 2
2 n + z 2 αi
(1− )
2
, (50)
n − ni
z2 αi + 2ni + z 2 αi z2 + 4ni
αi
(1− ) (1− ) (1− ) n
P +i = 2 2 2
2 n + z 2 α i
(1− )
2
49
Debido a lo anterior, Bromaghin propone el determinar el tamaño de muestra
considerando (50). Siguiendo la propuesta de Tortora, las cantidades αι son fijas y la
anchura del i-ésimo intervalo se limita a ser inferior a 2ei, bajo estas consideraciones
la ecuación (47) se escribe:
n − ni
z αi z αi + 4ni
2
(1− ) (1− ) n
n = min+ ∋ 2 2
≤ ei ; i = 1,....., k , (48)
n∈I
2 n + z αi
2
(1− )
2
z α i z α i + 4ni Pi (n − Pi )
2
(1− ) (1− )
n = min+ ∋ 2 2
≤ ei
; i = 1,....., k , (49)
n∈I
2 n + z α i
2
(1− )
2
La i-ésima desigualdad en (49) puede ser escrita como una ecuación cuadrática en n
y es fácil de demostrar que una de las raíces entrega la solución óptima. Por lo tanto
teniendo Pi y la especificación de αι y ei, la i-ésima inecuación es exactamente
satisfecha por:
z 2 αi
(1− )
n=
2 ei
2 i
2
[ ]
P (1 − Pi ) − 2ei2 + Pi 2 (1 − Pi ) 2 − ei2 (4 Pi (1 − Pi ) ) , (50)
50
0,25 z 2 α i
(1− )
n = 1 + int max 2
2
− z αi
2
, (51)
i∈(1, 2,..k ) ei 2
(1− )
0,25 z 2 α i
(1− )
2
n = nt 2k
− z(1− α i )
, (52)
1 1 2
1 − z α i 2k
m m 2k
( 1 − )
k
r
Π1 (k , p; α ) = lim P I Ai (α )
n→∞
r z (α / 2)
En donde Ai (α ) = f : pˆ i − pi ≤
2 n
51
r
1 − ∑ (1 − P( A )) = F (k , pr ; z (α / 2) / 2)
k
Π1 (k , p;α ) ≥ lim P , (53)
n→∞ i
1
En donde
k
r
F (k , p; z ) = 2∑ Φ ( z / pi (1 − pi )) + 1 − 2k
1
Con Φ (•) que denota la distribución normal estándar. En base a esto se propone el
siguiente lema:
Lema:
r
F ( k , p; z ) toma el mínimo valor para z fijo sobre k=2,3,… y p ∈ S siendo
r k
S = p : pi ≥ 0,
∑p
1
i = 1 con k=m(z) y pi=1/k (i=1,…,k) para algún entero m(z).
Teorema:
r
Para k=2,3,… y p ∈ S :
r
Π1 (k , p; α ) ≥ L(α )
Donde
1 − 2α ; α ≤ 0,016
L(α ) = 3 z (α / 2)
6Φ −5 ;0,016 ≤ α ≤ 0,150
8
52
1
n = 1 + int 2 z12−α 0 (54)
4e 2
k
P I { pi − Pi ≤ ei } ≥ 1 − α
i =1
Para los errores de muestreo o precisiones e1,e2,…ek que cumplan con e = min1≤i ≤ k ei .
El tamaño muestral estimado según la ecuación (54) es menor que los que se
determinan con las aproximaciones de Tortora (1978) y Bromaghin (1993) y esto se
debe a este procedimiento se basa en el peor de los casos que se toma entre aquellos
en donde la suma de los parámetros sea igual a 1.
53
2.2 Método de construcción de poblaciones simuladas y criterios de
selección de muestras.
54
Tabla 1. Errores muestrales absolutos considerados para los
distintos puntos de corte.
Basta calcular F-1(Y) en el paso ii) para poder aplicarlo, y no es necesario especificar
cuál debe ser la forma de F(X). En el caso de la distribución multinomial si se tiene
una variable X con k categorías, dicha distribución indica la probabilidad de que n
muestras de la variable X sigan una determinada distribución de frecuencias. Sus
parámetros son n el número de muestras y p1,p2,…,pk que indican la probabilidad de
que la variable X tome cada uno de sus posibles valores. Si usamos el algoritmo de la
transformada inversa para seleccionar una muestra de la variable X se procede del
siguiente modo:
55
i) Simular una distribución U(0,1).
V −1 V
ii) La variable toma el valor X=V que satisfaga: ∑ pi < U ≤ ∑ pi , en
i =1 i =1
0
donde ∑p
i =1
i = 0.
∑θˆ ij
ˆ = (θˆ ,....., θˆ ) en donde θˆ =
a Θ i =1
y corresponde al valor promedio de las
1 k j
~ m
respectivas estimaciones del parámetro asociado a la categoría j-ésima de la variable
multinomial de k-categorías ( 1 ≤ j ≤ k ) para las m simulaciones realizadas en cada
propuesta de muestreo presentada.
θˆ − θ
1 1
.
ˆ −Θ= .
sesgo(Θ) = Θ , (55)
~ ~ ~
.
θˆ − θ
k k
56
Porcentaje de sesgo: La ecuación (55) muestra el vector de sesgos del cual se
puede derivar una expresión llamada porcentaje de sesgo que está dada por la
siguiente expresión ecuación (56)
θˆ − θ
1 1
θ1
.
psesgo(Θ) = . × 100 , (56)
~
.
θˆk − θ k
θ
k
θˆ − θ
1 1
se(θˆ1 )
.
sd (Θ) = . , (57)
~
.
θˆk − θ k
ˆ
se(θ k )
∑ (θˆ ij − θˆ j ) 2
Siendo se(θˆ j ) = i =1
es la desviación estándar empírica de las estimaciones
m −1
de interés para el parámetro asociado a la categoría j-ésima sobre todas las
simulaciones.
57
de los m intervalos construidos al menos una categoría no contenía a su respectivo
parámetro, entonces de manera simultánea el intervalo de confianza no contiene al
vector poblacional Θ = (θ1 ,....., θ k ) ”.
~
(
ECM(βˆ ) = E ( βˆ − β ) 2 )
Se calculará el ECM para cada categoría de las variables a trabajar y considerando
las m=1000 muestras simuladas de tamaño n y se reportara el valor mediano de este.
Sea una población finita conformada por N individuos que se pueden clasificar en k
categorías o clases. Sea E= (E1,E2,…,Ek) el conjunto de todas las categorías o clases,
se define:
r
Φ k = p = ( p1 , p2 ,....., pk ) : pi ≥ 0 ; i = 1,..., k ; ∑ pi = 1
k
, (58)
i =1
H ´: Φ k → R
Cuya expresión está dada por:
r k
H ´( p ) = H ´( p1 , p 2 ,..., p k ) = − ∑ pi log pi , (59)
i =1
Y se verifica que.
r r r r
1. H ´( p ) ≥ 0 , ∀ p ∈ Φ k con H ´( p ) = 0 si y sólo si p es degenerada.
58
Un concepto de importancia en el estudio de la diversidad tiene que ver con la
“mayorización”, que nos permite comparar el grado de incertidumbre en la
estimación de vectores multinomiales. Una definición dada por Pardo (2006) se
enuncia a continuación:
Definición 1:
r r
p p q ⇔ ∑ p( i ) ≤ ∑ q( i ) , r = 1,...., k − 1 , (60)
i =1 i =1
Siendo
p (1) ≥ p( 2 ) ≥ .... ≥ p( k ) y q(1) ≥ q( 2) ≥ .... ≥ q( k )
p p q ⇔ H hφ ( p) ≥ H hφ (q)
p = ( p1 , p2 ,..., pk ) t ∈ Φ k
k
H hφ ( p) = h ∑ φ ( pi )
i =1
59
En donde
Estos resultados se deben a (Salicrú et al. 1993) y son extendidos en una aplicación
por Pardo (2006). Al considerar h(x)=x y φ(x)=-log (x) se obtiene el índice de
Shannon.
Equivalencia:
r r
p p q ⇔ ∑ p(i ) ≤ ∑ q( i ) ⇔ H hφ ( p ) ≥ H hφ ( q)
i =1 i =1
60
2.3.1 Índice de Shannon promedio para las simulaciones
∑ Hˆ i
Hˆ = i =1
, (61)
m
61
3 Planteamiento del problema, hipótesis y objetivos
Este trabajo de tesis pretende estudiar seis enfoques estadísticos que se que se usan
en la estimación de tamaños de muestra cuando la variable de diseño es de
naturaleza multinomial, los que corresponden a: Angers (1974), Tortora (1978),
Thompson (1987), Cochran (1953), Bromaghin (1993) y Fitzpatrick y Scott (1987),
dichos enfoques están ampliamente discutidos en la literatura del muestreo
estadístico pero son controversiales al momento de aplicarlos en estudios de salud
dado a que no siempre permiten conjugar costos, representatividad y tamaños de
muestra adecuados para un esquema de muestreo aleatorio simple y muestreo
complejo de poblaciones en donde la variable de diseño o estudio corresponde a una
distribución con múltiples categorías. Se discute inicialmente como la utilización de
la máxima varianza cuando la variable de diseño con k=2 categorías entrega
estimaciones de prevalencias considerando un valor P=0,50 para estimar dicho
tamaño muestral sin conocer valores previos de dicho estimador lo que entrega
estimaciones sesgadas, luego la discusión se enfoca en la determinación de que
método analizado entrega mejores tamaños de muestra y estimaciones considerando
distintos escenarios en donde las categorías consideradas van desde k=3 a k=7,
finalmente se propone y discute la utilización de las medidas de incertidumbre o
entropía de Shannon para estudiar la variabilidad de los vectores estimados mediante
los distintos métodos.
3.1 Hipótesis
62
3.2 Objetivos
Revisar y comparar las propuestas metodológicas vigentes que permiten estimar los
tamaños de muestra en poblaciones multinomiales en muestreos de tipo monoetapico
bajo el enfoque aleatorio simple.
4.- Comparar los tamaños de muestra estimados mediante las distintas propuestas
metodológicas.
5.- Comparar mediante una aplicación real los niveles de confianza reales, sesgos,
porcentajes de sesgo y varianzas de los estimadores (medidas de entropía)
construidos, y decidir que método de estimación de tamaños de muestra es el más
adecuado.
6.- Discutir las ventajas y desventajas del uso del supuesto de varianza máxima en la
estimación de tamaños de muestra.
63
4.1
MANUSCRITO 1
4.1.1 Resumen
El objetivo de este trabajo es plantear una reflexión sobre el uso y abuso del supuesto
de máxima indeterminación para la estimación del tamaño de muestra necesario
para estudiar un atributo de interés en estudios poblacionales y en estudios
epidemiológicos. Se enfatiza el sentido de seguridad que le da al investigador trabajar
con este supuesto y los probables errores de medición que se puede incurrir cuando
en la practica el atributo de interés tiene un frecuencia sustancialmente diferente de
la esperada según el supuesto de máxima indeterminación, lo que puede afectar
seriamente la precisión y confiabilidad de los resultados obtenidos. Se presentan
aclaraciones técnicas y prácticas respecto al correcto uso de dicho supuesto en
muestreo estadístico y discutimos las ventajas y desventajas de su uso.
64
4.1.2 Introducción
z 2 × N × σ 2X
n= ; (1.1)
z 2 × σ 2X + ( N − 1) × e 2
z 2 × σ 2X
n= , (1.2)
e2
65
máxima” o supuesto de “máxima indeterminación”. Al introducir P = 0,50 en las
ecuaciones (1.1) y (1.2) para el cálculo de tamaño de muestra, se obtendrá que
n=384 bajo los supuestos estándares habitualmente usados (confianza del 95% en
una distribución normal y error de muestreo de un 5%). Por ejemplo si P tomara el
valor de 0,15 se tendría una varianza de PQ = 0,13 (Figura 1) y el tamaño de
muestra estimado sería de n=246, inferior al que se determinaría si considera
varianza máxima. Sin embargo, este valor se modifica relevantemente cuando los
errores muestrales varían: con P = 0,50, considerando un 3% de error, el tamaño
sería n=1062 usando la ecuación (1.1). (Figura 2, mayores detalles ver Anexo 1).
Esto es válido si todos los otros valores de las ecuaciones (1.1) y (1.2) están fijos.
66
Figura 1. Gráfica que relaciona el valor del parámetro P y su varianza. Se
aprecia que la varianza para P = 0,50 es mayor que para P = 0,15 (Ver Anexo 1
para la demostración de la maximización).
.25
.2
.15
PQ
.1
.05
0
0 .2 .4 .6 .8 1
P
n=1067
800
600
n
400
n=384
200
0
0 .2 .4 .6 .8 1
P
e=0,05 e=0,03
67
Error absoluto versus error relativo
ea
Se puede determinar el error relativo según er = , en donde ea es el error absoluto
p
el cual indica la desviación sobre la estimación en la misma magnitud en la que se
mide la característica poblacional de interés. Trabajando con un error absoluto del
5% y considerando un valor de P = 0,50, se tendría un error relativo del orden del
e
10% ( a =0,05/0,50=10%), pero si el valor de P = 0,10 o P = 0,05 se tendrían
p
valores de errores relativos del 50% y del 100%, respectivamente. En ambos casos
ningún investigador debería estar dispuesto a cometer un error relativo tan alto en su
investigación, ya que las estimaciones obtenidas serían altamente imprecisas y por lo
tanto muy poco confiables. Pero ¿es correcto fijar el valor del error absoluto,
desconociendo el valor de P ?, como veremos en unos ejemplos, esto no es correcto: si
por ejemplo P = 0,50 y fijamos arbitrariamente el valor del error absoluto se tendrá
que el tamaño muestral depende exclusivamente del valor del error absoluto. La
paradoja que acontece, es cómo definimos el error absoluto si no tenemos información
sobre el valor de P (Espinoza-Moreno 2005).
Pensemos por ejemplo en el brote de gripe AH1N1 que tuvo su origen a mediados del
año 2009, y por un momento pensemos en cómo estimar un tamaño de muestra que
nos permita levantar una encuesta de propósitos múltiples y además tomar una
muestra biológica para determinar si hubo exposición al virus lo que desencadena la
presencia y o ausencia de anticuerpos en los individuos, es decir, estimar la
seroprevalencia en la muestra estudiada. Lo que necesitaríamos para estimar dicho
tamaño sería considerar por ejemplo un error muestral que se encuentre asociado a la
seroprevalencia (desconocida) que en este caso es una variable de tipo binaria, dicho
error fijémoslo en un 5%, pero como la seroprevalencia no se conoce por el hecho de
ser una enfermedad nueva, supongamos que la fijamos un P = 0,50, i.e. el 50% de la
población tiene anticuerpos del virus en un tiempo determinado, pero además
68
deberemos considerar la ecuación (1.2) para la población infinita (ya que la
población en estudio es lo suficientemente grande), ahora si se estima dicho tamaño
de muestra considerando un nivel de confianza del 95% se tiene que el tamaño de
muestra requerido es n= 384. Aquí hay dos situaciones importantes que hay que
tener presente, primero: es que necesitamos tan solo 384 personas para poder hacer
una inferencia a la población, asumiendo todos lo demás constante (z y error) siendo
que nuestra población la estamos considerando infinita y segundo: estamos
asumiendo o considerando la peor de las situaciones respecto a la prevalencia de
dicha enfermedad, es decir hacemos uso de la máxima varianza.
El primer caso, se tendrá que sea cual fuere el tamaño de la población y si ésta
tiende a infinito, el valor estimado de n se aproximará en torno al valor 384 (ver
Figura 3), esta situación se da por la naturaleza de la fórmula utilizada, ya que si a
la ecuación (1.1) se le calcula el límite de N cuando tiende a infinito permite obtener
la ecuación (1.2) y con esto se genera una relación de tipo asintótica entre el tamaño
de la población y el tamaño muestral. En el segundo caso se está estimando un
tamaño de muestra considerando la máxima indeterminación ante un evento nuevo,
del cual no se posee información de la prevalencia ni mucho menos se tiene
información de otros estudios en donde se tenga una estimación de dicho parámetro.
¿Cómo operamos en esta situación?, en este caso lo más adecuado sería utilizar una
muestra de tipo intencionada con el objeto de poder levantar información preliminar
de la prevalencia constituyendo en este caso un estudio de “línea base” el que
posteriormente permita tener una aproximación del comportamiento de la variable en
estudio y del parámetro, y así elaborar una estrategia de diseño muestral en donde se
estime un tamaño de muestra suficiente para contar con un número de individuos
con el atributo de interés que permita hacer inferencia a la población.
69
Figura 3. Relación asintótica entre el tamaño de la población N y el tamaño
de la muestra n (Ver Anexo 1).
385
n=384
380
n
375
370
70
pˆ
n=384 , NCreal (Nivel de confianza real) y es: error estándar promedio ( es = ). La
n
prevalencia promedio estimada p̂ se calculo mediante la ecuación (1.3).
m =100
∑ ( pˆ )
j =1
j
pˆ = , (1.3)
100
71
valor de prevalencia poblacional, por ejemplo para P=70% se selecciono la muestra
m=24 en donde el intervalo es (64,4% - 73,63%) y la estimación es p=69%, con un
error relativo bajo del 7,2% que corresponde al porcentaje de error en la precisión de
la medida estimada.
Prevalencia Tamaño
Valores de Entrada Estimaciones
Población Poblacional Muestral
P NC Nominal z ea n p̂ er NC Real IC 95%
1 70% 95% 1,96 5% 384 70,2% 7,10% 98% m=24 p=69% (64,4% - 73,63%)
2 55% 95% 1,96 5% 384 54,5% 9,20% 97% m=14 p=54% (48,9% - 58,88%)
3 35% 95% 1,96 5% 384 34,7% 14,50% 95% m=88 p=33% (28,12% - 37,50%)
4 15% 95% 1,96 5% 384 15,1% 33,60% 97% m=60 p=12% (8,73% - 15,22%)
5 4% 95% 1,96 5% 384 4,2% 124% 97% m=92 p=4,95% (2,78% - 7,11%)
6 2% 95% 1,96 5% 384 2,1% 256% 95% m=13 p=1,82% (0,49% - 3,16%)
72
Figura 4. Ejemplos para las poblaciones 1 y 6 de prevalencias poblacionales P=0,70 y
P=0,02 respectivamente, en (a) solo dos intervalos de confianza (marcados con un
circulo) no contienen al valor de prevalencia poblacional. En (b) en cinco intervalos de
confianza (marcados con un circulo) no contienen al valor de prevalencia poblacional.
4.1.3 Discusión
73
este atributo estará subrrepresentado. En la práctica, esto se traduce en que cuanto
más se parece el parámetro estimado a P=0,50, la longitud del intervalo de confianza
aumenta si bien su precisión mejora. Teniendo así que el error relativo es mayor
cuanto más se aleja la prevalencia estimada de la considerada para el cálculo del
tamaño muestral, P=0,50.
Ante tal situación se necesitan tamaños de muestra mucho más grandes con el fin de
poder detectar o encontrar las unidades (atributos) en la muestra, dada su baja
frecuencia, situación que se contradice con el supuesto ya que este trabaja con el
máximo tamaño de muestra el cual no es suficiente en dicha situación.
4.1.4 Conclusiones
74
4.1.5 Bibliografía
Cabral, MD., Luiz, RR. (2007). Sensitivity analysis for unmeasured confounders
using an electronic spreadsheet. Rev Saude Publica, 41(3):446-52
Cochran, WG. (1977). Sampling Technics. Third Edition. John Wiley y Sons, Inc.442
pp.
75
4.2
MANUSCRITO 2
4.2.1 Resumen
76
Se realizo una aplicación tomando como ejemplo una variable de naturaleza
categórica de la Encuesta Nacional de Salud (ENS) realizada el año 2009 en Chile.
En dicha aplicación se utilizaron los tamaños de muestra para una población teórica
de características similares en cuanto a las proporciones a los valores que presentó la
variable de la encuesta y se evaluó el desempeño de los métodos estudiados siguiendo
los mismos criterios de las simulaciones teóricas.
77
4.2.2 Introducción
78
4.2.3 Métodos
Simulaciones poblacionales
79
habitualmente asumiendo el mismo error independiente del numero de categorías,
prevalencias y método.
Posterior a eso se calcularon los tamaños de muestra que se pueden ver en la Tabla
3. En las Tablas 3a-3f (Anexo 2) se muestran los tamaños de muestra máximos
obtenidos con ciertas categorías de la variable. Los valores de errores muestrales se
escogieron en función de juicio experto del autor. Finalmente para evaluar el
desempeño de los métodos a comparar se utilizo: 1) Tamaño de muestra, 2) Nivel de
confianza real, 3) Estimador promedio, 4) Sesgo y 5) Mediana del Error cuadrático
medio (Burton et al.,2006). Las Tablas 4a-4x’ del Anexo 2 incorporan el porcentaje
de sesgo y sesgo estandarizado (Burton et al. 2006), para mejor comprensión del
lector.
Proporción en la Error
categoría i-ésima muestral
Pi ≤ 5% 1%
5% < Pi ≤ 10% 2%
10% < Pi ≤ 15% 3%
15% < Pi ≤ 20% 4%
Pi > 20% 5%
80
Tabla 2. Valores de parámetros poblacionales (Pi) considerados en la simulación y
errores muestrales (ei) a considerar para la estimación de tamaño muestral
dependiendo del método a emplear siguiendo los criterios mostrados en Tabla 1.
k=3
Población 1 Población 2 Población 3 Población 4 Población 5
<5% < 10 % 50% (1 categoría) libre distribución equiprobabilidad
Pi ei Pi ei Pi ei Pi ei Pi ei
3,17% 1% 8,98% 2% 24,98% 5% 3,14% 5% 33,34% 5%
53,86% 5% 40,01% 5% 50,03% 5% 53,83% 5% 33,37% 5%
42,97% 5% 51,01% 5% 24,99% 5% 43,03% 5% 33,29% 5%
k=4
Población 6 Población 7 Población 8 Población 9 Población 10
<5% < 10 % 50% (1 categoría) libre distribución equiprobabilidad
Pi ei Pi ei Pi ei Pi ei Pi ei
3,16% 1% 9,17% 2% 10,02% 2% 3,13% 5% 24,98% 5%
13,83% 3% 15,87% 4% 15,01% 3% 13,85% 5% 25,03% 5%
40,03% 5% 40,03% 5% 50,01% 5% 40,02% 5% 25,00% 5%
42,98% 5% 34,93% 5% 24,95% 5% 43,00% 5% 24,99% 5%
k=5
Población 11 Población 12 Población 13 Población 14 Población 15
<5% < 10 % 50% (1 categoría) libre distribución equiprobabilidad
Pi ei Pi ei Pi ei Pi ei Pi ei
3,13% 1% 9,18% 2% 9,17% 2% 3,16% 5% 20,02% 5%
8,89% 2% 12,81% 3% 12,83% 3% 8,87% 5% 20,04% 5%
25,02% 5% 15,04% 4% 15,09% 4% 25,01% 5% 20,01% 5%
19,98% 4% 19,99% 4% 13,03% 3% 19,99% 5% 19,96% 5%
42,97% 5% 42,98% 5% 49,88% 5% 42,98% 5% 19,97% 5%
k=6
Población 16 Población 17 Población 18 Población 19 Población 20
<5% < 10 % 50% (1 categoría) libre distribución equiprobabilidad
Pi ei Pi ei Pi ei Pi ei Pi ei
4,02% 1% 8,99% 2% 10,06% 2% 3,99% 5% 16,66% 4%
12,97% 3% 16,04% 4% 9,96% 2% 12,99% 5% 16,74% 4%
23,03% 5% 20,05% 5% 50,04% 5% 22,99% 5% 16,61% 4%
17,00% 4% 20,02% 5% 9,98% 2% 17,03% 5% 16,67% 4%
22,00% 5% 19,91% 5% 10,01% 2% 22,05% 5% 16,65% 4%
20,98% 5% 14,99% 3% 9,95% 2% 20,95% 5% 16,67% 4%
k=7
Población 21 Población 22 Población 23 Población 24 Población 25
<5% < 10 % 50% (1 categoría) libre distribución equiprobabilidad
Pi ei Pi ei Pi ei Pi ei Pi ei
3,99% 1% 9,97% 2% 4,04% 1% 3,99% 5% 14,31% 3%
15,99% 4% 13,98% 3% 14,00% 3% 16,00% 5% 14,29% 3%
14,94% 3% 15,98% 4% 49,98% 5% 14,97% 5% 14,24% 3%
15,01% 4% 19,99% 4% 11,97% 3% 15,03% 5% 14,32% 3%
15,00% 4% 15,01% 4% 9,99% 2% 15,04% 5% 14,28% 3%
25,07% 5% 13,06% 3% 4,98% 1% 24,98% 5% 14,26% 3%
9,99% 2% 12,00% 3% 5,03% 2% 9,99% 5% 14,29% 3%
81
Métodos comparados de estimación de tamaños de muestra
Los métodos a evaluar en este trabajo corresponden a seis enfoques que son los más
utilizados para trabajar variables categóricas, las propuestas corresponden a Angers
(1974), Tortora (1978), Thompson (1987), Bromaghin (1993) y Fitzpatrick y Scott
(1987) y el de Cochran (1977) que corresponde a un enfoque empleado para estimar
tamaños de muestra para variables de tipo binomial. La propuesta de Angers es un
método gráfico, que se basa en la construcción de intervalos de confianza propuesto
por Goodman (1965) el cual permite calcular el tamaño de muestra usando valores
conocidos de los parámetros de la distribución multinomial. La propuesta
básicamente consiste en la utilización de interpolaciones lineales y considera los
puntos medios de los intervalos de confianza. Tortora introduce la idea del peor caso
para distribuciones multinomiales, análogamente a lo propuesto con el peor caso las
distribuciones binomiales. Para definir qué tamaño de muestra es el apropiado, lo que
se debe hacer es calcular los k tamaños de muestra (k categorías) considerando los k-
pares (ei,pi), en donde ei y pi corresponden al error y proporción para la categoría i-
ésima respectivamente con i=1,…,k y posteriormente seleccionar el mayor tamaño de
muestra de entre los k calculados.
Thompson (1987) hace una revisión de los trabajos publicados y propone que el
método mostrado por Angers (1974) es la propuesta que mejor se aproxima a la
estimación de las proporciones poblacionales, pero afirma que dicha propuesta es
compleja en la práctica ya que su aplicación requiere mucho cálculo tedioso. Su
método busca determinar el peor de los casos para un vector de parámetros
multinomiales cuando se desean obtener intervalos de confianza simultáneos en
donde todos sean de igual longitud para cada uno de los componentes del vector de
r
parámetros P = ( P1 , P2 ,...., Pk ) . La propuesta de Cochran utiliza una aproximación que
considera a la proporción en la categoría i-ésima de una distribución multinomial,
como si fuese una distribución binomial versus el resto de las categorías, es decir si la
categoría i-ésima es la categoría de interés y la variable presenta k-categorías se
agrupan las otras k-1 categorías en una sola. Bromaghin presenta un método que está
basado en intervalos de confianza que son asintóticamente equivalentes. El objetivo
es determinar el tamaño de muestra n, tal que el conjunto de k (k > 2) intervalos de
confianza simultáneos capturen o contengan todas las k categorías con una
probabilidad 1 − α .
82
r
Fitzpatrick y Scott consideran un vector f = ( f1 , f 2 ,...., f k ) de valores que denotan las
frecuencias observadas en una muestra de n observaciones de una distribución
r
multinomial con probabilidades ( p = p1 , p 2 ,...., p k ) y lo que se busca es construir
una cota inferior para el nivel de confianza simultaneo asintótico. Finalmente el
procedimiento se basa en el peor de los casos que se toma entre aquellos en donde la
suma de los parámetros sea igual a 1.
4.2.4 Resultados
Simulaciones
83
Tabla 3. Tamaños de muestra estimados según los métodos utilizados para las
25 poblaciones simuladas.
k=3
Población 1 Población 2 Población 3 Población 4 Población 5
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 1788 1190 583 583 518
Bromaghin 1784 1171 564 564 502
Fitzpatrick & Scott 510 510 510 510 510
Thompson 512 512 512 512 512
Cochran 382 384 384 384 342
Angers 1250 840 485 498 510
k=4
Población 6 Población 7 Población 8 Población 9 Población 10
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 1901 1296 1403 623 468
Bromaghin 1945 1306 1411 618 465
Fitzpatrick & Scott 510 510 510 510 510
Thompson 512 512 512 512 512
Cochran 376 369 384 384 288
Angers 1211 854 965 649 1849
k=5
Población 11 Población 12 Población 13 Población 14 Población 15
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 2010 1381 1380 663 425
Bromaghin 2055 1390 1389 657 423
Fitzpatrick & Scott 510 510 510 510 510
Thompson 512 512 512 512 512
Cochran 376 376 384 384 246
Angers 1304 908 928 465 426
k=6
Población 16 Población 17 Población 18 Población 19 Población 20
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 2733 1451 1604 710 618
Bromaghin 2720 1433 1582 690 606
Fitzpatrick & Scott 510 510 510 510 510
Thompson 512 512 512 512 512
Cochran 272 246 384 384 214
Angers 1498 897 1496 419 600
k=7
Población 21 Población 22 Población 23 Población 24 Población 25
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 2893 1696 3571 756 1030
Bromaghin 2807 1631 3451 717 987
Fitzpatrick & Scott 510 510 510 510 510
Thompson 512 512 512 512 512
Cochran 289 246 384 384 188
Angers 1600 1012 2203 387 985
84
Tabla 4. Puntajes asignados a tamaños de muestra estimados según los métodos
utilizados para las 25 poblaciones simuladas de Tabla 3.
k=3
Población 1 Población 2 Población 3 Población 4 Población 5
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 1 1 1 1 1 5
Bromaghin 2 2 2 2 5 13
Fitzpatrick & Scott 5 5 5 5 3,5 23,5
Thompson 4 4 4 4 2 18
Cochran 6 6 6 6 6 30
Angers 3 3 3 3 3,5 15,5
k=4
Población 6 Población 7 Población 8 Población 9 Población 10
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 2 2 2 2 2 10
Bromaghin 1 1 1 3 3 9
Fitzpatrick & Scott 5 5 5 5 5 25
Thompson 4 4 4 4 4 20
Cochran 6 6 6 6 6 30
Angers 3 3 3 1 1 11
k=5
Población 11 Población 12 Población 13 Población 14 Población 15
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 2 2 2 1 4 11
Bromaghin 1 1 1 2 5 10
Fitzpatrick & Scott 5 5 5 5 2 22
Thompson 4 4 4 4 1 17
Cochran 6 6 6 6 6 30
Angers 3 3 3 3 3 15
k=6
Población 16 Población 17 Población 18 Población 19 Población 20
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 1 1 1 1 1 5
Bromaghin 2 2 2 2 2 10
Fitzpatrick & Scott 5 5 5 5 5 25
Thompson 4 4 4 4 4 20
Cochran 6 6 6 6 6 30
Angers 3 3 3 3 3 15
k=7
Población 21 Población 22 Población 23 Población 24 Población 25
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 1 1 1 1 1 5
Bromaghin 2 2 2 2 2 10
Fitzpatrick & Scott 5 5 5 4 5 24
Thompson 4 4 4 3 4 19
Cochran 6 6 6 6 6 30
Angers 3 3 3 5 3 17
85
Tabla 5. Puntajes totales por categoría asignados a tamaños de muestra
presentados en Tabla 4.
Los niveles de confianza reales se calcularon en base a m=1000 muestras del mismo
tamaño para cada método y población considerado en la Tabla 3, así por ejemplo
para la población 6 y considerando el método de Tortora se estimo un n=1901 para
k=4 categorías, luego se sacaron 1000 muestras del mismo tamaño mediante
muestreo aleatorio simple y si en cada uno de los m intervalos construidos al menos
una categoría no contenía a su respectivo parámetro, entonces de manera simultánea
el intervalo de confianza no contiene al vector poblacional. La Tabla 6 presenta los
resultados de los intervalos y se aprecia que para todas las poblaciones trabajadas, el
método de Cochran es el que presenta el nivel de confianza más bajo en relación al
nivel de confianza nominal fijado previamente del 95%. La Tabla 7 corresponde a los
puntajes asignados a los intervalos de confianza de la Tabla 6 y posteriormente se
construyo la Tabla 8 que corresponde a la suma de puntajes presentados en la Tabla
7 como Tabla final de la construcción de intervalos de confianza.
Se puede ver en la Tabla 8 que los puntajes finales para las propuestas de Fitzpatrick
y Scott y Thompson presentan los valores más altos cuando las categorías son
superiores a 3, posicionando con un empate a ambos métodos seguidos del método de
Tortora y en último lugar el método de Cochran.
86
Tabla 6. Niveles de confianza reales para las muestras seleccionadas según los métodos
utilizados para las 25 poblaciones simuladas.
k=3
Población 1 Población 2 Población 3 Población 4 Población 5
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 96,40% 96,60% 95,70% 98,00% 97,40%
Bromaghin 95,90% 95,80% 96,30% 97,50% 94,10%
Fitzpatrick & Scott 97,40% 96,20% 96,80% 96,80% 95,50%
Thompson 97,30% 96,30% 96,90% 97,10% 95,90%
Cochran 87,00% 88,10% 87,80% 90,10% 85,70%
Angers 96,20% 94,00% 94,00% 94,70% 94,80%
k=4
Población 6 Población 7 Población 8 Población 9 Población 10
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 96,00% 95,20% 96,00% 98,70% 94,80%
Bromaghin 96,00% 94,90% 94,70% 97,60% 95,80%
Fitzpatrick & Scott 96,20% 96,30% 97,20% 97,70% 97,40%
Thompson 95,40% 96,80% 97,20% 96,20% 95,90%
Cochran 81,40% 82,70% 84,60% 83,10% 82,70%
Angers 97,20% 94,70% 95,80% 94,50% 97,30%
k=5
Población 11 Población 12 Población 13 Población 14 Población 15
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 95,70% 96,60% 93,10% 98,40% 94,80%
Bromaghin 96,10% 96,60% 94,40% 98,50% 94,20%
Fitzpatrick & Scott 97,10% 97,10% 97,40% 97,20% 97,60%
Thompson 96,20% 97,30% 97,50% 96,90% 97,80%
Cochran 78,20% 78,30% 78,50% 78,00% 76,80%
Angers 95,00% 95,30% 93,70% 93,40% 89,20%
k=6
Población 16 Población 17 Población 18 Población 19 Población 20
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 94,60% 94,90% 95,20% 99,70% 94,30%
Bromaghin 94,80% 95,80% 93,70% 99,30% 93,20%
Fitzpatrick & Scott 97,90% 99,30% 98,60% 98,00% 97,90%
Thompson 98,00% 98,50% 97,20% 98,20% 98,10%
Cochran 68,90% 75,80% 71,70% 69,40% 68,30%
Angers 94,30% 95,10% 94,00% 92,80% 94,90%
k=7
Población 21 Población 22 Población 23 Población 24 Población 25
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 95,20% 94,50% 94,90% 99,80% 95,40%
Bromaghin 95,60% 94,90% 94,40% 99,50% 94,60%
Fitzpatrick & Scott 98,70% 98,70% 96,70% 98,20% 98,70%
Thompson 98,60% 98,70% 96,80% 98,70% 98,70%
Cochran 65,30% 65,20% 67,40% 67,00% 72,00%
Angers 94,70% 94,50% 94,20% 93,60% 94,10%
87
Tabla 7. Puntajes asignados a niveles de confianza reales para las muestras seleccionadas
según los métodos utilizados para las 25 poblaciones simuladas.
k=3
Población 1 Población 2 Población 3 Población 4 Población 5
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 4 6 3 6 6 25
Bromaghin 2 3 4 5 2 16
Fitzpatrick & Scott 6 4 5 3 4 22
Thompson 5 5 6 4 5 25
Cochran 1 1 1 1 1 5
Angers 3 2 2 2 3 12
k=4
Población 1 Población 2 Población 3 Población 4 Población 5
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 3,5 4 4 6 2 19,5
Bromaghin 3,5 3 2 4 3 15,5
Fitzpatrick & Scott 5 5 5,5 5 6 26,5
Thompson 2 6 5,5 3 4 20,5
Cochran 1 1 1 1 1 5
Angers 6 2 3 2 5 18
k=5
Población 1 Población 2 Población 3 Población 4 Población 5
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 6 3,5 2 6 4 21,5
Bromaghin 3 3,5 4 5 3 18,5
Fitzpatrick & Scott 5 5 5 4 5 24
Thompson 4 6 6 3 6 25
Cochran 1 1 1 1 1 5
Angers 2 2 3 2 2 11
k=6
Población 1 Población 2 Población 3 Población 4 Población 5
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 3 2 4 6 3 18
Bromaghin 4 4 2 5 2 17
Fitzpatrick & Scott 5 6 6 3 5 25
Thompson 6 5 5 4 6 26
Cochran 1 1 1 1 1 5
Angers 2 3 3 2 4 14
k=7
Población 1 Población 2 Población 3 Población 4 Población 5
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 3 2,5 4 6 4 19,5
Bromaghin 4 4 3 5 3 19
Fitzpatrick & Scott 6 5,5 5 3 5,5 25
Thompson 5 5,5 6 4 5,5 26
Cochran 1 1 1 1 1 5
Angers 2 2,5 2 2 2 10,5
88
Tabla 8. Puntajes asignados por categorías a niveles de confianza reales para las
muestras seleccionadas según los métodos utilizados para las 25 poblaciones simuladas, el
valor total es la suma de los totales que se ven en Tabla 7.
Las Tablas presentadas en Anexo (véase Anexo 2 Tablas 4a-4x’) muestran los valores
obtenidos para el desempeño de las simulaciones realizadas considerando: estimador
promedio, sesgo y error cuadrático medio, para todas las muestras así como también
los puntajes asignados para cada población y categoría. Para el estimador y sesgo se
reporta su valor promedio en m=1000 muestras y para el error cuadrático medio la
mediana en m=1000 muestras. La Tabla 9 muestra un resumen de los totales de las
Tablas presentadas en Anexo, luego se generó la Tabla 10 derivada de la anterior que
simplifico la asignación de puntajes y consistió en asignarle un rango de 1 a 6 a los
valores de cada casilla de la Tabla 9 generando la Tabla final de puntajes de las
simulaciones. El método de Tortora presenta el valor final de puntajes más alto y
Fitzpatrick y Scott y Thompson valores que van en contraposición con lo obtenido
en los intervalos de confianza inclusive superados por el método de Cochran.
89
Tabla 9. Puntajes totales asignados por cada método y categoría en relación al
desempeño de las simulaciones considerando estimador promedio, sesgo y error
cuadrático medio, los totales en cada población corresponden a los totales de cada Tabla
del anexo 4a-4x’
K=3
Población 1 Población 2 Población 3 Población 4 Población 5
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 41 19 29,5 31 47 167,5
Bromaghin 29 43 26 32,5 27 157,5
Fitzpatrick & Scott 41 36 32 27,5 29,5 165,5
Thompson 34 41 37,5 25,5 28 166
Cochran 15 20 32,5 40 33 140,5
Angers 30 31 32 32,5 31 156,5
K=4
Población 6 Población 7 Población 8 Población 9 Población 10
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 49 45 38,5 44,5 35,5 212,5
Bromaghin 47 42 38,5 34 40,5 202
Fitzpatrick & Scott 34 47 34,5 35,5 44,5 195,5
Thompson 49 45 32 40 32,5 198,5
Cochran 42 27,5 57 56 41,5 224
Angers 33,5 46 51,5 42 57,5 230,5
K=5
Población 11 Población 12 Población 13 Población 14 Población 15
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 54,5 45 60,5 66,5 47 273,5
Bromaghin 59 55,5 46,5 56 53 270
Fitzpatrick & Scott 49 52,5 52,5 39 49 242
Thompson 50 47,5 54,5 42,5 43,5 238
Cochran 47 57,5 45 35,5 68 253
Angers 55,5 57 56 73,5 55 297
K=6
Población 16 Población 17 Población 18 Población 19 Población 20
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 67 69 72,5 56,5 78,5 343,5
Bromaghin 76 72,5 65 75 80,5 369
Fitzpatrick & Scott 53 54 50,5 58,5 59 275
Thompson 52 64 46 58 48,5 268,5
Cochran 55 50 64,5 73,5 54 297
Angers 72 68,5 79,5 57 54,5 331,5
K=7
Población 21 Población 22 Población 23 Población 24 Población 25
Método Total
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 86 85,5 87 65,5 73,5 397,5
Bromaghin 78 90 93,5 100 71 432,5
Fitzpatrick & Scott 69 60 55 71,5 69 324,5
Thompson 53 68 60,5 72,5 74,5 328,5
Cochran 61 78 63,5 71 78 351,5
Angers 94 67,5 81,5 60,5 70,5 374
90
Tabla 10. Puntajes asignados a cada método por categorías de los valores totales de
Tabla 9 en el desempeño de las simulaciones, los valores corresponden a un puntaje de 1
a 6 en donde 6 corresponde a la nota más alta.
La Tabla 11 presenta la suma de todos los puntajes para cada método y categoría
considerados, los valores corresponden a las sumas en casillas de las Tablas 5, 8 y 10.
En la última columna se aprecia que el método de Fitzpatrick y Scott se posicionan
en primer lugar, seguido por Thompson.
Tabla 11. Suma de todos los puntajes para cada método y categoría considerados, los
valores corresponden a las sumas en casillas de las Tablas 5, 8 y 10.
91
Aplicación
La Tabla 13 muestra los puntajes por desempeño para cada método evaluado, se
destaca la propuesta de Bromaghin, en donde se puede ver que para todas las
categorías posee un alto puntaje entre 14 y 17 puntos siendo el valor máximo 18
puntos sumando un total de 66 puntos, el método de Cochran presenta los puntajes
más bajos para las categorías P2 y P3 y en cambio para P1 y P4 puntajes similares
sumando un total de 28 puntos. La Tabla 15 muestra las posiciones finales en donde
el método de Bromaghin queda en primer lugar seguido de Tortora y en último lugar
a Cochran.
92
Tabla 12. Valores correspondientes a: 1) Estimador promedio, 2) Sesgo y 3) Error
cuadrático medio.
P1 P2 P3 P4
Parámetro Poblacional
Método 1,90% 9,70% 29,06% 59,30%
Criterio p1 p2 p3 p4
Estimador promedio 1,92% 9,68% 29,07% 59,31%
Tortora Sesgo 0,001175 -0,000399 0,000197 0,000084
Error Cuadratico Medio 1083,41 3268,63 264,44 38,52
Estimador promedio 1,91% 9,72% 29,06% 59,31%
Bromaghin Sesgo -0,000014 -0,000033 -0,000036 0,000082
Error Cuadratico Medio 11,56 25,34 11,61 43,68
Estimador promedio 1,93% 9,72% 29,19% 59,22%
Fitzpatrick & Scott Sesgo 0,000186 -0,000032 0,000690 -0,000844
Error Cuadratico Medio 722,16 4,92 985,36 1099,71
Estimador promedio 1,89% 9,71% 29,05% 59,34%
Thompson Sesgo -0,000210 -0,000135 -0,000040 0,000384
Error Cuadratico Medio 1325,54 74,27 2,94 255,87
Estimador promedio 1,89% 9,67% 29,14% 59,29%
Cochran Sesgo -0,000175 -0,000529 0,000816 -0,000112
Error Cuadratico Medio 366,17 770,18 1084,86 15,33
Estimador promedio 1,93% 9,71% 29,05% 59,24%
Angers Sesgo 0,000169 0,000474 -0,000041 -0,000602
Error Cuadratico Medio 1206,63 2787,13 9,20 1848,14
93
Tabla 13. Puntajes asignados a medidas mostradas en Tabla 12.
Tabla 14. Tamaños de muestra utilizados para Población 6 de k=4 categorías para
ejemplo de ENS, niveles de confianza nominal y real para las muestras.
94
Tabla 15. Puntajes asignados mostrados en Tabla 13 y asignación de puntajes de Tabla
14 para nivel de confianza real y tamaño de muestra (columna C).
Tortora 2 2 4 52,5 2
Bromaghin 1 3,5 4,5 70,5 1
Fitzpatrick & Scott 5 5 10 41,5 5
Thompson 4 6 10 51 3
Cochran 6 1 7 35 6
Angers 3 3,5 6,5 43,5 4
95
4.2.5 Discusión
Para las simulaciones el método de Tortora presenta el puntaje más alto seguido por
el método de Angers y Bromaghin, llama la atención que los métodos de Fitzpatrick
y Scott y Thompson presenten los puntajes más bajos en contraposición con el
desempeño mostrado en los intervalos de confianza, esto se debería que las
estimaciones realizadas por estos métodos presentan menor exactitud que las
realizadas por los métodos de Tortora, Angers y Bromaghin véanse puntajes en
(Tablas 9 y 10) (mayores detalles en Tablas 4a-4x’ del Anexo 2).
Los tamaños de muestra estimados por el método de Cochran (1977) siempre son
inferiores a 384, esto se debe a que se utiliza el “peor de los casos” en donde P=0,50
y se tiene una varianza máxima de PQ=0,25 para la estimación del tamaño muestral,
este método es el más adecuado para trabajar con dos categorías en donde una de
ellas se aproxime al 50% y no con k ≥ 3 categorías ya que categorías con
proporciones bajas son poco representadas. Las Tablas 4 y 5 presentan los puntajes
asignados a los tamaños de muestra calculados y se destaca el método de Cochran
con el máximo puntaje de 30 puntos seguido por Fitzpatrick y Scott con totales que
varían entre 22 y 25 puntos.
Estos tamaños n ≤ 384 permiten que a medida que aumenta el número de categorías
( k ≥ 3 ), el nivel de confianza real para el método de Cochran comienza a disminuir
(Tablas 6 y 8), lo que estaría dado por el hecho de que en cada uno de los m=1000
intervalos construidos al menos una categoría no contenía a su respectivo parámetro,
96
entonces de manera simultánea el intervalo de confianza no contiene al vector
poblacional y esto hace que el puntaje asignado a intervalos de confianza sea el más
bajo.
Para las simulaciones se puede ver que el método de Cochran presenta un puntaje
total de 15 puntos el cual es bajo (Tabla 10), en donde solo en variables de k=4
categorías alcanzo un puntaje mayor y que corresponde a poblaciones en donde un
parámetro presenta una prevalencia cercana al 40% o superior salvo la población 10
que posee una distribución equiprobable con prevalencias cercanas al 25%. Esto pone
en evidencia que dicho método es apropiado para estimar prevalencias altas.
Los tamaños de muestra estimados según Tortora (1978) presentan valores altos,
situación que ya había sido mencionada por Angers en su trabajo del año 1979 el
cual afirma “los resultados generados por el trabajo de Tortora son muy
conservadores y estima tamaños de muestra muy grandes”. El método de Tortora
estima los tamaños de muestra para cada categoría y luego se escoge aquel tamaño
de muestra mayor que asegure una adecuada variabilidad para aquellas proporciones
o prevalencias bajas. En el caso de las poblaciones 1, 6, 11, 16 y 21 de k=3, 4, 5, 6 y
7 categorías respectivamente, los tamaños de muestra son grandes juntos con los
estimados por el método de Bromaghin (1993) (Tabla 3), debido a que las
poblaciones consideran una categoría con una proporción inferior al 5%. Los niveles
de confianza reales obtenidos presentan un patrón en donde se aprecia por ejemplo
que para algunas poblaciones tanto el método de Tortora (1978) como el de
Bromaghin (1993) presentan niveles de confianza reales inferiores al nominal del
95% y los posicionan con puntajes en un segundo y tercer puesto. Esto podría
deberse a que estos métodos están basados en intervalos de confianza que son
asintóticamente equivalentes obtenidos por Goodman (1968) y que permiten tener
niveles de confianza reales similares.
Los tamaños de muestra obtenidos mediante la propuesta de Angers (1974) son altos
en comparación con el resto y se posicionan en un tercer puesto después de las
estimaciones con los métodos de Tortora (1978) y Bromaghin (1993). Angers también
trabaja con intervalos de confianza obtenidos por Goodman (1968) al igual que
Tortora y Bromaghin y esto podría explicar el porqué el tamaño de muestra es tan
alto. Los niveles de confianza real obtenidos presentaron un patrón de
comportamiento no claro en función del número de categorías trabajadas, y en
algunos casos fueron inferiores a los niveles de confianza nominales.
97
Los tamaños de muestra para las variables de “libre distribución” y considerando un
error constante del 5% (véase Tabla 3 para poblaciones 4, 9, 14, 19 y 24) para los
métodos de Tortora (1978) y Bromaghin (1993) son muy similares, esto se debería a
que estos métodos están basados en intervalos de confianza que son asintóticamente
equivalentes obtenidos por Goodman (1968) y que permiten tener niveles de
confianza reales altos y similares.
98
presentaba una categoría con una prevalencia menor al 5% y además se consideraban
errores específicos por categoría (e=1% si la categoría era menor al 5% ; véase Tabla
1). Si bien en las simulaciones el nivel de confianza real para el método de
Bromaghin para la población 6 es del 96% (ver Tabla 4), en el ejemplo de la
aplicación este nivel baja al 95,2%, esto estaría dado por el hecho de que el tamaño
de muestra según el método de Bromaghin de n=954 es generado para aquella
categoría de menor prevalencia j=1 que en el caso de la Población 6 era de
P1=3,16% (Véase Tabla 3c de Anexo).
Pese a que los métodos de Bromaghin y Tortora son similares por la forma de
construir los intervalos de confianza, el método de Tortora presenta un nivel de
confianza real inferior al que presenta Bromaghin, esto podría estar explicado a que
el desempeño del método de Tortora para prevalencias bajas no es adecuado ya que
presenta bajos puntajes para las categorías 1 y 2 y en el caso del sesgo para P1 posee
el puntaje más bajo indicando que dichas estimaciones están altamente sesgadas y
probablemente los intervalos de confianza para esa categoría no contienen al
parámetro P1 lo que hace que el intervalo simultaneo no lo contenga disminuyendo
así la proporción de contención del vector de parámetros.
Finalmente hay que destacar que todos los procedimientos anteriores están basados
en la desigualdad de Bonferroni y por lo tanto son conservativos.
99
4.2.6 Conclusiones
La propuesta de Angers (1974) trabaja con tamaños muestrales altos y los niveles de
confianza real podrían ser inferiores a los niveles de confianza nominales dependiendo
del número de categorías a trabajar.
Todos estos puntos harían que finalmente las propuestas más apropiadas para
trabajar tamaños de muestra para variables multinomiales correspondan a
Fitzpatrick y Scott y Thompson, ya que estiman el mismo tamaño de muestra
conservador de n=510 y n=512 respectivamente, que además conjugan buen nivel de
confianza. Si bien el método de Cochran estima los menores tamaños, los niveles de
confianza son los más bajos ya que al construir los intervalos simultáneos hay ciertas
categorías que no incluyen al parámetro respectivo y hacen que el intervalo
simultáneo no contenga al vector de parámetros.
100
Los métodos de Fitzpatrick y Scott (1987) y Thompson (1987) son constantes y
toman valores bajos, los cuales son adecuados en términos de costo pero no de
estimaciones de prevalencias pequeñas ya que su puntaje es bajo.
101
4.2.7 Bibliografía
Angers, C. (1974), "A Graphical Method to Evaluate Sample Sizes for the.
Multinomial Distribution," Technometrics, 16, 469-471.
Burton, A., Altman, D., Royston, P., y Holder, R. (2006). The design of simulation
studies in medical statistics. Statistics in Medicine, 25:4279-4292.
Cochran, WG. (1977). Sampling Technics. Third Edition. John Wiley y Sons, Inc.442
pp.
102
4.3
MANUSCRITO 3
4.3.1 Resumen
103
4.3.2 Introducción
Esta última medida evaluada se aborda de la forma clásica y pocas veces se pone
interés en estudiar si en el proceso de muestreo en donde una muestra que dio origen
a ciertas estimaciones “tiene más información” respecto a otra muestra construida
con los mismos fines. Los trabajos de Wu y Zhang (2006) y Dahl y Orestas (2010)
aplican la teoría de la información para estudiar encuestas por muestreo
incorporando las funciones de entropía, otras aplicaciones novedosas se encuentran en
el campo del diseño de escalas en encuestas (Oruç et al. 2009) y sereening en estudios
de VIH (Tu et al. 1992), extensiones del índice de Shannon (Yamano 2001), de lo
anterior se desprende la importancia del estudio de la información proveniente de
encuestas.
104
Cuando uno se enfrenta a un proceso de tipo aleatorio es difícil predecir con certeza
el resultado de este y por ende las probabilidades o proporciones de especies (a nivel
de comunidad biológica) presentarán una distribución dependiente de la abundancia
de dichas especies (Joust 2006, Keylock 2005, Lieberson 1969), y del muestreo
empleado, de igual forma ocurre cuando se estudian prevalencias asociadas a
enfermedades ya que el resultado del experimento “muestreo” no se puede predecir y
dicho valor depende de la prevalencia, del adecuado tamaño de muestra y de una
adecuada estrategia de muestreo.
1 1
H ´( p1 , p2 ,..., pk ) ≤ H ´ ,...., ; (1)
k k
1
Con la condición de igualdad para pi =
, ∀ i = 1,..., k , en donde H ´(P ) alcanza el
k
valor máximo cuando la distribución es la uniforme, siendo P = ( p1 , p2 ,..., pk ) , es
decir el vector de probabilidad asociado a la enfermedad Y posee menos
incertidumbre que el vector de probabilidad asociado a la enfermedad X
( H ´(Y ) = 0,50 ≤ 0,693 = H ´( X ) ).
105
A nivel poblacional la entropía resulta desconocida, debido a todos los inconvenientes
que tienen relación con medir la diversidad y posterior construcción dicho parámetro,
por ejemplo: 1) Costos, 2) accesibilidad a las unidades de muestreo, 3) tamaño
poblacional y 4) Problemas de diseño de muestreo. A raíz de esto surge la necesidad
de medir dicha entropía a partir de una muestra, ¿Pero cuál es el tamaño adecuado?
¿Existen formulas que permiten estimar dichos tamaños?, ¿ que formula es la más
adecuada en el sentido de una adecuada representación de las categorías de la
variable a estudiar?.
4.3.3 Métodos
Se trabajo con el índice de Shannon promedio Ĥ para los vectores estimados para
los tamaños de muestra asociadas a las 25 poblaciones simuladas para las seis
propuestas metodológicas las que corresponden a Angers (1974), Tortora (1978),
Thompson (1987), Bromaghin (1993) y Fitzpatrick y Scott (1987) y Cochran (1977).
Se trabajaron con las combinaciones de categorías correspondientes a: i) Una
categoría menor al 5%, ii) Una categoría entre el 5% y 10%; iii) Una categoría igual
al 50%; iv) Categorías con libre distribución de proporciones, en el caso de la
combinación de categorías v) que considerando equiprobabilidad (misma proporción
en cada categoría). Se calculo el valor del índice de Shannon poblacional (parámetro)
para cada población y se comparo cualitativamente con los índices estimados.
106
m
∑ Hˆ i
Hˆ = i =1
, (2)
m
k
Hˆ ´= −∑ pi log pi
i =1
4.3.4 Resultados
k=3
Población 1 Población 2 Población 3 Población 4 Población 5
0,806 0,926 1,039 0,805 1,099
k=4
Población 6 Población 7 Población 8 Población 9 Población 10
1,112 1,245 1,208 1,112 1,386
k=5
Población 11 Población 12 Población 13 Población 14 Población 15
1,355 1,452 1,380 1,355 1,609
k=6
Población 16 Población 17 Población 18 Población 19 Población 20
1,694 1,760 1,497 1,694 1,792
k=7
Población 21 Población 22 Población 23 Población 24 Población 25
1,852 1,925 1,535 1,852 1,946
107
Tabla 2. Índices de Shannon promedio para las seis propuestas de
Estimación de tamaños de muestra en las 25 poblaciones.
k=3
Población 1 Población 2 Población 3 Población 4 Población 5
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 0,805 0,927 1,037 0,802 1,097
Bromaghin 0,804 0,926 1,036 0,802 1,094
F & Scott 0,804 0,925 1,038 0,802 1,097
Thompson 0,803 0,925 1,037 0,802 1,097
Cochran 0,802 0,926 1,037 0,803 1,095
Angers 0,805 0,926 1,037 0,802 1,097
k=4
Población 6 Población 7 Población 8 Población 9 Población 10
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 1,112 1,244 1,210 1,110 1,380
Bromaghin 1,112 1,243 1,206 1,109 1,379
F & Scott 1,110 1,242 1,205 1,110 1,383
Thompson 1,109 1,242 1,206 1,109 1,383
Cochran 1,109 1,242 1,204 1,108 1,381
Angers 1,112 1,243 1,206 1,110 1,385
k=5
Población 11 Población 12 Población 13 Población 14 Población 15
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 1,354 1,451 1,379 1,352 1,604
Bromaghin 1,352 1,451 1,379 1,352 1,599
F & Scott 1,351 1,448 1,378 1,352 1,605
Thompson 1,350 1,448 1,378 1,352 1,606
Cochran 1,350 1,447 1,375 1,349 1,601
Angers 1,353 1,451 1,379 1,350 1,605
k=6
Población 16 Población 17 Población 18 Población 19 Población 20
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 1,693 1,758 1,496 1,691 1,787
Bromaghin 1,692 1,756 1,496 1,690 1,783
F & Scott 1,690 1,756 1,493 1,689 1,787
Thompson 1,690 1,755 1,493 1,689 1,787
Cochran 1,685 1,750 1,490 1,686 1,780
Angers 1,693 1,757 1,496 1,687 1,788
k=7
Población 21 Población 22 Población 23 Población 24 Población 25
Método
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
Tortora 1,851 1,923 1,535 1,849 1,943
Bromaghin 1,849 1,921 1,533 1,848 1,939
F & Scott 1,846 1,919 1,529 1,847 1,940
Thompson 1,846 1,919 1,529 1,847 1,940
Cochran 1,842 1,910 1,527 1,845 1,923
Angers 1,850 1,921 1,533 1,845 1,943
108
Las Figuras 1 a 25 (Anexo 3) muestran las distribuciones del estimador promedio de
Shannon para las 25 poblaciones en estudio y los métodos a evaluar, para aquellas
distribuciones con i) Una categoría menor al 5%, ii) Una categoría entre el 5% y
10%; iii) Una categoría igual al 50% y iv) Categorías con libre distribución de
proporciones se ve que las distribuciones presentan una asimetría marcada que se
modifica en función del número de categorías y método evaluado, para el caso de la
combinación de categorías v) que considera equiprobabilidad se puede ver un
comportamiento de la distribución en forma de escalón en donde se aprecia una
marcada frecuencia en aquellas medidas de entropía “máximas” dentro de la
distribución para todas las poblaciones y métodos evaluados.
109
4.3.5 Discusión
Si bien el método de Fitzpatrick y Scott fue el más adecuado para estimar tamaños
de muestra seguido por el de Thompson, y pese a haber diferencias entre un método
y otro, el estimador promedio del índice presentó un comportamiento similar para
todos los métodos evaluados. Un propiedad importante es que la función de Shannon
es una función continua y a pequeños cambios en el vector p=(p1,p2,….,pk) se deben
producir pequeños cambios en H (Pardo 2006), esto se corresponde con las pequeñas
variaciones observadas en las estimaciones (manuscrito 2), lo que hizo que se
generaran índices similares.
110
4.3.6 Conclusiones
En este trabajo se puede ver que todos los métodos evaluados realizan estimaciones
del índice de Shannon promedio similares sin presentar variaciones incluso con los
valores del índice a nivel poblacional, los índices construidos muestran que el grado
de homogeneidad de las probabilidades estimadas (prevalencias) por los distintos
métodos son similares. Pero ante este escenario se aconseja por los resultados del
manuscrito 2, utilizar las propuestas de Fitzpatrick y Scott y Thompson si se trabaja
con poblaciones de similares características a las simuladas.
111
Finalmente los resultados obtenidos nos permiten interpretar los índices como “el
grado promedio de incertidumbre en predecir a que categoría pertenecerá un
individuo escogido al azar de una colección” (Begon et al. 2006, Magurran 1988).
Esto relacionado a prevalencias de enfermedades y asociándolo al principio de
máxima varianza nos llevaría a que “existiría mayor incertidumbre en predecir que se
encuentre un evento de salud en un momento determinado en la medida que este
valor se hace extremo”.
112
4.3.7 Bibliografía
Angers, C. (1974), "A Graphical Method to Evaluate Sample Sizes for the.
Multinomial Distribution," Technometrics, 16, 469-471.
Burton, A., Altman, D., Royston, P., y Holder, R. (2006). The design of simulation
studies in medical statistics. Statistics in Medicine, 25:4279-4292.
Cochran, WG. (1977). Sampling Technics. Third Edition. John Wiley y Sons, Inc.442
pp.
113
Oruç, O., Kurouglu, E., y Vupa, O. (2009). An Application of Entropy in Survey
Scale. Entropy, 11, 598-605.
Tu, X., Litvak, E., y Pagano, M. (1992). Issues in human Immunodeficiency Virus
VIH screening programs. Am.J. Epidemiol., 136,244-255.
114
5. Discusión general
Los tamaños de muestra según Tortora (1978) y Bromaghin (1993) son superiores a
los de Fitzpatrick y Scott (1987) y Thompson (1987). Los métodos de Tortora (1978)
y Bromaghin (1993) están basados en el peor caso de los valores de los parámetros
para cada categoría, en cambio los procedimientos de Fitzpatrick y Scott (1987) y
Thompson (1987) se basan en el peor caso tomado de aquellos que la suma de los
parámetros de la multinomial sea igual a uno.
El método de Tortora presenta el puntaje más alto para las simulaciones realizadas
seguido por el método de Angers y Bromaghin. Se destaca en los métodos de
Fitzpatrick y Scott y Thompson puntajes bajos en contraposición con el desempeño
mostrado en los intervalos de confianza (puntajes altos), esto se debería que las
estimaciones realizadas por estos métodos presentan menor exactitud que las
realizadas por los métodos de Tortora, Angers y Bromaghin.
115
una varianza máxima de PQ=0,25 para la estimación del tamaño muestral. En los
puntajes asignados a los tamaños de muestra calculados el método de Cochran se
destaca con el máximo puntaje de 30 puntos seguido por Fitzpatrick y Scott con
totales que varían entre 22 y 25 puntos. El método de Cochran presentó niveles de
confianza reales muy bajos, ya que en los m=1000 intervalos construidos al menos
una categoría no contenía a su respectivo parámetro, luego simultáneamente el
intervalo de confianza no contiene al vector poblacional lo que hace que el nivel de
confianza sea más bajo.
Pese a que los métodos de Bromaghin y Tortora son similares por la forma de
construir los intervalos de confianza, el método de Tortora presenta un nivel de
confianza real inferior al que presenta Bromaghin, esto podría estar explicado a que
el desempeño del método de Tortora para prevalencias bajas no es adecuado. Se debe
tener presente que en la aplicación a la ENS se utilizaron los tamaños de muestra
116
estimados para la simulación de la Población 6 (Tabla 2), ya que esta presentaba una
categoría con una prevalencia menor al 5% y además se consideraban errores
específicos por categoría (e=1% si la categoría era menor al 5% ; véase Tabla 1).
El índice promedio de Shannon presentó una característica particular, y era que para
una población respectiva el índice no variaba considerablemente y se mantenía casi
igual. Dicha característica se explica ya que las estimaciones promedio para cada
método en una población específica se mantenían similares (resultado manuscrito 2)
y las diferencias que se encontraron tenían relación específica con: 1) Niveles de
confianza, 2) Sesgos y 3) errores cuadráticos medios.
117
6 Conclusiones generales
118
8. En la construcción de los índices de Shannon, los vectores que consideraban
equiprobabilidad muestran un comportamiento de la distribución de los
estimadores promedios de Shannon en forma de escalón, en donde se aprecia
una marcada frecuencia en aquellas medidas de entropía “máximas” dentro
de la distribución para todas las poblaciones y métodos evaluados.
10. Las estimaciones del índice de Shannon promedio son similares sin presentar
variaciones incluso con los valores del índice a nivel poblacional.
119
7 Bibliografía General
Alonso, J., Prieto, L., y Anto, JM. (1995). The Spanish version of the SF-36 Health
Survey (the SF-36 health questionnaire): an instrument for measuring clinical
results]. Med Clin (Barc), May 27;104(20):771-776.
Angers, C. (1974), "A Graphical Method to Evaluate Sample Sizes for the.
Multinomial Distribution," Technometrics, 16, 469-471.
Burton, A., Altman, D., Royston, P., y Holder, R. (2006). The design of simulation
studies in medical statistics. Statistics in Medicine, 25:4279-4292.
Cabral, MD., Luiz, RR. (2007). Sensitivity analysis for unmeasured confounders
using an electronic spreadsheet. Rev Saude Publica, 41(3):446-52
Chow, S., Shao, J., y Wang, H. (2008). Sample Size Calculations in Clinical
Research. Chapman y Hall. 449 pp.
Cochran, WG. (1977). Sampling Technics. Third Edition. John Wiley y Sons, Inc.442
pp.
120
Cuadras, C. (1999). Problemas de Probabilidades y Estadística. Volumen II.
Inferencia Estadística. EUB, Barcelona, (2a edición), 454pp., 2000.
121
Kish, L. (1965). Survey Sampling. John Wiley y Sons. 635 pp.
MacMahon, B., y Pugh, TF. (1970) Epidemiology : principles and methods. Little,
Brown.
Martín, M., Horna, O., Nedel, F., y Navarro, A. (2010). Fundamentos de estadística
en ciencias de la salud. Universitat Autónoma de Barcelona. Servei de Publicacions.
224 pp.
122
Marrugat, J., Vila, J., y Pavesa, M. (1999). Supuesto de máxima indeterminación:
¿error absoluto o error relativo en el cálculo del tamaño de la muestra?. Gaceta
Sanitaría, 13: 491-493.
123
Robinson, D. (2009). Entropy and Uncertainty. Entropy, 10,493-506.
124
Tu, X., Litvak, E., y Pagano, M. (1992). Issues in human Immunodeficiency Virus
VIH screening programs. Am.J. Epidemiol., 136,244-255.
125
8. Anexos
∂f ∂ z 2 pq ∂ z 2 p (1 − p ) ∂ z 2 ( p − p 2 ) z 2
= = = = 2 (1 − 2 p )
∂p ∂p e 2 ∂p e2 ∂p e2 e
∂f 1
La función tiene su máximo en = 0 , esto es cierto si y sólo si p = .
∂p 2
z 2 × N × pq
z × N × pq
2
lim n = lim 2 = lim 2 N
N →∞ N → ∞ z × pq + ( N − 1) × e 2 N →∞ z × pq ( N − 1) × e 2
+
N N
z 2 × N × pq
2
= lim 2 N = z pq
N →∞ z × pq 1 e2
+ 1 − e 2
N N
126
8.2 Anexo 2 (Manuscrito 2)
Tortora
Población 1 Población 2 Población 3 Población 4 Población 5
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
k=3 k=3 k=3 k=3 k=3
j=1 j=1 j=2 peor caso constante para cada j
n=1788 n=1190 n=583 n=583 n=518
Población 6 Población 7 Población 8 Población 9 Población 10
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
k=4 k=4 k=4 k=4 k=4
j=1 j=1 j=1 peor caso constante para cada j
n=1901 n=1296 n=1403 n=623 n=468
Población 11 Población 12 Población 13 Población 14 Población 15
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
k=5 k=5 k=5 k=5 k=5
j=1 j=1 j=1 peor caso constante para cada j
n=2010 n=1381 n=1380 n=663 n=425
Población 16 Población 17 Población 18 Población 19 Población 20
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
k=6 k=6 k=6 k=6 k=6
j=1 j=1 j=1 peor caso j=2
n=2733 n=1451 n=1604 n=710 n=618
Población 21 Población 22 Población 23 Población 24 Población 25
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
k=7 k=7 k=7 k=7 k=7
j=1 j=1 j=5 peor caso constante para cada j
n=2893 n=1696 n=3571 n=756 n=1030
127
Tabla 3b. Estimaciones de tamaño de muestra según propuesta de Cochran.
Cochran
Población 1 Población 2 Población 3 Población 4 Población 5
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=3 k=3 k=3 k=3 k=3
j=2 j=3 j=2 peor caso j=2
n=382 n=384 n=384 n=384 n=342
Población 6 Población 7 Población 8 Población 9 Población 10
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=4 k=4 k=4 k=4 k=4
j=4 j=3 j=3 peor caso constante para cada j
n=376 n=369 n=384 n=384 n=288
Población 11 Población 12 Población 13 Población 14 Población 15
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=5 k=5 k=5 k=5 k=5
j=5 j=5 j=5 peor caso constante para cada j
n=376 n=376 n=384 n=384 n=246
Población 16 Población 17 Población 18 Población 19 Población 20
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=6 k=6 k=6 k=6 k=6
j=3 j=3 j=3 peor caso j=2
n=272 n=246 n=384 n=384 n=214
Población 21 Población 22 Población 23 Población 24 Población 25
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=7 k=7 k=7 k=7 k=7
j=3 j=3 j=3 peor caso constante para cada j
n=289 n=246 n=384 n=384 n=188
128
Tabla 3c. Estimaciones de tamaño de muestra según propuesta de Angers.
Angers
Población 1 Población 2 Población 3 Población 4 Población 5
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=3 k=3 k=3 k=3 k=3
n=1250 n=840 n=485 n=498 n=510
Población 6 Población 7 Población 8 Población 9 Población 10
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=4 k=4 k=4 k=4 k=4
n=1211 n=854 n=965 n=649 n=1049
Población 11 Población 12 Población 13 Población 14 Población 15
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=5 k=5 k=5 k=5 k=5
n=1304 n=908 n=928 n=465 n=426
Población 16 Población 17 Población 18 Población 19 Población 20
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=6 k=6 k=6 k=6 k=6
n=1498 n=897 n=1496 n=419 n=600
Población 21 Población 22 Población 23 Población 24 Población 25
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=7 k=7 k=7 k=7 k=7
n=1600 n=1012 n=2203 n=387 n=985
129
Tabla 3d. Estimaciones de tamaño de muestra según propuesta de Thompson.
Thompson
Población 1 Población 2 Población 3 Población 4 Población 5
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=3 k=3 k=3 k=3 k=3
j=3 j=3 j=3 j=3 j=3
n=512 n=512 n=512 n=512 n=512
Población 6 Población 7 Población 8 Población 9 Población 10
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=4 k=4 k=4 k=4 k=4
j=3 j=3 j=3 j=3 j=3
n=512 n=512 n=512 n=512 n=512
Población 11 Población 12 Población 13 Población 14 Población 15
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=5 k=5 k=5 k=5 k=5
j=3 j=3 j=3 j=3 j=3
n=512 n=512 n=512 n=512 n=512
Población 16 Población 17 Población 18 Población 19 Población 20
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=6 k=6 k=6 k=6 k=6
j=3 j=3 j=3 j=3 j=3
n=512 n=512 n=512 n=512 n=512
Población 21 Población 22 Población 23 Población 24 Población 25
<5% < 10 % 50% (1 categoria) error constante equiprobabilidad
k=7 k=7 k=7 k=7 k=7
j=3 j=3 j=3 j=3 j=3
n=512 n=512 n=512 n=512 n=512
130
Tabla 3e. Estimaciones de tamaño de muestra según propuesta de Bromaghin.
Bromaghin
Población 1 Población 2 Población 3 Población 4 Población 5
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
k=3 k=3 k=3 k=3 k=3
j=1 j=1 j=2 peor caso j=2
n=1784 n=1171 n=564 n=564 n=502
Población 6 Población 7 Población 8 Población 9 Población 10
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
k=4 k=4 k=4 k=4 k=4
j=1 j=1 j=1 peor caso constante para cada j
n=1946 n=1306 n=1411 n=618 n=465
Población 11 Población 12 Población 13 Población 14 Población 15
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
k=5 k=5 k=5 k=5 k=5
j=1 j=1 j=1 peor caso constante para cada j
n=2055 n=1390 n=1389 n=657 n=423
Población 16 Población 17 Población 18 Población 19 Población 20
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
k=6 k=6 k=6 k=6 k=6
j=1 j=1 j=1 peor caso j=2
n=2720 n=1433 n=1582 n=690 n=606
Población 21 Población 22 Población 23 Población 24 Población 25
<5% < 10 % 50% (1 categoria) libre distribución equiprobabilidad
k=7 k=7 k=7 k=7 k=7
j=1 j=1 j=6 peor caso j=4
n=2807 n=1631 n=3451 n=717 n=987
131
Tabla 3f. Estimaciones de tamaño de muestra según propuesta de Fitzpatrick y Scott.
132
Tabla 4a. Evaluación de desempeño de las simulaciones para población 1 de K=3
categorías.
P1 P2 P3
Parámetro Poblacional
Método 3,17% 53,86% 42,97%
Criterio p1 p2 p3
Estimador promedio 3,17% 53,88% 42,94%
Sesgo 0,000012 0,000222 -0,000233
Tortora % Sesgo 0,04% 0,04% -0,05%
Sesgo Estandarizado 2,62% 18,06% -16,93%
Error Cuadratico Medio 452612,80 406691,80 335482,10
Estimador promedio 3,18% 53,82% 43,00%
Sesgo 0,000091 -0,000375 0,000285
Bromaghin % Sesgo 0,28% -0,06% 0,06%
Sesgo Estandarizado 20,61% -29,04% 22,94%
Error Cuadratico Medio 345323,30 361269,40 369546,50
Estimador promedio 3,17% 53,84% 42,99%
Sesgo -0,000078 -0,000167 0,000245
Fitzpatrick & Scott % Sesgo -0,24% -0,03% 0,05%
Sesgo Estandarizado -7,46% -7,33% 10,44%
Error Cuadratico Medio 279190,10 440162,30 433750,10
Estimador promedio 3,16% 53,84% 42,99%
Sesgo -0,000088 -0,000178 0,000266
Thompson % Sesgo -0,27% -0,03% 0,06%
Sesgo Estandarizado -8,51% -7,85% 11,38%
Error Cuadratico Medio 223518,40 447314,70 445377,80
Estimador promedio 3,15% 54,00% 42,86%
Sesgo -0,000266 0,001374 -0,001108
Cochran % Sesgo -0,83% 0,25% -0,26%
Sesgo Estandarizado -26,77% 49,87% -41,45%
Error Cuadratico Medio 312930,10 475505,90 360996,30
Estimador promedio 3,17% 53,81% 43,02%
Sesgo 0,000017 -0,000500 0,000483
Angers % Sesgo 0,05% -0,09% 0,11%
Sesgo Estandarizado 3,33% -31,55% 29,07%
Error Cuadratico Medio 485462,70 367066,00 327779,00
133
Tabla 4a’. Puntajes asignados a desempeño de las simulaciones para población 1 de K=3
categorías.
134
Tabla 4b. Evaluación de desempeño las simulaciones para población 2 de K=3 categorías.
P1 P2 P3
Parámetro Poblacional
Método 8,98% 40,01% 51,01%
Criterio p1 p2 p3
Estimador promedio 9,05% 40,00% 50,96%
Sesgo 0,000644 -0,000126 -0,000519
Tortora % Sesgo 0,72% -0,03% -0,10%
Sesgo Estandarizado 66,05% -8,00% -35,22%
Error Cuadratico Medio 354574,30 405918,60 469569,50
Estimador promedio 9,00% 40,00% 51,00%
Sesgo 0,000148 -0,000071 -0,000077
Bromaghin % Sesgo 0,16% -0,02% -0,01%
Sesgo Estandarizado 14,96% -5,09% -5,28%
Error Cuadratico Medio 286541,70 499395,70 388986,30
Estimador promedio 9,01% 40,01% 50,99%
Sesgo 0,000211 0,0000001 -0,000218
Fitzpatrick & Scott % Sesgo 0,23% 0,002% -0,04%
Sesgo Estandarizado 15,51% 0,29% -8,00%
Error Cuadratico Medio 363355,40 295296,70 291308,70
Estimador promedio 9,00% 40,01% 50,99%
Sesgo 0,000193 -0,0000005 -0,000188
Thompson % Sesgo 0,21% -0,001% -0,037%
Sesgo Estandarizado 14,15% -0,19% -0,78%
Error Cuadratico Medio 327669,00 317397,50 253663,90
Estimador promedio 9,09% 40,02% 50,90%
Sesgo 0,001014 0,000104 -0,001118
Cochran % Sesgo 1,13% 0,03% -0,22%
Sesgo Estandarizado 61,20% 3,05% -39,40%
Error Cuadratico Medio 302794,70 237237,30 397531,00
Estimador promedio 9,03% 40,00% 50,98%
Sesgo 0,000417 -0,000110 -0,000308
Angers % Sesgo 0,46% -0,03% -0,06%
Sesgo Estandarizado 34,41% -6,19% -14,91%
Error Cuadratico Medio 295410,70 371495,90 364523,30
135
Tabla 4b’. Puntajes asignados a desempeño de las simulaciones para población 2 de K=3
categorías.
136
Tabla 4c. Evaluación de desempeño de las simulaciones para población 3 de K=3
categorías.
P1 P2 P3
Parámetro Poblacional
Método 24,98% 50,03% 29,99%
Criterio p1 p2 p3
Estimador promedio 24,96% 50,05% 24,99%
Sesgo -0,000191 0,000243 -0,000052
Tortora % Sesgo -0,08% 0,05% -0,02%
Sesgo Estandarizado -9,93% 11,16% -2,55%
Error Cuadratico Medio 433188,40 348227,90 373044,60
Estimador promedio 25,04% 50,04% 24,92%
Sesgo 0,000634 0,000113 -0,000747
Bromaghin % Sesgo 0,25% 0,02% -0,30%
Sesgo Estandarizado 32,11% 5,47% -39,70%
Error Cuadratico Medio 410446,00 453064,60 431048,20
Estimador promedio 25,02% 50,05% 24,92%
Sesgo 0,000495 0,0002196 -0,000715
Fitzpatrick & Scott % Sesgo 0,20% 0,04% -0,28%
Sesgo Estandarizado 23,04% 9,14% -32,81%
Error Cuadratico Medio 365737,00 340786,30 339453,30
Estimador promedio 25,05% 50,04% 24,91%
Sesgo 0,000717 0,0000964 -0,000813
Thompson % Sesgo 0 ,29% 0,02% -0,32%
Sesgo Estandarizado 32,91% 4,02% -38,08%
Error Cuadratico Medio 380096,60 339755,50 304079,30
Estimador promedio 24,99% 50,05% 24,96%
Sesgo 0,000103 0,000211 -0,000314
Cochran % Sesgo 0,04% 0,04% -0,12%
Sesgo Estandarizado 4,15% 8,05% -11,59%
Error Cuadratico Medio 385700,80 369454,40 330725,30
Estimador promedio 25,03% 50,05% 24,93%
Sesgo 0,000498 0,000152 -0,000649
Angers % Sesgo 0,20% 0,03% -0,26%
Sesgo Estandarizado 24,31% 5,92% -30,24%
Error Cuadratico Medio 381504,60 350115,50 357223,40
137
Tabla 4c’. Puntajes asignados a desempeño de las simulaciones para población 3 de K=3
categorías.
138
Tabla 4d. Evaluación de desempeño de las simulaciones para población 4 de K=3
categorías.
P1 P2 P3
Parámetro Poblacional
Método 3,14% 53,83% 43,03%
Criterio p1 p2 p3
Estimador promedio 3,09% 53,89% 43,01%
Sesgo -0,000465 0,000637 -0,000172
Tortora % Sesgo -1,48% 0 ,12% -0,04%
Sesgo Estandarizado -61,30% 29,50% -8,64%
Error Cuadratico Medio 372901,40 421273,60 488031,50
Estimador promedio 3,11% 53,90% 42,99%
Sesgo -0,000299 0,000669 -0,000370
Bromaghin % Sesgo -0,95% 0,12% -0,08%
Sesgo Estandarizado -30,50% 33,13% -15,15%
Error Cuadratico Medio 239584,80 570728,10 363803,70
Estimador promedio 3,11% 53,91% 42,98%
Sesgo -0,000279 0,0007903 -0,000511
Fitzpatrick & Scott % Sesgo -0,89% 0,15% -0,12%
Sesgo Estandarizado -26,27% 34,49% -19,71%
Error Cuadratico Medio 304377,70 525269,00 325071,10
Estimador promedio 3,11% 53,93% 42,95%
Sesgo -0,000254 0,0010243 -0,000770
Thompson % Sesgo -0,81% 0,19% -0,18%
Sesgo Estandarizado -24,12% 45,88% -29,62%
Error Cuadratico Medio 294303,00 442864,30 390670,60
Estimador promedio 3,16% 53,81% 43,04%
Sesgo 0,000182 -0,000231 0,000049
Cochran % Sesgo 0,58% -0,04% 0,01%
Sesgo Estandarizado 18,59% -7,87% 1,66%
Error Cuadratico Medio 298873,00 311997,60 357355,60
Estimador promedio 3,11% 53,91% 42,98%
Sesgo -0,000329 0,000796 -0,000468
Angers % Sesgo -1,05% 0,15% -0,11%
Sesgo Estandarizado -29,52% 35,34% -19,40%
Error Cuadratico Medio 225299,60 499211,80 411990,00
139
Tabla 4d’. Puntajes asignados a desempeño de las simulaciones para población 4 de K=3
categorías.
140
Tabla 4e. Evaluación de desempeño de las simulaciones para población 5 de K=3
categorías.
P1 P2 P3
Parámetro Poblacional
Método 33,34% 33,37% 33,29%
Criterio p1 p2 p3
Estimador promedio 33,32% 33,37% 33,31%
Sesgo -0,000199 -0,000040 0,000239
Tortora % Sesgo -0,06% -0,01% 0,07%
Sesgo Estandarizado -7,70% -1,99% 10,20%
Error Cuadratico Medio 296801,40 437420,40 291297,50
Estimador promedio 33,26% 33,49% 33,26%
Sesgo -0,000823 0,001152 -0,000328
Bromaghin % Sesgo -0,25% 0,34% -0,09%
Sesgo Estandarizado -35,25% 52,03% -14,44%
Error Cuadratico Medio 393546,60 451536,90 364839,20
Estimador promedio 33,25% 33,48% 33,27%
Sesgo -0,000846 0,0010650 -0,000219
Fitzpatrick & Scott % Sesgo -0,25% 0 ,32% -0,06%
Sesgo Estandarizado -37,44% 52,42% -10,01%
Error Cuadratico Medio 371622,80 483553,60 417818,50
Estimador promedio 33,25% 33,39% 33,36%
Sesgo -0,000924 0,0002103 0,000714
Thompson % Sesgo -0,28% 0,06% 0,21%
Sesgo Estandarizado -44,25% 10,63% -10,01%
Error Cuadratico Medio 391623,90 460181,10 376369,40
Estimador promedio 33,33% 33,51% 33,16%
Sesgo -0,000091 0,001402 -0,001312
Cochran % Sesgo -0,03% 0,42% -0,39%
Sesgo Estandarizado -2,22% 46,48% -49,59%
Error Cuadratico Medio 184975,30 353705,70 572654,10
Estimador promedio 33,25% 33,48% 33,27%
Sesgo -0,000846 0,001065 -0,000219
Angers % Sesgo -0,25% 0,32% -0,07%
Sesgo Estandarizado -37,44% 52,42% -10,01%
Error Cuadratico Medio 371622,80 483553,60 417818,50
141
Tabla 4e’. Puntajes asignados a desempeño de las simulaciones para población 5 de K=3
categorías.
142
Tabla 4f. Evaluación de desempeño de las simulaciones para población 6 de K=4
categorías.
P1 P2 P3 P4
Parámetro Poblacional
Método 3,16% 13,83% 40,03% 42,98%
Criterio p1 p2 p3 p4
Estimador promedio 3,17% 13,84% 39,99% 43,00%
Sesgo 0,000128 0,000061 -0,000337 0,0001484
Tortora % Sesgo 0,40% 0,04% -0,08% 0,03%
Sesgo Estandarizado 27,64% 6,78% -29,89% 13,85%
Error Cuadratico Medio 324347,60 344082,80 372123,20 468515,80
Estimador promedio 3,17% 13,84% 39,99% 42,99%
Sesgo 0,000142 0,000083 -0,000335 0,0001098
Bromaghin % Sesgo 0,45% 0,06% -0,08% 0,02%
Sesgo Estandarizado 29,74% 8,98% -31,11% 10,68%
Error Cuadratico Medio 337291,70 304709,90 419386,00 492018,2
Estimador promedio 3,15% 13,91% 39,92% 43,02%
Sesgo -0,000063 0,0007589 -0,001051 0,0003548
Fitzpatrick & Scott % Sesgo -0,20% 0 ,55% -0,26% 0,08%
Sesgo Estandarizado -6,37% 46,95% -38,15% 14,08%
Error Cuadratico Medio 331525,40 435815,70 258626,60 314097,6
Estimador promedio 3,16% 13,81% 40,03% 43,00%
Sesgo 0,000021 -0,0002299 0,000060 0,000149
Thompson % Sesgo 0,07% -0,17% 0,01% 0,03%
Sesgo Estandarizado 2,46% -15,68% 2,36% 5,34%
Error Cuadratico Medio 421252,40 473848,20 374503,20 308984,6
Estimador promedio 3,19% 13,84% 40,06% 42,91%
Sesgo 0,000379 0,000055 0,000318 -0,0007522
Cochran % Sesgo 1,20% 0,04% 0,08% -0,17%
Sesgo Estandarizado 34,63% 2,74% 11,25% -29,14%
Error Cuadratico Medio 269183,60 356406,70 373914,40 463565,3
Estimador promedio 3,17% 13,89% 39,97% 42,96%
Sesgo 0,000146 0,000555 -0,000532 -0,0001697
Angers % Sesgo 0,46% 0,40% -0,13% -0,04%
Sesgo Estandarizado 25,93% 50,86% -35,65% -11,33%
Error Cuadratico Medio 381818,80 325310,40 422316,50 402683
143
Tabla 4f’. Puntajes asignados a desempeño de las simulaciones para población 6 de K=4
categorías.
144
Tabla 4g. Evaluación de desempeño de las simulaciones para población 7 de K=4
categorías.
P1 P2 P3 P4
Parámetro Poblacional
Método 9,17% 15,87% 40,03% 34,93%
Criterio p1 p2 p3 p4
Estimador promedio 9,17% 15,84% 40,09% 34,90%
Sesgo -0,000028 -0,000283 0,000541 -0,0002301
Tortora % Sesgo -0,03% -0,18% 0,13% -0,06%
Sesgo Estandarizado -3,11% -26,54% 34,35% -17,90%
Error Cuadratico Medio 388930,30 394129,70 335524,90 488360,80
Estimador promedio 9,17% 15,84% 40,09% 34,90%
Sesgo -0,000024 -0,000300 0,000547 -0,0002227
Bromaghin % Sesgo -0,03 -0,19% 0,14 -0,06%
Sesgo Estandarizado -2,85% -28,06% 33,98% -17,63%
Error Cuadratico Medio 419081,20 391472,60 315975,20 517016,8
Estimador promedio 9,17% 15,88% 40,09% 34,86%
Sesgo -0,000013 0,0001176 0,000584 -0,0006884
Fitzpatrick & Scott % Sesgo -0,01% 0,07% 0,14% -0,19%
Sesgo Estandarizado -0,95% 4,31% 23,80% -31,91%
Error Cuadratico Medio 360855,80 181929,70 360187,10 390743,3
Estimador promedio 9,16% 15,87% 40,07% 34,90%
Sesgo -0,000084 -0,0000321 0,000395 -0,0002786
Thompson % Sesgo -0,09% -0,02% 0,09% -0,08%
Sesgo Estandarizado -6,17% -1,98% 18,88% -12,41%
Error Cuadratico Medio 503498,10 400762,10 553657,10 352391,6
Estimador promedio 9,22% 15,91% 40,07% 34,80%
Sesgo 0,000486 0,000366 0,000375 -0,0012258
Cochran % Sesgo 0,53% 0,23% 0,09% -0,35%
Sesgo Estandarizado 29,84% 17,27% 14,49% -54,10%
Error Cuadratico Medio 409607,80 340753,30 433786,70 536317
Estimador promedio 9,19% 15,86% 40,06% 34,90%
Sesgo 0,000142 -0,000126 0,000287 -0,0003031
Angers % Sesgo 0,15% -0,08% 0,07% -0,08%
Sesgo Estandarizado 13,92% -9,29% 14,11% -17,79%
Error Cuadratico Medio 423826,20 416523,50 276187,60 360064,2
145
Tabla 4g’. Puntajes asignados a desempeño de las simulaciones para población 7 de K=4
categorías.
146
Tabla 4h. Evaluación de desempeño de las simulaciones para población 8 de K=4
categorías.
P1 P2 P3 P4
Parámetro Poblacional
Método 10,02% 15,01% 50,01% 24,95%
Criterio p1 p2 p3 p4
Estimador promedio 9,97% 14,99% 50,05% 24,99%
Sesgo -0,000486 -0,000242 0,000361 0,000367
Tortora % Sesgo -0,48% -0,16% 0,07% 0,15%
Sesgo Estandarizado -58,34 -27,07 22,58 28,78
Error Cuadratico Medio 422128,20 554854,90 373158,80 442832,30
Estimador promedio 10,05% 15,03% 50,02% 24,90%
Sesgo 0,000340 0,000147 0,000071 -0,000558
Bromaghin % Sesgo 0,34% 0,10% 0,01% -0,22%
Sesgo Estandarizado 45,71 13,61 4,96 -45,80
Error Cuadratico Medio 527302,40 419426,40 429454,90 416043,80
Estimador promedio 10,05% 14,98% 49,96% 25,02%
Sesgo 0,000259 -0,000372 -0,000518 0,000632
Fitzpatrick & Scott % Sesgo 0,26% -0,25% -0,10% 0,25%
Sesgo Estandarizado 18,32 -20,97 -21,31 27,22
Error Cuadratico Medio 462108,60 359512,70 409164,70 324316,30
Estimador promedio 10,05% 14,97% 49,96% 25,01%
Sesgo 0,000288 -0,000391 -0,000509 0,000612
Thompson % Sesgo 0,29% -0,26% -0,10% 0,25%
Sesgo Estandarizado 20,68 -22,33 -21,02 26,81
Error Cuadratico Medio 433234,30 327445,90 409221,30 334417,40
Estimador promedio 10,00% 15,01% 50,06% 24,93%
Sesgo -0,000188 -0,000040 0,000501 -0,000272
Cochran % Sesgo -0,19% -0,03% 0,10% -0,11%
Sesgo Estandarizado -10,68 -2,08 16,10 -11,13
Error Cuadratico Medio 270389,90 396353,10 338418,60 382965,80
Estimador promedio 9,99% 15,05% 50,02% 24,94%
Sesgo -0,000276 0,000347 0,000061 -0,000132
Angers % Sesgo -0,27% 0,23% 0,01% -0,05%
Sesgo Estandarizado -25,91 26,32 2,91 -9,76
Error Cuadratico Medio 425977,50 312721,20 265003,80 495763,80
147
Tabla 4h’. Puntajes asignados a desempeño de las simulaciones para población 8 de K=4
categorías.
148
Tabla 4i. Evaluación de desempeño de las simulaciones para población 9 de K=4
categorías.
P1 P2 P3 P4
Parámetro Poblacional
Método 3,13% 13,85% 40,02% 42,99%
Criterio p1 p2 p3 p4
Estimador promedio 3,16% 13,87% 40,01% 42,97%
Sesgo 0,000226 0,000207 -0,000174 -0,000259
Tortora % Sesgo 0,72% 0,15% -0,04% -0,06%
Sesgo Estandarizado 33,32 13,34 -9,86 -11,79
Error Cuadratico Medio 680682,50 350592,10 575059,30 419886,20
Estimador promedio 3,17% 13,82% 40,05% 42,96%
Sesgo 0,000397 -0,000294 0,000250 -0,000354
Bromaghin % Sesgo 1,27% -0,21% 0,06% -0,08%
Sesgo Estandarizado 53,86 -20,05 10,99 -12,68
Error Cuadratico Medio 544581,50 379337,20 350999,00 230383,20
Estimador promedio 3,15% 13,89% 39,98% 42,97%
Sesgo 0,000219 0,000432 -0,000415 -0,000236
Fitzpatrick & Scott % Sesgo 0,70% 0,31% -0,10% -0,05%
Sesgo Estandarizado 22,19 26,95 -19,07 -10,91
Error Cuadratico Medio 349792,00 433106,20 410671,30 489781,70
Estimador promedio 3,17% 13,80% 40,05% 42,99%
Sesgo 0,000322 -0,000445 0,000242 -0,000120
Thompson % Sesgo 1,03% -0,32% 0,06% -0,03%
Sesgo Estandarizado 37,82 -29,17 10,02 -4,12
Error Cuadratico Medio 459964,40 393602,80 328908,40 231863,60
Estimador promedio 3,13% 13,82% 40,03% 43,02%
Sesgo 0,000013 -0,000275 0,000026 0,000236
Cochran % Sesgo 0,04% -0,20% 0,01% 0,05%
Sesgo Estandarizado 1,23 -11,94 1,06 9,18
Error Cuadratico Medio 244901,90 222904,00 463648,00 383149,20
Estimador promedio 3,16% 13,87% 40,00% 42,97%
Sesgo 0,000287 0,000274 -0,000239 -0,000239
Angers % Sesgo 0,92% 0,20% -0,06% -0,07%
Sesgo Estandarizado 43,64 18,12 -12,78 -14,30
Error Cuadratico Medio 610145,90 389874,30 518170,30 384403,90
149
Tabla 4i’. Puntajes asignados a desempeño de las simulaciones para población 9 de K=4
categorías.
150
Tabla 4j. Evaluación de desempeño de las simulaciones para población 10 de K=4
categorías.
P1 P2 P3 P4
Parámetro Poblacional
Método 24,97% 25,03% 24,99% 24,99%
Criterio p1 p2 p3 p4
Estimador promedio 25,05% 25,00% 25,03% 24,92%
Sesgo 0,000708 -0,000343 0,000360 -0,000724
Tortora % Sesgo 0,28% -0,14% 0,14% -0,29%
Sesgo Estandarizado 35,82 -16,93 17,65 -31,84
Error Cuadratico Medio 437658,30 420968,30 397744,30 320679,20
Estimador promedio 25,04% 25,00% 25,03% 24,92%
Sesgo 0,000653 -0,000318 0,000360 -0,000695
Bromaghin % Sesgo 0,26% -0,13% 0,14% -0,28%
Sesgo Estandarizado 32,44 -15,96 17,39 -31,03
Error Cuadratico Medio 430370,60 478979,20 420034,60 357504,00
Estimador promedio 25,02% 25,00% 25,05% 24,92%
Sesgo 0,000495 -0,000357 0,000576 -0,000715
Fitzpatrick & Scott % Sesgo 0,20% -0,14% 0,23% -0,29%
Sesgo Estandarizado 23,04 -17,69 28,34 -32,81
Error Cuadratico Medio 365737,00 378981,10 395060,30 339453,30
Estimador promedio 24,90% 25,07% 25,09% 24,94%
Sesgo -0,000774 0,000364 0,000910 -0,000501
Thompson % Sesgo -0,31% 0,15% 0,36% -0,20%
Sesgo Estandarizado -43,89 17,52 46,67 -24,34
Error Cuadratico Medio 580270,40 336322,80 489194,00 327726,40
Estimador promedio 25,02% 24,98% 24,97% 25,03%
Sesgo 0,000416 -0,000559 -0,000250 0,000393
Cochran % Sesgo 0,17% -0,22% -0,10% 0,16%
Sesgo Estandarizado 15,75 -23,07 -6,70 16,18
Error Cuadratico Medio 419677,30 493298,80 216218,00 508197,40
Estimador promedio 24,94% 25,02% 24,98% 25,06%
Sesgo -0,000390 -0,000143 -0,000155 0,000688
Angers % Sesgo -0,16% -0,06% -0,06% 0,28%
Sesgo Estandarizado -36,81 -12,97 -13,09 64,44
Error Cuadratico Medio 388046,90 296304,60 292040,00 360269,40
151
Tabla 4j’. Puntajes asignados a desempeño de las simulaciones para población 10 de K=4
categorías.
Parámetro Poblacional
Método P1=24,97% P2=25,03% P3=24,99% P4=24,99% Total
Criterio p1 p2 p3 p4
Estimador promedio 1 3 4,5 2,5 11
Sesgo 2 4 3,5 1 10,5
Tortora
Error Cuadratico Medio 2 3 3 6 14,0
Total 5 10 11 9,5 35,5
Estimador promedio 2,5 5,5 4,5 2,5 15
Sesgo 3 5 3,5 4 15,5
Bromaghin
Error Cuadratico Medio 3 2 2 3 10
Total 8,5 12,5 10 9,5 40,5
Estimador promedio 4,5 5,5 3 2,5 15,5
Sesgo 4 3 2 2 11
Fitzpatrick & Scott
Error Cuadratico Medio 6 4 4 4 18
Total 14,5 12,5 9 8,5 44,5
Estimador promedio 2,5 2 2 5 11,5
Sesgo 1 2 1 5 9
Thompson
Error Cuadratico Medio 1 5 1 5 12
Total 4,5 9 4 15 32,5
Estimador promedio 4,5 1 1 6 12,5
Sesgo 5 1 5 6 17
Cochran
Error Cuadratico Medio 4 1 6 1 12
Total 13,5 3 12 13 41,5
Estimador promedio 6 4 6 2,5 18,5
Sesgo 6 6 6 3 21
Angers
Error Cuadratico Medio 5 6 5 2 18
Total 17 16 17 7,5 57,5
152
Tabla 4k. Evaluación de desempeño de las simulaciones para población 11 de K=5
categorías.
P1 P2 P3 P4 P5
Parámetro Poblacional
Método 3,13% 8,89% 25,02% 19,98% 42,97
Criterio p1 p2 p3 p4 p5
Estimador promedio 3,10% 8,91% 25,02% 20,02% 42,95%
Sesgo -0,000323 0,000169 -0,000001 0,0003998 -0,0002375
Tortora % Sesgo -1,03% 0,19% -0,33% 0,20% -0,06%
Sesgo Estandarizado -71,63 23,35 -0,74 40,00 -16,46
Error Cuadratico Medio 437353,80 278767,80 341438,90 375478,10 259677,5
Estimador promedio 3,14% 8,89% 25,05% 19,98% 42,94%
Sesgo 0,000051 -0,000031 0,000317 -0,0000285 -0,0003084
Bromaghin % Sesgo 0,16% -0,03% 0,13% -0,01% -0,07%
Sesgo Estandarizado 13,57 -4,52 32,51 -2,75 -27,64
Error Cuadratico Medio 350970,70 383087,30 415595,30 333841,2 486742,1
Estimador promedio 3,15% 8,85% 25,05% 19,96% 42,98%
Sesgo 0,000192 -0,0003569 0,000336 -0,0002754 0,0001041
Fitzpatrick & Scott % Sesgo 0,61% -0,40% 0,13% 0,14% 0,02%
Sesgo Estandarizado 24,00 -20,66 16,04 -13,36 5,05
Error Cuadratico Medio 533023,80 242612,00 360559,20 317431,1 465180,9
Estimador promedio 3,09% 8,90% 25,03% 20,00% 42,99%
Sesgo -0,000454 0,0001098 0,000086 0,0001403 0,0001183
Thompson % Sesgo -1,45% 0,12% 0,03% 0,07% 0,03%
Sesgo Estandarizado -51,83 7,58 4,19 7,73 5,49
Error Cuadratico Medio 433004,30 365854,60 434935,70 372905,1 404907,2
Estimador promedio 3,08% 8,90% 25,01% 20,04% 42,97%
Sesgo -0,000533 0,000121 -0,000109 0,0005317 -0,0000116
Cochran % Sesgo -1,70% 0,14% -0,04% 0,27% -0,003%
Sesgo Estandarizado -50,97 8,22 -4,79 27,89 -0,33
Error Cuadratico Medio 318168,10 415253,20 482056,50 514521 237920,7
Estimador promedio 3,12% 8,88% 24,99% 19,98% 43,02%
Sesgo -0,000104 -0,000073 -0,000229 -0,000055 0,000461
Angers % Sesgo -0,33% -0,08% -0,09% -0,28% 0,11%
Sesgo Estandarizado -22,26 -7,90 -19,70 -3,90 27,54
Error Cuadratico Medio 459322,20 334799,30 454487,60 258217,50 277640,40
153
Tabla 4k’. Puntajes asignados a desempeño de las simulaciones para población 10 de
K=4 categorías.
154
Tabla 4l. Evaluación de desempeño de las simulaciones para población 12 de K=5
categorías.
P1 P2 P3 P4 P5
Parámetro Poblacional
Método 9,18% 12,83% 15,09% 19,99% 42,98%
Criterio p1 p2 p3 p4 p5
Estimador promedio 9,23% 12,79% 15,08% 19,95% 42,96%
Sesgo 0,000481 -0,000213 0,000360 -0,000399 -0,000229
Tortora % Sesgo 0,52% -0,17% 0,24% -0,20% -0,05%
Sesgo Estandarizado 62,50 -24,65 37,56 -39,18 -17,14
Error Cuadratico Medio 465833,90 443094,60 339912,90 499042,70 393792,50
Estimador promedio 9,22% 12,81% 15,06% 19,96% 42,95%
Sesgo 0,000434 0,000011 0,000148 -0,000252 -0,000341
Bromaghin % Sesgo 0,47% 0,01% 0,10% -0,13% -0,08%
Sesgo Estandarizado 58,08 1,18 15,61 -24,83 -24,58
Error Cuadratico Medio 511483,70 410191,50 361382,20 489659,50 387629,60
Estimador promedio 9,16% 12,75% 15,05% 20,04% 42,99%
Sesgo -0,000220 -0,000585 0,000117 0,000553 0,000135
Fitzpatrick & Scott % Sesgo -0,24% -0,46% 0,08% 0,28% 0,03%
Sesgo Estandarizado -13,00 -41,04 7,45 32,10 5,41
Error Cuadratico Medio 235543,20 411851,60 439613,50 474728,20 374575,10
Estimador promedio 9,22% 12,81% 15,02% 19,94% 43,01%
Sesgo 0,000432 0,000015 -0,000235 -0,000507 0,000296
Thompson % Sesgo 0,47% 0,01% -0,16% -0,25% 0,07%
Sesgo Estandarizado 30,67 1,08 -13,07 -25,72 11,73
Error Cuadratico Medio 479183,60 420337,80 295535,50 313586,00 378423,30
Estimador promedio 9,16% 12,78% 15,06% 20,03% 42,97%
Sesgo -0,000175 -0,000295 0,000207 0,000393 -0,000130
Cochran % Sesgo -0,19% -0,23% 0,14% 0,20% -0,03%
Sesgo Estandarizado -9,66 -15,88 10,51 20,59 -5,24
Error Cuadratico Medio 264686,70 357113,60 379058,50 516587,40 503239,80
Estimador promedio 9,24% 12,81% 15,07% 19,95% 42,93%
Sesgo 0,000652 -0,000001 0,000261 -0,000439 -0,000473
Angers % Sesgo 0,71% -0,0004% 0,17% -0,22% -0,11%
Sesgo Estandarizado 62,49 -0,05 17,77 -25,78 -25,22
Error Cuadratico Medio 447690,30 314305,50 242034,10 268462,90 363238,80
155
Tabla 4l’. Puntajes asignados a desempeño de las simulaciones para población 12 de K=4
categorías.
156
Tabla 4m. Evaluación de desempeño de las simulaciones para población 13 de K=5
categorías.
Parámetro P1 P2 P3 P4 P5
Método Poblacional 9,17% 12,83% 15,09% 13,03% 49,88%
Criterio p1 p2 p3 p4 p5
Estimador promedio 9,20% 12,82% 15,09% 13,03% 49,86%
Sesgo 0,000268 -0,000106 0,000036 -0,000022 -0,000176
Tortora % Sesgo 0,29% -0,08% 0,02% -0,02% -0,04%
Sesgo Estandarizado 29,88 -10,75 3,80 -2,20 -12,20
Error Cuadratico Medio 374821,5 353245,1 485713,0 334193,7 404826,6
Estimador promedio 9,18% 12,79% 15,14% 13,04% 49,84%
Sesgo 0,000083 -0,000397 0,000571 0,000136 -0,000393
Bromaghin % Sesgo 0,09% -0,31% 0,38% 0,10% -0,08%
Sesgo Estandarizado 9,95 -41,20 49,45 12,27 -30,11
Error Cuadratico Medio 409908,0 380024,5 356160,2 339606,1 531558,5
Estimador promedio 9,17% 12,87% 15,08% 13,08% 49,79%
Sesgo -0,000013 0,000362 -0,000059 0,000539 -0,000829
Fitzpatrick & Scott % Sesgo -0,01% 0,28% -0,04% 0,41% -0,17%
Sesgo Estandarizado -0,95 16,99 -3,66 33,08 -35,11
Error Cuadratico Medio 360855,8 251075,7 518944,7 298689,9 375190,3
Estimador promedio 9,17% 12,87% 15,08% 13,09% 49,79%
Sesgo -0,000006 0,000387 -0,000055 0,000587 -0,000913
Thompson % Sesgo -0,01% 0,30% -0,04% 0,45% -0,18%
Sesgo Estandarizado -0,42 18,36 -3,30 36,53 -37,78
Error Cuadratico Medio 307317,6 240919,0 461003,2 329535,3 355127,8
Estimador promedio 9,16% 12,74% 15,18% 13,04% 49,87%
Sesgo -0,000080 -0,000887 0,000942 0,000081 -0,000056
Cochran % Sesgo -0,09% -0,69% 0,62% 0,06% -0,01%
Sesgo Estandarizado -5,42 -51,13 46,29 4,43 -2,30
Error Cuadratico Medio 450250,9 412282,3 398733,1 334593,2 489028,8
Estimador promedio 9,19% 12,82% 15,08% 13,06% 49,84%
Sesgo 0,000213 -0,000084 -0,000031 0,000250 -0,000347
Angers % Sesgo 0,23% -0,07% -0,02% 0,19% -0,07%
Sesgo Estandarizado 22,05 -5,89 -2,36 17,55 -22,88
Error Cuadratico Medio 465601,8 284864,5 418881,2 210421,8 517779,5
157
Tabla 4m’. Puntajes asignados a desempeño de las simulaciones para población 13 de
K=4 categorías.
Parámetro
Método Poblacional P1=9,17% P2=12,83% P3=15,09% P4=13,03% P5=49,88% Total
Criterio p1 p2 p3 p4 p5
Estimador promedio 1 5,5 6 6 5 23,5
Sesgo 1 5 5 6 5 22
Tortora
Error Cuadratico Medio 4 3 2 2 4 15
Total 6 13,5 13 14 14 60,5
Estimador promedio 3,5 4 2 4,5 3,5 17,5
Sesgo 3 2 2 4 3 14
Bromaghin
Error Cuadratico Medio 3 2 6 3 1 15
Total 9,5 8 10 11,5 7,5 46,5
Estimador promedio 5,5 2,5 4 2 1,5 15,5
Sesgo 5 4 3 2 2 16
Fitzpatrick & Scott
Error Cuadratico Medio 5 5 1 5 5 21
Total 15,5 11,5 8 9 8,5 52,5
Estimador promedio 5,5 2,5 4 1 1,5 14,5
Sesgo 6 3 4 1 1 15
Thompson
Error Cuadratico Medio 6 6 3 4 6 25
Total 17,5 11,5 11 6 8,5 54,5
Estimador promedio 3,5 1 1 4,5 6 16
Sesgo 4 1 1 5 6 17
Cochran
Error Cuadratico Medio 2 1 5 1 3 12
Total 9,5 3 7 10,5 15 45
Estimador promedio 2 5,5 4 3 3,5 18
Sesgo 2 6 6 3 4 21
Angers
Error Cuadratico Medio 1 4 4 6 2 17
Total 5 15,5 14 12 9,5 56
158
Tabla 4n. Evaluación de desempeño de las simulaciones para población 14 de K=5
categorías.
Parámetro P1 P2 P3 P4 P5
Método Poblacional 3,16% 8,87% 25,01% 19,99% 42,98%
Criterio p1 p2 p3 p4 p5
Estimador promedio 3,15% 8,85% 24,98% 20,04% 42,98%
Sesgo -0,000019 -0,000161 -0,000271 0,000465 -0,000015
Tortora % Sesgo -0,06% -0,18% -0,11% 0,23% -0,003%
Sesgo Estandarizado -2,03 -12,37 -15,59 27,71 -0,70
Error Cuadratico Medio 259100,3 364419,4 349084,7 344513,9 413628,0
Estimador promedio 3,16% 8,92% 25,00% 19,93% 42,99%
Sesgo 0,000044 0,000530 -0,000097 -0,000619 0,000142
Bromaghin % Sesgo 0,14% 0,60% -0,04% -0,31% 0,03%
Sesgo Estandarizado 5,67 37,41 -4,96 -37,69 7,46
Error Cuadratico Medio 283941,7 260830,7 320368,2 382713,7 475887,5
Estimador promedio 3,15% 8,92% 24,97% 19,94% 43,02%
Sesgo -0,000063 0,000572 -0,000376 -0,000488 0,000355
Fitzpatrick & Scott % Sesgo -0,20% 0,65% -0,15% -0,24% 0,08%
Sesgo Estandarizado -6,37 39,27 -19,77 -25,14 14,08
Error Cuadratico Medio 331525,4 321769,8 454579,7 360440,7 314097,6
Estimador promedio 3,15% 8,93% 24,97% 19,94% 43,01%
Sesgo -0,000057 0,000601 -0,000332 -0,000507 0,000296
Thompson % Sesgo -0,18% 0,68% -0,13% -0,25% 0,07%
Sesgo Estandarizado -5,83 41,73 -17,82 -25,72 11,73
Error Cuadratico Medio 319907,9 355217,5 533203,4 313586,0 378423,3
Estimador promedio 3,17% 8,80% 25,07% 19,94% 43,01%
Sesgo 0,000174 -0,000617 0,000596 -0,000488 0,000335
Cochran % Sesgo 0,55% -0,70% 0,24% -0,24% 0,08%
Sesgo Estandarizado 14,26 -41,19 23,90 -20,82 11,57
Error Cuadratico Medio 204658,5 472155,5 389002,8 339510,2 390420,6
Estimador promedio 3,16% 8,83% 25,01% 20,00% 43,00%
Sesgo 0,000041 -0,000356 0,000001 0,000100 0,000214
Angers % Sesgo 0,13% -0,40% 0,0006% 0,05% 0,05%
Sesgo Estandarizado 3,97 -20,16 0,05 5,42 6,98
Error Cuadratico Medio 305622,8 265221,0 263321,8 349457,8 251896,3
159
Tabla 4n’. Puntajes asignados a desempeño de las simulaciones para población 14 de
K=4 categorías.
Parámetro
Método Poblacional P1=3,16% P2=8,87% P3=25,01% P4=19,99% P5=42,98% Total
Criterio p1 p2 p3 p4 p5
Estimador promedio 3 6,0 4 3,5 6 22,5
Sesgo 6 6 4 5 6 27
Tortora
Error Cuadratico Medio 5 2 4 4 2 17
Total 14 14 12 12,5 14 66,5
Estimador promedio 5,5 3,5 5 1 5 20
Sesgo 4 4 5 1 5 19
Bromaghin
Error Cuadratico Medio 4 6 5 1 1 17
Total 13,5 13,5 15 3 11 56
Estimador promedio 3 3,5 2,5 3,5 1 13,5
Sesgo 2 3 2 3,5 1 11,5
Fitzpatrick & Scott
Error Cuadratico Medio 1 4 2 2 5 14
Total 6 10,5 6,5 9 7 39
Estimador promedio 3 2 2,5 3,5 2,5 13,5
Sesgo 3 2 3 2 3 13
Thompson
Error Cuadratico Medio 2 3 1 6 4 16
Total 8 7 6,5 11,5 9,5 42,5
Estimador promedio 1 1 1 3,5 2,5 9
Sesgo 1 1 1 3,5 2 8,5
Cochran
Error Cuadratico Medio 6 1 3 5 3 18
Total 8 3 5 12 7,5 35,5
Estimador promedio 5,5 5 6 6 4 26,5
Sesgo 5 5 6 6 4 26
Angers
Error Cuadratico Medio 3 5 6 3 4 21
Total 13,5 15 18 15 12 73,5
160
Tabla 4o. Evaluación de desempeño de las simulaciones para población 15 de K=5
categorías.
Parámetro P1 P2 P3 P4 P5
Método Poblacional 20,02% 20,04% 20,01% 19,96% 19,97%
Criterio p1 p2 p3 p4 p5
Estimador promedio 20,06% 19,95% 20,08% 19,91% 20,00%
Sesgo 0,000423 -0,000917 0,000711 -0,000498 0,000280
Tortora % Sesgo 0,21% -0,46% 0,36% -0,25% 0,14%
Sesgo Estandarizado 21,26 -42,14 32,21 -25,35 14,47
Error Cuadratico Medio 489492,1 398393,8 404230,4 488388,5 385631,4
Estimador promedio 20,06% 19,95% 20,08% 19,91% 19,99%
Sesgo 0,000443 -0,000877 0,000760 -0,000462 0,000136
Bromaghin % Sesgo 0,22% -0,44% 0,38% -0,23% 0,07%
Sesgo Estandarizado 22,64 -40,97 34,98 -23,97 6,85
Error Cuadratico Medio 472104,7 405383,3 375669,7 466440,6 427284,3
Estimador promedio 20,04% 19,92% 20,09% 19,93% 20,02%
Sesgo 0,000238 -0,001195 0,000807 -0,000337 0,000486
Fitzpatrick & Scott % Sesgo 0,12% -0,60% 0,40% -0,17% 0,24%
Sesgo Estandarizado 15,51 -67,78 37,67 -18,51 23,85
Error Cuadratico Medio 604809,7 475119,7 305255,1 445229,3 347386,4
Estimador promedio 20,05% 19,92% 20,09% 19,93% 20,02%
Sesgo 0,000266 -0,001201 0,000782 -0,000307 0,000460
Thompson % Sesgo 0,13% -0,60% 0,39% -0,15% 0,23%
Sesgo Estandarizado 16,97 -69,39 36,01 -17,17 22,92
Error Cuadratico Medio 655531,6 521725,1 335090,1 457656,6 371580,6
Estimador promedio 20,02% 19,92% 20,07% 19,94% 20,05%
Sesgo -0,000016 -0,001153 0,000630 -0,000240 0,000779
Cochran % Sesgo -0,01% -0,58% 0,32% -0,12% 0,39%
Sesgo Estandarizado -0,58 -42,72 19,12 -8,87 26,73
Error Cuadratico Medio 380653,0 418263,2 270776,2 379776,3 332511,8
Estimador promedio 20,09% 19,96% 20,06% 19,90% 19,98%
Sesgo 0,000715 -0,000754 0,000518 -0,000573 0,000094
Angers % Sesgo 0,36% -0,38% 0,26% -0,29% 0,05%
Sesgo Estandarizado 36,08 -32,53 23,40 -29,15 4,88
Error Cuadratico Medio 494063,9 350542,2 402004,7 487205,9 387984,7
161
Tabla 4o’. Puntajes asignados a desempeño de las simulaciones para población 15 de
K=4 categorías.
Parámetro
Método Poblacional P1=20,02% P2=20,04% P3=20,01% P4=19,96% P5=19,97% Total
Criterio p1 p2 p3 p4 p5
Estimador promedio 2,5 4,5 3,5 2,5 4 17
Sesgo 3 4 3 2 4 16
Tortora
Error Cuadratico Medio 4 5 1 1 3 14
Total 9,5 13,5 7,5 5,5 11 47
Estimador promedio 2,5 4,5 3,5 2,5 5 18
Sesgo 2 5 4 3 5 19
Bromaghin
Error Cuadratico Medio 5 4 3 3 1 16
Total 9,5 13,5 10,5 8,5 11 53
Estimador promedio 5 2 1,5 4,5 2,5 15,5
Sesgo 5 2 1 4 2 14
Fitzpatrick & Scott
Error Cuadratico Medio 2 2 5 5 5 19
Total 12 6 7,5 13,5 10 49
Estimador promedio 4 2 1,5 4,5 2,5 14,5
Sesgo 4 1 2 5 3 15
Thompson
Error Cuadratico Medio 1 1 4 4 4 14
Total 9 4 7,5 13,5 9,5 43,5
Estimador promedio 6 2 5 6 1 20
Sesgo 6 3 5 6 1 21
Cochran
Error Cuadratico Medio 6 3 6 6 6 27
Total 18 8 16 18 8 68
Estimador promedio 1 6 6 1 6 20
Sesgo 1 6 6 1 6 20
Angers
Error Cuadratico Medio 3 6 2 2 2 15
Total 5 18 14 4 14 55
162
Tabla 4p. Evaluación de desempeño de las simulaciones para población 16 de K=6
categorías.
Parámetro P1 P2 P3 P4 P5 P6
Método Poblacional 4,02% 12,97% 23,03% 17,00% 22,00% 20,98%
Criterio p1 p2 p3 p4 p5 p6
Estimador promedio 4,02% 12,96% 22,99% 17,04% 22,04% 20,96%
Sesgo 0,000013 -0,000122 -0,000397 0,000407 0,000376 -0,000277
Tortora % Sesgo 0,03% -0,09% -0,17% 0,24% 0,17% -0,13%
Sesgo Estandarizado 2,78 -16,71 -38,67 57,26 44,98 -30,53
Error Cuadratico Medio 330236,8 332978,0 306920,5 482952,6 386004,7 341192,2
Estimador promedio 4,02% 12,97% 23,00% 17,02% 22,04% 20,95%
Sesgo -0,000051 0,000006 -0,000314 0,000235 0,000424 -0,000301
Bromaghin % Sesgo -0,13% 0,005% -0,14% 0,14% 0,19% -0,14%
Sesgo Estandarizado -11,33 0,87 -29,87 32,05 50,30 -32,26
Error Cuadratico Medio 361478,2 351867,1 292797,8 405778,4 408710,8 316788,1
Estimador promedio 4,01% 13,05% 22,95% 16,97% 22,09% 20,93%
Sesgo -0,000115 0,000811 -0,000774 -0,000277 0,000890 -0,000535
Fitzpatrick & Scott % Sesgo -0,29% 0,63% -0,34% -0,16% 0,40% -0,25%
Sesgo Estandarizado -11,19 58,24 -39,07 -14,17 47,24 -26,34
Error Cuadratico Medio 229317,2 525718,1 300315,4 325498,8 366125,0 333951,1
Estimador promedio 4,01% 13,05% 22,96% 16,97% 22,08% 20,93%
Sesgo -0,000113 0,000846 -0,000733 -0,000295 0,000871 -0,000575
Thompson % Sesgo -0,28% 0,65% -0,32% -0,17% 0,40% -0,27%
Sesgo Estandarizado -11,14 59,10 -36,56 -15,33 47,08 -28,09
Error Cuadratico Medio 246670,7 544486,6 332959,6 368721,3 353355,1 281874,3
Estimador promedio 4,08% 12,92% 23,03% 16,93% 22,01% 21,04%
Sesgo 0,000568 -0,000488 -0,000049 -0,000691 0,000093 0,000566
Cochran % Sesgo 1,41% -0,38% -0,02% -0,41% 0,04% 0,27%
Sesgo Estandarizado 44,80 -17,58 -1,66 -29,75 2,94 20,47
Error Cuadratico Medio 357197,8 243130,3 335324,8 448468,5 316870,3 361187,8
Estimador promedio 4,03% 13,00% 23,02% 16,97% 22,00% 20,97%
Sesgo 0,000073 0,000343 -0,000158 -0,000209 0,000036 -0,000085
Angers % Sesgo 0,18% 0,26% -0,07% -0,12% 0,02% -0,04%
Sesgo Estandarizado 12,13 34,42 -13,18 -21,68 2,84 -7,83
Error Cuadratico Medio 333585,7 308404,5 373464,9 440413,8 372518,6 406406,8
163
Tabla 4p’. Puntajes asignados a desempeño de las simulaciones para población 16 de K=5 categorías.
Parámetro
Método Poblacional P1=4,02% P2=12,97% P3=23,03% P4=17,00% P5=22,00% P6=20,98% Total
Criterio p1 p2 p3 p4 p5 p6
Estimador promedio 5,5 5 3 2 3,5 5 24
Sesgo 6 5 3 2 4 5 25
Tortora
Error Cuadratico Medio 4 4 4 1 2 3 18
Total 15,5 14 10 5 9,5 13 67
Estimador promedio 5,5 6 4 6 3,5 4 29
Sesgo 5 6 4 5 3 4 27
Bromaghin
Error Cuadratico Medio 1 3 6 4 1 5 20
Total 11,5 15 14 15 7,5 13 76
Estimador promedio 3 1,5 1 4 1 2,5 13
Sesgo 2 2 1 4 1 3 13
Fitzpatrick & Scott
Error Cuadratico Medio 6 2 5 6 4 4 27
Total 11 5,5 7 14 6 9,5 53
Estimador promedio 3 1,5 2 4 2 2,5 15
Sesgo 3 1 2 3 2 1 12
Thompson
Error Cuadratico Medio 5 1 3 5 5 6 25
Total 11 3,5 7 12 9 9,5 52
Estimador promedio 1 3 6 1 5 1 17
Sesgo 1 3 6 1 5 2 18
Cochran
Error Cuadratico Medio 2 6 2 2 6 2 20
Total 4 12 14 4 16 5 55
Estimador promedio 3 4 5 4 6 6 28
Sesgo 1 4 5 6 6 6 28
Angers
Error Cuadratico Medio 3 5 1 3 3 1 16
Total 7 13 11 13 15 13 72
164
Tabla 4q. Evaluación de desempeño de las simulaciones para
población 17 de K=6 categorías.
Parámetro P1 P2 P3 P4 P5 P6
Método Poblacional 8,99% 16,04% 20,05% 20,02% 19,91% 14,99%
Criterio p1 p2 p3 p4 p5 p6
Estimador promedio 9,00% 16,06% 20,05% 20,03% 19,84% 15,02%
Sesgo 0,000055 0,000212 0,000003 0,000164 -0,000717 0,000284
Tortora % Sesgo 0,06% 0,13% 0,001% 0,08% -0,36% 0,19%
Sesgo Estandarizado 6,98 19,88 0,26 14,78 -73,06 29,02
Error Cuadratico Medio 415083,9 406575,2 443274,1 358704,1 502543,8 429789,7
Estimador promedio 9,03% 15,97% 20,07% 20,00% 19,92% 15,00%
Sesgo 0,000367 -0,000633 0,000219 -0,000163 0,000090 0,000121
Bromaghin % Sesgo 0,41% -0,39% 0,11% -0,08% 0,04% 0,08%
Sesgo Estandarizado 48,32 -65,00 18,48 -13,79 7,18 12,70
Error Cuadratico Medio 426815,2 434197,0 397334,3 336491,6 292469,5 421828,4
Estimador promedio 9,05% 16,01% 20,11% 20,02% 19,85% 14,96%
Sesgo 0,000564 -0,000302 0,000615 0,000001 -0,000581 -0,000297
Fitzpatrick & Scott % Sesgo 0,63% -0,19% 0,31% 0,0003% -0,29% -0,20%
Sesgo Estandarizado 45,09 -20,00 27,97 0,04 -27,73 -18,17
Error Cuadratico Medio 419259,1 563499,2 262918,3 555516,2 260874,9 442937,4
Estimador promedio 9,02% 16,05% 20,07% 19,97% 19,93% 14,96%
Sesgo 0,000228 0,000153 0,000232 -0,000500 0,000208 -0,000320
Thompson % Sesgo 0,25% 0,10% 0,12% -0,25% 0,10% -0,21%
Sesgo Estandarizado 16,89 8,57 12,00 -26,77 11,61 -18,92
Error Cuadratico Medio 428626,7 417732,4 412730,8 459766,2 434079,2 365249,5
Estimador promedio 9,04% 16,11% 19,96% 20,07% 19,94% 14,89%
Sesgo 0,000428 0,000718 -0,000928 0,000533 0,000297 -0,001048
Cochran % Sesgo 0,48% 0,45% -0,46% 0,27% 0,15% -0,70%
Sesgo Estandarizado 17,73 30,40 -25,85 23,52 10,05 -39,99
Error Cuadratico Medio 234281,3 372900,6 239531,7 578178,9 306460,6 362351,3
Estimador promedio 9,01% 15,99% 20,09% 20,04% 19,86% 15,01%
Sesgo 0,000113 -0,000477 0,000426 0,000247 -0,000494 0,000186
Angers % Sesgo 0,13% -0,30% 0,21% 0,12% -0,25% 0,12%
Sesgo Estandarizado 9,61 -38,04 23,77 15,45 -36,02 15,36
Error Cuadratico Medio 291827,9 403541,3 257865,5 278279,1 467057,4 473634,4
165
Tabla 4q’. Puntajes asignados a desempeño de las simulaciones para población 17 de K=5 categorías.
Parámetro
Método Poblacional P1=8,99% P2=16,04% P3=20,05% P4=20,02% P5=19,91% P6=14,99% Total
Criterio p1 p2 p3 p4 p5 p6
Estimador promedio 6 5 6 5 1 3 26
Sesgo 6 5 6 4 1 4 26
Tortora
Error Cuadratico Medio 4 4 1 4 1 3 17
Total 16 14 13 13 3 10 69
Estimador promedio 3 1,5 4,5 3,5 6 6 24,5
Sesgo 3 2 5 5 6 6 27
Bromaghin
Error Cuadratico Medio 2 2 3 5 5 4 21
Total 8 5,5 12,5 13,5 17 16 72,5
Estimador promedio 1 4 2 6 2 3,0 18
Sesgo 1 4 2 6 2 3 18
Fitzpatrick & Scott
Error Cuadratico Medio 3 1 4 2 6 2 18
Total 5 9 8 14 10 8 54
Estimador promedio 4 6 4,5 1,5 5 3,0 24
Sesgo 4 6 4 2 5 2 23
Thompson
Error Cuadratico Medio 1 3 2 3 3 5 17
Total 9 15 10,5 6,5 13 10 64
Estimador promedio 2 1,5 1 1,5 4 1 11
Sesgo 2 1 1 1 4 1 10
Cochran
Error Cuadratico Medio 6 6 6 1 4 6 29
Total 10 8,5 8 3,5 12 8 50
Estimador promedio 5 3 3 3,5 3 5 22,5
Sesgo 5 3 3 3 3 5 22
Angers
Error Cuadratico Medio 5 5 5 6 2 1 24
Total 15 11 11 12,5 8 11 68,5
166
Tabla 4r. Evaluación de desempeño de las simulaciones para población
18 de K=6 categorías.
Parámetro P1 P2 P3 P4 P5 P6
Método Poblacional 10,06% 9,96% 50,04% 9,98% 10,01% 9,95%
Criterio p1 p2 p3 p4 p5 p6
Estimador promedio 10,08% 9,94% 50,01% 10,00% 10,01% 9,97%
Sesgo 0,000195 -0,000184 -0,000289 0,000140 -0,000012 0,000149
Tortora % Sesgo 0,19% -0,18% -0,06% 0,14% -0,01% 0,15%
Sesgo Estandarizado 25,75 -21,34 -22,45 20,10 -1,65 15,75
Error Cuadratico Medio 472736,0 310656,6 415881,6 497901,3 544014,4 300967,4
Estimador promedio 10,05% 9,97% 49,99% 9,96% 10,04% 10,00%
Sesgo -0,000122 0,000131 -0,000552 -0,000252 0,000328 0,000466
Bromaghin % Sesgo -0,12% 0,13% -0,11% -0,25% 0,33% 0,47%
Sesgo Estandarizado -13,22 16,72 -44,69 -24,45 41,93 44,14
Error Cuadratico Medio 311084,0 467399,0 463836,3 236138,6 491202,3 203719,9
Estimador promedio 10,14% 9,96% 49,94% 10,02% 9,97% 9,98%
Sesgo 0,000795 0,000025 -0,001062 0,000372 -0,000365 0,000235
Fitzpatrick & Scott % Sesgo 0,79% 0,03% -0,21% 0,37% -0,36% 0,24%
Sesgo Estandarizado 55,04 1,84 -50,85 24,09 -25,43 17,10
Error Cuadratico Medio 406772,7 361572,9 459118,4 269727,7 459144,3 462902,1
Estimador promedio 10,01% 9,93% 50,02% 10,02% 10,03% 9,98%
Sesgo -0,000441 -0,000272 -0,000199 0,000379 0,000247 0,000284
Thompson % Sesgo -0,44% -0,27% -0,04% 0,38% 0,25% 0,29%
Sesgo Estandarizado -32,81 -18,20 -8,96 27,52 20,38 21,02
Error Cuadratico Medio 428722,5 277383,0 469591,5 480705,3 587694,6 512797,4
Estimador promedio 10,08% 9,93% 50,07% 10,00% 10,00% 9,92%
Sesgo 0,000179 -0,000208 0,000241 0,000177 -0,000034 -0,000355
Cochran % Sesgo 0,18% -0,21% 0,05% 0,18% -0,03% -0,36%
Sesgo Estandarizado 11,60 -12,72 9,06 9,53 -2,22 -22,77
Error Cuadratico Medio 375729,1 453630,4 364945,3 366828,4 567103,4 398863,5
Estimador promedio 10,09% 9,93% 50,02% 9,99% 10,00% 9,97%
Sesgo 0,000287 -0,000230 -0,000232 0,000082 -0,000030 0,000122
Angers % Sesgo 0,28% -0,23% -0,05% 0,08% -0,03% 0,12%
Sesgo Estandarizado 34,67 -23,80 -16,53 10,57 -4,03 12,34
Error Cuadratico Medio 369842,0 302755,9 363401,0 439917,2 571445,8 297775,3
167
Tabla 4r’. Puntajes asignados a desempeño de las simulaciones para población 18 de K=5 categorías.
Parámetro
Método Poblacional P1=10,06% P2=9,96% P3=50,04% P4=9,98% P5=10,01% P6=9,95% Total
Criterio p1 p2 p3 p4 p5 p6
Estimador promedio 4,5 4 3,5 4 6 5,5 27,5
Sesgo 4 4 3 5 6 5 27
Tortora
Error Cuadratico Medio 1 4 4 1 4 4 18
Total 9,5 12 10,5 10 16 14,5 72,5
Estimador promedio 6 5 2 4 2 1 20
Sesgo 6 5 2 3 2 1 19
Bromaghin
Error Cuadratico Medio 6 1 2 6 5 6 26
Total 18 11 6 13 9 8 65
Estimador promedio 1 6 1 1,5 1 3 13,5
Sesgo 1 6 1 2 1 4 15
Fitzpatrick & Scott
Error Cuadratico Medio 3 3 3 5 6 2 22
Total 5 15 5 8,5 8 9 50,5
Estimador promedio 2 2 5,5 1,5 3 3 17
Sesgo 2 1 6 1 3 3 16
Thompson
Error Cuadratico Medio 2 6 1 2 1 1 13
Total 6 9 12,5 4,5 7 7 46
Estimador promedio 4,5 2 3,5 4 4,5 3 21,5
Sesgo 5 3 4 4 4 2 22
Cochran
Error Cuadratico Medio 4 2 5 4 3 3 21
Total 13,5 7 12,5 12 11,5 8 64,5
Estimador promedio 3 2 5,5 6 4,5 5,5 26,5
Sesgo 3 2 5 6 5 6 27
Angers
Error Cuadratico Medio 5 5 6 3 2 5 26
Total 11 9 16,5 15 11,5 16,5 79,5
168
Tabla 4s. Evaluación de desempeño de las simulaciones para población
19 de K=6 categorías.
Parámetro P1 P2 P3 P4 P5 P6
Método Poblacional 3,99% 12,99% 22,99% 17,03% 22,05% 20,95%
Criterio p1 p2 p3 p4 p5 p6
Estimador promedio 4,04% 12,94% 23,03% 17,00% 22,07% 20,93%
Sesgo 0,000469 -0,000452 0,000317 -0,000288 0,000212 -0,000259
Tortora % Sesgo 1,18% -0,35% 0,14% -0,17% 0,10% -0,12%
Sesgo Estandarizado 63,19 -33,68 20,06 -17,32 11,79 -17,81
Error Cuadratico Medio 484006,9 427356,8 418508,9 341470,4 345524,4 493339,9
Estimador promedio 4,03% 13,00% 22,99% 17,01% 21,99% 20,98%
Sesgo 0,000379 0,000139 -0,000065 -0,000188 -0,000531 0,000266
Bromaghin % Sesgo 0,95% 0,11% -0,03% -0,11% -0,24% 0,13%
Sesgo Estandarizado 50,95 10,38 -3,69 -11,51 -28,43 16,97
Error Cuadratico Medio 475052,2 473389,3 398435,5 331490,7 304402,8 470222,4
Estimador promedio 4,02% 13,02% 23,02% 16,96% 21,98% 20,99%
Sesgo 0,000308 0,000314 0,000253 -0,000639 -0,000661 0,000425
Fitzpatrick & Scott % Sesgo 0,77% 0,24% 0,11% -0,38% -0,30% 0,20%
Sesgo Estandarizado 30,08 20,73 14,26 -38,88 -29,67 22,05
Error Cuadratico Medio 257733,0 461550,3 552636,4 486058,0 320473,3 354840,5
Estimador promedio 4,04% 12,93% 23,05% 16,99% 22,04% 20,94%
Sesgo 0,000498 -0,000621 0,000592 -0,000350 -0,000012 -0,000108
Thompson % Sesgo 1,25% -0,48% 0,26% -0,21% -0,01% -0,05%
Sesgo Estandarizado 52,66 -42,17 29,00 -20,99 -0,58 -5,26
Error Cuadratico Medio 501407,8 357687,8 330156,8 463702,0 456871,0 356475,5
Estimador promedio 3,95% 12,98% 23,01% 17,07% 22,04% 20,95%
Sesgo -0,000396 -0,000063 0,000186 0,000420 -0,000078 -0,000069
Cochran % Sesgo -0,99% -0,05% 0,08% 0,25% -0,04% -0,03%
Sesgo Estandarizado -37,48 -4,01 8,92 18,57 -2,92 -2,94
Error Cuadratico Medio 434943,4 555845,9 504130,3 384655,1 304665,1 379829,1
Estimador promedio 3,95% 12,88% 23,09% 17,05% 21,98% 21,05%
Sesgo -0,000372 -0,001052 0,000948 0,000183 -0,000694 0,000986
Angers % Sesgo -0,93% -0,81% 0,41% 0,11% -0,31% 0,47%
Sesgo Estandarizado -34,11 -60,51 40,19 7,66 -33,94 48,75
Error Cuadratico Medio 354599,1 394652,2 326634,1 286391,5 392841,0 377673,2
169
Tabla 4s’. Puntajes asignados a desempeño de las simulaciones para población 19 de K=5 categorías.
Parámetro
Método Poblacional P1=3,99% P2=12,99% P3=22,99% P4=17,03% P5=22,05% P6=20,95% Total
Criterio p1 p2 p3 p4 p5 p6
Estimador promedio 1,5 3 3 4 4 4 19,5
Sesgo 2 3 3 4 4 4 20
Tortora
Error Cuadratico Medio 2 4 3 4 3 1 17
Total 5,5 10 9 12 11 9 56,5
Estimador promedio 4 5,5 6 5,5 3 3 27
Sesgo 4 5 6 5 3 3 26
Bromaghin
Error Cuadratico Medio 3 2 4 5 6 2 22
Total 11 12,5 16 15,5 12 8 75
Estimador promedio 6 4 4 1 1,5 2 18,5
Sesgo 6 4 4 1 2 2 19
Fitzpatrick & Scott
Error Cuadratico Medio 6 3 1 1 4 6 21
Total 18 11 9 3 7,5 10 58,5
Estimador promedio 1,5 2 2 2,5 5,5 5 18,5
Sesgo 1 2 2 3 6 5 19
Thompson
Error Cuadratico Medio 1 6 5 2 1 5 20
Total 3,5 10 9 7,5 12,5 15 58
Estimador promedio 4 5,5 5 2,5 5,5 6 28,5
Sesgo 3 6 5 2 5 6 27
Cochran
Error Cuadratico Medio 4 1 2 3 5 3 18
Total 11 12,5 12 7,5 15,5 15 73,5
Estimador promedio 4 1 1 5,5 1,5 1,0 14
Sesgo 5 1 1 6 1 1 15
Angers
Error Cuadratico Medio 5 5 6 6 2 4 28
Total 14 7 8 17,5 4,5 6 57
170
Tabla 4t. Evaluación de desempeño de las simulaciones para población
20 de K=6 categorías.
P1 P2 P3 P4 P5 P6
Parámetro Poblacional
Método 16,66% 16,74% 16,61% 16,67% 16,65% 16,67%
Criterio p1 p2 p3 p4 p5 p6
Estimador promedio 16,64% 16,77% 16,58% 16,70% 16,65% 16,66%
Sesgo -0,000296 0,000316 -0,000231 0,000258 0,000064 -0,000111
Tortora % Sesgo -0,18% 0,19% -0,14% 0,15% 0,04% -0,07%
Sesgo Estandarizado -18,53 17,43 -13,05 16,67 3,48 -6,57
Error Cuadratico Medio 436176,0 344088,4 340106,1 398744,3 291068,6 334297,1
Estimador promedio 16,64% 16,76% 16,60% 16,70% 16,64% 16,67%
Sesgo -0,000281 0,000212 -0,000079 0,000282 -0,000071 -0,000064
Bromaghin % Sesgo -0,17% 0,13% -0,05% 0,17% -0,04% -0,04%
Sesgo Estandarizado -17,81 11,80 -4,51 17,88 -3,90 -3,83
Error Cuadratico Medio 396365,2 347867,7 362100,7 390194,6 309145,4 356048,8
Estimador promedio 16,58% 16,77% 16,61% 16,75% 16,64% 16,65%
Sesgo -0,000808 0,000356 0,000075 0,000733 -0,000098 -0,000258
Fitzpatrick & Scott % Sesgo -0,48% 0,21% 0,05% 0,44% -0,06% -0,15%
Sesgo Estandarizado -41,44 20,87 4,44 38,61 -4,92 -13,35
Error Cuadratico Medio 363033,8 421500,0 436117,6 380738,6 335503,5 367659,8
Estimador promedio 16,69% 16,78% 16,73% 16,55% 16,65% 16,61%
Sesgo 0,000205 0,000386 0,001192 -0,001263 0,000080 -0,000599
Thompson % Sesgo 0,12% 0,23% 0,72% -0,76% 0,05% -0,36%
Sesgo Estandarizado 12,01 22,21 68,00 -63,30 4,67 -34,71
Error Cuadratico Medio 423473,5 502746,8 442829,6 304878,5 433039,9 405974,7
Estimador promedio 16,68% 16,72% 16,73% 16,50% 16,72% 16,65%
Sesgo 0,000199 -0,000185 0,001222 -0,001713 0,000753 -0,000276
Cochran % Sesgo 0,12% -0,11% 0,74% -1,03% 0,45% -0,17%
Sesgo Estandarizado 8,79 -6,19 54,40 -58,86 24,01 -8,73
Error Cuadratico Medio 572812,2 356041,3 541747,1 348545,8 291102,7 296197,3
Estimador promedio 16,74% 16,74% 16,55% 16,68% 16,69% 16,60%
Sesgo 0,000742 0,000032 -0,000556 0,000056 0,000486 -0,000761
Angers % Sesgo 0,45% 0,02% -0,33% 0,03% 0,29% -0,46%
Sesgo Estandarizado 43,52 1,48 -38,38 3,55 29,49 -51,15
Error Cuadratico Medio 360526,7 182258,6 505352,5 432985,7 361375,1 420064,2
171
Tabla 4t’. Puntajes asignados a desempeño de las simulaciones para población 20 de K=6 categorías.
Parámetro Poblacional
Método P1=16,66% P2=16,74% P3=16,61% P4=16,67% P5=16,65% P6=16,67% Total
Criterio p1 p2 p3 p4 p5 p6
Estimador promedio 5 2,5 4 4,5 5,5 5 26,5
Sesgo 3 3 4 5 6 5 26
Tortora
Error Cuadratico Medio 2 5 6 2 6 5 26
Total 10 10,5 14 11,5 17,5 15 78,5
Estimador promedio 5 4,5 5 4,5 3,5 6 28,5
Sesgo 4 4 5 4 5 6 28
Bromaghin
Error Cuadratico Medio 4 4 5 3 4 4 24
Total 13 12,5 15 11,5 12,5 16 80,5
Estimador promedio 1,5 2,5 6 3 3,5 3,5 20
Sesgo 1 2 6 3 3 4 19
Fitzpatrick & Scott
Error Cuadratico Medio 5 1 4 4 3 3 20
Total 7,5 5,5 16 10 9,5 10,5 59
Estimador promedio 3 1 2 2 5,5 2 15,5
Sesgo 5 1 2 2 4 2 16
Thompson
Error Cuadratico Medio 3 2 3 6 1 2 17
Total 11 4 7 10 10,5 6 48,5
Estimador promedio 5 4,5 1 1 1 3,5 16
Sesgo 6 5 1 1 1 3 17
Cochran
Error Cuadratico Medio 1 3 1 5 5 6 21
Total 12 12,5 3 7 7 12,5 54
Estimador promedio 2 5 3 4,5 2 1 16,5
Sesgo 2 6 3 6 2 1 20
Angers
Error Cuadratico Medio 6 6 2 1 2 1 18
Total 10 17 8 11,5 6 3 54,5
172
Tabla 4u. Evaluación de desempeño de las simulaciones para
población 21 de K=7 categorías.
P1 P2 P3 P4 P5 P6 P7
Parámetro Poblacional
Método 3,99% 15,99% 14,94% 15,01% 15,00% 25,07% 9,99%
Criterio p1 p2 p3 p4 p5 p6 p7
Estimador promedio 3,98% 15,98% 14,95% 15,00% 15,03% 25,05% 10,00%
Sesgo -0,000088 -0,000019 0,000054 -0,000044 0,000261 -0,000188 0,000024
Tortora % Sesgo -0,22% -0,01% 0,04% -0,03% 0,17% -0,07% 0,02%
Sesgo Estandarizado -21,41 -2,40 7,81 -5,03 36,00 -25,16 3,68
Error Cuadratico Medio 393219,5 355805,0 399154,5 270846,6 387322,1 525243,6 338357,5
Estimador promedio 4,00% 16,02% 14,93% 14,99% 14,98% 25,09% 9,99%
Sesgo 0,000042 0,000296 -0,000086 -0,000155 -0,000264 0,000162 0,000005
Bromaghin % Sesgo 0,10% 0,19% -0,06% -0,10% -0,18% 0,06% 0,01%
Sesgo Estandarizado 10,06 38,40 -14,12 -20,29 -37,50 19,87 1,02
Error Cuadratico Medio 369453,5 374820,3 526778,4 351522,4 424768,3 501833,4 488907,6
Estimador promedio 4,00% 15,92% 14,93% 15,07% 15,03% 25,06% 10,00%
Sesgo 0,000045 -0,000702 -0,000080 0,000571 0,000233 -0,000114 0,000048
Fitzpatrick & Scott % Sesgo 0,11% -0,44% -0,05% 0,38% 0,16% -0,05% 0,05%
Sesgo Estandarizado 4,32 -42,20 -4,80 35,17 13,23 -5,55 3,54
Error Cuadratico Medio 409395,3 424858,8 376471,5 434793,8 373487,0 340512,3 508671,2
Estimador promedio 3,98% 16,07% 14,92% 14,96% 14,96% 25,10% 10,01%
Sesgo -0,000092 0,000824 -0,000277 -0,000492 -0,000415 0,000301 0,000150
Thompson % Sesgo -0,23% 0,52% -0,19% -0,33% -0,28% 0,12% 0,15%
Sesgo Estandarizado -8,46 49,92 -15,25 -26,19 -23,64 14,56 11,16
Error Cuadratico Medio 382165,3 478952,3 351404,9 368529,4 418961,3 391406,6 493109,9
Estimador promedio 3,99% 16,06% 14,95% 14,91% 14,91% 25,11% 10,07%
Sesgo -0,000025 0,000770 0,000024 -0,001028 -0,000937 0,000413 0,000782
Cochran % Sesgo -0,06% 0,48% 0,02% -0,69% -0,62% 0,16% 0,78%
Sesgo Estandarizado -1,57 34,42 1,07 -39,01 -35,78 16,72 41,77
Error Cuadratico Medio 289004,2 422771,9 404102,8 329594,4 231661,3 403546,9 332100,6
Estimador promedio 3,99% 16,01% 14,95% 15,02% 15,00% 25,03% 9,99%
Sesgo 0,000021 0,000247 0,000087 0,000118 0,000009 -0,000461 -0,000021
Angers % Sesgo 0,05% 0,15% 0,06% 0,08% 0,01% -0,18% -0,02%
Sesgo Estandarizado 4,05 27,41 7,41 12,07 0,66 -40,43 -2,57
Error Cuadratico Medio 381892,6 474178,3 270166,0 431277,8 189478,5 391683,4 380161,1
173
Tabla 4u’. Puntajes asignados a desempeño de las simulaciones para población 21 de K=7 categorías.
Parámetro Poblacional
Método P1=3,99% P2=15,99% P3=14,94% P4=15,01% P5=15,00% P6=25,07% P7=9,99% Total
Criterio p1 p2 p3 p4 p5 p6 p7
Estimador promedio 5 6 4 5,5 3,5 4,5 3,5 32
Sesgo 2 6 2 6 4 4 4 28
Tortora
Error Cuadratico Medio 2 6 3 6 3 1 5 26
Total 9 18 9 17,5 10,5 9,5 12,5 86
Estimador promedio 2 4 4 4 5 4,5 3,5 27
Sesgo 4 4 4 4 3 5 6 30
Bromaghin
Error Cuadratico Medio 5 5 1 4 1 2 3 21
Total 11 13 9 12 9 11,5 12,5 78
Estimador promedio 2 2,5 4 2 3,5 6 5 25
Sesgo 3 2 3 2 5 6 3 24
Fitzpatrick & Scott
Error Cuadratico Medio 1 3 4 1 4 6 1 20
Total 6 7,5 11 5 12,5 18 9 69
Estimador promedio 2 1 1 3 2 3 2 14
Sesgo 1 1 6 3 2 3 2 18
Thompson
Error Cuadratico Medio 3 1 5 3 2 5 2 21
Total 6 3 12 9 6 11 6 53
Estimador promedio 5 2,5 4 1 1 1,5 1 16
Sesgo 5 3 1 1 1 2 1 14
Cochran
Error Cuadratico Medio 6 4 2 5 5 3 6 31
Total 16 9,5 7 7 7 6,5 8 61
Estimador promedio 5 5 4 5,5 6 1,5 6 33
Sesgo 6 5 5 5 6 1 5 33
Angers
Error Cuadratico Medio 4 2 6 2 6 4 4 28
Total 15 12 15 12,5 18 6,5 15 94
174
Tabla 4v. Evaluación de desempeño de las simulaciones para
población 22 de K=7 categorías.
P1 P2 P3 P4 P5 P6 P7
Parámetro Poblacional
Método 9,97% 13,98% 15,98% 19,99% 15,01% 13,06% 12,00%
Criterio p1 p2 p3 p4 p5 p6 p7
Estimador promedio 9,94% 13,97% 15,97% 20,01% 15,03% 13,05% 12,03%
Sesgo -0,000312 -0,000067 -0,000168 0,000145 0,000215 -0,000115 0,000303
Tortora % Sesgo -0,31% -0,05% -0,10% 0,07% 0,14% -0,09% 0,25%
Sesgo Estandarizado -40,47 -5,67 -18,06 15,40 22,09 -14,22 36,84
Error Cuadratico Medio 359607,6 258304,7 409591,7 482958,2 403734,5 484337,3 464253,6
Estimador promedio 9,97% 13,96% 15,97% 20,00% 15,01% 13,10% 12,00%
Sesgo -0,000058 -0,000250 -0,000168 0,000074 0,000032 0,000355 0,000014
Bromaghin % Sesgo -0,06% -0,18% -0,10% 0,04% 0,02% 0,27% 0,01%
Sesgo Estandarizado -6,48 -29,55 -16,79 6,49 3,62 41,30 1,49
Error Cuadratico Medio 321868,1 474700,8 401284,7 345268,2 447097,7 406157,8 370063,3
Estimador promedio 10,05% 13,96% 15,97% 20,07% 14,97% 13,02% 11,96%
Sesgo 0,000784 -0,000230 -0,000127 0,000802 -0,000385 -0,000403 -0,000441
Fitzpatrick & Scott % Sesgo 0,79% -0,16% -0,08% 0,40% -0,26% -0,31% -0,37%
Sesgo Estandarizado 60,92 -14,35 -8,35 36,26 -19,79 -21,33 -28,47
Error Cuadratico Medio 549747,3 486145,8 501490,5 279310,7 303504,7 230529,7 369569,1
Estimador promedio 10,05% 13,96% 15,98% 20,07% 14,97% 13,03% 11,95%
Sesgo 0,000741 -0,000230 -0,000068 0,000781 -0,000391 -0,000368 -0,000465
Thompson % Sesgo 0,74% -0,16% -0,04% 0,39% -0,26% -0,28% -0,39%
Sesgo Estandarizado 58,30 -14,03 -4,17 35,87 -20,02 -20,07 -31,08
Error Cuadratico Medio 576010,1 442787,3 495838,5 256040,1 266020,6 270004,3 355210,1
Estimador promedio 10,02% 13,99% 16,04% 20,01% 14,99% 12,98% 11,97%
Sesgo 0,000514 0,000062 0,000525 0,000220 -0,000171 -0,000852 -0,000299
Cochran % Sesgo 0,52% 0,04% 0,33% 0,11% -0,11% -0,65% -0,25%
Sesgo Estandarizado 24,46 2,60 24,65 7,20 -6,93 -32,98 -13,32
Error Cuadratico Medio 449397,3 375734,3 493896,4 309008,3 419302,5 243549,9 406391,2
Estimador promedio 9,99% 13,93% 16,00% 20,10% 14,99% 13,04% 11,96%
Sesgo 0,000182 -0,000516 0,000203 0,001055 -0,000221 -0,000275 -0,000428
Angers % Sesgo 0,18% -0,37% 0,13% 0,53% -0,15% -0,21% -0,36%
Sesgo Estandarizado 18,94 -51,80 15,39 74,40 -18,53 -23,79 -40,20
Error Cuadratico Medio 383354,5 533080,4 352758,3 351360,3 435525,9 392684,3 368595,7
175
Tabla 4v’. Puntajes asignados a desempeño de las simulaciones para población 22 de K=7 categorías.
Parámetro Poblacional
Método P1=9,97% P2=13,98% P3=15,98% P4=19,99% P5=15,01% P6=13,06% P7=12,00% Total
Criterio p1 p2 p3 p4 p5 p6 p7
Estimador promedio 4 6 4 4,5 4 6 4,5 33
Sesgo 4 5 3,5 5 3 6 4 30,5
Tortora
Error Cuadratico Medio 5 6 4 1 4 1 1 22
Total 13 17 11,5 10,5 11 13 9,5 85,5
Estimador promedio 6 3 4 6 6 2,5 6,0 33,5
Sesgo 6 2 3,5 6 6 4 6 33,5
Bromaghin
Error Cuadratico Medio 6 3 5 3 1 2 3 23
Total 18 8 12,5 15 13 8,5 15 90
Estimador promedio 1,5 3 4 2,5 1,5 2,5 2,5 18
Sesgo 1 3,5 5 2 2 2 2 17,5
Fitzpatrick & Scott
Error Cuadratico Medio 2 2 1 5 5 6 4 25
Total 4,5 8,5 10 9,5 8,5 10,5 8,5 60
Estimador promedio 1,5 3 6 2,5 1,5 4 1 19,5
Sesgo 2 3,5 6 3 1 3 1 19,5
Thompson
Error Cuadratico Medio 1 4 2 6 6 4 6 29
Total 4,5 10,5 14 11,5 8,5 11 8 68
Estimador promedio 3 5 1 4,5 4 1 4,5 23
Sesgo 3 6 6 4 5 1 5 30
Cochran
Error Cuadratico Medio 3 5 3 4 3 5 2 25
Total 9 16 10 12,5 12 7 11,5 78
Estimador promedio 5 1 2 1 4 5 2,5 20,5
Sesgo 5 1 5 1 4 5 3 24
Angers
Error Cuadratico Medio 4 1 6 2 2 3 5 23
Total 14 3 13 4 10 13 10,5 67,5
176
Tabla 4w. Evaluación de desempeño de las simulaciones para
población 23 de K=7 categorías.
P1 P2 P3 P4 P5 P6 P7
Parámetro Poblacional
Método 4,04% 14,00% 49,98% 11,97% 9,99% 4,98% 5,03%
Criterio p1 p2 p3 p4 p5 p6 p7
Estimador promedio 4,03% 14,01% 49,97% 11,97% 9,99% 4,99% 5,04%
Sesgo -0,000096 0,000080 -0,000099 0,000010 -0,000022 0,000049 0,000078
Tortora % Sesgo -0,24% 0,06% -0,02% 0,01% -0,02% 0,10% 0,16%
Sesgo Estandarizado -0,24 0,06 -0,02 0,01 -0,02 0,10 0,16
Error Cuadratico Medio 349427,1 464835,9 303086,1 378178,6 492367,5 435322,3 452479,8
Estimador promedio 4,05% 14,03% 49,92% 11,98% 9,99% 4,98% 5,04%
Sesgo 0,000119 0,000295 -0,000548 0,000074 0,000016 0,000015 0,000031
Bromaghin % Sesgo 0,29% 0,21% -0,11% 0,06% 0,02% 0,03% 0,06%
Sesgo Estandarizado 30,66 45,48 -61,10 13,06 2,37 3,09 8,34
Error Cuadratico Medio 324180,7 376425,3 495012,4 461018,5 315989,1 301483,0 452868,7
Estimador promedio 4,05% 13,93% 50,06% 11,89% 9,98% 5,02% 5,07%
Sesgo 0,000077 -0,000727 0,000825 -0,000856 -0,000055 0,000323 0,000414
Fitzpatrick & Scott % Sesgo 0,19% -0,52% 0,16% -0,71% -0,06% 0,65% 0,82%
Sesgo Estandarizado 6,72 -46,98 33,81 -45,41 -3,71 31,70 33,18
Error Cuadratico Medio 342403,1 471378,3 402883,6 263821,4 419594,1 431891,6 273987,7
Estimador promedio 4,05% 13,93% 50,06% 11,89% 9,98% 5,02% 5,08%
Sesgo 0,000081 -0,000711 0,000762 -0,000877 -0,000029 0,000342 0,000433
Thompson % Sesgo 0,20% -0,51% 0,15% -0,73% -0,03% 0,69% 0,86%
Sesgo Estandarizado 7,14 -46,64 31,37 -45,55 -1,99 33,91 35,00
Error Cuadratico Medio 329290,8 461313,0 403478,1 227133,3 414356,2 463664,8 260551,5
Estimador promedio 4,02% 13,94% 50,03% 11,91% 10,01% 5,03% 5,07%
Sesgo -0,000225 -0,000664 0,000533 -0,000653 0,000199 0,000418 0,000392
Cochran % Sesgo -0,56% -0,47% 0,11% -0,55% 0,20% 0,84% 0,78%
Sesgo Estandarizado -20,09 -35,85 19,53 -31,37 12,31 34,50 25,71
Error Cuadratico Medio 341886,1 450728,1 436113,4 253027,1 420556,4 379136,8 208140,5
Estimador promedio 4,03% 13,94% 50,06% 11,97% 9,98% 4,97% 5,04%
Sesgo -0,000064 -0,000591 0,000782 0,0000003 0,000046 -0,000046 -0,000121
Angers % Sesgo -0,16% -0,42% 0,16% 0,003% -0,05% -0,24% 0,07%
Sesgo Estandarizado -15,83 -75,86 55,69 0,42 -6,87 -23,10 7,14
Error Cuadratico Medio 455571,4 375278,1 236659,2 374991,8 369830,6 344442,3 365208,3
177
Tabla 4w’. Puntajes asignados a desempeño de las simulaciones para población 23 de K=7 categorías.
Parámetro Poblacional
Método P1=4,04% P2=14,00% P3=49,98% P4=11,97% P5=9,99% P6=4,98% P7=5,03% Total
Criterio p1 p2 p3 p4 p5 p6 p7
Estimador promedio 4 6 6 6 5,5 4,5 5 37
Sesgo 3 6 6 5 5 4 5 34
Tortora
Error Cuadratico Medio 2 2 5 2 1 2 2 16
Total 9 14 17 13 11,5 10,5 12 87
Estimador promedio 4 5 4 5 5,5 6 5 34,5
Sesgo 2 5 4 4 6 6 6 33
Bromaghin
Error Cuadratico Medio 6 5 1 1 6 6 1 26
Total 12 15 9 10 17,5 18 12 93,5
Estimador promedio 4 1,5 2 1,5 3 2,5 2,5 17
Sesgo 5 1 1 2 2 3 3 17
Fitzpatrick & Scott
Error Cuadratico Medio 3 1 4 4 2 3 4 21
Total 12 3,5 7 7,5 7 8,5 9,5 55
Estimador promedio 4 2 2 1,5 3 3 1 15,5
Sesgo 4 2 3 1 4 2 2 18
Thompson
Error Cuadratico Medio 5 3 3 6 4 1 5 27
Total 13 7 8 8,5 11 6 8 60,5
Estimador promedio 1 3,5 5 3,5 1 1 2,5 17,5
Sesgo 1 3 5 3 1 1 4 18
Cochran
Error Cuadratico Medio 4 4 2 5 3 4 6 28
Total 6 10,5 12 11,5 5 6 12,5 63,5
Estimador promedio 4 3,5 2 3,5 3 4,5 5 25,5
Sesgo 6 4 2 6 3 5 1 27
Angers
Error Cuadratico Medio 1 6 6 3 5 5 3 29
Total 11 13,5 10 12,5 11 14,5 9 81,5
178
Tabla 4x. Evaluación de desempeño de las simulaciones para
población 24 de K=7 categorías.
P1 P2 P3 P4 P5 P6 P7
Parámetro Poblacional
Método 3,99% 16,00% 14,97% 15,03% 15,04% 24,98% 9,99%
Criterio p1 p2 p3 p4 p5 p6 p7
Estimador promedio 4,04% 16,00% 14,98% 14,96% 15,05% 24,95% 10,02%
Sesgo 0,000533 0,000000 0,000087 -0,000786 0,000112 -0,000286 0,000340
Tortora % Sesgo 1,33% 0,0001% 0,06% -0,52% 0,07% -0,11% 0,34%
Sesgo Estandarizado 73,00 0,02 7,11 -45,88 8,66 -16,90 29,85
Error Cuadratico Medio 483005,9 467932,8 539110,1 264105,3 421166,0 407095,9 407489,3
Estimador promedio 4,00% 16,00% 14,94% 15,03% 15,05% 24,97% 10,02%
Sesgo 0,000068 0,000022 -0,000334 -0,000062 0,000097 -0,000135 0,000342
Bromaghin % Sesgo 0,17% 0,01% -0,22% -0,04% 0,06% -0,05% 0,34%
Sesgo Estandarizado 7,98 1,48 -24,51 -3,55 6,92 -6,35 22,05
Error Cuadratico Medio 306727,8 337345,1 461760,7 299223,6 375446,4 284992,2 254209,9
Estimador promedio 4,04% 15,98% 15,01% 14,98% 15,02% 24,96% 10,01%
Sesgo 0,000514 -0,000182 0,000349 -0,000508 -0,000203 -0,000173 0,000203
Fitzpatrick & Scott % Sesgo 1,29% -0,11% 0,23% -0,34% -0,14% -0,07% 0,20%
Sesgo Estandarizado 57,55 -10,65 20,51 -30,78 -13,34 -7,46 14,22
Error Cuadratico Medio 541980,6 411942,6 381566,8 454850,0 465825,4 312573,1 461161,4
Estimador promedio 4,02% 15,99% 15,05% 15,01% 14,93% 25,00% 9,99%
Sesgo 0,000319 -0,000064 0,000808 -0,000269 -0,001032 0,000173 0,000066
Thompson % Sesgo 0,80% -0,04% 0,54% -0,18% -0,69% 0,07% 0,07%
Sesgo Estandarizado 31,43 -3,67 50,13 -17,99 -60,66 7,35 4,86
Error Cuadratico Medio 244985,2 440408,8 471450,5 432261,7 472934,8 329138,2 496344,4
Estimador promedio 4,01% 15,97% 15,05% 14,97% 14,99% 25,01% 10,00%
Sesgo 0,000169 -0,000266 0,000745 -0,000610 -0,000465 0,000285 0,000143
Cochran % Sesgo 0,42% -0,17% 0,50% -0,41% -0,31% 0,11% 0,14%
Sesgo Estandarizado 16,26 -12,12 38,94 -31,50 -22,20 11,50 9,34
Error Cuadratico Medio 450039,4 293357,5 375529,5 502538,3 347473,1 388756,3 384893,3
Estimador promedio 4,01% 15,96% 15,05% 14,97% 15,00% 25,01% 9,99%
Sesgo 0,000197 -0,000326 0,000782 -0,000608 -0,000418 0,000297 0,000076
Angers % Sesgo 0,49% -0,20% 0,52% -0,40% -0,28% 0,12% 0,08%
Sesgo Estandarizado 17,85 -14,65 42,07 -31,04 -20,47 12,19 4,80
Error Cuadratico Medio 359446,7 325012,4 472648,8 467691,1 370056,1 450497,0 506462,3
179
Tabla 4x’. Puntajes asignados a desempeño de las simulaciones para población 24 de K=7 categorías.
Parámetro Poblacional
Método P1=3,99% P2=16,00% P3=14,97% P4=15,03% P5=15,04% P6=24,98% P7=9,99% Total
Criterio p1 p2 p3 p4 p5 p6 p7
Estimador promedio 1,5 5,5 6 1,5 5,5 2 1,5 23,5
Sesgo 1 6 6 1 5 2 2 23
Tortora
Error Cuadratico Medio 2 1 1 6 3 2 4 19
Total 4,5 12,5 13 8,5 13,5 6 7,5 65,5
Estimador promedio 6 5,5 5 1,5 5,5 6 1,5 31
Sesgo 6 5 5 6 6 6 1 35,0
Bromaghin
Error Cuadratico Medio 5 4 4 5 4 6 6 34,0
Total 17 14,5 14 12,5 15,5 18 9 100
Estimador promedio 1,5 3 4 5 4 4,5 3 25
Sesgo 2 3 4 4 4 4,5 3 24,5
Fitzpatrick & Scott
Error Cuadratico Medio 1 3 5 3 2 5 3 22
Total 4,5 9 13 12 10 14 9 71,5
Estimador promedio 3 4 2 6 1 4,5 5,5 26
Sesgo 3 4 1 5 1 4,5 6 24,5
Thompson
Error Cuadratico Medio 6 2 3 4 1 4 2 22
Total 12 10 6 15 3 13 13,5 72,5
Estimador promedio 4,5 2 2 3,5 2 2 4 20
Sesgo 5 2 3 2 2 3 4 21
Cochran
Error Cuadratico Medio 3 6 6 1 6 3 5 30
Total 12,5 10 11 6,5 10 8 13 71
Estimador promedio 4,5 1 2 3,5 3 2 5,5 21,5
Sesgo 4 1 2 3 3 1 5 19
Angers
Error Cuadratico Medio 4 5 2 2 5 1 1 20
Total 12,5 7 6 8,5 11 4 11,5 60,5
180
Tabla 4y. Evaluación de desempeño de las simulaciones para
población 25 de K=7 categorías.
P1 P2 P3 P4 P5 P6 P7
Parámetro Poblacional
Método 14,31% 14,29% 14,24% 14,32% 14,28% 14,26% 14,29%
Criterio p1 p2 p3 p4 p5 p6 p7
Estimador promedio 14,41% 14,29% 14,23% 14,28% 14,28% 14,25% 14,27%
Sesgo 0,000961 -0,000030 -0,000115 -0,000362 -0,000035 -0,000182 -0,000236
Tortora % Sesgo 0,67% -0,02% -0,08% -0,25% -0,02% -0,13% -0,17%
Sesgo Estandarizado 83,66 -2,62 -9,95 -28,82 -3,11 -13,38 -20,23
Error Cuadratico Medio 504527,9 421969,3 379368,5 332567,2 368547,6 320095,2 419738,5
Estimador promedio 14,33% 14,31% 14,21% 14,34% 14,28% 14,18% 14,35%
Sesgo 0,000178 0,000193 -0,000331 0,000194 0,000031 -0,000834 0,000569
Bromaghin % Sesgo 0,12% 0,13% -0,23% 0,14% 0,02% -0,58% 0,40%
Sesgo Estandarizado 13,67 14,08 -28,08 14,92 2,47 -81,34 48,82
Error Cuadratico Medio 318914,3 308783,0 409364,4 360358,8 325785,1 508249,3 375897,3
Estimador promedio 14,40% 14,23% 14,22% 14,27% 14,37% 14,25% 14,25%
Sesgo 0,000906 -0,000647 -0,000186 -0,000453 0,000875 -0,000103 -0,000392
Fitzpatrick & Scott % Sesgo 0,63% -0,45% -0,13% -0,32% 0,61% -0,07% -0,27%
Sesgo Estandarizado 51,13 -38,02 -8,24 -26,30 48,19 -6,07 -24,57
Error Cuadratico Medio 308065,8 318934,3 216782,9 325605,7 311027,1 302144,4 395868,3
Estimador promedio 14,23% 14,30% 14,29% 14,32% 14,32% 14,27% 14,26%
Sesgo -0,000760 0,000039 0,000532 0,000079 0,000341 0,000100 -0,000331
Thompson % Sesgo -0,53% 0,03% 0,37% 0,06% 0,24% 0,07% -0,23%
Sesgo Estandarizado -40,86 2,47 28,85 5,41 19,94 5,81 -20,60
Error Cuadratico Medio 306158,4 403982,9 290828,6 501894,3 341057,3 456347,9 395472,4
Estimador promedio 14,38% 14,25% 14,26% 14,35% 14,28% 14,28% 14,20%
Sesgo 0,000661 -0,000438 0,000225 0,000331 0,000029 0,000106 -0,000915
Cochran % Sesgo 0,46% -0,31% 0,16% 0,23% 0,02% 0,07% -0,64%
Sesgo Estandarizado 19,68 -17,10 7,78 9,82 1,26 3,67 -31,42
Error Cuadratico Medio 239980,7 356550,3 352325,3 237051,8 516961,5 343583,5 327273,3
Estimador promedio 14,40% 14,30% 14,22% 14,28% 14,29% 14,25% 14,26%
Sesgo 0,000912 0,000027 -0,000165 -0,000409 0,000093 -0,000161 -0,000296
Angers % Sesgo 0,64% 0,02% -0,12% -0,29% 0,06% -0,11% -0,21%
Sesgo Estandarizado 76,83 2,30 -14,55 -32,09 7,20 -12,40 -26,10
Error Cuadratico Medio 454532,3 383334,7 441912,4 324368,4 321070,9 355941,4 400755,2
181
Tabla 4y’. Puntajes asignados a desempeño de las simulaciones para población 25 de K=7 categorías
Parámetro Poblacional
Método P1=14,31% P2=14,29% P3=14,24% P4=14,32% P5=14,28% P6=14,26% P7=14,29% Total
Criterio p1 p2 p3 p4 p5 p6 p7
Estimador promedio 1 6 6 2,5 5 4,5 4,5 29,5
Sesgo 1 5 6 3 4 2 6 27
Tortora
Error Cuadratico Medio 1 1 3 3 2 5 2 17
Total 3 12 15 8,5 11 11,5 12,5 73,5
Estimador promedio 6 3 2 5 5 1 2 24
Sesgo 6 3 2 5 5 1 2 24
Bromaghin
Error Cuadratico Medio 3 6 2 2 4 1 5 23
Total 15 12 6 12 14 3 9 71
Estimador promedio 2 1,5 4 1 1 4,5 3 17
Sesgo 3 1 4 1 1 5 3 18
Fitzpatrick & Scott
Error Cuadratico Medio 4 5 6 4 6 6 3 34
Total 9 7,5 14 6 8 15,5 9 69
Estimador promedio 3 4,5 1 6 2 4,5 4,5 25,5
Sesgo 4 4 1 6 2 6 4 27
Thompson
Error Cuadratico Medio 5 2 5 1 3 2 4 22
Total 12 11 7 13 7 12,5 12,5 74,5
Estimador promedio 4,5 1,5 4 4 5 2 1 22
Sesgo 5 2 3 4 6 4 1 25
Cochran
Error Cuadratico Medio 6 4 4 6 1 4 6 31
Total 15,5 7,5 11 14 12 10 8 78
Estimador promedio 4,5 4,5 4 2,5 3 4,5 4,5 27,5
Sesgo 2 6 5 2 3 3 5 26
Angers
Error Cuadratico Medio 2 3 1 2 5 3 1 17
Total 8,5 13,5 10 6,5 11 10,5 10,5 70,5
182
Tabla 5a. Prevalencias estimadas según métodos para k=3 categorías.
183
Tabla 5b. Prevalencias estimadas según métodos para k=4 categorías.
184
Tabla 5c. Prevalencias estimadas según métodos para k=5 categorías.
185
Tabla 5d. Prevalencias estimadas según métodos para k=6 categorías.
186
Tabla 5e. Prevalencias estimadas según métodos para k=7 categorías
187
8.3 Anexo 3 (Manuscrito 3)
,1
,1
,08
,06
f(H)
f(H)
f(H)
,05
,05
,04
,02
0
0
,76 ,78 ,8 ,82 ,84 ,76 ,78 ,8 ,82 ,84 ,75 ,8 ,85 ,9
H H H
,1
,1
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
188
Figura 2. Histogramas de para el índice de Shannon promedio en la
población 2 para los seis métodos evaluados.
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
,88 ,9 ,92 ,94 ,96 ,88 ,9 ,92 ,94 ,96 ,85 ,9 ,95 1
H H H
,15
,1
,1
,08
,08
,1
,06
,06
f(H)
f(H)
f(H)
,04
,04
,05
,02
,02
0
0
,85 ,9 ,95 1 ,8 ,85 ,9 ,95 1 ,85 ,9 ,95 1
H H H
189
Figura 3. Histogramas de para el índice de Shannon promedio en la
población 3 para los seis métodos evaluados.
,1
,1
,08
,1
,06
f(H)
f(H)
f(H)
,05
,04
,05
,02
0
0
,98 1 1,02 1,04 1,06 1,08 ,98 1 1,02 1,04 1,06 1,08 ,98 1 1,02 1,04 1,06 1,08
H H H
,1
,1
,08
,08
,06
f(H)
f(H)
f(H)
,06
,05
,04
,04
,02
,02
0
,98 1 1,02 1,04 1,06 1,08 ,95 1 1,05 1,1 ,95 1 1,05 1,1
H H H
190
Figura 4. Histogramas de para el índice de Shannon promedio en la
población 4 para los seis métodos evaluados.
,1
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
,7 ,75 ,8 ,85 ,9 ,7 ,75 ,8 ,85 ,9 ,7 ,75 ,8 ,85 ,9
H H H
,1
,1
,08
,08
,06
,06
f(H)
f(H)
f(H)
,05
,04
,04
,02
,02
0
191
Figura 5. Histogramas de para el índice de Shannon promedio en la
población 5 para los seis métodos evaluados.
,2
,2
,2
,15
,15
,15
f(H)
f(H)
f(H)
,1
,1
,1
,05
,05
,05
0
0
1,08 1,085 1,09 1,095 1,1 1,085 1,09 1,095 1,1 1,085 1,09 1,095 1,1
H
H H
,2
,2
,15
,3
,15
f(H)
f(H)
f(H)
,2
,1
,1
,05
,05
,1
0
1,085 1,09 1,095 1,1 1,06 1,07 1,08 1,09 1,1 1,085 1,09 1,095 1,1
H H H
192
Figura 6. Histogramas de para el índice de Shannon promedio en la
población 6 para los seis métodos evaluados.
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,08 1,1 1,12 1,14 1,16 1,08 1,1 1,12 1,14 1,16 1,05 1,1 1,15 1,2
H H H
,1
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
1 1,05 1,1 1,15 1,2 1 1,05 1,1 1,15 1,2 1,06 1,08 1,1 1,12 1,14 1,16
H H H
193
Figura 7. Histogramas de para el índice de Shannon promedio en la
población 7 para los seis métodos evaluados.
,1
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,2 1,22 1,24 1,26 1,28 1,2 1,22 1,24 1,26 1,28 1,15 1,2 1,25 1,3
H H H
,1
,08
,1
,06
f(H)
f(H)
f(H)
,05
,04
,05
,02
0
1,15 1,2 1,25 1,3 1,1 1,15 1,2 1,25 1,3 1,15 1,2 1,25 1,3
H
H H
194
Figura 8. Histogramas de para el índice de Shannon promedio en la
población 8 para los seis métodos evaluados.
,1
,1
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,16 1,18 1,2 1,22 1,24 1,15 1,2 1,25 1,1 1,15 1,2 1,25 1,3
H H H
,15
,1
,1
,08
,08
,1
,06
,06
f(H)
f(H)
f(H)
,04
,04
,05
,02
,02
0
1,1 1,15 1,2 1,25 1,3 1,1 1,15 1,2 1,25 1,3 1,1 1,15 1,2 1,25 1,3
H H H
195
Figura 9. Histogramas de para el índice de Shannon promedio en la
población 9 para los seis métodos evaluados.
,1
,1
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,05 1,1 1,15 1,2 1,05 1,1 1,15 1,2 1 1,05 1,1 1,15 1,2
H H H
,1
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
1 1,05 1,1 1,15 1,2 1 1,05 1,1 1,15 1,2 1 1,05 1,1 1,15 1,2
H H H
196
Figura 10. Histogramas de para el índice de Shannon promedio en la
población 10 para los seis métodos evaluados.
,15
,15
,1
,1
,1
f(H)
f(H)
f(H)
,05
,05
,05
0
0
1,37 1,375 1,38 1,385 1,37 1,375 1,38 1,385 1,37 1,375 1,38 1,385
H H H
,15
,2
,2
,15
,1
,15
f(H)
f(H)
f(H)
,1
,1
,05
,05
,05
0
1,365 1,37 1,375 1,38 1,385 1,34 1,35 1,36 1,37 1,38 1,39 1,382 1,383 1,384 1,385 1,386
H H H
197
Figura 11. Histogramas de para el índice de Shannon promedio en la
población 11 para los seis métodos evaluados.
,1
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,3 1,32 1,34 1,36 1,38 1,4 1,32 1,34 1,36 1,38 1,4 1,25 1,3 1,35 1,4 1,45
H H H
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
1,25 1,3 1,35 1,4 1,45 1,25 1,3 1,35 1,4 1,45 1,3 1,32 1,34 1,36 1,38 1,4
H H H
198
Figura 12. Histogramas de para el índice de Shannon promedio en la
población 12 para los seis métodos evaluados.
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,4 1,42 1,44 1,46 1,48 1,5 1,4 1,42 1,44 1,46 1,48 1,5 1,35 1,4 1,45 1,5 1,55
H H H
,1
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
1,35 1,4 1,45 1,5 1,35 1,4 1,45 1,5 1,55 1,4 1,42 1,44 1,46 1,48 1,5
H
H H
199
Figura 13. Histogramas de para el índice de Shannon promedio en la
población 13 para los seis métodos evaluados.
,1
,08
,1
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,3 1,35 1,4 1,45 1,3 1,35 1,4 1,45 1,25 1,3 1,35 1,4 1,45
H H H
,08
,08
,1
,06
,06
f(H)
f(H)
f(H)
,04
,04
,05
,02
,02
0
1,25 1,3 1,35 1,4 1,45 1,25 1,3 1,35 1,4 1,45 1,3 1,35 1,4 1,45
H H H
200
Figura 14. Histogramas de para el índice de Shannon promedio en la
población 14 para los seis métodos evaluados.
,1
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,25 1,3 1,35 1,4 1,45 1,25 1,3 1,35 1,4 1,45 1,25 1,3 1,35 1,4 1,45
H H H
,1
,08
,08
,1
,06
,06
f(H)
f(H)
f(H)
,04
,04
,05
,02
,02
0
1,25 1,3 1,35 1,4 1,45 1,25 1,3 1,35 1,4 1,45 1,25 1,3 1,35 1,4 1,45
H H H
201
Figura 15. Histogramas de para el índice de Shannon promedio en la
población 15 para los seis métodos evaluados.
,15
,15
,1
,1
,1
f(H)
f(H)
f(H)
,05
,05
,05
0
0
1,585 1,59 1,595 1,6 1,605 1,61 1,585 1,59 1,595 1,6 1,605 1,61 1,59 1,595 1,6 1,605 1,61
H H H
,15
,15
,1
,1
,1
f(H)
f(H)
f(H)
,05
,05
,05
0
1,59 1,595 1,6 1,605 1,61 1,56 1,57 1,58 1,59 1,6 1,61 1,585 1,59 1,595 1,6 1,605 1,61
H H H
202
Figura 16. Histogramas de para el índice de Shannon promedio en la
población 16 para los seis métodos evaluados.
,1
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,67 1,68 1,69 1,7 1,71 1,67 1,68 1,69 1,7 1,71 1,6 1,65 1,7 1,75
H H H
,1
,1
,08
,06
,08
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
1,6 1,65 1,7 1,75 1,6 1,65 1,7 1,75 1,66 1,68 1,7 1,72
H H H
203
Figura 17. Histogramas de para el índice de Shannon promedio en la
población 17 para los seis métodos evaluados.
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,74 1,75 1,76 1,77 1,78 1,74 1,75 1,76 1,77 1,78 1,72 1,74 1,76 1,78
H H H
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
1,72 1,74 1,76 1,78 1,7 1,72 1,74 1,76 1,78 1,73 1,74 1,75 1,76 1,77 1,78
H H H
204
Figura 18. Histogramas de para el índice de Shannon promedio en la
población 18 para los seis métodos evaluados.
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,4 1,45 1,5 1,55 1,4 1,45 1,5 1,55 1,4 1,45 1,5 1,55 1,6
H H H
,1
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
1,35 1,4 1,45 1,5 1,55 1,6 1,35 1,4 1,45 1,5 1,55 1,6 1,4 1,45 1,5 1,55
H H H
205
Figura 19. Histogramas de para el índice de Shannon promedio en la
población 19 para los seis métodos evaluados.
,1
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,64 1,66 1,68 1,7 1,72 1,64 1,66 1,68 1,7 1,72 1,64 1,66 1,68 1,7 1,72 1,74
H H H
,1
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
1,64 1,66 1,68 1,7 1,72 1,74 1,6 1,65 1,7 1,75 1,6 1,65 1,7 1,75
H H H
206
Figura 20. Histogramas de para el índice de Shannon promedio en la
población 20 para los seis métodos evaluados.
,15
,15
,1
,08
,1
,1
,06
f(H)
f(H)
f(H)
,04
,05
,05
,02
0
0
1,775 1,78 1,785 1,79 1,795 1,775 1,78 1,785 1,79 1,795 1,77 1,775 1,78 1,785 1,79
H H H
,15
,1
,1
,08
,1
,06
f(H)
f(H)
f(H)
,05
,04
,05
,02
0
1,77 1,775 1,78 1,785 1,79 1,75 1,76 1,77 1,78 1,79 1,775 1,78 1,785 1,79 1,795
H H H
207
Figura 21. Histogramas de para el índice de Shannon promedio en la
población 21 para los seis métodos evaluados.
,1
,08
,1
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,83 1,84 1,85 1,86 1,87 1,83 1,84 1,85 1,86 1,87 1,78 1,8 1,82 1,84 1,86 1,88
H H H
,08
,1
,08
,06
,06
f(H)
f(H)
f(H)
,04
,05
,04
,02
,02
0
1,75 1,8 1,85 1,9 1,75 1,8 1,85 1,9 1,82 1,84 1,86 1,88
H H H
208
Figura 22. Histogramas de para el índice de Shannon promedio en la
población 22 para los seis métodos evaluados.
,1
,1
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,91 1,92 1,93 1,94 1,9 1,91 1,92 1,93 1,94 1,88 1,9 1,92 1,94
H H H
,1
,1
,08
,08
,06
,06
f(H)
f(H)
f(H)
,05
,04
,04
,02
,02
0
1,88 1,9 1,92 1,94 1,84 1,86 1,88 1,9 1,92 1,94 1,89 1,9 1,91 1,92 1,93 1,94
H H H
209
Figura 23. Histogramas de para el índice de Shannon promedio en la
población 23 para los seis métodos evaluados.
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,5 1,55 1,6 1,48 1,5 1,52 1,54 1,56 1,58 1,4 1,45 1,5 1,55 1,6 1,65
H H H
,1
,08
,06
,06
f(H)
f(H)
f(H)
,04
,05
,04
,02
,02
0
1,4 1,45 1,5 1,55 1,6 1,65 1,3 1,4 1,5 1,6 1,7 1,45 1,5 1,55 1,6
H H H
210
Figura 24. Histogramas de para el índice de Shannon promedio en la
población 24 para los seis métodos evaluados.
,1
,1
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
0
1,8 1,82 1,84 1,86 1,88 1,78 1,8 1,82 1,84 1,86 1,88 1,75 1,8 1,85 1,9
H H H
,1
,1
,1
,08
,08
,08
,06
,06
,06
f(H)
f(H)
f(H)
,04
,04
,04
,02
,02
,02
0
1,75 1,8 1,85 1,9 1,75 1,8 1,85 1,9 1,75 1,8 1,85 1,9
H H H
211
Figura 25. Histogramas de para el índice de Shannon promedio en la
población 25 para los seis métodos evaluados.
,15
,15
,1
,1
,1
f(H)
f(H)
f(H)
,05
,05
,05
0
0
1,935 1,94 1,945 1,93 1,935 1,94 1,945 1,92 1,925 1,93 1,935 1,94 1,945
H H H
,15
,1
,08
,1
,1
,06
f(H)
f(H)
f(H)
,04
,05
,05
,02
0
1,925 1,93 1,935 1,94 1,945 1,88 1,9 1,92 1,94 1,935 1,94 1,945
H H
H
212