5 PDF
5 PDF
5 PDF
ESTADÍSTICAS
2014
T 1 '/
lntroduccton
aDren
.f
¡ Oué es la estadística.
r Por qué la estadística es fundamental para la administración.
. I l^ ^^+^)l^+:
Los conceptos baslcos y el vocaDularlo oe td EJ --
Ld\l t) LtLo.
algunos inversionistas privados respecto a qué tan viable será Good Tl¡nes & More al paso del tiempo. Los
o
directivos debedn identificar formas de mejorar el negocio, ya que, durante muchos años de evolución, ha
sido necesano modificar parte de sus políticas y pnícticas, las cuales se han convertido en un conjunto de
enmiendas que probablemente no constituyen buenas pautas administativas y ocasionan que se pasen por
alto oportLrnidades de mayores utilidades.
Para enfrenhr estos ¡€tos, los gerentes oecesitarán tener éxito al aplicar las divenas habilidades admi-
nistativas que adquirieron a través de su formacióaacadémicay experiencia- Todo esto es-m¡isque
evidente. Lo que no es claro es el papel que desempeñaría la estadistica en la aplicación de di-
chas habilidades y 1¿ toma de decisiones que determinarií el futuro de Good Tunes &
More.
Mibri Siffii¡/Pto¡orcm
4 CAPÍTULO 1 Inüoducción
"*"rJ^
udística, iguos cu¡so htoductorio que dest¿caba los métodos desÜiptivos
recuerdau un
panre-
.,. de todo, estadística su¿¿a muy parecido a
sumir y presentar datos, otros expresan temor (desfués
lri¿i.á'i, ooor ntiis recuerdan varios dichos populares acerca de Ia estadístic* enüe los que destaca
v
.i q". ,.íu,
..g¡rt* tres tipos de mentiras: las mintiras, las malditas mentiras y las estadísticas" ' .
pocos reconocen que ia estadistica es una habilidad fundamental en su educación de negocios,
Aunque esta frase a
cotidiana para descri-
menudo se atribuYe a y .olno á, p.*ite comprender mejor los números que se utilizan de manera
Ma*Twain, Ya había úl y anatizar et munOo. Las siguientes noticias ejemplifican lo anterior:
fases imPresas similares
al menos 12 años antes .*Másclicsparaeütarap¡Iecerenun¡listrdecorreoelectrónico''(TheNetYork
de que Ia de él se grandes minoristas en linea reportó
Tímes,2g de marzo de 20i0, p. 82) Un estudio de 100
feg6Ían. les excluyera de una List¿ de
oue 39% de ellos necesttaron áar hes o más clics para qué se
co¡reo electrónico en 2009, en comparación con 7% en
2008'
.(¿Losprinerosdosañosdeestutliosuniversitariosdesperdiciados?"(M'Marklein'
de 3000 estudiantes
isl riaoy,lg de enero de 2011, p. 3A) una encuesta aplicada a más
de tiempoiompleto reveló que dedican 51% de su tiempo
a.socializar, a divertirse y a otras
!
La estadística biisica para su educación en administración, ya que desempeña un papel fi:n-
es
damental en los negocios. Permite que los profesionales de la administración realicen las siguien-
tes tareas rmportantes:
VARIABLE
Una ca¡acteristica de un objeto o indiüduo'
DATOS
una va¡iable'
El conjunto de valores individuales asociados con
Cadavariablequeseutiliceclebetenerunadefiniciénoperacional,lacualpermitequetodc
valoreo
variable y cuáles son sus
b, q;. pJ.ip* en un análisis comprendan qué representa la
de ios investigadores que
i.
p"rrii.rl ;Jp"nancia de lo anterioi queda clarl enel flmos.o¡remnlo
que los par-
i"* i"áu" p-" reunir datos demogrificos escribieron la palabra "sexo", esperando
se encontraron con que va'
;;t"*t .trpirtd ierm ma.sculino ofemenino; al revisar los formatos
(Quizás a esto se deba que en
;;;;;;;""r'..tpondieron Sí, en lugar tle la respuesta esp.erada
,.Género" en vez del'Sexo" para denomrnar a esta vanable'
,. p..flra utilizar el términi
".^[r",
ya que su definición operacional es más evidente)'
Aveceslasdefinicionesoperacionalestarnbiénnecesitandefinirvaloresindividuales.Por
que puede adoptar los cuatro
.j..pfo, p*n iu uariable "gradó académico", definida como aquella
de tercer año.y de último año' sería necesano
valores de estudiante de primer año, de segundo año'
de los créditos logrados) con la finalidad
de
definü cad¿ uno de A.fro, uo¡orr, (ioi u.ien términos va-
asegurarse de que todos .ompreoduo' Quizás
el ejemplo mlís famoso de defidciones vagas de
lores fue la elección a"l pr"slaeote Je eita¿os Uni¿os
to el año 2000 en el estado de florida' laen
de contoversta'
cual las definiciones de úoletas "válidas" e "inválidas" fueron motivo
Tipos de variables
Lalatura|ezadelosdatosasocradosconunav¿riabledeterminaeitipodeesta.Esimpoftante
conocereltipodevariable,yaquelo"smétorlclsestadísticosqueseutilizanenunan:ílisisvaríande
acuerdo con este.
1.4 El vocabulario básico de ia estadística
Las variables categóricas (también llamadas variables cualit¡tivas) tienen valores que solo
pueden colocarse en categorías, como sí y no. Ejemplos de variables categóricas son: "¿Tiene cer-
tificados de inversión actualmente?" (sí o no) y el nivel del riesgo de un certificado de i¡versión
(por debajo del promedio, prom€dio o por amba del promedio).
Las variables numéricas (también llamadas variables cuantitativas) tienen valores que re-
presentan cantidades. Las vanables numéricas, a la vez, se clasifican como discretas o continuas'
Las variables discretas tienen valores numéricos que surgen de un proceso de conteo. ("El
número de canales de televisión por cable al que se suscribió" es un ejemplo de una variable numé-
rica discreta, ya que la respuesta es uno de un número finito de enteros. Las personas se pueden
suscribir a cero, uno, dos o miis canales. Otra variable numérica discreta es "el número de artículos
comprados", porque se cuenta el número de productos adquüdos.
Las variables continuas producen respuestas numéricas que surg€n de un proceso de medi-
ción. Ei tiempo que uu persona espera pam ser ateDdida por un cajero de un banco es un ejemplo
de una variable numérica continua, ya que la respuesta asume cualquier valor dento deuo conti-
nuo o trt intervalo, dependiendo de la precisión del instn¡mento de medición. Por ejemplo, su
tiempo de espera podría se¡ de I minuto, 1. 1 minutos, 1.1 1 minutos o I .l 13 milutos, dependiendo
de la precisión del aparato utilizado. (En teoría, dos valores continuos nunca son idénticos. Sin
embargo, como nhgún aparato de medición es perfectamente preciso, quizis ocurran valoles con-
tinuos idénticos para dos o más objetos o indiüduos).
A primen vista parece que es sencillo identificar el tipo de vanable, pero en ocasiones es nece-
sario estudiar algunas variables que podrían ser categóricas o numficas, dependiendo de la forma
en que se hayan definido. Por ejemplo, parecería que la "edad" es un valo¡ numérico evidente,
pero, ¿qué sucedería si ese valor se utilizara para comparar los hábitos de compra de niños, adultos a,
jóvenes, adultos maduros e individuos jubilados? En tal caso, tendría rnás sentido definir la "edad '
como una va¡iable categórica. Esto ilustra nuevamente el coment¿rio anterior acerca de que, sin
definiciones opencionales, las variables carecen de significado. o
Para determinar el tipo de variable que se necesita, a menudo es muy útil hacer preguntas
o
o
acerca de las variables a estudiar que se identificaron. En la tabla 1.1 se Presenta el proceso. N
(D
N
una muestr¡ es una paÍe que se selecciona de una población para someterla a análisis. D.e los
una muestra de esfiJdio de
cuatro ejemplos de pobhóiones que se nombraron, usted podría obtener
azar por un auütor' uT
200 uansacciones de ventas de Good Tunes & More, elegidas al Tue.sP
de 30 clientes de Good Tunes & More a los que se pide responder
una encuesta sobfe satisfaccióD"
para un estudio de marketing, y una
una muestra de 50 estudiantes de tiempo completo elegidos
política por teléfono'
muestra de 500 votantes registrados enbhio quieoes se aplica una encuesta
" o las personas en la muestra representan una parte
Eo .ud" *o
d. .rtos ejemp-los, las tansacciones
de los objetos o individuos que confonaan la población'
que siwen para.describir
Los áros dos ténnino sbáEicos,pdfámet\o y esfddísnco, son medidas
que describe una.variable.que
los datos asociados con una vanabié. Un parámetro es uua medida
vanabLe que uü[za
utiliza datos de una población. un estadístico es una medida que describe
una
datosdeunamuestra,Elpromediodelastra¡saccion€sdeventasdeGoodTunes&Morepanunaño
.rf..in.o ., * .¡..plo de un panámeno, po¡que la medida, el promedio' descnbe los datos de pro-
una
En contasle' el
p"ii..lo", q.t ."ista ¿e to¿as tas transaccionei realizadas en un año específico
me¿io ¿e itiO tansacciones cle ventas de Good Tunes & More, elegidas al azar por un auditor para su
estudio,esunejemplodeunestadís'ticoporquelamedidadescribelosdatosdeunamuestra.
parámetro y estadís-
como se obse¡va en el stguiente resumen de definiciones, los conceptos
y referirse de manera
tico también se pueden definir utilizando la palabra caracteistica evitando
explícita a variables.
Explique por qué el tipo de bebida que se vende es un fl Número de teléfonos celulares en el hogar.
ejemplo de una variable categónca. 1.5 La siguiente información se obtuvo de estudiantes
1.2 Un restaurante de comida nápida vende bebidas gaseo- cuando salian de la libreia de la universidad durante la pri-
si cada una de las siguientes variables es ca- que "seleccione el círculo que corresponde a su nivel de in-
1.7 Deternine
o ¡uménca. Si la variable es numéric4 establezca gesos" y se le presentan varios rangos de ingresos entre los
tesórica
vanable discreta o continua. cuales debeni elegir el suyo.
siie rata de una
o) Explique por qué, en el primer formato, el ingreso podría
¿) Canudad de ¿inero gastado en ropa durante el mes anterior
conside¡arse discreto o continuo.
ri Tientla departamental favorit¿
á) ¿Cual de los dos formatos preferiría utilizar si tuviera que
,i' prtiodo durante el cual es más probable que se compre
¡6p¿ (entre semana, noche enhe semana o ñn de semana) realizar una encuesta? Explique su respuesu.
/) Número de pares de zapatos que posee 1.1 0Si dos estudiantes obtienen 90 en el mismo examen,
que ia va-
l.E Suponga que ia siguiente información se obtuvo de la soli- ¿qué argumentos se podrían utilizar para demostrar
riable subyacente (la calificación en el examen) es continua?
citud de un préstamo para crédito hipotecario que hizo Robert
Keeler a la Meto Counf Savings and Loan Association. '1 .'l1 El director de investigación de metcados de una gran
c¡ Pagos mensuales: $ 1,927 cadena de tiendas departamentales quiere realizar una en-
á) Número de empleos en los últimos 10 años: 1
cuesta a 1o largo de una zona metropolitana, para determinar
cj Ingreso familiar anual: $76,000 la cantidad de tiempo que las mujeres trabajado¡as dedican
y') Est¿do civil: casado.
a comprar ropa durante un mes normal.
Clasifique cada r¡na de las respuestas de acuerdo con el a) Describa tanto la población como la muesfa de interés. In-
tipo de datos. dique el tipo de datos que podría necesitar reunir el director.
1.9 Una de las va¡iables que se incluye con mayor ftecuen- á) Elabore un primer borrador del cuestionario que se le'
'' 'cia en las encuestas es el ingreso. En ocasiones, la pregunta quiere en el inciso a) redacando tes preguntas categóricas
se redacta de la siguiente forma: "¿Cuál es su ingreso (en
y tes p¡eguntas numéricas que considere adecuadas para
miles de dólares)?". En otras encuestas se pide al individuo esta encuesta.
at,
para aprender y practicar los métodos estadísticos que se estudian en €ste libro, puede usar
det¿lla-
Excel o Minitab. Ai final de cada capítulo se presentan guías que contienen ilstl¡cciones
que estudiaron. Esas guías
das para apticar Microsoft Excel y Minitab a los métodos estadísticos se
exnlica de manera máq detallada en la sección EGl.l de la guía de Excel del capítulo l-
h éstadística. Cada sección describe u¡a situacióu de negocios reaüsa y plantea pregunt¿s que ayu-
dan apresentar conceptos o métodos estadísticos específicos. Por ejemplo' la descripción sobre la
y algunos tcnas
enpresa GT&M Holdings de este capítulo presenta los tipos de métodos estadísticos
tratan
relacionados con la deñnición de una variable. En otros capitulos las secciones iniciales
qué zona de un supamercado aumentan mrás
temas ñás eqEcíficos utilizando preguntas como: "¿En
¿¿El ventas?'.
las ventas de una bebida de cola?; o tamaño de una tienda minoriSra influye en las
-
Al final de cada capíh¡lo se retoma la sección inicial para describir cómo se podrían utiüzar los
también se
métodos específicos disc¡itos en el capítulo para responder las preguntas planteadas_;
'!f y de repaso del
incluyen secciones como Resurnen, Términoi clave, Ecuaciones clave Problemas
capítulo, las cuales le ayudarán a reforzar lo que aprendió'
' En ía mayoría de lás capítulos, tlespués de este material de repaso, enconüará un estudio.de
!t
caso seriado iue le permitiri aplicar la estadística a los problemas que etfrenta la administ"ció¡
I La mayoría
de Ashland Multicomm services, un prove¿dor de telecomunicaciones residenciales.
tf; que examinará una variedad de doo"-
los capítulos también incluyen un caso digital, en el usted
problemas o ana-
mentos electónicos y aplicani sus conocimientos de estadística para resolver los
'. respecto
I lizar las cuestiones que istos plantean Muchos de los casos digitales lo hanin reflexionu
(La sección "Aprendizaje con los casos digitales", in-
al uso adecuado o éiico de la estadística.
cluido en la página 14, presenta este conjunto único de casos de.negocios). Por ultimo,_al final de
Minitab que
cada capítr ó, J*."po il últi-o, se presentan las Guías de Excel y las Guías de
a las
fABLA 1.2 o Seleccione cuál progama, Excel o Minitab, utrlizaÉ con este libro. (Es probable que su profesor
haya tomado esta decisión por usted).
Lista de requlsllos
D Lea el apéndice A si necesita aprender o repas¿r notación y conceptos matemáticos básicos.
para empezar a
iabajar con o Lea el apéndice B si necesiia aprender o repasar conceptos y habilidades básicas de cómprlto
Estadíst¡ca Para a Descargue los archivos y ohos recursos electrónicos necesarios p¿ra tnbajar con este libro. Lea
negocios. Un curso el apóndice C para saber más acerca de las herramientas que puede descargar de la página de
básico descargas para este iibro. @ste proceso requiere el acceso a Intemet).
O Instale adecuadamente el programa elegido y aplique todas las actualiz¿ciones disponibles para
el mismo. Lea la sección D.1 de los apéndices pará saber cómo enconaar y aplicar las
actualizaciones. (Este proceso requiere el acceso a Intemet).
D Si planea utilizar PHStat2 con Excel, responda la lista especial de requisilos incluida en la
sección D.2 de los apéndices. Si planea utilizar las Herramientas para Aarílisis (Analysis
ToolPak) con Excel, lea y siga las instrucciones de la sección D.5 de los apendices.
o Revise los apéndices F y G pa.ra que sepa en qué le podrían ayudar estas secciones cuando utilice
este libro con Excel o Minitab.
Una vez que temrine de responder la lista de requisitos estará listo para empezar a utilizar las
Guías de Excel y las Guías de Minitab que aparecen al final de los capítulos. Estas guías le indican
cómo aplicar Excel y Minitab a los métodos estadísticos que se estudiaron en el capítulo. Las
Guías de Excel y l¿s Guías de Minitab para este capítulo (las cuales inician en las páginas 16 y 21, o
respectivamente) revisan las operaciones básicas de estos programas y explican la manera en que
esos programas manejan el concepto del tipo de variable que se explicó en l¿ sección 1.3.
Las instrucciones en las Guías de Excel y las Guías de Minitab, así como los apéndices rela- o
cionados, utilizan los términos acostumbrados para las operaciones de cómputo que se presentan
o
o
en la tabla 1.3. Lea y repase el apéndice B si parte del vocabulano de la tabla es nueva para usted. N
(¡
5
Operación Ejemplos Intero retación
TABLA 1.3
Teclas Enter Los nombres de las teclas siempre son el objeto directo del
Términos utilizados Ctrt vetbo presionar, como en "presionar Enter".
para las operaciones
shift
de cómputo
Combinación Chl+C Algunas acciones del teclado reqüeren que se presione más de
de teclas Chl+Shift+Enter una tecla al mis¡ro tiempo. Ctrl+C significa presionar la tecla
C mientras se mantiene presionada la tecla Ctrl.
Ctrl+Shift+Enter significa presionar Ia tecla Enter mientras
se mantienen presionadas las teclas Ctrl y Shift.
Hacer clic en Clic en OK Hacet clic con el mouse sobre un objeto. Cvnü los objetos sobre
un objeto Clic Todo en la los que se hace clic pertenecen a rma ventana que contiene más de
sección Núnero de una pane, umbien se lndica el nombre dela pane; por ejemplo'
páginas "en la sección Núnero de ptÁginas". Revise la sección B.2 de los
apendices para saber qué verbo se utiliza en este übro con los
obietos sobre los que se hace clic.
R E.S'UM E
cos con-fiables y para mejorar los procesos administ'ativos'
En
La estadística es el conjunto de métodos que ayudan a dar sen-
y este capitr:lo usted aprendió el vocabula¡io básico de la estadís-
tido a los datos que se utilizan todos los días para describir
tica y los diversos tipos de datos que se utilizan en los nego
, analizar el mundo. El manejo de la estadística es una habilidad
cios. En los siguientes dos capín:los se estudianí 1a recolecciór'
fundamental necesaria para una educación completa en adru-
y de datos, así como las divenas tablas, gnificas y medidas des
nisración. Los gerentes utilizan la estadística para resumr
pronósti- criptivas que se utilizan para presentar y analizar datos'
obrener conclusiones a parur de los datos. para hacer
rÉnMlNOS
habilidad numérica 4 variable categórica 6
analítica 5
muesta 8 variable continua 7
datos 8
paquete estadístico 9 variable cualitativa 6
definición oPeracional
pariírmeno 8 variablecuantitativa 7
estadística 4
4 población 7 variable discreta 7
estadística descriPtiva
4 predicciónestadística 5 variable numérica 7
estadística inferencial
estadístico 8 variable 6
-
-
D E,L
denciales. También podrá encontrar una serie de
casos
Al final de casi todos los capirulos, se encuenra un estudio
a los dieitales que amplían muchas de las secciones del Uso de '
,) de .aso seriado que le permitirá aplicar la estadística
problemas que enftenta la administración de Ashland Mult! .rá¿irtr.á que sé presentan al inicio de cada capítulo'
'Comm proveedor de telecomunicaciones resi-
S.-ic.s, un
de un es-
y pre- estadística y luego corregir los enores. A diferencia
La gente utiliza tecnicas estadísticas para comutricarse muchas situa-
los demiás tanto dantro como tudio de caso nádicional, pero al igual que en
seniar i¡formació¡ importante a
sera
todos ciones de negocios, no toda la información que aparece
fuera de sus empresas. A1 igual que en estos ejemplos, ocaslones d€s-
de manera inade- relevante para la tarea, y es probable que en .
los días las penonas uúlizan estas técnicas para
gerentes cubra información en conflicto que deberá resolver
cuada. Una responsabilidad importante de todos los
y eütar el mal uso de la estadístic4 ya comoletar el caso.
consiste en idenhfcar
desano' iaru opoyu, ,u up..ndizaje, cada caso digital comienza
sea o no intencional. Los casos digitales le ayudarán a
problema o
con un objátivo de aprendizaje y un resumen del
llar las habüdades necesarias para esu importante t'area' necesa-
tema a tratar. Cada caso lo conduce a la información
En un caso' digital se le pide que revise documentos y responder las
ria para obtener sus propias conclusiones
electrónicos relacionados con una empresa o con un
tema
documentos para
la estadística orauuotut. Usted puede trabajar con los
estadístico que se analüó en la sección Uso de ".uro,
reüsa el contenido de esos documen- io, dieitales fuera de línea después de bajarlos de la
de ese capíürlo. Usted
oásina de déscargas de esre libro lvéase el apéndice C)'
o
y asevefaclones ln-
tos, Ios cuaies pueden coniener hechos capitulo por
teáas confidénciales o públicas, con la finalidad de tiá. rabaiar.on lot.utot digitales en línea'
de Ia caoirulo. en el sitio web complementario'
identifrcar los casos en los que se haya hecho mal uso
Refe¡encias 15
:s
o
o
t o
N
REF.ERE 9¡
¡ 1. Davenpof, T. y J. Harris, Competing on Analytics: The 6. Microsofi Excel2010 (Redmond, WA: Microsoft Corpo-
:T
New Science of Winníng (Boston: Harvard Business ration, 2010).
School Press, 2007). 7. Minitab Release l6 (State College, PA: Minitab, Inc.,
'I 2. Davenport, T., J. Harris y R. Morrison, Analytics at Work 20lo).
(Boston: Haward Business School Press, 2010). 8.Nash, J. C., "Spreadsheets in Statistical Practice-
3. McCullough, B. D, y D. Heiser, ''On the Accuracy of A¡other Look", The Amerícan Statistician, ó0 (2006),
Statistical Procedures in Microsoft Excel200':'", Com- pp.281-289.
putational Statistics and Data Analysis, 52 (2008), 9. "New York 1964 World's Fatr", National Geographic,
pp. 4568-460ó. abril de 1965, p. 526.
4. McCullough, B. D. y B. Wilson, "On the Accuracy of 10. Thompson, C. "What Is I.B.M.'s Watson?" http://www.
Statistical Procedures il Microsoft Excel 1997" , Com- nytimes. com/20 I 0 I 0 6 I 20 | ma,ga,zine/20Computer-t.
putat¡onal Statistics and Data Analysis,3l (1999), html,20 de junio de 2010, p. MM30 de la revista do-
DD. ¿t-Jt. minical.
5. ir.icCullough, B. D. y B. Wilson, "On the Accuracy of
Statistical Procedures il Microsoft Excel 2003", Coz-
putational ,Srat¡stics and Data Analysis,49 (2005),
pp. 1244-1252.
16 CAPÍTULOI Int¡oduccióo
Tipos de Proporciona instrucciones paso a paso para aplicar Excel a los métodos estadísticos del capítulo.
instrucciones para Ventajas Se aplica a todas las veniones de Excel. Crea hojas de cá1cu1o y hojas gráficas "vivas"
la Guía de Excel que se actualizan de manera automática cuando cambian los datos básicos.
Desventajas Podría tomar mucho tiempo, ser frustrante y provoca¡ muchos enores, especialmente
para los novatos. Podría obligarlo a concentr¿rse en detalles de Excel de bajo nivel, distrayéndolo
del aprendizaje de la estadística.
Instrucciones de PHStat2
Brinda instrucciones paso a paso para utilizar el auxiliar PHStaO con Excel. (Para conocer más
acerca de PHStat2, véase el apéndice G).
Ventajas Crea hojas de cálculo y hojas gráficas'Vivas" que son iguales o similares a las que se
pueden crear con las instrucciones de E¡¿el m pmfundídad-Lo libe¡a d€ tener que concentrarse en
det¿lles de Excel de bajo nivel. Se utiliza para conoborar con rapidez los resultados oeados por las
I hstrucciones de Exc el en profundidad .
i
Desventajas Se debe instalar de fbn¡a separada y, por lo tanto, requiere conocimientos sobre la
{ instalación del software en su computadora. (Véase el apéndice D para los detalles técnicos). No es
'I
compatible con versiones Mac OS de Excel.
i!
tt)
t '. -, Si desea dominar Excel y ganar práctica en constuir las soluciones de manera ascendente, de-
berá utilizar las instrucciones de E¡ cel en profundidad. Si prefiere nabajar de forma descendente, es
decu, si primero quiere obtener resultados nípidos y después estudiar los detalles de una solución,
entonces quená aprovechar al máximo el uso de las instucciones de PHStat2. En cualquier momento
puede altemar el uso de estos métodos sin sacrificar su comprensión. Ambos métodos conducen a
resultados idénticos o casi idénticos, los cuales se presentan prhcipalmente en forma de libros de
trabajo reutilizables. Estos libros de trabajo, al igual que los libros de trabajo descargables (véase
et apéndice i), se pueden guardar y reutilizar con otros problemas, así como en otros cursos o en el
lugar de trabajo.
Cuando es necesario, las Guías de Excel también incluyen instrucciones de las Herrami€ntas
para Análisis (Analysis TootPak), un componente opcional de Excel que Microsoft distribuye con
nuchas versiones de este programa, excepto con la versión actual de Mac Excel.
Las instrucciones de la Guía de Excel contienen las versiones 2010 y 2007 de Whdows Excel y
señalan zus dife¡encias, cuando estas son significativas. Las instrucciones están redactadas de tal ma-
nera que sean lo más compatibles posible con las veniones actuales de Mac Excel y OpenOfrce.org
Calc, que funcionan de manera muy similar a Excel. Si utiliza Mac Excel u OpenOffice org Calc,
El resto de esta Guía podní uülrzar casi todos los libros de aabajo que se mencionan en las instucciones de Excel en prcfin'
de Excel revisa los didad. Si empleala versión mrís antigua de Excel 2003 para Windows, puede utilizar las instrucciones
conceptos básicos y las
de PHStat2 y descargar del sitio web que complementa este libro el documento Uso de Excel 2003
operác¡one5 comunes
que encontrará al utilizar con Estadística basica para negocios, que adapta las instrucciones de Excel en profundidad patala
Excel con este libro. versión 2003 de Excel.
Guía del caDiiulo I Para Excel 17
FIGURA GE1.1
d¡ una cas. 6r,
Un ejemP]9 0J0 9, 6l LloE ¡iel¡te
hoja. de catcuto 0,7t rr: 5.6 av€r{l
de datos
Excel hfiere el tipo de variable a partir,de los datos que se ingresan en una columna. Por ejem-
plo, si Excel descubre que una columna contiene ntlneros, la trataní como variable numérica' Si
Excel descubre que una columna contiene palabras o d¿tos alfanuméricos, la tatará como una va-
riable no numérica (categórica). Este método imperfecto funciona la mayor parte del tiempo en
Excel, especialmente si usted se asegura de que las categorías de su variable categórica sean pala-
bras o fiases, como "sí" y "no", y no valores codificados que podrían confundirse con valores nu-
méricos, como "l","2" y"3". Sin embargo, como no es posible definir el tipo de variable de forma
explícita, en ocasiones Excel comete "errores" al sugerir o permitir accio¡es absurdas como utili-
zar un método estadístico que está diseñado para variables numéricas con variables categóricas.
A1 ingresar datos, nunca se salte renglones en una columna ¡como regla general, evite sal-
tarse cualquier columna. Ponga atención a cualquier instrucción especial que apa¡ezca a lo largo u,
del libro con respecto al orden en que debe ingresar sus datos. Para algunos métodos est¿üsticos,
ingesar los datos en un orden que no es aceptado por Excel producirá resuliados incorrectos.
=
La mayoría de los libros de trabajo de Excel que puede bajar del sitio de descargas de este libro o
(apéndice C) y utilizar con las Guías de Excel contienen la hoja de cálculo DATA que sigue las re- o
o
glas de esta sección. Cualquiera de esas hojas de cálculo sirve como un modelo adicional para el N
(¡l
método con el que decida ingresar los datos de variables en Excel.
completar la t¿rea. 41 guardar archivos, algunas veces deseará cambiar el tipo de archivo antes de
hacer clic en Save. Si desea aknacenar su libro de fiabajo en el formato utilizado por Excel 2003 y
versiones anteriores, seleccione Excel 97-2003 Workbook (*'xls) de la lista desplegable Save as
type (que se muestra en la figura GEl.2) antes de hacer clic en Save. Si desea guardar los datos en
un formato que se pueda abrir con programas que oo abren übros de trabajo de Excel, podría selec-
cionar Text (fab delimited) (*.trt) o CSV (Comma delimited) (*.csv) como el tipo de guardado.
Cuando quiera abrir un archivo y no encuentre su nombre en la lista, verifique que la carpeta
¿ctual de Look in sea la adecuada. Si lo es, cambie el tipo de archivo a All files (*,*) para ver todos
los archivos en la carpeta actual. Est¿ técnica le ayudará a descubrir erroles ortográficos ó exten-
siones de archivo faltantes que no permiten que se mueste el archivo.
Aunque todas t¿s versiones de Microsoft Excel hcluyen el comando Save, debe evitar esta
opción hasta que tenga experiencia, ya que si utiliza guardar es muy fácil que sobrescriba su tra-
bajo de manera inadvefida. Además, no puede utilizar el comando Save para cualquier libro de
trabajo abierto que Excel haya marcado como de solo lectura. (Para aknacenar este tipo de libros
de tabajo, utilice Save As.)
FIGU RA GEI.3
Menú rápido en la
hr.n-
pestaña de una hoja grktr
y.. e, -..-t-^v l^
^t Luou' uE
diálogo Move 8ar¡as
F¡l.d st¡r{.-
I.b Colr.
lldr
¡Él.d A! 3h.rlt
También puede hacer una copia de una hoja de cálculo o moverla a otro lugar en el mismo
libro de trabajo o en un segundo libro. Haga clic con el botón derecho en la pestaña de la hoja y
seleccione Move or Copy en el menú rápido que aparece. En la lista desplegable To Book del cuadro
cle diálogo Move or copy (véase ta figura G81.3) primero seleccione (new book) (o el nombre del
libro de trabajo elegido ya existente), marque el cuadro Creat a copy y luego haga clic en OK.
FIGURA GE1'4
de,
Vista Preliminar
impresión de Exce¡
z}ilo,fizqu¡erdal Y
F-J.cel ¿wl
(insertado), Y cuaoro
de diálogo de rage
SetuP (derecnal
En Excel 2007 el mismo proceso requiere un mayor número de clics. P¡imero haga clic en
Oflice Button y luego mueva el cursor sobre Print (pero sin hacer clic). En la galería de Preview
and Print, haga clic en Print Preview. Si la vista preliminar mostrada (véase la figura GEl.4) con-
tiene enores o presenta la hoja de cálculo de una forma no deseada, haga clic en Close Print Pre-
view, realice los c¿mbios necesarios y vuelva a seleccionar la vista preliminar de impresión. Una
vez que termine de hacer las co¡recciones y los ajustes, haga clic en Print en la vent¿na de Print o
heview para desplegar el cuadro de diálogo Print (que se muestra en la sección B.3 de los apéndi-
=
ces). Seleccione la impresora que se usará de la üsta desplegable Name, haga clic en AII y Active
Sheet(s), ajuste el número de copias en Number of copies y luego haga clic en Otr( o
En caso necesario, puede ajustar el fonnato de impresión mietrfras se encuenta en la vista pre- o
o
liminar de impresión haciendo clic en el icono de Page Setup @xcel 2007), o bien, en la liga de N
Page Setup (Excel 2010) para abri¡ el cuadro de diálogo Page Setup (la imagen derecha de la fi- (¡
gura GE1.4). Por ejemplo, para imprimir su hoja de cálculo con cuadrícula y encabezados de ren-
o
glón numerados y encabezados de columna con letras (similar a la apariencia de la hoja de cálculo
en la pantalia), haga clic en la pestaña Sheet en el cuadro de diálogo de Page Setup, marque Gri-
dünes y Row and column headings y luego haga cüc en OK.
Aunque todas las versiones de Excel ofrecen la opción (de inpresión) de Entire workbook,
obtendrá mejores resultados si imprime cada hoja de cálculo (u hoja grrifica) por separado cuando
necesite imprimir más ds
''na.
Figura-l.2, debe encer¡ar el nombre de la hoja entre comi- 83 se copie en la celda C3, que la fórmula =A4 + 84 se c0-
llas sencillas, como en'CITYDATA'IA2 o 'F'igura-1'2'!A2. pie en la celda C4, y así sucesivamente.
Cuando necesite refenrse a un gnrpo de celdas, como las Hay cücunstancias en las que quizás usted no desee que
celdas de una columna que ahnacena los datos de una variable Excel ajuste una parte o toda la fórmula. Por ejempio, si co-
en particular, utilice un rango de celdas, el cual nombra Ia pia la fórmula de la celda g2 =(tr2 + B2)lBl5' y la celda
celda supoior izquierda y la celda inferior derecha del grupo 815 contiene e1 divisor que utilizaÉ en todas las fórmu-
se
con el siguiente formúo SheeName'lUpperLeflCell: Lowe' Ias, no desear:i que la fórmula =(A3.. B3)/816 se copie eu
rRightCett. Por ejemplo, el rango de celdas DATAIAI:AII C3. Para evitar que Excel ajuste una referencia de celd4 uti-
identifica las pnmeras I I celdas en la primera columna de la lice una referencia de celda absoluta insertando un siglo
hoja de cálculo DATA. Los rangos de celdas se extienden so- de dólares ($) antes de las refe¡encias de columna y de ren'
bre muitiples columnas; el rango de celdas DATAIAI:DII se glón. Por ejemplo, la referencia de celda absoluta $B$15 en
refiere a las primeras 1l celdas en las primeras 4 columnas de la fórmula de la celda C2 copiada =(A2 + B2)i$B$15 provo-
la hoja de cálculo. caría,que Excel pegue =(A3 + B3y$B$15 en la celda C3.
Al igual que cuando se remita a una sola celda, puede (Para facilitar 1a lectura, las fórmulas que se muestran en
omitir la parte ,lheetNamel delz referetcia ¡emiüendose a u¡ ilustaciones de las hojas de cálculo en este libro, por lo ge-
rango rle celdas de la hoja de cálculo actual, y debe utilizar neral, no incluyen referencias de celdas absolutas).
un par de comillas sencillas si el nombre de la hoja contiene No conirnda el uso del símbolo de dó14¡es en una refe-
espacios o caracteres especiales. Sin embargo, en algunos rencia absolut¿ con la operación de formato que mu€sta los
cuadros de diálogo debe incluir el nombre de la hoja remi- números con valores de moneda estadounidense.
tiéndose a una celda para obtener los resultados adecuados.
(En tales casos, las instrucciones de este libro incluyen el
GE1.8INGRESO DE FÓRMULAS EN HOJAS
nombre de la hoja; de 1o conta¡io, no se incluyen).
DE CÁLCULO
Aunque en este libro no se utilizan, las referencias de las
il celdas oueden incluir el nombre de un libro de fabajo con el logrese las formulas escribiendo el signo de igual (=) seguido
il formato de una combinación de operaciones matemiíticas y de proce-
I Tal vez des- samiento de datos. Para las fórmulas senc las, utilice los sím-
f¡i cubra este tipo de referencias si, de manera inadvertida' bolos +, .-, *, l; y para las operaciones de suma, resta,
copia ciertos tipos de hojas de cálculo u hojas gnáficas de un nultiplicació4 diüsión y exponenciales (rm número elevado
t
ti libro de fabajo a oto. auna potencia), utilice ^. Por ejemplo, la ñmrula =DATA!B2
ill + DATAIB3 + DATAIB4 suma los contenidos de las celdas
i,
GE1.7 REFERET'ICIAS DE CELDAS 82, 83 y 84 de la hoja de cálculo DATA y muesha la suma
$ ABSOLUTAS Y RELATIVAS como el valoi en la celda que conti€ne la formula.
También se utilizan funciones de hoja de cálculo en las
Muchas hojas de cálculo contienen columnas (o renglones)
fórmulas para simplificarlas. Para utilizar una fimción de hoja
fl con fórmulas aparentemente similares. Por ejemplo, la co-
de cálculo en una formula, escriba la fimción como se mues-
il lumna C en una hoja de cálculo podría contener fórmulas que
F ha en las instrucciones de este libro, o bien, utüce el Asi'
[. los contenidos de los renglones de la columm A y de
' suman tente para funciones de Excel para insertar la función. s'
la columna B, La fórmula para la celda ¿2 tgn¿=L2 +82,la
I
ajusta las referencias de oeldas en las fótmulas, de manera cómo lograr que los contenidos de una celda aparezcan en
oue si se copia la fórmula =!,2 + B2 de la celda C2 a la negritas o cómo controlar el número de decunaies que apare-
."ldu E3 r" obti"n. .orno ¡esultado que la fórmula =A3 + cen, lea las secciones F.l y F.2 del apordice F.
Guía del caoín¡]o I Dara Minitab 21
FIGURA GM1'1
Hoia de cálculo
princiPal de Minitab
con las ventanas
sobrePuestas de
sesión, hoja de
cálculo, 9ráfica Y o
administrador de
proyectos (Session,
Woiksheet, Chart Y
o
Project Manager) o
o
N
(¡
Puesto que Minitab define de forma explícita el tipo de vanable, a diferencia de Excel, la posi-
bilidad de realizar acciones absurdas es limitada (como utilizar un método estadístico que está ü-
- señado para variables numéricas con datos categóricos). Si Minitab malinterpreta sus datos, usted
:
tiene la posibilidad de cambia¡ el tipo de variable seleccionando Data )
Change Data Type y
I lueso seleccionando en el submenú el cambio adecuado.
22 cAPÍTt'Lo I Introducción
GM1.3cÓMoABR|RYSALVARHoJASDEcÁLcULoYPRoYEcIoS
ParaabriryguardarhojasdecálculooarchivosdeproyectosenMinitab,primeroseleccionela
del archivo del libro. Para
,orp.o qué imacena un libro cle trabajo y luego especifique el nombre
uuri, *u no¡u a. .álculo, seleccione Fíe t
open worksheet. Para abrir un proyecto, seleccione
Fite + Open fro¡ect' Para guardar una hoja di cálculo' seleccione
File t
S¡ve Current Work-
sheetAs, y para guardar un proyecto seleccione File )
Save Proiect As'
la figura
e,o¡á'.".il¿or pan aurir y guaraar mueshan cuadros de diálogo casi idénticos. En Work-
comandos open
GMl.2 r;;r;.;1¿a los cu"dror áe-diálogo rle Minitab 16 que muestran los
sheet Y Save Current Worksheet As'
H
rri
1{ur,rr*a*o.rr* o.*..1
lrii
'-"J"1
| ü-¡ | '*' l 'ú
;1.
iii
TI
la carpeta de almacena-
f$
tt Dentro de los cuadros del diálogo de abrir y guardar, se selecciona
ft
¡tl miento utilizando la üsta desplegable que aparece en la parte superior
de cada cuadro En el ¡e'
para el libro de trabajo. Para completar
¡f.
:
dro File nane se anota o selecciona de una lista el nombre
latarea,hagacücenOpenoSave.Esprobablequealal¡mcenarunarchivo'deseecanbiareltipo
-antes
de hacer clic en save. si des"a guurdar sus datos como
hoja de cálculo de Fxcel,
de arcbivo
seleccio¡eExcel97-2003delalistadesplegableSaveastypeantesdehacerclicenSave.Sidesea
que no abren libros de trabajo de
zuardar los datos en un formato que pueda abrirse con programas
Éxcel, podría seleccionar las opciones Text o CSV en Save as type'
io*do ¿.r., abrir un archivo y no encuentre su nombre en 1a lista, conobore que la carpeta
de Look in actual sea la adecuada. si lo es, cambie el tipo de
archivo a All (*;*) para ver todos los
de ortografia o extensio-
archivos de la carpeta achlal. Esta técnica debe ayudar a descubrir faltas
nes de archivo faltantes que evitan que se muestre el archivo'
Cuandoguardeunproyecto'puedehacerclicenoptionsenelcuadrodediálogoSaveProject
en el cuadro de diálogo de Save
As luego Ápecfrcai que partes del proyecto desea guardar
y
aquí)'
-Project4ptions (el cual no se muestra
i*qu. fnlioioU incluye los comandoi Save Current Workheet y Save Project (dos coman-
,.As,'), debeni evitar estas opciones hasta adquirir experiencia Si usa el conrando
dos sin eitérmino
Save,esmuyfácilquesinquerersobrescribasufi¿bajo'Además,nopuedeutilizarelcomandoSave
almacenar este tlpo oe
.oo íibro, atiertos que Minitab haya marcado como de solo lectura (Para
libros de rabajo, utilice Save As).
gráficas individuales y una ven-
En Minit;b también se abren y se guardan de manera separada
en este libro'
tana de sesión de proyecto, aunque tales operaciones no se utilizan
Güía del caDítulo I Dara Miniiab 23
t.
apfef|orzale
I servicio de inversiones Choice Is Yours ayuda a sus clientes con sus opciones de inver-
sión. Choice Is Yours evalúa i¡versiones en bienes raíces, inversiones direchs de capital
privado, productos derivados y diversos tipos de fondos de inversión especializados.
Usted fue contratado para asesorar a los clientes que quieren inverth en fondos de inver-
sión, los cuales agnrpan el dinero de muchos clientes hdividuales y lo invierten en una
combinación de valores diversos y en ofios tipos de inversiones. (Para aprender miís acerca de los
U'
fondos de ilversión, visite investopeüa.com/university/mutualfunds).
Puesto que los fondos de inve¡sión constituidos por una alta inve¡sión en acciones comunes re-
cientemente han tenido rendimientos variables, Choice Is Yours qüere examinar los fondos de inver- o
sión que se concentan en i¡vertir en ciertos tipos de bonos. Analistas de la empresa seleccionaron o
una muestra de 184 fondos de este tipo que, según creen, podrían interesar a los clientes. A usted se o
N
le pidió que presentara datos acerca de esos fondos de una forma que ayude a los clientes a toma¡ 5
buenas decisiones de inversión. ¿Qué datos acerca de cada fondo de inversión en bonos reuniría
para ayudar a los clientes a comparar los diferentes tipos de fondos?
Un buen punto de partida sería reunir datos que ayuden a los clientes a clasificar los fondos
de inversión en diversas categorias. Usted podría investigar factores como el riesgo que tiene
una estrategia de inversión en fondos y el tipo de bonos en que el fondo invierte prin-
cipalmente. Desde luego, tambien querría cooocer el desempeño del fondo
en el pasado para informar al cliente varias medidas del compor-
tamiento previo de cada fondo. (Aunque el desempeño previo
no es una garantía del desempeño futuro, los datos delpasado
pueden hformar a los clientes cómo se ha administado cada
fondo de inversión).
Cuanto más piensa acerca de su ta¡ea, se da cuenta de que
la información que anojan los datos de los 184 fondos de in-
versión es tanta, que resulta muy dificil revisarla por completo.
A usted le pidieron que presentara los datos sobre estos fondos
de una forma que sirva para que los clientes tomen buenas deci
siones de inversión. ¿De qué manera podría revisar y explorar
este tipo de datos de una manera sencilla? ¿Qué datos acerc¿ de
cada fondo reuniría para ayudar a los clientes a comparar los dife-
rentes tioos de fondos?
I reto que enfrenta,en la parte I de la sección anterior es el de ex¡ñinar utra gra¡ cantidad de
. Defina las va¡iables que desea estudiar para resolver un problema de negocios
o cumplir un
objetivo admidstrativo.
. Reúna 1os datos de las fuentes adecuadas'
. Organice los d¿tos reunidos por medio de tablas'
. Preiente los datos resumidos por medio de gnificas'
. Analice los datos examinando las tablas y las gmficas adecuadas (y en capítulos postenores
utilizando ohos métodos estadísticos) para sacar conclusiones'
tie. (véase la referencia 2). En el capítulo 1 vimos que, para definir una variable'
estudísti.os
se debe elaborar una definición operacional e identificar el
tipo de variable. En este capítulo apretr-
la present¿ción gnífica y el
dení nás sobre los pasos implicados en Ia recolección, 1a organización,
análisis dé los datos.
Pa¡a ilustrar el modelo DROPA, en los ejemplos de este capítulo con
frecuencia se utiliza la
en bonos que se mencionar^-
muestra de 184 fondos cle inversión especializados en las inversiones
iuf^.t" I a. U ,ección sobre Choicé i, Yo*t. (Pra examinar esta muestra abra f![f@[
r..
"o explica en el
de los archivos de datos que puede descargar y utilizar con este libfo,
tal como se
las preguntas planteadas
op¿n¿ice C). Cuando llegue ai final del capítulo, será capaz de responder
que comparan dos categorías de fon-
en la seccién iniciat. Porejemplo, podrá rJsponder preguntas
dosenbonoscomo:..¿eústealgunadiferenciaenlasrendimientosdelosfondosenbonosinterme-
t clios gubemamentales y los fondos en bonos corporativos a corto
plazo?" o "¿los fondos en bonos
que los fondos en boúos cor-
interáedios gubemament¿les tienden a ser inversiones menos riesgosas
{ porativos a corto plazo?".
i
i
É
2.1 Recolección de datos
Algunos ejem-
una vez que ha deñnido sus variables, necesitará reunir los datos conespondientes.
plos de recolección de datos son los siguientes:
I
.Unanalistademarketingdeseaevaluarlaeficaciadeunnuevoanunciodetelevisión.
. Un fabricante farmacéuiico necesita determinar si un nuevo fármaco es más eficaz que los
que se usan en la actualidad.
. ún gerente de operaciones desea mejorar un proceso de manufactura o'de servicio.
. Uu iuditor quiáre reüsar las trausaóciones financie¡as de una empresa con
la finalidad de
2,1 Data, and Story Library (DASL) es una biblioteca en 2.3 Una cadena de supermercados desea determinar el me-
línea de archivos de datos e historias que ilustran el uso de jor lugar para colocar una marca de bebidas gaseosas en sus
t los métodos estadísticos básicos. Visite lib.stat.cmu.edu/
index.php, haga clic en DASL y explore un conjunto de da-
tiendas. ¿Qué tipo de fuente de ¡ecolección de datos cree
que debería utilizar la cadena de supermercados?
$ tos que sea de su interés. ¿Curíl de las cuatro fuentes de datos
t{ se utilizó para el conjunto de datos que eligió?
2.4 Visite la página "Longitudinal Employer-Household
Dlnamics" del sitio web del U.S. Census Bureau, lehd.did.
t
2.2 Visite el sitio web de la organización Galiup en www. census.gov/led/. Examine la sección titulada "Did You
t gallup.com y lea la principal historia del día. ¿En qué tipo Know". ¿En qué tipo de fuente de datos se basó la informa-
* de fuente de datos se basa? ción que aquí se presanta?
*
i
{
ORGANIZACIÓN DE LOS DATOS
Después de definir sus variables y reunir sus datos, debe organizar el material de nane¡a que' mas
adelante, pueda realizar una presentación gráfica y analizar Ia información. Las técnicas que debe
.
utilizar para organizar sus datos dependen del tipo de variable (categórica o numérica) relacionada
i con los mismos.
I
L
28 CAPiTULO 2 organización y presentación gráfica de los datos
línea
Electónico/en 28
Oho/no sabe 3
Tabla de contingencia
Unatabladecontingenciapermiteestudiarpat¡onesquepodríanexistireohelasrespuestasde
cruzadas o conteos conjuntos
dos o urás variables categóricas. este tipo de tabla hu"e iabul""ion"t
á;;;*p"*^ a las viiables categóricas. En el caso más sencillo de dos variables categóricas,
-en
;r;ñstas.oo;.-t". se ordenan la tabla de modo que los conteos de las categorías de una
2.2 Organización de datos categóricos 29
variable se localizan en los renglones, y los conteos de las categoías de la oha variable se locali-
zan en las colur¡¡as. Las hte¡secciones de los renglones y las columnas se llaman celdss, cada
y
celda contiene un valor asociado con un pat único de respuestas par¿ las dos variables (por ejem-
plo, cuota: Si y Tipo: Inter¡nedio gubemamental en I a labla 2.3). Las celdas pueden incluir la fre-
cuencia, el porcentaje del total general, el porcentaje del total por renglón o el porcentaje del total
por columna" dependiendo del tipo de tabla de contingencia que se utiüce.
En 1a parte I de la sección referente a Choice Is You¡s se podría crear una tabla de contingencia
para examinar si existe algúl patrón entre el tipo de bono del fondo (intermedio gubernamental o
corporativo a corto plazo) y si el fondo cobra una cuota (sí o no). Primero se cuentan las respr'lestas
conjuntas para cada uno di los 184 fondos en bonos de la muestra (incluidos en l![f@' Se
anota la reipuesta en una de las cuako celdas posibles de 1a tabla, dependiendo del tipo de fondo y
de si este cobra una cuota. Por ejemplo, el primer fondo listado en la muestra se clasifica como un
fondo intermedio gubemamental que no cobra una cuota. Por lo tanto, se incluye esta respuesta
conjunta en la celda que se localiza en la intersección del renglón de lntermedio gUbernamental y
la colunrna de No. En la tabla 2.3 se presenta la t¿bla de contingencia complet4 después cle que se
consideraron los 184 fondos.
=
Para buscar otros paaones enhe el tipo de fondo y el cobro de una cuota, se pueden construir
o
o
tablas de contingencia que presentan los valo¡es de 1as celdas como un porcentaje del total geoelal o
(los i 84 fondos), los totales por renglón (los 87 fondos intermedios gubemamentales y los 97 fon- N
y 5
clos en bonos a corto plazo) y los totales por columna (los 54 fondos que cobran una cuota los ul
130 fondos que no la cobran). Las tablas 2.4,2.5 y 2.6 presentan estas tablas de contingencra.
En 1a t¿bla 2.4 se observa que 47.28% de los fondos corporativos de la muesta corresponden a
fondos intermedios subemamentale s, 52.72o/o a fondos en bonos corporativos a codo plazo y
18.48% a fondos intermedios gubemamental€s que cobran una cuota; En la tabla 2.5 se obserya
que 39.08% de los fondos intermedios gubemamentales cobfan una cuota, mientas que 20.62% de
CUSTA
TABLA 2.ó
sí No Totrl
TIPO
fabla de contingencia
que muestra el tlPo 62.96 40;17 47.28
lntermedio gubernamental
cje fondo y si cobra 37.M 59.23 52.72
Corporativo a corto Plazo
una cuota con base 100.00
Tot¡l 100.00 100.00
en el porcentaje del
total Por columna
ropuerto intemacional de Palm Beach Las categorías fue- Región Consuno de Petróleo
ron las siguientes:
Europa desanollada r4.5
Cuchillos Y navalas
4 114 Resto del mundo 46.7
Ohos 357 -
c) Calcule el porcentaje de los datos en cada categoría' .
petróleo.
á) ¿Qué concluye con respecto al consumo de
a) Calcule el porcentaje de 1os datos en cada categoría'
durante 2009?
ú¡ ¿Qué conclilye con respecto a los artículos prohibidos?
t
,
r 2.3 O¡ganización d€ datos numéricos 31
federales en Es¡ados Unidos para los 2.1 1 En un hospital se realizan varios cientos de pruebas de
2,9 Las obligaciones
prestaciones Y latzuda nacional ascendieron laboratorio cada día. La tasa de pruebas realizadas de fo¡rna
i'rogtu.ut de rnadecuada (y que, por lo tanto, necesitan repetlrse) parece ser
l'áí¡ Uittoo"t ¿" Aótaresen 2008. EI costo por familia l$)
categorías fue el siguiente: estable, de aproximadamente 4%' En rm esfi.rer¿o por encontrar
iara las difer.ntes
lo que provoca que las pnrebas no cumplan los requisitos, es
decir, que necesiten repetine, el director de laboratorio decide
Costo por familia ($)
cxtegofi^ llevar registros durante una semana. Las pruebas de laborato-
15,851
Jubilación de funcionarios rio se subdividieron de acuerdo con el tumo de 1os trabaja-
5¿ 5??
Deuda federal dores oue las realizaron. Los resrftados son los siguientes:
Seguro médico
284,288
Jubilación de milit¡res
29,694 TURI{O
PRUEBAS flE TAEORATORIO
Seguriüd social 160,21ó
REALIZAOAS Noche Total
2,172 lo a^ 40
Otros No cumplen con Ias normas
"What We Owe", US'4 Ioday'29 dernayo de Cumplen con las normas 654 306 960
Fuente: Datos €xiaídos de
2009, P, lA. Total 6T0 330 1,000
o) Calcule el porcentaje de los datos en cada categoría' a) Construya tablas de contingencia basadas en los porcen-
ói conctuye con respecto a los programas de presta-
¿Qué tajes totales. Ios porcentajes por renglón y los porcentajes
ciones?
por columna.
2.'t0 En una encuesta aplicada a 1,085 adultos se pregr¡ntó ó) ¿Qué tipo de porcentaje (por renglón' por colurnna o to-
lo siguiente: "¿Le gusta salir a comprar ropa para usted?"' tal) cree que oftece más i¡for¡nación con rcspecto a estos
Los resultados (datos extraídos de "Split decision on clothes datos? Explique su respuest¿
shopping", USA Today,28 de enero de 2011, p. lB) indica- c) ¿A qué conclusiones podría llegar el director de laborato- o
ron que a 51% de las mujaes les gusta salir a comprar ropa rio con respecto al patrón de las pnrebas que no cumplen
para ellas, en tanto que solo a 44% de 1os hombres les gusta con las normas?
Lacerlo. No se informó sobre el tamaño de las muestras de
o
2.12 ¿En ta acnralidad le toma mas
tiempo que antes ser eü- o
hombres y mujeres. Suponga que los resultados son los que o
minado de una lista de coneo electónico? Un esn¡dio de 100 N
se observan en la tabla:
de los principales minoristas en línea reveló lo siguiente: s
5
¿LE GUSTA SALIR
GEI'IERO SE ¡¡ECESITA llAR TBES O MAS
A CÍIMPRAR ROPA
PARAUSTED? Hombre Mujer Total CI-ICS PARA SER ETIMIMDO
que se eligin, al igual que la iorma en que se presentan los datos en la hoja de cálculo'
Arreglo ordenado
Unanegloordenadoacomodalosdatosdeunavariablenuméricadelm,ísoequeñoalrnásgrande.Un
de ros daios-y es especi¿lnente útil
arreslo ordenado si-" p"." .oooJr*J+*i.*g"
a.
""lores datos que se
ffii t*;;;ñ;"' du.t' P;r ejempio' en la tabla 2 7A se observan los en una
áe los alirnentos eú 50 rest¿urantes localüados
reunieron al realizar un es¡¡dro dll costo ciudad (alnace-
ubicados en los subr¡rbios de la misma
ciudad iúportante v tos ¿" So r"Jt"orantes
no ordenados de la tabla 2.7A no penniten
obtener
il;, #:i;;;;^ffii. ;;;i",
conclusiones Épidas ace¡c¿ del costo de los alimentos'
79
A' 2T
)i 43 49 28 35
citadinos Y 50 40
restaurantes 64 48 41 34 )J 27
40 49 54
suburbanos 61 59 48 78 65 ^a
44 58 68 59
46 J) 40 ll
37 56 60 31 68
)J
28 44 26 a37 63 22 OL
per'
arreglo ordenado de los mismos datos' nos
En contraste, \a rabla 2-7B,la versión con e1 y
mite ver con rapidr" qu" el .otto d" i'i nti,o'oto
to toJttttau¡¿ntes de 1a ciudad va de $21 $79
a
a $ó8'
;;i;;;;;ñ alimento en los restaurantes suburbanos va de $22
que incluye una gran cantidad de valorcs iesulta
dificil
Cuando se tiene un conlunto de datos
una distnbu-
sacar concrusiones a partir de un aneglo
oidenado, En este caso, sería mejor crear
porcentual acumulada (véase las siguientes
ción de frecuencia o porcentajes y un"u airt.ltu"ioo
secciones).
2.3 Oreanización de datos nüméricos 33
40 4l )l'l 42 43
J] 38 39 40 40
43 44 44 44 45 45 46 48 48
49 49 )J 54 fo fo 57 )ú )v )v
59 6l 62 & 65 67 68 78 79 79
34 34 35 36 )l 38
38 39 40 40 4l 4l 42 42 43 43
44 44 AA
44 45 45 46 48 49 )l
)J 53 54 )) )) ftl 60 62 63 68
Distribución de frecuencia
Una distribución de frecuencia resume valores numéricos organizríndolos en un conjunto de cla-
ses ordenadas numficamente. Las clases son gru.pos que representan un rango de valores, denomi-
nados intervalo de clase. Cada valor puede pertenecer solo a una clase y debe estar incluido en
una de las clases.
Para crear una distibución de tecuencia útil, es necesario pensar cufutas clases son adecuadas
v,
para los datos y también deteminar un ¡azcío adecuado para cada intervalo de clase. En general, una
-dirtibu"ióo
d.t **.ia debe incluir al menos 5 clases, aunque no más de 15, ya que el hecho de te- =
ner mrry pocas o dernasiadas clases brinda muy poca inforriación nueva- Pa¡a det¡rmina¡ el tam¡ño o
o
ancho rlet interv¡lo de clase (véase la ecuación 2.1), se r€sta el valor más bajo del valor más alto y se o
diüde el resultado ente el ¡r!rcro de clases que se desea en la distribución de fiecu€ncia- o
N
5
or
Como los datos del restáurante citadino constan de una muesta de solo 50 ¡estaurantes, serÍa
aceptable utilizar entre 5 y 10 clases. A partir del aneglo ordenado de los costos en 1a ciudad que se
preientan en la tabla 2.78, la diferencia enhe el valor miás alto de $79 y el valor más bajo de $21 es
$58. Si se utiliza la ecuación (2. I ), se calcula el ancho del intewalo de clase de la siguiente manen:
.58
A¡cho del mtervalo = = ).ó
l0
Este resultado sugiere que se debe elegir un ancho de intewalo de $5.80. Sin embargo, el ancho siem-
pre debe ser una cantidad que simplifique la lectrua y la interpretación de la distibución de frecuen-
cia- En este ejemplo * d.l iotrrvalo de $10 sería mucho miís adecuado que un ancho de $5-.80.
-"Lo
Como cada valor solo puede aparecer en una clase, es necesario establecer límites de clase
para cada una, definiéndolós de forma clara y apropiada- Por ejemplo, si elegimrcs $10 como el
r- intervalo de clase para los datos de los fest¿urantes, necesitaríamos establecer límites que incluyan
v todos los datos y simpliñcar la lectura y la interpretacióú de la distribución de frecuencia. Como el
costo de un alimento en los restaurantes citadinos varía de $21 a $79, cumplimos con los requisitos
il si establecemos el prim-er intervalo de clase de $20 a menos de $30, el seguudo de $30 a menos de
ir¡'
l- $40, y así sucesivamente hasta el último intewalo de $70 a menos de $80. En la tabla 2.8 se presen-
tan las dist¡ibuciones de frecuencia de los costos por alimento de 1os 50 restaurantes citadinos y de
1.1
)s il
i los 50 restaurantes suburbanos utilizando estos intervalos de clase.
34 CAPÍTULO 2 Organización y presentación gráfica de los datos
cITADtlto suEuRBAl{0
BLA 2.I O
Frecuencia Porcent¡je Frecuetrcia Porcentaje
relativas c0sr0 PoR AulrEilTo ($) rel¡tiv¡ (%l rel¡dv¡ (o/n')
v,
La proporción o frecuenci¡ rel¡tiva en cada grupo es igual al númuo de d¿ros en cada clase
dividido ente el número total de d¿tos. El porcentaje en caü grupo es su proporción multiplicada
por 100%. o
o
o
N
CALCULO.DE LA FROPORCIÓN O FRECUENCIA RELATIVA A
La proporción, o fiecuencia ¡elativa, es el número de daros en cad¿ clase üvidido entre
el número total de datos:
número de datos-;;:-i:;t:-
en cada clase
tfoporclon = lrecuencla rentrva = --------;------ Q.2)
Si existen 80 datos y la frecuencia en cierta clase es 20, la proporción de datos en esa clase es:
2!=n^
80 ---
y el porcentaje es
3d=u.ró
La distribución porcentual se calcula multiplicando cada proporción (o frecuencia relativa)
por 100%. Así, la proporción de alimentos en los restaurantes citadinos que cuest¿ ente $50 y $60
es 9 üvidido entre 50, o 0.18, y el porcentaje es 18%. Eü la tabla 2.10 se presentan la distribucióo
3ó CAP1TULO 2 Organización y presertación gráfica de los datos
defrecuenciarelativayladistribuciónporcenhraldelcostodelosalimentosen¡estaurantescitadi-
nos y suburbanos
un poco más en los restaurantes
be h tabla 2 10 podemos concluir que los alimlentos cuestan
citadinosqueenlosrestaurantessuburbanos.Asimismo,12%delosalimenloscuestanen[e$60y
de 8% de los alimentos en los restaurantes subu¡ba'
$70 en tos .estau."nniJs .üáin"r,. ¿r.r"ncia
citadinos, a diferencia de
nos; y 14% ¿" ro.;i.*á. .uestan enne $30 y $40 en 1os restaurantes
34% de los alimentos en los restaurantes suburbanos'
EnlasecciónsobreelUsodelaestadísticasebuscacompararlosrendimientosqueprodujeronlos
EJEMPLO 2.3 y.fondos e tuT]:t-:1,!ll"'l.ll3l:
Áo¿o, a. iou..r¡On en bonos i¡termedios gubernamentales y distribuciones
Distribuciones de .i"á. " ""n pf.o durante 2009. Constriya distribuciones de ftecuencia relativa
frecuencia relativa porcentuales esos fondos.
Para
y distribuciones
porcentuales de soluoÓNseconcluye(véaselatabla2.11)que,<lurante2009,losren<iimientosdelosfondos
gubemamen-
intermedios
los rendimientos In-¡lo* *éo*,iuos fuáron mucho más elevadoi que los de los fondos
corporativos tuvieron rendimientos de ente l0
para los fondos tales. Por ejemplo, 3I.96% de los fondos en bonos
tuvieron rendimientos de
de inversión en ;l;, ;;ilr'qr; 6.g0% delos fondos intermedios gubernamentales
soio 15 4ó7o h¡vo rendimientos de enhe 0 y 5'
bonos intermedios enhe 10 y 15. De los fondos en oonos corporativos'
gubemamentales'
gubernamentales u dif"rrn"i" d. 40.23% de los fondos intermedios
y fondos de
inversión en bonos
corporativos a corto
plazo durante 2009
I
Distribución acumulada
rl Ladistribuciónporcentua|acumuladaesunaformatlepresentarinfomaciónacercadelporcen.
taje de los datos sue ,oo...no"''q* u* :T'ty-':T."1::"i"t::":1"rH*
n*:
I
L
qu€ H"üT;ff¿
i
.'
cül es el porcentaje de los alimentos de restaürantes crtadmos distribución por-
pil.*":J.r.J iienos de $50. S. otiti". U Art itución porcentual para ffear.la
de lo.s intervalos
i""*f l"r."i"¿" .En la tabla2.l2 se muesta cómo se combinan los porceütajes
del costo de alimenbs el
porcentual,acumulada
de clase individuales para tbrmar la distribución
rest¿uantes citadinos. En esta taula-sJ "ürrrv"
q"á ,irg"ro de _los alimentos (0%) cuesta menos de
$30' que 26% de los alimentos cuestan menos
$20, que 12% de los allmentos cuestan menosie
y
14% de los alimentos cuestan entre $30 $a0)'
y así sucesivamente hasta que
;;litb;tqt.
100% dJlos aLimentos cuestan menos de $80'
Enlatabla2'l3seresumenlosporcentajesacumuladosdelcostodelosalimentosenrestau-
que el costo de los alimentos es un
*rrt", y *u*Uunor. tu Ji'i'ito"ión acumulada indica que
"iáaioo,
en los reshura es que en los citadinos En la tabla 2'13 se observa
poco menor 26Yo de
'ubu'buno' cuest¿ menos de $40' a difere¡cia de
44Vo de losalimeútos en los restaurantes suburbatros
2.3 organización dc datos numéricos 37
iÁett z'tz
Porcentaje de alimentos que cuest¿n menos
Costo por alimento ($) Porcentaje (%) lfnite inferior del intervalo de clase (%)
que el
de la
20 pero menos que 30 12 0
30 pero menos que 40 I4 T2
los alimentos en los restaüantes citadinos: 78% de los alimentos en los ¡est¿urantes subu¡banos
cuestan menos de $50, a diferencia de 64% de los aiimentos en los restaurantes cit¿dinos; 92% de
los alimentos en los restaurantes suburbanos cuestan menos de $60, a diferencia de 82% de los
alimentos en los restaurantes citadinos.
suientes datos de una muestra de n = 7 calificaciones de una muestra aleatoria de 50 depanamentos con un dormito'
ixámenes de contabilidad: rio en una gran ciuüd.
a) Construya una distribución de &ecuencia y una disaibu'
68 94 63 7s 71 88 64
ción porcentual con intervalos de clase que tengan lími-
2.'14 Construya un arreglo ordenado, considerando los si tes superiores de $99, $119, y así sucesivamente.
guientes datos de una muestra de caüficaciones de exáme- ó) Constuya una distribución porcentual acumulada.
nes de marketing: c) ¿Alrededor de qué cantidad parece estar concentrado el
clase que iba de 700 a 749. Dos aspirantes obtuvleron una 2.19 l,a operación de una codadora consiste en cort¿r tozos
c¿lificación en el intervalo de 450 a 499, y 16 obtuvieron de acero en partes, que después se utilizarán como estruchua
una calificación en el intervalo de 500 a 549. para los asientos frontales de un automóüI. El acero se corta
c) ¿Qué porcentaje de los aspirantes obtuvieron una califi- ion una siera de diam¡nte y se requiere que las partes resultan'
cación menor que 500? ¡es esténdento d€ a 0.005 pulgadas de la longitud especificada
á) porcentaje de aspirantes obtuvieron una califica-
¿Qué por la empresa automotiz. Se reunieron clatos de una muesfra
ción entre 500 Y 549? ie tOO partes Oe acao y se aünacenaron en el archivo !@l' I ¡
c) ¿Qué porcentaje de aspirantes obtuvieton una califica- medición reportada es la diferencia en pulgadas enüe la longt-
ción menor gue 550? tud real de la parte de acero, medida por medio de un aparato
e) ¿Qué porcentaje de aspirantes obtuvieron una califica- de medición láser, y la longihrd especiúcada para la misma' Por
ción menor {ue 750? ejemplo. el primer valor, -0.002. ¡epresenta una parte de acero
2.1ó Un conjunto de datos incluye valores que van de 11'6 que es 0.002 pulgadas mas corta que la longitud especificada"
a9'7.8. d) Construya una distribución de frecuencia y una distribu-
¿) Si estos datos se agnrparan en nueve clases, indique cuá- ción porcentual.
les serlan los límites de clase á) Construya una distribución porcentual acumulada'
'. r á) ¿Qué ancho de intervalo de clase eligió? c) ¿La cortadora de acero está cumpliendo con los requ'
'
'i"' c) ¿Cuáles son las nueve ma¡cas de clase? tos establecidos por la empresa automotriz? Explique '-
respuesta.
APLICACIÓN DE CONCEPÍOS
2.20 llna empresa produce carcasas de acero para equipo
2.'t7 El archivo l!!!@@ incluye datos sobre el costo elfuco. La parte principal de la carcasa es una bandeja hecha
total (S) de cuatro boletos, dos cervezas, cuatro bebiüs ga- de kírnina de acero de calibre 14. Se produce utilizando una
seosas, cuatro emparedados de salchich4 dos programas de prensa moldeadora progresiva de 250 toneladas, mediante
juegos, dos gonas de béisbol y la tarifa de estacionamiento una operación que coloca dos formas de 90o en el acero plano
para un vehícrrlo en cada uno de los 30 estadios de las ligas para fonnar la bandeja. La distancia desde un lado de la forma
mayores de béisbol durante la temporada 2010. Los costos iasta la otra es fi¡ndamental, ya que debe estar aislada cuando
la
fueron los siguientes: se usa a la intemperie. La emEesa reqüere que el ancho de
bandeja sea de ente 8.3i y 8.61 pulgadas. Se obtienen las an-
tn335,2s0, t8b, Ú3,162, \32,2Ü7,316, r78' 184, 141, 168,208, 115 la
churas, en pulgadas, de la siguiente muestra de 49 bandejas;
158. 330, l5l, L6L, t70,212,222. t60,n'7.22',7.127.211' t2t.221,216 información esta almacenada en el archivo ft@l!:
Fuente: Daios extraídos de teammarketing'com, 1 de abril de 2010'
8.3r2 8.343 8.317 8.383 8.348 8.410 8.351 8.373
a) Organice esos costos en un ¿rreglo ordenado. 8.481 8.422 8.476 8.382 8.484 8.403 8.414 8.419
á) Construya una distribución de ftecuencia y una distribu- 8.385 8.4ó5 8.498 8.447 8.436 8.413 8.489 8.41'l
ción porcentual Para esos costos. 8.481 8.415 8.479 8.429 8.458 8.462 8.460 8.444
c)' ¿Alrededor de qué agrupamiento de clase se concentra- 3.129 8.460 8.412 8.420 8.410 8.405 8.323 8.420
ion, si es que lo hicieron, los costos de asistir a unjuego 8.396 8.447 8.405 8.439 8.411 8.421 8'420 8.498
de béisbol?: Explique su respuesta'
8.409
2.4 Presentación gnifica de datos categóricot 39
a cabo pruebas
destructivas en laboratorios de gran c) Co¡struya una distibución de fecuencia y una distrbución
ncia para determtnar Cuanta Juend Se necesrta
pala porcentual para cada fabricante utilizando el siguiente
La fuerza se mide observando la cantidad de li- ancho para el intervalo de cl¿se de cada distribución:
is que se deben aplicar
al aislante antes de que se rompa.
Fabricante A: 650 pero menos que 750, 750 pero menos
obtienen las siguientes mediciones de fuerza de una que 850, y así sucesivamente.
de 30 aislantes; la infonnación está alnacenada en
Fabricante B: 750 pero menos que 850, 850 pero menos
archivoEEl: que 950, y así sucesivaúente.
una distribución de frecuencia y una distribu- 2.23 Los siguientes datos (almacenados en el archivo EED
porcentual. representan el contenido de bebida gaseosa en una muestra a,
una distribución porcentual acumulad¿ de 50 botellas de 2 litos.
concluye acerca de la resistencia de los aislantrs si 2.109 2.086 2.066 2.075 2.065 2.057 2.052 2.044 2.036 2.038
empresa eúge la medición de una fuetza de al menos 2.031 2.029 2.025 2.029 2.923 2.020 2.01s 2.014 2.0t3 2.014
o
o
übras antes de que se rompa el aislante? 2.012 2.0t2 2.012 2.010 2.005 2.N3 1.999 1.996 1997 1.992 o
1.994 1.986 1.984 1.981 1.9'13 1.9'15 t.97r 1.969 1.966 1.967
N
El archivo !![!
contiene información sobre la vida
|.963 1.951 1.951 1.951 t9ü r.94r l.941 1.938 1.908 1.894
5
o
) de una muestra de 40 bombillas de 100 watts
por e[ Fabricante A, y una muestra de 40 bom- a) Construya úna distribución porcentual acumulada.
de 100 watts producidas por el Fab¡icante B. En la á) Con base en los resultados del inciso a), ¿la canticlad de
tabla se presentan los datos como un par de arre- bebida gaseosa vedida en las botellas se concentra alre-
ordenados. dedor de valores esoecíficos?
A depende de si su objetivo consiste en comparar las categorías entre sí de manera direca (gnífica de
44 barras), en destacar la manera en que las categorías formatr parte de un todo (gnifica circular), o
20 de que los dalos se concenten solamente en algunas de las categorías (gr.áfica de Pareto). Si se desea
98 hacer una presentación grrÁfica de los clatos para dos variables categóricas, se utiliza una gnáfica de
barras agnrpadas.
40 cA?fruLO 2 organización y presentación gláfica de los
datos
Gráfica de barras
Unagráñcadebarrascomparadiferentescategorlasutilizandobanasindiüdualespararepreseu.
la frecuencia o el
t¿r los cooteos ¿.1"ü.Lé¿". La longitud de una barra representa la cantida4
un histogram4 que se estudia
po...ntn¡. o. o"tor-ii. Juá-o.nr.o cte r:ia categoría. A diferencia de
enlasección2.5,unagnificadebanasseparatasbarrasentrelascategorías'EnIafigura2.lse
página 28' la cual
de la tabla 2.1 que se muestra.en la
obsewa la gráfica ¿. u?".;p"" r"r d¿ros
estábasadaenunaencuest¿recienteenlaquesepreguntóaungrrrpo<leadultoscómopagabansug
0.".r.*,*Ñü;;Adil ü uv Todav' 4 deocnbre de 2007' p'1)'
Mooorv nilt"'
Po|Eant¡la
l- Gáfica de banas
de los niveles de
LA riesgo de los
fondos de Invers¡on
€
¡l en bonos
ut
ct{050
Frlcr¡tñai¡
o
Gráfica circular =
Una gráfica circular üiliza las partes de rm circulo pra rcpreseirtar los valqcs dc c¿d¡ ca¡egoría- El
tamaño de cada parte o porción del clrculo varia de acuerdo coo el porceirtaje en cada categoría-
o
o
Por eje,mplo, en la tabla 2. 1 cle la página 28, 54% de los participant€s dijo que pag¡ sus cu€ntas con o
cheque. Para represent¿r €sta categoría como un¡ parte del círculo, se multiplica 54% por los 360 N
grados que conforman uu clrculo para obteoer una parte que corresponde a 194.4 grados de los
¡
ao
360 que conforman el clrculo. Bn la figura 2.3, la gráfica circular p€moitl visusliza¡ ls Parte del
clrculo completo que conforma cada categorla. En esta figura, el pago de los g¡rfios con cheque
conesponde a la parte más g¡ande, 54% del cl¡culo. La segunda parte más gande conesponde al
pago electónico o en llnea de los gastos, 28% del círculo.
EL.üó¡l.oÉ|| lú|Cr
\ zltl
tl
42 CAPÍTULO 2 Organización y presentación gláfica de los datos
EJEMPTO 2.ó En la pafe I de la seccidn refetente a Choice Is You¡s se busca examinar el riesgo de los fondos de
invers-ión en bonos. Ya se definieron las variables y se reunieron los datos de una muestra de 184
Gráfica circular fondos en bo¡os. Ahora se necesita construir una gfáfica circular para el riesgo de los fondos en
de los niveles de
bonos (con base en latabl^z.z de ia página 28) e interpeta¡ los resultados'
riesgo de los
fondos de
inversión en bonos
P]omedlo
l7.sx
SOLUC¡óN AJ revisar la figura 2.4, se observ"a que aproximadamente ua poco mrás de una tercera
parte <le los fondos rep,resena rm riesgo promedio, que alrededor de una tercera parte implica unriesgo
por arriba del promedio y que menos de üna tsrcera pate tiene un riesgo por debajo del promedio.
Gráfica de Pareto
En una gráñca de P¡reto los valores de cada categoría se grafican como banas verticales en orden
deScendente, de acuerdo Con sus frecuenCias, y se combilan con una llnea porcentual
acuml¡l''la
en la misma gnifica. Una gráfica de Pareto puede revelar situaciones en las que se presenta el ,
cipio de Pareto.
una gráfica de Pareto tiene la capacidad de separar a "los pocos vit¿les" de "los muchos trivia'
les,', conio que permite cenhar la atención en las categorías import¿ntes. En situaciones en las
que
los datos repiesentan artículos defectuosos o que no cumplen con las normas, una gfáfica de Par€to
es una herramienta muy útil para priorizar los esfuezos de mejora.
para esü¡diar una iituación in la que [a gráfica de Pareto demostró ser especialmente ade-
cuad4 considere el problema que enfrenta un banco. El banco definió el problema como las.fan'
su""iónes incompleias de los cajeros automáticos. Se obtuvieron datos sobre las causas de
las
fA1LA 2'15
Causa Frecuencia Porce¡t¡je (%)
Mal fi¡ncionamiento delcajero 32 4.42
fabla-resumen Para
las causas
oe El cajero no tienedinero 28 3.87
La tabla 2.16 es r'na tabla-resumen para los datos de las transacciones incompletas de los caje-
ros automáticos, donde las categorías est¡ín ordenad¿s con base en la frecuencia de ha¡sacciones
incompletas presentadas (y no en orden alfabético). También se incluyeú los porcentajes, ¿si como
los porcentajes acumulados, de las categorías ordenadas.
En la figura 2.5 se presenta una gráfica de Pareto con base en los resultados mostrados en la
tabla 2.16.
Gráfica de Pareto
para los datos de
transacciones
incompletas en
cajeros automáticos
de-
atr
las
t da¡ rh¡ Ee¡d ffiád Pl.dó.r r¡lt¡&
dciomadá m¡Fétla ¡ot¡l|l to¡.¡t .b &rda lbrdor .r
.loBd¡ íLgibL dlBr ¡ñáfü rÉnGl¡r l. qrnb
causá
M CAPITULO 2 Organiz¿ciór y preseatación gráñca de los datos
UnagráficadeParetopresentalasbafrasenformaveftical'juntoconunallneaporcentualacu-
de clase de cada categorí4 a una altüa igu¿l al
mulada. La linea acumuhü se grafica en la marca
po.."ot"1" u"u.J"ao. pu. qu"-*u gáfica de pareto incluya todas las categorías, incluso aquellas
denomi¡¿d¿ otos o
con pocos defectos, en algun; situaciones es necesario incluir una categoria
Misceláneos.Enestassituaciones,labafraqüe¡epfesentaesascategoríasdebecoloca¡seala<le¡e.
cha de las otras barr¿s'
estjl[ ordenadas por la ftecuencia de ocu-
Debico a que hJcategorías en una gráfic¿ de_Pareto
esfirerzos para mejorar el proceso. Al analiza¡
nencia, es posibiet Jáf¿. r. ¿"U.n cóncentar los
la grafica ae rareto ."ü ¡g*.i.s, ,i ,e sigue la línea, se ve que las primeras dos categofías repre-
incomlletas de cajeros automáticos. La primera categoría
son
sefiat g:¿..l3%O.l$ f*r-"*¡".r
50.41% de los defectos), seguida por las tira¡
las tarjetas defo¡madas atoradas (que representan
por reducir las uansacciones irrcompietas en
magnéticus itegbles Gon un ¡2.¡zx) ros intentos
atoradas y a tiras magnéticas ilegibles deberían
cajefos autoúft;;;¿iii¿" , tri.t".'o.formadas
producir los ."y"*, i;"fi".s. debería conceuftrse en descubrir por qué ocurrieron
El equipo
esos €rrofes.
Gnáfica de Pareto
para el pago de
los gastos
En la frgun 2.ó se o
o
608
ñuestn una graflca
de Parcto cÍeada con Fo
Minitab; en la figura 2.5 I E
0
chgque Elecdn¡co/ Otro/no sabe
Forma de pago
en Inea
FI6URA 2'7
Gráñca de barrss egrüp¡das de cr¡ota y tlpo
Gráfica
de b
,ar,ras
aqruPad-as qel
tióo de tonoo
v del cobro
áe una cuota
rffi|¡ffi
1o¡0lor1050607!¡$
Fr..!.fid.
s€
edad universitaria y los resultados se presentan en la si- Gas natural 24
gurente tabla.
os Nuclear 20
c) Construya una gráfica de banas, una gráfica cücular y
Otr¿ 5
Le-
una gáfica de Pareüo.
á) ¿Cuál método gráfico cree que es mejor para presentar fue¡tc: Ercrgy ldormatio¡ Adoitri¡tatio4 2010.
estos datos?
46 CAPÍTULO 2 Organización y presentación gráhca de los datos
9
Refrigeración
Número Calentadores ambientales 7
Errores de radi¿ción
8
No acertar a toda la zona deteminada Calentadores de agua
284 6
o a parte de ella Televisores Y decodificadores
255 Fuede: D¿tos extr¿idos de J. Moü¿wad y K G¿lb!¿ith' '?luggcd-in
Aplicación de dosis iÍcoÍecta
20 de
50 Age leeds a hu¡ger for ElecElciy', The Nev) York'|1nes'
Paciente incorecto [atado
septi€@bre de 2009, PP. t' 28.
Oho
¿) Construya una gráIica de barras, una glífica cücular
y
y colinadores
Fruta I
77 Puerco 8
Falla en el plan de tratamiento ' Ma¡iscos 19
Mal funciona¡niento de hardware 60
52
Verdur¿s 5
Empleados \üant
Fuente: Datos extaídor de "What Folk
Mal fimcionamiento de programas cle conpúo ^,1
Sizztiag on the Gritl During B¿rb€cue S€asotr"'
USI
o tr¿¡sfercncia de infomación digital TodoY,29 deñar.o &2009'P lA"
Alteración de los datos d€ cálculo por parte l9
y
del penonal c) Construya una gráfica de banas, una gráfica circular
14 una gnifica de Pareto.
Mala comunicación presentar
ó) ¿Cuál método gráfico cree que es mejor para
Inciert¿s/out¡ 8
estos datos?
Fueote: Daios exF¿ldos de W. Bogdanicb,
'A Lifesaving Tool Tumed
a lo que las persooas qurerel
Deaüly",The New Yotk fit¡¿t' 24de eDero d€ 2010' pp l' l5' 16' c)- ¿Qué concluye con respecto
ásar durante la temporada de parrilladas?
gu:o
u.o-..prar ropa para ellas, a dife- c) Constuya una gráfica de barras agrupadas del tumo y del
de lu mujeres l.tT
del.os homlres' No se especifica el tamaño de cump limiento con las no¡mas.
ie¡cia de aa%
y de mujercs' Suponga que los resul¡a- ú) ¿A qué conclusiones podría llegar el director de laborato-
ia,¡u.sra de nomUres
en la siguiente tabla: rio con respecto al patrón de las pruebas que no cumplen
Á. ,on los qu. se muestran
con las normas?
GE¡¡ERO
ÉG$fAIBA 2.32 ¿Enla actualidad le toma más tiempo que antes ser
COMPRAR RÍ)PA Hombre Mujer eliminado de una lista de correo electónico? Un estudio de
sl 238 276 514 los 100 principales minorist¿s en línea reveló lo siguiente:
No 304 zot )/I
Total s42 543 1,085 ]{ECES]ÍA lnn MAS DE TREI CtfCS
PAnA Sn ilililAoo
¡) Construya una gráftca de barras agnrpadas relacionada SI No
AÑO
con el gusto por ir de compras y con el género.
á) ¿Qué concluye a partir de esta gnifica? 2009 39 ol
se realizan varios cientos de pruebas de
2008 7 93
2.31 En un hospital
laboratorio cada día" L¿ t¡sa de pruebas realizadas de forma Fuentq Datos exFaídos de "Drill Down", fie /Ver yort ltn4,29 da
inadecuada (y que, ¡nr lo tanto, necesitan repetine) parece ser 10.6rz0 dc 2010, p. 82.
estable, de aproximadamente 4%. En un esfuerzo por encon-
¡ar el origen del incumplimiento de los requisitos, es dech de c) Constuya una gnifica de barras agrupadas del año y de si
oue se necesite repetir las pruebas, el difector de laboratorio se requieren tres o más clics para ser eliminado de una
áecide llevar registos durante una semana. Las pruebas de la- lista de correo electónico.
bontorio se subdiüdieron de acuerdo con el turno de los em- á) ¿Qué le indican estos resultados acerca de si más mino-
:y pleados que las realiza¡on. Los resultados son los siguientes:
ristas en línea requerían tes o más clics en 2009 que en o
far 2008? =
PRUEBAS OE IA8OFATORIO
rURilO
REAUZADAS Noche Tot¡l o
de
t6 at o
No cumplen con las normas 40 o
Cumplen con las norrnas 654 306 960 N
atr or
le.
Tot¡l 6'70 1,000 N
r
5.40 4.30 4.80 5.50 7.30 8.s0 6.10 4.80 4.90 4.90 5.50 3.50 5.90 6.30 6"ó0
Para construir el diagrama de tallo y hoja se utilizan las cantidades de dólares enieras en los
tallos y se redondean los centavos, es decir, las hojas, a un decimal. Para el primer valor, 5i40,
el tallo se¡ía 5 y su hoja sería 4. Para el segundo valor, 4.30, el tallo seria 4 y su hoja sería 3' El
diagrama de tallo y hoja completo para esos datos es:
3 5
4 38899
sl- 4559
5
ol- 6 LJo
7 3
% 8 5
:
7
48 CAPfIULO 2 Orgrnización y presc,ntación gnifica de los clatos
La figun ZB muesta un
diagnna de allo y hoia
aeado con Miniab Y
mcdrífrado Pan que Al aualizar la ñgrua 2.8 se concluye lo siguienrc:
ada allo oatP solo un
renglón. Si * utilíza
. Los r€údimieútos más !¿jss €o !009 ñ¡eron de -8'
PHSat2,las hoias . Los rendimientos más altos en 2009 fueron de 32'
dihrián un Poco & . Los re,ndimi€ntos de 2009 esh¡vieron concenftdos ente 0 y 20'
Ias de la frgun 2.8, Ya .Solounodelosfondostuvorendimientosnegativosen200g,ytesfondosuvieronrendimien.
que PHSEI2 Y M¡n¡tab
¡ilizan úferent* tos de 20 o rnrás en ese año.
métodos.
Histograma
Unhistogrrmaesunagráficadebarrasparadatosnrrméricos¿gfupadosenlaqr.reseutilizaubanas
;;Jr-p.- *pr"r€n;, hs frecuenció o porc€nlajes en cada grupo. En un histograma no
existen
rc, .l*¿i*i y r.rt",-ot"s suburtanoi. histograma paralos resta_urantes citadinos indica que el
El
costo de los alimentos se conceútra aproxina¿anente átre $zt0 y $50' Muy pocos alimentos en los
FIGURA 2,9
y suburlcanos
Histogramas para el costo de los alimentos en restaurantes citadinos
Hlttogñña dd coato da 16 all|naitoa an l3tru|t t3 d¡bÚti'not
H¡ttogaañr dal co¡to da loa ¡llmlntoa ql ttatrur'nt" dt¡d¡no'
I
z
I t
d
¡15
restaur¿trtes citadinos cuestan más de $70. E1 histograma pa¡¿ los restaurantes suburbanos indica
)s
que el costo de 1os alimentos se concenha entre $30 y $50. Muy pocos alinentos cuestan más de
i- $60 en los restaurantes suburbanos.
FIGURA 2.10
Histoqramas de frecuencia de los rendimientos que los fondos en bonos de certificados
intermedios gubemamentales
y corfontivos a corto plazo produjeron en 2009
Hlltor¿m¡ dr l.ó nndlmhnto3 ql¡. 1o3 ñoñd6 €n b.n6 fikiorr¡m¡ d. lo3 Endlm¡ú.t qu. ltt iúd.t or lo@
ld.rlnr{or ¡ib.m.m.nbl.. predui.M ¿n 20(D onor.üc!. . cofto pl¡¡! ,.od|/hrú 3| 2!09
U'
o
:t !¡' o
o
N
or
(¡
'as
en
:Je
¡- La ftgura 2.10 muest|a Al revisar los histogramas de la figura 2.10, se concluye que los rendimientos producidos por
histognmas creados los fondos en bonos corporativgs a cofo plazo fueron mucho máq elwados qu€ los producidos por 1os
con Excel y PHStat2;
h frgura 2.? muestn fondos en bonos intermedios gubemamentales. Los rendimientos de los fondos en botros intelme-
histogramas creados dios gubemamentales se concenaan ente 0 y 10, mientras que los rendimientos de los foudos en
con Minitab. bonos corporativos a corüo plazo se concentrar entre 5 y 15.
35 45 55 b!
Co¡to d€ lo3 al¡merto. (l)
sobre el eje-Xre-
Los poügonos que se presentan en la figura 2' 11 tienen puntos cuyos valores
pr.r.or_ tu i*."á..hs. d.l int *alo de clase. por ejemplo, observe los puntos localizados
X= OS (SOS). El punto para el costo de los alimentos eD los restaurantes citadinos (el más alto¡
y $70. El
,rpr.."otu .í h""ño de que 12% de los alimentos en esos restaurantes cuestan entre $60
representa el hecho
punto para el costo de los alimentos en los ¡estaurantes suburtanos (el más bajo)
i. qo. AX A. los alimentos en esos restaümntes cuesta ente $60 y $70'
Al consnuü polígonos o histogramas, el eje vertical (i0 debe mostar el cero verdarlero u "origen"
para no distorsionJ el carácter áe los datos. El eje horizontal (X) no necesita mostrar,el
Yalor
parte principal del eje.
cerc para la variable de inteÉs, aunque el raogo de la variable debe incluir la
previo de
EJEMPLO 2.10 En la parte I de la sección referente a choice Is Yours se busca comparar el desempeño
corporativos a
los fondos en bonos intermedios gubemamentales con el de los fondos en bonos
Polígonos q¡e p¡odujeron en 2009.
corto plazo. Una medid¿ de su desimpeño anterior son los rendimis¡fe5
porcentuales de ya seiefinieron las vari¿bles y se reunieron los datos de una muestra de 184 fondos en bonos'
los rendimientos gubema'
Ahora necesita constuir polígonos pofcentuales para los fondos en bonos intermedios
se
producidos por los
mentales y corporativos a corto plazo.
fondos en bonos
produ-
intermed¡os SOLUCÉN En la figr*a 2.12 se muestan los polígooos pofcsnhüles para los rendimientos
y a corto plazo en 2009.
gubernamentales cidos por los fondos dbonos iÍtsrmedios gubernamentales corporativos
y corporativos a
corto plazo en 2009
Polígonos
porcentuales de
los rendimientos
producidos por
ios fondos en bonos
¡ntermedios
gubernamentales Y
i corporat¡vos a corto
l¡ plazo en 2009
t.
En Ia figura 2.12 se
muestran los polígonos
Por9entuales creaoos
con Excel; en la figun
2-11 se mueshan los 23 ts
polígonos porcentuales ir.iniúté a !¡9
qeadas con Minitab.
2.5 Presentación gráfica de datos numéricos 51
A1 analizar la figura 2,12, se concluye que los rendinientos en 2009 de los fondos corporativos
a corto plazo son rnucho rxis elevados que los de los fondos intem€dios gubemamentales. El poü-
gono para los fondos corporativos a corto plazo se localiza a la derecha (los rendimientos son más
altos) del polígono para los fondos htemredios gubemament¿les.. Los rendimientos de los fondos
intermedios gubernamentales se concentran entre 0 y 10, mientras que los rendimientos de los fon-
dos comorativos a corto Dlazo se concentran entre 5 y 15.
Polígonos,
porcentuales
icumulados del
costo de alimentos
en restauranles
o
citadinos Y
subuóanos
o
o
o
N
or
5
3040s060m
Co.to d. lo. ¡llñ.ñto. (l)
Al revisar las cr¡rvas, se observa que la curva del costo de los alimentos en los restaurantes
citadinos se localiza a la derecha de la cuwa de los restaurantes suburbanos. Esto indica que los
restaurantes citadinos cuentan con un menor número de alimentos que cuesten menosque un valor
1
en particular. Por ejemplo, 64% de los alimentos en restaurantes citadinos cuestan menos de $50, a
¡
diferencia de 78% de los alimentos en los restaurantes suburbanos.
f
'1
;
EJEMPLO 2.11 En la parte I de la sección referente a Choice Is Yours, se busca comparar el desempeño previo de
I los fondos en bonos inte¡medios gubernamentales con el de los fondos en bonos corporativos a
Polígonos
corto plazo. Una medida de su desempeño anterior son los rendimientos que produjeron en 2009'
: porcentua les
: Ya se definieron las variables y se reunieron los datos de una muestra de 184 fondos en bonos.
acumulados para
los rendimientos
Ahora se necesita constuir los polígonos porcentuales acumulados para los fondos en bonos inter-
producidos por los medios gubemamentales y corporativos a corto plazo. ,
iondos en bonos SOIUCIóN La frgura 2.14 de la página 52 presenta polígonos porcentuales acumulados para los
intermedios rendimientos producidos por los fondos en bonos intermedios gubemamentales y corporativos a
gubernamentales co¡to olazo en 2009.
y corporativos
a corto plazo en
2009
i¿ CAPÍTLLO 2 Organización y prcsertación griifica de los d¿tos
Polígonos
porcentuales I
ácumulados de
los rendimientos
producidos Por I
ios fondos en
bonos intermedios
gubernamentales Y
corporat¡vos a cono
plazo en 2009
Jt ti¿"t á un examen de sistemas de infonnación' @ sobte .l costo lotral ($) de cuafio boletos,
dos cerve'
l4l t49 206 t75 123 128 144 168 109 167
o( loJ 150 154 130 t43 187 i66 r39 t49
108 119 183 151 114 135 191 137 129 158
#, iQué concluye con respecto a los impuestos sobre la propie- 2.4i1 La empresa fabricmte mencionad¿ en el Foblema 2.42
dad percápita? también produce aislantes eléctricos. Si los ¿isla¡tes se
54 CAPffuLo 2 o4anización y prcsentación gnifica de los
datos
Fabric¡ eA Fabricatrt€ B
podda ocurnr un c-or-
rompen mientras estiín funcioúando'
se lle' 684 720 173 819 836 888 89? 903
i."it"""i Para probar la resistencia de los aislantes' 697 821
".
nuo a ,u¡o pruebas destructivas
en laboratorios de gran
831 0835 848 852 852 901 9t2 918 942 943
io"o.i" pot determinar.cuánt^ fu'*: ?? :::::t::::: 859 860 868 870 816 952 9s9 962 986 992
observando la canhdad de tr-
ioaoatlor. La fuerza se mide 893 899 905 909 911 994 r,004 1,005 1,007 I,OI5
antes de que se rompa-
bras que se deben aplicar al aislante 922 924 926 926 938 1,01ó 1,018 1,020 1,022 I,034
muestra de 30
i. áuii"o.o t* ,igoi*to mediciones de una
uchivo !!@' 939 %) 946 9s4 911 I,018 t,o'12 1,0'71 1,071 1,082
lirmt.., tu, cualJs est'ín al¡¡acenadas en el 1,100 1,113 1,113 1,116
o) Coort oyu uo t'istograma porcentual y un polígono por- 912 97'l 984 1,005 1,014 I,09ó
1,153 1,154 1,174 I,188 1,230
centual. 1,016 1,041 1,052 1,080 1,093
acumulado'
ó) Construya un polígono porcentual c) Constuya histogamas porcentuales en
gráficas separa-
.í
-' ¿qt¿ .á.1"V. acerca
de la resistencia de los aislantes st ' en una gnífica'
das y diúuje los polígonos porcentuales
iu-.tpt.tu exige la medición de una fuerza de al
menos
acumulados en uúa
ó) Construya poliionos porcentuales
i,soo ti¡.^ ¿e que se rompa el aislante?
"ni"t grifica.
incluye información sobre la vida
(en larga' las del Fa'
2,44 El archivo [!!! c)' iCuáles bombillas tienen una vida más
üricante A o las del Fabricante Bl Explique
de 100 watts ploaucl- su res-
horas) de una muestra de 40 bombillas
I 00
rlospár el Fabricante A y una muestra de 40 bombillas de Puesta.
tabla se
. i,"oi p.á¿t l¿* por el Fabricante B' En 1a siguiente [@
::,¡,:'.:
repre'.
2.45 Los datos almacenados en el archivo
p*.u:oo fo, ¿u* como un par de arreglos ordenados' tan la canticlad tle bebida gaseosa en una
muestra de 50 bo
de clase de
Utilice los siguientes anchos para el intervalo tellas de 2 litos.
porcen$al'
cada distribución: 4) Construya un histograma y uú polígono
750 pero menos ii Co**vu * polígono porcentual acumulado'y b)' can'
Fabricante A: 650 pero menos que 750,
,í óoo t^t .o t* resultaÁos de los incisos a) ¿la
que 850, Y así zucesivaúente' concen-
se
pero menos tidad de bebida gaseosa vertida en las botellas
fatricanie S: 750 pero melos que 850' 850 ta al¡ededor de valores específicos?
que 950, Y así sucesrvamente'
IA1LA 2"17
de los equipos de la NBA
r3
Valor e ingresos
.3
V¡lor
2,
306 103 Milwaukee 91
! AtlsnB
¿}JJ 144 Mi¡nesota 268 96
Bostoú
2 Ch¿rlotte
n8 96 Néw Jersey 269 92
:.oo
n¡
de
ica
,la
rli
io-
ul-
tl
f3'
:ho
Al reüsar la figura 2.15 se observa que, al parecer, existe uoa relación creciente (positiva) muy
fuerte ente los ingresos y e[ valor de un equipo. En otras palabras, los equipos que generan meno-
res ingresos valen menos, mientras que los equipos que generan grandes ingresos tienen un valor
m¿is alto. Observe la línea recta que se colocó sobre los datos representados en la figura 2.15. Para
estos datos la línea se acerca mucho a los puntos en el diagama de dispenión. Se tata de una llnea
de predicción de regresión lineal, un tema que se estudiará en el capíhrlo 12. (En la sección 3.5 se
retomar:á este ejemplo cuando se estudie la covarianza y el coeficiente de correlación).
5ó CAPiTULO 2 Organización y presentación gráñca de los datos
Esprobablequeotrosparesdevariablestenganunarelacióndecreciente(negativa),dondeu¡¿
relación haber una
de las variabtes ¿isminuya mientras la oÍa aumenta. En otras situaciones podría
rlébil o incluso ninguna relación ente las variables'
Gan¡nci¡s combinadas
TABLA 2.18
1996 5,669.20
Ganancias 6393.90
1997
combinadas
de películas 1998 6,523.00
1999 7,317.50
2000 7,659.50
8,077.80
* 2001
tr 2002 9,146.10
2003 9,043.20
$
ta
2004 9,359.40
?l 2005 8,817. i0
2006 9,23r.80
:
2007 9,685.70
2008 9,107.40
2009 10,675.60
H
lji i I
!
Problemas Dara la sec{ión 2.6 5t
La siguiente es una serie de ventas anuales (en millo- a) Coirstruya un diagrama de dispersión con las calorías en
de dólares) durante un periodo de 1 I años (de 2000 a el eje Xy
la grasa total en el eje Y.
0). ó) ¿Qué concluye acerca de la relación que existe entre las
calorías y la gasa total en las hamburguesas vegeta-
2M 2001 2002 2003 2004 2005 2006 200't 2008 2@9 2010
rianas?
13.0 17.0 19.0 20.0 20.5 20.5 20.5 20.0 19.0 17.0 13.0
2.50 El básquetbol universitario es un gÉn negocio, ya
ConstrBya una gfifica de series de tiempo.
que 1os salarios de los enüenadores, los ingresos y los gas-
¿lgún cambio en las ventas anuales con el
¿Parece h¿ber
.
)
paso del tiempo? Explique su respuesta.
tos se miden en millones de dólares. El archivo !![!!f!!
@f, incluye datos sobre el salario de los entenadores y
los ingresos del básquetbol universitario en ó0 de la 65 es-
APLICAOÓN DE CONCEPTOS
cuelas que participaron en el tomeo de básquetbol varonil o
2.48 Las compañías productoras de películas ne- de la NCAA e¡ 2009 (datos exnaldos de "Compensation for =
cesitan pronosticar los ingresos brutos de pelícu- Division 1 Men's Basketball Coaches", USA Today,2 de
individuales una vez que se han estenado. Los siguientes abril de 2010, p. 8C y C. Isadore, 'Nothing but Net: Bas- o
. que se encuentran almacenados en el ar- o
ketball Dollars by School", money.cnn'com/2010/03/18/ o
chivo @@@, corresponden a las ganancias obtenidas news/conpanies/basketballltrofi ts|. N
0r
durante el primer fin de semana en Estados Unidos, así a) ¿Cree que las escuelas con mayores ingresos también tie-
dorno a las ganancias en todo el mundo (en millones de dó- nen entrenadores con salarios más altos?
lues) de las primeras seis películas de Ha¡ry Potter. á) Construya un diagrama de dispenión con los ingresos en
el eje Xy los salarios de los entenadores en el eje f.
Primer G¡n¿nci¿s c) ¿El diagrama de dispenión confirma o contradice su res-
lin de en Est¿dos G¡n¡ncias puesta al inciso c)?
sem¡na Unidos mundiales
2.51 A 1os jugadores de futbol colegial que buscan ingre-
', La piedra flosofal 90.295 3i7.558 976.458
sar a la NFL se lesapüca la.prueba-deinteligencia estandari-
La ctámara secreta 88.357 261.988 878.988 zada Wonderlic. El archivo [@ incluye infomración
El prisíonero de 93.687 249.539 795.539 sobre las puntuaciones promedio obtenidas en la prueba
Azkaban Wonderlic por los jugadores de futbol que buscan ingesar a
.El cáliz fuego 102.335 290.013
de 896.013 la NFL y et índice de graduación de los jugadores en escue-
La otden del Fénb 77.108 292.005 938.469 las seleccionadas (datos extaídos de S. Walker, "The NFL' s
Smartest Team", The Yy'aIl Street Journal,30 de septiembre
:
El mtsterio del 77.836 30r.460 934.601
príncipe de 2005, pp. W1, W10).
c) Construya un diagrama de dispersión con la calificación
Iue¡tq Datos exFaidos de rwÍ.thc-truEben,coE/irtc¡active/coEF promedio en la prueba Wonderlic sobre el eje X y el ín-
H¡ry-Pott€r.php.
dice de graduación en e[ eje I'.
a) Construya un diagrama de dispersión con las ganancias á) ¿Qué concluye acerca de la relación entre la calificación
del primer fin de semana en el promedio en la prueba Wonderlic y el índice de gra-
ejeXy las ganancias en
Estados Unidos en el eje )¡. duación?
á) Construya un diagrama de dispersión con las ganancias
2.52 ¿Cu.il ha sido el desempeño anterior de las acciones?
del primer fin de semana en el ejeXy las ganancias en La siguiente tabla presenta los datos aknacenados en el ar-
t todo el mundo en el eje If chivo @@![@ que indican el desempefio de una
A
¡
t
58 CAPÍTULO 2 Orgaaizacióo y pr€se ación gráltca de los datos
medida general de acciones (por polcentaje) pa¡a cada dé- a) Construya una gráfica de series de tiempo para los prs.
t
Rr
*Hast¿ el 15 de üciemb,re de 2009'
indica el conteo de la tercera variable, orgaúiz¿do de acuerdo con los subgrupos r€presentados por
las variables de renglón y de columla.
Considere la tabla di contingencia que se presenta en la tabla 2.3, que muesüa el tipo de fondo
y el cobro de una cuota para la muesta de 184 fondos de inve¡sión eu bonos. La figura 2.17 pre-
ienta esta info¡mación como una tabla dinámica de Excel. Al añadir una tercera variable categórica
a la tabla dinámica, el riesgo, se form¿ la nueva tabla dinímica multidimensionai que se presenta
en la figura 2.18. La nuevalabh revela los siguientes pahooes que no se observan en la tabla origi-
nal de contingencia de la tabla 2.3.
. Aunque la proporción de fondos en bonos que cobran cuota con respecto a los que no-la
cobran parala iategoría de htermedios gubemamentales parece ser de aproximadame¡rte 2 a
3 Q4; $),la proporción para los fondos en bonos intemedios gubernamenlales con. m
rlesgo po, ,oita OJt prome¿io es de al¡ededor de 1 a I (15 a l4), mientras que lalroporción
para los fondos con uu riesgo por debajo del promedio es menor que I a 3 (6 a 20)'
que se . ivfientras que el gn¡po "fondos corporativos a corto plazo que cobran una cuota" tiene casi el:
este mismo número áe iondos con un riesgo por aniba del promedio, cotr un riesgo promedio y
..fondos en bonos intermedios
con un riesgo por debajo del promedio (7,7 y 6), el grupo
s¡ estas
gUlemamdtais que cóbra¡ una cuot¿" incluye menos fondos con un riesgo por debajo del
¡nPrcstones
fromedio (6) que fondos con un riesgo promedio (13) o fondos con un riesgo por arriba
del promedio (15).
. El p-atrón de valores de riesgo difiere entre los fondos que cobran una cuota y los que no la
cobran en cada una de las categorías de los fondos en bonos.
RA 2.f 7
a,
2.3
de o
dinámica o
o
N
or
o
RA 2,1 8
contingencia multidimensional de Excel y M¡nitab para tipo, riesgo y cuota
FIGURA 2.19
para tiPo' cuotas y sumas de activos
fabla de contingencia multidimens¡onal de Excel Minitab
y
FIGURA 2.20
Tabla de
contingenc¡a
multidimensional
para tipo de fondo,
categoría de cuota
y porcentales
de activos
FIGURA 2.21
Tabla de
u contingencia Par¿
F tipo y Porcentales
f
u
¡
de cuotas
'
Cuandoseincluyeun¿variablenumérica,porlogeneral,secalculaalgunodelosestadísticcls
y 3'2' Por ejemplo' la frgn2'22 ¡re'
lVéssq ls sccció¡ 3.1 P¿ra
descriptivos numéricos que se estudian en las secciooes 3'1
se calculó 1¿ media o tasa de rendi'
¿prc[dcr Eás acelca d€ l8
,..r"i". ,"ur" de contingencia multidimensional en la que
infomacioú,
.-:,:r. ;;;;;;;d;á;2009iara cadauuo de los subg'upos.r-Estarabla-revela, enre otra
mcdis.
de 2009' dependiendo de si ¡.
o* uunque prácticamente no hubo diferencia en el reldimiento
por aniba del promedio' el rendimienh
#;;"J;;;eicaso de bs ron¿os coo rm ¡iesgo
cuota fue mucho más alto (4 89) Ee
de los fondos intermedios gubemamentales que cobraron una
el de los fondos que no la cobraron (1'41)'
FIGURA 2.22
y t¡po, r¡esgo, cuotas y media de las tasas de
Tabla de contingencia mulüdimensional de Excel Minitab Par¿
rendimiento en 2009
¡¡Ér¡l¡bl ffi;lt?q Rfdq F.t
v,.tr a\té / a!!r colú!: ¡ét
'¡o Ié, ¡¡¡
I¡rcdt¡tc €6v€!E!l tJ0?. ,."r, ,.r,'
¡¡.n! ¡t'll(F
¡vltaql l.t!? 3,üz ¡,:t
L¡d í!t ll 1.L70 5'9i3 6'89'
s¡d¡r Idr có4¿!ac:
lbt! ¡rr¡4r 12,1lt ¡9,9!6 rl ¿tl
9'611 g 7o¡
Itéq. 9.61i!
Élld ¡ElaG 5.6¡9 6.5¡{ 5'610
1¡1
A¡¡ 6.9!? t 16¡
c.l¡ cqrte¡€. ¡¿l¡a 2tÍ19 : tl.t
2.8 Uso indebido y errores comunes en la presentación gráfica de datos
U'
Seobservanvariospfoblemasenestagáfica.Primero,noexist€unceloenelejeveftic¿l.s^
graficada por arriba-dr
guoJo, L" sup".ficle de i35,326 acres para;l periodo de 1949 a 1950 estri
Tércsro, no es evidente qu€ la difere¡-
Juperficie di 150,300 acres para el periodo di 1969 a 1970'
rqls yl9g0 y 1997 y 199¡ (71,569 acres) sea aproxima¿t¿mente 3.5 veces la
diferencia
.iJ."* horizont¿l carece de valores escala-
."o.lSzS v lSgo y téOS y ólO et,ilS acres). Cuarto, el eje
horizontal. Quinto, Ios
,.r. r., u¡á. .r,¿" graficados junto a las superficies totales y no sobre el €je
adecurda a lo largo del eje
t! valores para la rhJensión dei tiempo no eitrí,n espaciados dt-manem
más cerca del periodo
;r
F norirootl. no. .¡".plo, el valor pára el periodo di 1979 a 1980 esüi mucho
que se suelen obsewa¡
¿" isas 1gg0 que de lg6g a 1g70. oto tipo de presentaciones.atractivas
"
en las revistas y en los periódicos a menudo incluyen información
que no es necesaria y que solo
r
. Una gníñca no debería distorsiooar los datos'
!
. Una -gáfica no debería contener basura, es decir, adomos innecesarios que no transmitsl
información útil.
. Cualquier gniúca bidimensional debe contener una escala para cada eje'
. La escala en el eje vertical debe empez¿r en cero'
)
Problemas oara la sección 2.E o5
oer¿ adecuada la información que transmiten los da- 6ún.dM a odlnt úe.¡t6 n¿'lot.d. otu
a) Describa al menos una característica adecuada de esta informes anuales de 1as corporaciones (véase D. Rosato,
presentación gráfica. "Wor¡ied About the Numbers? How About the Charts? 71¿
á) Describa al menos una característica inadecuada de esta New York Tlmes,15 de septiembre de 2002, p. 87) y encon
presentación gráfica. tró que incluso ligeras distorsiones en rrna gráfica cambia.
c) Reconstruya la gráfica utilizando los lineamientos de las ban la percepción de los lectores sobre la información.
págnu 62 y 63. Utilice Intemet o recursos de una biblioteca para elegir u¡¡
corporación y estudiar su inforrne anual ¡riís reciente. f¡.
2.65 Lt siguiente presentación incluye una gráfica con
cuentre al menos r¡na gnífica en el informe que considel¡
adomos excesivos, simila¡ ¿ ¡¡¡
q¡s apa¡€ci6 en USA Today en
que necesita mejorar, y elabore una versión mejorada de ¡
relación con la tarjeta de uso más seguro ("USA Today misma. Explique por qué cree que la gnífica mejorada e3
Snapshots: Credit Card vs. Debit Card", UM Today' 14 de más adecuada que la que está incluida en el informe anual.
marzo de 2007, p. 1B).
2.ó7 Las figuras 2.1 y 2.3 presentan una gráfica de barras y
Túje¡s de ct€di¡o €n coúP¿¡acii¡ cú t¡¡jct¡ dc d¿Iito: uná grafica circular sobre la forrna en que los adultos paga¡
u
¿Cuil ticoc uro m,is següo?
,u, !"tto, ..or*les (véase las páginas 40 y 41).
c) Elabore una grafica circular con las porciones separada¡,
una gráfica de rosquilla, una gráñca de cono y una grá-
fica piramidal que muesten la fomra en que los adultos
pagan sus gastos mensuales.
á) ¿Que gníficas prefiere, la gnifica de banas, la gnífica ci
lar, la gnífica circular con porciones separadas, la grátrca
de rosquilla, la gráfrca de cono o la gráfica piramidal?
Explique su respuesta.
un riesgo por aniba del promedio. Laiabulación cruzada de los fondos respecto a si cobraban una
Con estos datos, usted está en condiciones de i¡forma a sus clientes ¿rcerca del desempeño de
los distintos tipos de fondos. Desde luego, el historial de desempeño preüo no garantiza el desem-
peño futuro. De hecho, si observa los rendimientos de 2008 ¿lmacenados en el archivo f!@
[@!!!@ ¡descubrirá que los rendimientos de los fondos en bonos corporativos a corto plazo
fueron mucho r¿¿js áa7os que los de los fondos en bonos intermedios gubernamentales!
El uso de mótodos gáficos como estos constituye un primer paso importante para resu¡ni¡ e
interpretar los datos. Aunque la presentación adecuada de los datos (como se analizó en la sección
2.8) ayuü a eviiar ambigüedades, los métodos gnáficos siempre impücan cierto grado de subjetivi-
dacl. Ahora necesitará estadísticos descriptivos para analizar más a fondo el desempeño anterio¡ de
los fondos en bonos. En el capítulo 3 se presetrtan estadísticos descriptivos (por ejenplo, media,
mediana y moda).
organizacióa y presenüación de los datos implica el uso de La elección de las tablas y las gnáficas depeirde del tipo
tablas y gráficas para sacar conclusiones acerca de datos con los que se cuenta. L¿ t¿bla 2.19 resume las de-
los mismos. En diferentes ejemplos del capíhrlo, las ta- cisiones adecuadas para el tipo de datos, tablas y gríficas
y las gráficas nos aludaron a obtener conclusiones que se esürdiaron en este capítulo. En el capítulo 3 se estu-
de la manera en que las personas prefieren pagar sus dia¡án diversos estadísticos descriptivos que son útiles para
y acerca de los costos de los alimentos en los ¡estau- el análisis v la intemretación de datos.
de una ciudad y sus suburbios; también b¡indaron
información acuca de la muest¡a de fondos de inver-
en bonos en 1a sección Uso de la estadistica. u,
=
BLA 2.19
o
de tablas y gráficas o
o
N
Tioo de datos
' Tipo de análisis Nunéricos Categóricos
O¡ganización de los Aneglo ordenado, distribución de ftecuenci4 Tabla-resumeq ubla de contingencia (2.2)
d¿tos distribución de frecuencia relativa.
distribución porcentual, dishibución
porcentual acumulada (sección 2.3)
Organzación de datos Tablas multidimensionales (sección 2.7) Tablas multidimensionales (sección 2.7)
o
multidimensionales
polígono porcenrual 49
formato no agruPado 32
analiz¿¡ 26 polígono porcentual acumulaco
clase 33 frecuencia relativa 35
ancho del intervalo de (ojiva) 5l
fiiente primaria de datos 26
arreglo ordenado 32 presentargnificamente 26
fuente secundaria de datos ¿o
basura en una gráfica 32
gráficacircular 4l principio de Pareto 42
celdas 29 proporción 35
gáfica de banas 40
clases 33 44 recolectar datos 26
gráfica de banas agruPadas
definir 26
reunir 26
disPenión 54 gnifica de Pareto 42
diagrama de tabla de contingencia 28
gnifica de series de nemPo )t)
diagrama de tallo Y hoja 47 tabla de contingencia multidimen-
distribución de tecuencia 33 histograma 48
i¡tervalo de clase 33 sional 58
distribución de tecuencia ¡elativa 35 tabla dinriL¡nica 58
límites de clase 33
distribución de porcentaje acumulado tabla-resumen 28
JO
marca de clase 34
I
PJ
FI
!I VERIFIOUE SU COMPRENSIÓN Categoria del ingreso Porcentaje (%)
¡f
y los polígonos en
t'
2.ó9 ¿En qué difieren los histogamas
cuanto a su constn¡cción Y uso? Costos de fabricación
!-
G¡nancias Boleto¡
en impreso .8
res Se
del indrviduo y si este ordenó un platillo fuerte con PAfS
en las
obtuvieron daios de 600 clientes y se organizaron Estados
siguientes tablas de contingencia: AIIMEI{TOS EMPACADOS Unidos Japón Rusia
Pasta 12 t6
GÉI{ERO
70
Hombre Mujer Tot¡l Alimentos procesados, 183
POSTRE (¡RDEI¡ADO
lJo congelados'
Sí 40 96
d$hidratados Y
2N 224 464
No refrigerados, así
280 600 como alimentos listos
Total
' part comer
S¡ls¡s, ¡derezos 63 75
Y
condimentos
Bocadillos y dulces 41 l9 24
Sí Tot¡l enlatados
POSTRE ORDENADO
garanth
PAfS Tamaño del neumático Número de reclamos de
23575R15 2,030
Estados
Unidos Rusia 3l1050R15 137
AUMEilTOS FRESCÍ¡S
Huevos, nueces 88 88 30950R15 82
y frijoles 23570R16 81
Fruta 124 88
331250R15 fó
Carne y mariscos 197 146 r25
25570R16
Verdur¡s 194 278 JJf,
Otros 62
Steps Up Recall
Fue¡te: Datos extraídos de Robert L. Simison, 'To¡d
77¡e WalI Sfteet Journal,14 de agosto de 2000' p A3'
Without Fi¡estone",
y
a)' Construya una gráfica de banas, una gráfica circular
una gráirca de Pareto para los diferentes tipos de
ali- Los 2,030 reclamos de garantía para los neumáticos
23575R15 se pueden clasiltcar en los modelos AIX
y en l0r
Unidos' Japón y
menás frescos consumidos en Estados resr¡me el trfl
Rusia.
iodelos WildLess. En la siguiente tabla se
)
Problem¿s de repaso del capíulo OY
-ai"-s;*
2.g0Estudiosrealizadosporeltabricantedelastejasdeas.ó)Construyaunhisto$amaporcentualparalacantidaddq
y
ll
v..o'"", y*:o.5l,HXXiLtJ|*'i:: .) :ü::::lt;r*. partir de su anárisis en ros incisos a) v ó)2
2.91¿Cr.r.ílenelprectopro.mediotleunahabitaciónenhote-c)Construyaunag"fi:it::l:'d"Ottnonaralacanti'
Jad de bebicla gaseosa en el eje
f v el número de botell¡
les de dos, nes y cuoto
il'.liüL-¿" toao .t -*to en el ejex'
"rt "uu, lista,los iilt;" Áliti:9 o" t-TÍi-t:*lcutiva)
durante el verano de 2010? Ei archivo @ ., en esos datos' si acaso hay
precios en libras brian_rcas {qu" eo eoefoTT0l
l equivalían t) )óué p-atrón está presente
Resuelva . alguno?
i"t"-jl.¿""t."t a 1.56 dóIares estadormidenses)' esüe[as. c¡' Si"tuuie'u q'-'" hacer un Pronóstico
acerca de la cantidad
ló siguiente para los hoteles de ;;, ;-y cua;; en la siguiente botell'
press/hotet- ;;;";id^ ü*""ta^que si verterá
Fuetrte: Datos extraídos de httpli/wlyw.hotek.cotr
price-index-summef-20t0.btn|.'/wwwl||U¡E¡!.!uu!P
una-cristribu- ::1"'i:
a) construya una distribución de ftecuencia v
ción Porcentuat.
";;lm:.:lt¡::t*:::ff1'ffil'Ífi'J¿
á) Construva un histograma y un polígono
porcentual' üfrñ. Zlqi de Ia págira 54'
'lü'il:TJii:l"lilT1::if :#{"!titffi ¡p¿
rí d) ¿Qué.concluye_acerca oet ct F,'ri-.'.,..-:"*i,:if.:'#:,"ffi
iliéiol zolq ¿.nde el dólar canadiense, el
yen japonesy
estadounidense?
caloúas.
Problanas clc repaso del capítulo 71
a cada estudiapte de la c) ¿Qué concluye acerca del índice de gastos con base en
--a l¡ cl¡se) Pida los resultados de los incisos a) y á)?
lí li pt"e*tu que el profesorgaseosa
"¿Qué.bebida car-
pueda in-
i,i-. d" 2.101 Para este problema con¡idere el rendimiento anuali-
. ag una
^*r*
tabla+esumen. zado a fres aflos, de 2007 a200l9.
iltor u pot.*t.¡.s
y constuya una gnífica
c) Constuya un histograma porcentual.
ó) En una misma gráfica dibuje polígonos porcentuales de
fuúlazgos' rendimiento anualizado a hes años, de 2007 a2009,pra
parr la cl¡se)
Clasifique:*j,Y*.: los fondos intermedios gubemanentales y los fondos
problema 2.84 en las 2.103 El problema 1.27 de la p6gna 13 describe una en- =
Le a los resultados del
garantia de cuesta apücada a 62 estudiantes de liccnciatura (la informa- o
en relación con los reclamos de
Fir€stone, y r€dacte un informe
que evalúe los ción esti alnacenada en el archivo @@. Para o
de los neumáticos Fircstone vendi- estos datos construya todas las tablas y gníficas p€rtin€ntes o
N
y redacte un informe en el que resuma sus conclusiones.
utilitarios Fo¡d. Asegúrese de incorpo- ot
en el informe. 5
2.104 El problen¿ 2.103 describe una encuesta aplicada a
62 estudiantes de licenciatura (la información está aL¡ace-
DE EOUIPO n¿da en elarchivoEE@@!@.
incluye información acerca de nuevas a) Seleccione una muestra de est¡diantes de ücenciatura de
ffi¿ ¿e I 84 fondos de inversión en bonos: su escuela y apüque una encuesta similar.
ü) Para los datos reunidos en el inciso a), construya todas
de fondo: número de identificación para cada las tablas y gníficas pertinentes, y redacte un informe en
de bono el que resuma susco¡clusiones.
de fo¡do del certificado (intermedio gubema- c) Conpate los resultados del inciso D) con los del pro-
o corDoñltivo a corto Plazo) blena 2.103.
en m'illones de dólares
Gastos de ventas (no o sí) 2.105 El problema 1.28 de la págim 14 desc¡ibe una en-
d€ gastos: proporción de gastos con respecto a los cuesta realizada a z[4 estudiantes de posgrado (véase el ar-
netos en porcentaje chivo @E!$. Para €stos datos, construya todas las
2009: rendimientos de 12 meses en 2009 tablas y gníficas pertinentes, y redacte un informe en el que
en fes años: rendimiento anualizado, de resuma sus conclusiones.
a2009 2.10ó El problema 2.105 describe una encuesta aplicada a
en cinco años: rendimiento anualizado, de 44 estudiantes de maestría en administracióri (almacenada
s2009
f¿ctor de riesgo de pérdida de los fondos en
e'iG6¡ de €studiantes de la maestría en
c) Seleccione una müestra
(por debajo del promedio, promedio, por arriba
administración de su programa de posgrado y aplique
promedio).
una encuesta similar.
Para este pnoblema considere e[ índice de gastos. á) Para los datos reunidos en el inciso 4), construya todas
un histogama Porcentual. las tablas y gráficas pertinentes, y redacte un informe en
misma gráfica dibuje polígonos porcentuales del el que resuma sus conclusiones.
de gastos para los fondos en bonos que cobran c) Compare los resultados del inciso á) con los del pro-
Y Para 1os fondos en bonos que no lo hacen. blema 2.105.
72 CAPiTL,'Lo 2 Organización y preseotación gr'ífica de los datos
.ADMI'N I 5T R AC.FGN..'I
. U.ETtC OF,
; .- .-.'.'i.;*,i.,
Total 44S
Tot¿l 10t.2
)
Referencias 73
Uso de Ia estadístic,a se le pidió que reuaiera 2. ¿La aseveración de EndRun de que cuent¿ con más gana-
En la sección
dores que perdedores es un reflejo justo y preciso de la
i)rn mar¡ó, Para ayudar a los clientes a tomar decisiones
'oiruo¿^ de.inversiones. Las fuentes de información in- calidad de su servicio de inversiones? Si cree que la ase-
de inversión y otras veración no es justa y precisa, rcalice una presentación
lluuen coneduios, asesores empresas
1)'rnntcios fnancteros. Aplique sus conocimientos sobre el altemativa que considere justa y precisa.
"wo y gráfcas a este Caso digital sobre 3. Revise el an¡ilisis sobre "La diferencia del Gran ocho" de
odurrodo de tablas
de previsíón y excelencia que asegura ofrecer EndRun y luego abra y examine el archivo Mutual
)i s"rutc¡o
de servicios fnancieros del área de Ashland- Funds que incluye una muestra de fondos de inversión
;tno empresa
en bonos. ¿Hay algunos otos datos relevantes en ese ar-
que incluye la "Guía para invertir" chivo que podrían h¿berse incluido en la tabla del Gran
Abra EndRunGuide.pdf,
Financial Services. Revise el documento, ponga ocho? ¿De qué manera los nuevos datos habrían alterado'
<le EndRun
atención a las propuestas de inversión de la onpresa su percepción de las afi¡naciones hechas por EndRun?
especial
y después responda lo siguiente:
de apoyo, 4. EndRun estií orgulloso de que los fondos Gran ocho han
v a los clatos
1. ,tDe qué manera la
presentación de la información gene- incrementado su valor dumnte los últimos cinco años.
ial sobre EndRun en esta guía afecta su percepción del ¿Coincide en que EndRun debe sentirse orgullosa de sus
nesocio? elecciones? Explique su respuesta.
U'
l. Htf D. How to L¡e w¡dl Sr¿t¡¡lics (Nueva York: Norton, t. Tufte, E. R. Beautiful Evüence (Cheshire, CT: Graphics
1954). Press,2006). o
2. Levine, D. y D. Stephan, "Teaching htroductory Busi Tufte, E. R Ezvrsro ning Informatbn (Cheshüe, CT: Gra- o
ness Statistics Using the DCOVA Fr¿mework", Decision phics Press, 1990). o
N
Scíences Jountal of innovative Educaüon, 9 de septiem- 7. Tufte, E. R. The hsual Display oJ Quanütative Informa'
(rl
bre de 2011, pp. 393 a398. tion,2r ed. (Cheshire, CT: Graphics Press,2002).
3. Microsoft Excel2010 (Redmond, WA: Microsoft Corpo- 8. Tufte, E. R' Tnual Explanations (Cheshire, CT: Graphics
ration,2010). Press. 1997).
4. Minitab Release I6 (State College, PA: Minitab, Inc., 9. Waine¡ H. frsual Revelations: Graphical Tales of Fate
20r0). and Deceptíon from Napoleon Bonaparte to Ross Perot
(Nueva York CopemicuVSpringer-Yerlag, 1997 ).
l
de los datos
74 CAPÍTULO 2 Organización y presentación gráfica
GE2.2 DE DAros
3ÁRrG#8ÉtXgN
Tabla-resumen
Charts para oear una
PHStat2 Utüce OneWay Tabtes &
t¿bla-resumen s¡
t"bl"-."sum.o. Po. ejemplo, para crear una
iif"t z'z áe ú página 28, abra la hoja de cálculo
iilrl ü"j" "¡f"
[t.. o" trabaj'o Bonrl Funds Seleccione PIIST¡I
"-
S"tistics -) OneWay Tables & Chars'
En
l*.J""* (que se muesta aba¡or:
eicuadro áe diálogo del procedimiento
rePort.
en el re'
4. Anastre la etiqueta marcada Risk y colóquela
copia de esta
cuadro Row L¡bels. Arrast¡e una segunda
.-*¿" n"ky colóquela en el recuadro Va-
-)Risk
i "oqt*
lues. Esta segunda etiqueta cambia a
Count of
un conteo de las ocurren'
'
oara i¡dicar que se moskará
ii". a. .ua^ á.goría de riesgo en la Tabla dinámica'
E. Haga clic
en OK para completar la tabla dinámica.
Tabla de contingencia
3. Marque Type y Fees en el recuadro Choose fields to
add to report.
PHStat2 Utilice Two-Way Tables & Charts para crear 4. Arrastre la etiqueta rrarcada Type y colóquela en el
una tabla de contingencia cuando necesite clasificar datos. recuadro Row L¡bels.
Por ejemplo, para crear la tabla de contingencia de la tabla 5. Arrastre una segunda copia de la eüqueta marcada Type y
2.3, que se muesfa en la págna 29, abra la hoja de cálculo )
colóquela en el recuadro de Values. @sta etiqueta cam-
DATA del libro de trabajo Bond Funds. Seleccione PIIS- bia a Count of Type). Luego anastre la etiqueta mar-
tat .) Descriptive Statistics ) Two-Way Tables & cada Fees v colóquela en el área Column L¡bels.
76 CAPÍTULO 2 Orgadzación y present¿ción gláfica de los datos
cione Home )
Sort & filter (en el Editing group) + Sort tego¡asl recorte y pegue las partes de las distribuciones de
Smauest to Largest. fricuencia creadas de maoera separada. @xamine las hojas
Guía del capitulo 2 para Excel 77
gubernamentales' Pa¡u
de inversión en bonos intermedios
porce¡-
modifi.ar esta ho¡a"de cálculo e i¡clufu distribuciones
tuales y Po¡centuales acumuladas:
"¿f."f" -o,i*.
Guía del capítulo 2 para Excel 79
-rr¿¡er üIlá
gráfica crcular, seleccione Layout ) 9, Seleccione Format (en Chart Tools). En goup Selec-
tion Cunent elija el comando para las series de porcen-
li"J More O¿ta fabel Options. En el cuadro de
taje acumulado de la lista desplegable y luego haga clic
Daia Labels, haga cüc en Label Options en
en Form¡t Selection.
lll" rzqüerd¿. En el cuadro de la derecha de Label
10. En e1 cuadro de diálogo Series para formato de datos,
l"".nur C"t"go.y Name y Percentage y deje los
marcar. Haga cüc en Outside End y luego haga clic en Scries Opüons en el cuadro de la izquierda
i¡ y en Series Options en el cuadro de la derecha, haga
una gnífic¿ cle barr¿s, si la escala del eje ho- cüc en A¡is Secondary. Haga cüc en Close.
el botón derecho en el {e 11, Cuando aún estén seleccionadas las series de porcentaje
fr"iu.- O, nugu
"licco_n acumulado en el grupo Selection Cunent, elija Desigl
rogat en matl_4'f1
lvaror) ¡_!ueeo.a {ls ;l Aris Op t Change Chart Qpe, y en la galería Change Chart
de dirálogo Axis Format, haga cüc en
cuartro izqüerdo. E¡ el cuadro de la derecha de
T!¡re seleccione la cuarta opción Litre (Line with Mar-
clic en el primer boton con la o,pció,n Fired kers). Haga clic en OI(
¡5. haga
n orden decreciente de Aecuencias y luego añada una Reubique la gr.i'fica en una hoja gniñca y ajuste su formato o
ipara elporcentaje Ultiü9e la tabla orde- utilizando las inshr¡cciones de la secciór F.4 de los apéndices. =
lunfado,
para crear la gr:ífica de Parcto. Cua¡do utilice nnz Tabla dinárnica como tabla-resunen,
para crear la gnáfica de Pareto de la figura le será más sencillo ordenarla: hag¡ cüc con el bo6n derecho o
AIMTabIe en el libro de trs- en la celda que contiene la prinera ftecuencia (celda 85 en la
o
la hoje de crilculo o
vf Transactions. Primero organice la tabla Eodifi- hoja <te oálculo del ejerylo) y seleccione Sort )
Sort Largest N
decreciente de ftecuencias: to Sm¡llest Sin embargo, es mucho más dificil crear una ot
gifica de Pareto a partir de una Tabla dinámica con colum- 6
el renglón 11 (el renglón del Total), haga
nas adicionales para el porcentaje y el porcentaje acumuiado
con el botén derecho y luego haga clic en Hide en
que crear una gnífica a partir de una tabla-resumen sencilla.
rápido. (Esto evita que el total por renglón se
La mejor solución consisG en convertir la Tabla dinámica en
en el ordenamiento).
una t¿bla-rest¡men sencilla copiando los nombres de las cate-
la celda 84 (la primera frecuencia), haga
gorías y las ftecuencias en la Tabla dinámic4 juuto con las
con el botón derecho y seleccione Sort Sort ) columnas adicio¡ales, a un á¡ea vacía de la hoja de cálculo.
to Smallest.
los renglones 10 y 12 (no hay renglón 1l),
Gráfica de barras agrupadas
clic con el botón derecho y luego haga clic en Un-
del menú rápido. PHstat2 Modifique las instrucciones para crear una tabla
una qolumna para el porcentaje acumulado:
de contingencia que se dieron en la página 75 en la sección
GE2.2 PHStat2, con la finalidad de crear una gráfica de ba-
Cumulative Petage en la celda D3. Ingrese nas agrupadas. En el paso 4 de esas i¡stucciones, malque
en la celda D4. Ingrese =IX + C5 en la celda D5 y
Sideby-Side Bar Chart adem:ás de escrfui¡ un Tftulo y hacer
esta formula hacia abaio hasta el renelón 10.
clic en OK.
el rango de celdas C4:D10, haga clic con el
derecho y luego haga clic en Fornat Cells en Excel en profundidad Construya una gráfica con base
nenú nipido. en una tabla de contingencia para crear una gráfica de ba-
la pesda Number del cuad¡o de diálogo Fo¡mar Cells nas agrupadas. Por ejemplo, para elaborar la gráfica de
ione Percentage en Category y haga clic en OK banas agnrpadas de la frgura 2.7 de la página 45, abra la
construya la
8táfica de Pareto: hoja de cálculo CONTINGENCY-PIVOT del capltulo 2
ü€leccione el rango de celdas A3:A10 y, mientas pre- del libro de trabajo y:
slona la tecla Ctrl, también seleccione el rango de celdas 1. Seleccione la celda A4 (o cualquier otr¿ celda dento de
10. la Tabla dinámica).
ione Insert t Column (en Charts group) y se- 2. Seleccione Insert t Bar y elüa la primera opción 2'I)
la primera opción 2-D Column (Clustered Bar (Ctustered Bar). Reubique la grrifica en una hoja
). gráfica y ajuste su forrato utilizando las instucciones
datos
80 CAPÍTULO 2 Organización y presetrtación gráfica de los
y PHSta¿
pero con Ia sigutetlte Como Minitab utiliza un método de tnrncamiento
de la sección F.4 de los apéndices,
.*..p"iOo' cuando haga clic en Legend, seleccione
o* * .¿to¿o ¿. .edondeo, 1as hojas del diagrama de PHg'
áá difi"."o * poco de las de 1a hgura 2'8 (que fue crea¿¿
Show LeYend at Right'
con Minitab).
óu*¿o t. .oot*ye Lrna gráfica a partir de una tabla
de
selecclona el Cuandá construya otros diagramas, utilice la opción
contilaencia que no es una Tabla dinámica, se Autocalcula¡
Set stem unit as de manera racional y solo si
.ü* l. l"fait de Ia tabla de contingencia, incluyendo los stem unit crea un diagrama con muy pocos 0 cem¿srados
el
enábezados de renglón y de colum¡a, pero excluyendo *ldid de tallo que especifique debe tener
seleccionar taitos. lCoutqule.
io-tut p. t"ngtoo y ei toá por columna
antes de
una potencia de l0).
----Eo ) Bar'
Insert
Excel en profundidad Construya de lor¡na manual
se consruye una gráfrca de banas los ta-
o.urionrr. .uando
mler- llos v las üoias en una nueua hoja de cálculo para crear q1
asupadas, las variables de renglón y de colurnna-de9.el
STEM-
Si la fuente de la gráfica es una-labla dmamlca' áiasrama de-t¿llo y hoja. Utilice la hoja de cálculo
"á.üitt..
t.",Ji""1" ***endo Ia variable de renglón en la
variable iiir a"l capítuto i
aet ntro de trabaio como guía para
y viceversa. Si la gráfica no se basa en una laota dar formato a su diagrama.
de columna,
iL-¿toi"a, ttuÁucon el botón derecho en la gráfica y luego
"t¡.
en el menú rápido' En el cuadro de diá-
Histograma
i. *i.i*i u",a
y
1Á Select Data Source, haga clic en Switch RodColumnse- PHStat2 Utilice el procedimiento Ilistogram &
Polygons
hJeo.o Of. (En Excel 2010 umbién puede utihz¿r.este para crear un histograma a partir de datos no agrupados' Por
cu;do mérodo para las gníficas basadas en t¿blas únamrcas'' li.rnpto, pu. o..il par de histogamas de la frgura 2J 0 o'-
"* r" oioUuuri q* talibien necesite reordenar las categorías r'" ti.tÉu * tu p¿gini +1, aUra U no¡a de cá'lcul¡ DATA
ou" ,.áortt á
Ia gr:í6ca. Si desea cambiar sus posiciones iit.o A. ttaf"¡o ñond Funds. Seleccione PHStat Des )
"o
lu.u u* *m.u U*adá en u¡a Tabla di¡árnica" haga clic en la cripáve Statisdcs > rristogram & Polygons' En
el cuadro de
'tirá [rpí"guut" p* Ia variable categórica que necesita.reor- cliáiogo del procedimiento (que se muesta
abajo):
il
rti
a¡are
tsin Cell Range y Midpoints Cell Range deben
cer en la misma hoja de cálculo que los ütos no
agrupaou:'
lo iftrm fu úoja de cáiculo DATA de1 libro de trabalo
"o.o
Guía det capinrlo 2 para Excel 81
clase no puede tener r¡namarc-a de dichas instrucciones, marque Chart Output y después
Como la primera
haga clic en OK.
o"i.*,;¡1¡**:i'::i:*-t:#"""i1 Por ejemplo, para crear el par de histogramas de la fi-
n*'ai-1* 1"t*,, nf
coqo etiqueta T:
"i .lrr" y o,ili- "--" i]11"--. para 1:
la gura 2.10 que se muestra en la página 49, utilice el paso 5
in- modificado con las hojas de oálculo IGDATA y STCDATA
ü tanto, el ilfidpoints Cell Range que.
mrís pequeño que el de del Capítulo 2 del llbro de trabajo (como se expuso en la
un tamano de celda
página 77) para crear un par de hoju de cálculo que conten-
iea "segurmiento del histograma" en Ia
ajustes adi- gan uoa disfibución de frecuencia y un histograma. Cada
de esta página para conocer los
aolicar a los histogramas que consfruya. histograma tendrá (los mismos) dos errores de formato que
usted puede corregir:
Construya una gnfrca a Partir de Par¿ eliminar los intervalos ente las barras:
de ftecuencia. Por ejemplo, para crear el
as de la figura 2.10, que se muesta
en la 1. Haga clic con el botón de¡echo en una de las barr¿s del
iero utilice las instucciones de Excel en pro' histograma y haga clic eú Form¡t Drta Series en el
lorre..o tn la se" cí6n' GE 2.4 "Distribución .enú Épido que aptt".".
parten", de laPlg;na 7l ' 2. En el cuadro Series Options del cuadro de diálogo For-
un par de distribucio- mat Data Series, mueva el deslizador de Gap Width a
ió.r, ürru..ioo.t para crear
para los fondos en bonos i¡termedios No Gap y haga clic en Close.
]iretrcia. uoa
ales y la otra para los fondos en bonos corpofil-
Para cambiar los rótuios de clase del histograma:
plazo en hojas de cálcr¡lo separadas. En cada
1. Úrgrese el encabezado de cohrma Midpoinb en la cekla
añada una colum¡a de marcas de clase escri-
de columna MidPoints en la celda C3 e ingrese '-- en la cekla C4 (a primera clase no tiene
e inicie en la celda C5 las m¿¡cas de
marca de clase). Inicie en la celda C5 e ingese las mar-
ita cekla C4
2.5, 7.5, l2'5, 17.5, 22.5' 21.5 v 32.5. Et
cas de clase -7.5, -2.5,2.5,7.5,12'5,175,22,5'27.5 y
-2.5,
32.5 en la columna C. (Las narcas de clase servi¡iín
crilculo:
como etiquetas para las nuwas clases en el puo 3).
o
el rango de celdas B3:B13 (el rango de cel- 2. Haga clic con el botó¡ derecho en el fondo de la gnifica
úecuencias). y luego haga clic en Select Dat¿.
Insert )
Column y elija la prirnera opción 3. En el cuadro de diálogo Select Data Source, haga clic
o
(Clustered Column). o
en Edit bajo el encabezado de Eorizontal (Cetegories) o
con el botón derecho en el fondo de la gráfica Aris L¡bel. En el cuadro de diálogo Axis Label' in- N
en Select Dat¿. grese la fórmula del rango de celdas en la forma
de diálogo Select Data: =SheetNam¿!C4:C13 en el Aris L¡bel r¡¡ge y des-
pués haga cüc en OK pua completar la tarea.
en Edit en el encabezado Éorizontal (cate-
A¡is Labels. En el paso 3, sustifirya el nombre de la hoja de cálculo que
de diri,logo Axis Labels ngese lafórmula contiene la distribución de ftecuencia y el histograma para
de celdas en la fotma --SheetNamet C4tCl3 SheelName; observe que el rango cle celdas C4:C13 no in-
SheetName es el nombre de la hoja de cálculo cluye la celda con el encabezado de colum¡a. Lea la si-
y después haga clic en OK para regres¿r al cua- guiente sección para conocer los ajustes adicionales que
dirílogo Select Data Source. puede aplicar a los histogramas creados.
cüc en OK.
Histograma: Seguimiento
clic con el botón de¡echo dentro de una barra y Como el ejemplo utilizado a 1o largo de la sección "Histo-
en Format Data Series en el menú nipido. grama" utiliza una técnica que incluye una clase adicional
(véase"Distibución de frecuenci4 pade I" en la sección
de diáloeo Formbt Data Se¡ies:
G82.4), el histograma creado incluiÉ la clase adicional sin
clic en Series Options en el cuadro izquierdo. En sentido. Si quiere eliminar la clase adicional, como se hizo en
t Options del cuadro derecho, mueva el deslizador los histogramas de la figu¡a 2.10, haga clic con el botón dere-
Width a No Gap. Haga clic en Close. cho en el fondo del histograma y eüja Select Dat¡. En el cua-
la gáfica a una hoj a gráfica y ajuste su formato dro de diflogo Select Data, primero haga clic en Edit bajo el
las instrucciones de la sección F.4 de los apéndi- encabezado Legend Entries (Series). En el cuadro de diá-
Seguimiento" en esta página para co- logo Edit Series modifique la fórmula del rango de celdas
aJustes adicionales que puede aplicar a los para Series Values. Luego haga cüc en Edit bajo el encabe-
creados. zado Horizontal (Categories) Axis Label. En el cuadro de
diálogo Axis Label modifique el Rango de Lebcls del eje.
rlentas para análisis (Analysis ToolPak) Modifi- Para el ejerylo que se utilizó etr la sección anterior, caurbie la
¡n$rucciooes de la sección GE2.3 Herramientas para celda inicial por la formula del rango de celdas para los Se'
para "Distibución
de frecuencia. parte II" de la pá- ries v¡lues de 84 a 85 y cambie la celda inicial por la fór-
con la fmalidad de
crear un histograma. En el paso 5 mula del rango de celdas del A¡is label Range de C4 a C5.
r
82 CA!ÍTULO 2 O€atrüación y presentación gnifica de los datos
series de tiempo
profundidad Constrüya una gráfica a partir de
cálculo en la oue la coh¡mna con los datos de la
aparezca inñediatamente a la izquíerda de
que contiene los datos de la variable numérica.
funciones cortar y pegar para reordenar las co-
uecesario).
para crear la gráfica de series de tiempo que
en la figura 2.16 de la página 56, abra la hoja de
en el libro de trabajo MovieGross y:
la gráfica en una hoja gr1fica y ajuste su for- ?. Haga clic en la lista desplegable Fees en la celda B3 y
las instrucciones de la sección F.4 de los seleccione Sort Z to A para reordenar las colum¡as
gráfica de los datos
84 CA¡ÍTI'LO 2 Organización y lresetrtaciól
IÓN DE DATOS Para crear los otros tipos de tablas de contingencia que se
muestran en las tablas 2.4 a2.6, modifique el paso 3 utili-
óÁreaónlcos zando otros elementos de Display adicionales.
contingencia
Tabulation and Chi-Square para crear una
ia. Por ejemplo, para construir una tabla
similar a la tabl¿ 2.3 de la página 29, abra la
Bond Funds, seleccione Stat t Tables )
and Cbi-Square. En el cuadro de diálogo del
(que se nuestra abajo):
Arreglo ordenado
Utiüce Sort para crear un arreglo ordenado. Seleccione Data
t Sort y en el c.radro de dirí{ogo Sort (que no se muesta) haga
doble clic en el nombre de una colunma en la lista de variables
para agregarla al cuadro Sort Column(s) y luego presione
7
8ó CA-P1TULo 2 organizacióo y presentaciótr griflca de los datos
en la
Tab. Haga doble clic en el nombre de la misma columna
lista de iariables para agregarla al primer cuadro By Column'
Haga clic en Niw worksheet, Original Column(s) o
Coiumn(s) of current worksheet. (Si elige la tercera opción,
colo-
también ügrese el nombre de la columna en la que desea
car los datos ordenados en el cuadro). Haga cüc en OK'
Distribución de frecuencia
Minitab no cuenta con comaúdos que utilicen clases que us-
ted especifique para crear distibuciones de frecuencia como
las qui se oüservan en las tablas 2.8 a 2'11' (Véase
t¿nbién
el apartado "Histograma" en la sección GM2'5)'
iii
rli
il
.
iiii
i[
li'
,il En el cuadro de diálogo Pie Chan - Labels (que se muestr¿
cüc en OK'
de Pareto
Chart paÉ crear una gráfica de Pareto. Por
construir la gráfica de Pareto de la figura 2.5,
en la página 43, abra Ia hoja de cálculo
Seleccione Stat t
Quality Tools t o
En el cuadro de diálogo del procedimiento GM2.5 PRESENTAqÓN GRAFICA DE =
abajo): DATOS NUMÉRICOS
o
doble clic en Cl Cause en la iista de variables Diagrama de tallo y hoja o
Cau¡e al cuadro Defects o attribute data. o
Utilice Stem-and-Letf para crear un diagrama de tallo y N
doble clic en C2 Frequency en la lista de va¡ia-
hoja. Por ejemplo, para crear el diagrama de tallo y hoja de N
agregar Frequency al cuadro Frequencies in.
la figura 2.8, qúe se muestra en la página 48, abra la hoja
clic en Do not combine.
clic en OK.
de cálculo Bond Funds, seleccione Graph t
Stem-and-
Leaf. En e1 cuadro de diálogo del procedimiento (que se
muestra abajo):
de barras agrupadas
Bar Chart para crear una gráfica de barras agrupa-
ejemplo, p¿ra crear la gráfica de barras agrupadas
2.7. que se muestra en la página 45, abra la
e cálculo Bond Funds. Seleccione Graph )
Bar
En el cuadro de diálogo del procedimiento:
Histograma
Por ejemplo'
Utilice Histogram para crear un histograma'
la figura 2 10' qre se
;;;;;t.t. .l ia, d. histog'amasladehoja de-cálculo Bond
i"""r"l" ii ou*ina 4qlabra
Funds. seleccione Graph
) Histogram- bn el cuaoro uc
abajoJ:
diálogo Histograms (que se muestra
clic en OK'
1. Haga clic en Simple y luego haga
- Simple:
Vuelva al cuad¡o de diálogo llistogram
variables. müestra.aba¡ol
en la pestaña Binning {que se
3. Haga clic en MultiPle GraPhs' '' Haga clic
9.
* Cttpoint (como Interval Tlpe) y Midp^o'
fi"g"
"ii.
inltutpoint poiition' y escnba -10 -5 0 5 10 15 2{
^"'l¡
entre
zS ¡O:i ¿"n io del cuadro (con un espacio
valor).
lfl
,ri l
ti\
[]
¡t
1i
- Nlultiple Graphs:
En el cuadro de diálogo Histogram
'!ili
1;r
no se muesrre)
{. En la pesraña Multiple variables (que haga
- clic en la
ii ;u^gJil .o ,"p","it graphs y luego
oestaña Bv Variables'
pane
ri -' É" i"
s. p.t*. ny Variables (que se muesra en la
Type en eL
*p"rio, de la siguiente columna) ingrese grapns'
.u'u¿ro sy V"ri"bles in groups
0n separate
6. Haga clic en OK'
cuía del capítulo 2 para Minitab 89
en la pestaña Scale
(que se muestra abajo). En el cuadro de diálogo Histogram - Scale:
en
position of ticks y escriba -7.5 -2.5 2.5
5. Haga clic en la pestaña Y-Scale Type. Haga clic en
fl.5 22.5 21.5 32.5 dentro del cuadro (con un
Percent, quite la ma¡ca de Accumulate values across
valor)'
e!üe cad¿ bins y después haga cüc en OK.
en OK'
Vuelva al cuadro de diálogo Histogram - Simple:
i"r"" ¿. variables para colocar 'suburban Restau- tiemDo. Por eiemplo, para crear la gáfica
de la figura 2 16'
rants' en la celda Y v¡riables row 1' qu. ," tu.rhu I a p6gna 56, abra la hoj a de cálculo Mo
plot. En el cuadro de dirílogo Scatterplots: 4. Haga clic en Starnp y luego presione Tab'
u 1. Haga clic en With regression y luego en OK' -' Haia doble clic eril Year en la listacolumns
5. de variables pari
(1-3' ir'
;;';;;t;"..n el recuadro stamp
regression (que
En el cuadro de diálogo Scatterplot With
- nermost first).
I se muestra en la parte superior de la
siguienie columna): 6. Haga clic en OK.
'oRGANtzActóru oe DATos
MIJLTIDIMENSIONALES
contingencia multidimensionales
Tabulation and Chi-Square para crear una
multidimensional. Por ejemplo, para
i abla similar a la de la figura 2.18 de la página 59,
,tipo de fondo, el riesgo y los costos, abra la hoja de
Funds y seleccione St¡t t Tables ) Cross
ond Chi-Square. En el cuadro de diáiogo del o
doble clic en C2 Type en la lisa de variables para En el cuadro de diálogo Descriptive Statistics - Summaries o
I}pe al recuadro For rows. Associated Variables (que se muestra abajo): o
doble clic en C9 Risk en la lista de variables para
o
5. Haga doble clic en C6 Return 2009 en la lista de varia- N
Risk al recuadro For rows y luego presione \¡
bles para agregar 'Return 2009' al cuadro Associated 5
Vari¿bles.
doble clic en C4 Fees en la lista de variables oara
ó. Marque Means.
Fees al recuadro For Columns.
7. Haga clic en OK.
Counts.
clic en OK. Vuelva al cuadro de diálogo Table ofDescriptive Statistics:
variables numéricas
Statistics para crear una labla de con-
multidimensional oue contensa una variable nu-
ejemplo, para crear la tabla de Ia fr,glna2.2z qlre
en la página 60. sobre el tipo de fondo, el riesgo y
la cual muestra los oromedios de los ¡endimien-
, abra la hoja de cálculo Bond Funds y selec-
t Tables )Descriptive Statistics. En el cuadro
Table of Descriptive Statistics (que se muestra
Medidas numéricas
descriptivas
DE LA EsrADlSTlcA en
Exploración de datos 3.ó EstadísticadescriPüva.
uso Desventaias y asPectos
ll numéricos
Choice ls Yours, Parte éticos
Cuartiles
Rango intercuartil
3.'l Medidas de tendencia
Resumen de los cinco Revisión del USO DE LA
central ESTADISTICA en Choice ls Your.
números
Media parte ll
Diagrama de caja
Mediana
Moda GUíA DEL CAPíTULO 3 PARA
Medidas numéricas
descriptivas Para una EXCEL
3.2 Medidas de variación población
y de forma GUíA DEL CAPÍTULO 3 PARA
Media poblacional
Rango MINITAB
Varianza Y desviación
Varianza Y desviación estándar de una Población
estándar
Regla emPírica
Coeficiente de variación
Regla de ChebYshev
Yalor Z
Forma
Covarianza Y coeficiente
de correlación
EXPLORACIONES Covarianza
VISUALES: Coeficiente de correlación
ExPloración de estadísticos
descriPtivo:
¡1
ril
il
1l
jfi
,i.:
:i:
as tablas y las gníñcas que preparó para la muesta de 184 fondos de inve¡sión en bonos
han sido útiles para los clientes del servicio Choice Is Yours. Sin embugo, se sienten
frustrados al tatar de evaluar el desempeño de los fondos en bonos. Aunque saben cómo
se distribuyeron los rendimientos de 2009, no tienen idea de cuál fue la tasa de rendi-
miento en ese año para una categoía especlfica de los fondos en bonos, como los inter-
gubernamentales y los corporativos a corto plazo. Tampoco conocen la magrrinrd de la
idad en la tasa de rendiniento de 2009. ¿Todos los valores son miás o noenos iguales, o inclu- a,
muy bajos y valores muy altos? ¿Hay muchos valores bajos y pocos altos, o sucede lo
? ¿Acaso la cantidad de valores bajos es simila¡ a la de valores altos?
podrían las respuestas a estas pr€gunt¿s ayudar a los clientes a evaluar mejor los fondos o
o
en bonos? o
N
{
or
plantea1¡o
os clientes de la segunda parte de
la sección referente a Choice Is Yours estan
p..g** ti1¡
""*."
¿e-variables numéricas, luando.sre ryt::H:^::t:*":T:ltT
*
.1#;,ñ;;; *op"p* lastabtasv grár:cas que T:t11:1,:1:],1"1]tt:?'
hs medidas de tendencia cenüal, la variación
y la fonm ¡6
t¿mbién es necesano ,o.* .n .o"ju
cada variable numérica.
VARIACION
a partir de un
La v¡riacién es Ia oantidad de dispersión o tlisemiración de los valores
valor cental,
FORMA
valores' descle el m'ís bajo hasta el más alto'
La forma es el patón de Ia distribución de
Media
media) es 1a medida de tendencia central
má¡
La media aritmética (generalmente denominada
'*-,¡"lL ei mrsmo pa'
."Ji" .s l"'inic" medida común en la que todos los valoresdedesempeñan
(como el punto 0e
t.L L" á.¿i" tf*. .oto "p*to .e equilibrió" en un conjunto datos
* de datos y
sumando todos loi vaiores en un conjunto
aoovo en un sube y U"¡a¡. L" meAia se calcuia
,i#il¿ilJr ,"1ít ¿" ,u-u entre el número de valores en dicho conjunto.
-"t;ilH;;;?"ii^l^¿i "¿o i "r" uru p.u representar la. media de una muestra.
tá*i,'r. Pafa ur8
se escribe como:
.u"rü qu. .ontiá. n valores' la ecuación para calcular la meüa
x= xr+xz+'+x,
n
A)'
con det¿lle en el apéndice
A continuación se utiliza la notación de sumatoria (que se analiza
para reemplazar el numerador X, + X2+'- + Xnconel término
iX" que significa sumar todos 106
3.1 Medid8s de tcDd€ncia cental 95
MEDIA MUESTRAL
La media muestr¡l es la suma de los valores en una muesta, diüdid¿ entre el número
de valores eú la muesÍa.
)¡
(3.1)
n'
donde j:'
:
.i media.muestial
z: número de valores o tamaño de ia muesta
X, = j-ésimo valor de la vaiiable ,Y
\r.
,Z¿"r = sumatoria de todos los
valores .& en la mueshr
por
Puesto que todos los valores desempeñan el mismo papel, la media se ve muy afectada
cualquio valor que sea muy diferente de los demás. Cu¿ndo existen este tipo de valores tan exte- o
mos.ie debe evitar el uso de la media como medid¿ de tendeucia cental'
La media sugiere un valor típico o cental para un coojunto de datos. Por ejemplo, si usted sabe
=
clrioto tiempo, por lo general, le toma prepararse para salir en la mañan4 podría planear mrcjor su o
rutina y reclucir al mínimo cualquier retraso (o anticipación) para salir a zu destino. Siguiendo el o
o
nétodó <h Oefini¡, Reunir, Organizar, Presentar gníficamente y Analizar, lo primero que hay que N
hacer es definir el tiempo qrr nos toma preparamos para salir como el tiempo (redondeado al mi-
ot
nuto más cercano) que transcurre a partir de que nos levaltamos de la cama hasta que salimos de
casa. Luego, los siguientes tiempos para
t"uoi-or l0 dlas l¿borales consecutivos (los cuales se
encuentran alnacenados en el archivo @$:
Día: 34 678910
Ttempo (minutos): 39 29 43 52 39 4 4 31 4 35
El primer estadlstico que se calcula para analizar esos datos es la media. Para esos datos, la
media del tiemoo es de 39.6 minutos, calculada como sigue:
i=l
x= n
39 + 29 + 43 + 52 + 39 + 44 + 40 + 31 + ¿14 + 35
10
=38
10
= 3e.6
Aunque ningún día en la muestra realnente tuvo el valor de 39.6 minutos, dedicar alrededor de
40 minutos a prepararse para salir sería una buena regla para planear las mañanas. La media es una
buena medida de tendencia cental en este caso, ya que el conjunto de dato, oo .o¡1¡sne ningún
valor excepcionalmente pequeño o gande.
:--- I
96 cA¡rIfJLO 3 Medidas numéricas descriptivas
Considereutrcasoenelqueelvalordeldía4es102mi¡utos,enlugarde52.Estevalo¡
a 44'6 minutos' como stgue:
extemo causa que la media aumente
suma de los valores
número de valores
2x,
,
-Y
'^ =Y9
l0
= M.6
con la media
la media de 39'6 a'14'6 min¡tos' En contraste
Ese único valor extremo incfementó tiempos que loma prepa'
..en
il"#i;r; ,;;;"*ba el cenro" ies decir, era mayor que 5 de los
mavor que e de los'10 tiempos
#;il J;;;;;;i q,,. ro' ono-'JtiJ'po'¡' L ootuu
"&aes
ta media dejó de ser una meüda de te¡'
;ffi;;;ó;;;"'l *ri'' o'úiÁ "i-vitor
ext'eno'
denciacenral adecuada.
(almacenado
ffi mues[a de siete cereales para el desayuno
EJEMPLO 3.1 incluve el número de calorías por porción:
;i;.hi;; @
La media de las
C¡lorí¡s
calorías en los Cere¡l
cerealeS 80
All Bran de Kellogg's
100
Com Flakes de Kellogg's
100
Wheaties
Path 110
Organic Multigrane Flakes de Na¡¡re's
130
Rice Krispies de Kellogg's
Post 190
Shredded Wheat Vanilla Almond de
200
Mini Wheats de Kellogg's
en esos cereales para el desayuno'
Calcr¡le la media del número de caloias
que se calcula como sigue:
soLucóN El número metlio de calorías es 130,
suma de los valores
número de valores
(.')
X:
910
=_=IJU
7
\{f
ilt
ril
Mediana
il
lt, Lamedianaeselvalori¡temredioenunconjuntodedatosofdenadodemenoramayor'Lamitad
son mayores o iguald
'il de los valores sdn menores tg;t ;ü"-;;;.t* ; ü-titu¿ ¿t tot uotores útil cuando exrso
t."ü"rt'"[" p"i""l"tit'é*tr"mos' po' lo r€sulta
,
que
rr[1 ;;;#i;;;;
lrü
r.tii'
l, ll
""$HH*Ti"di-" dr-.*junto dedatos, primrcro se ordenanlos varores.el
ji"i'it-JJt
nenor al.m¡-
que se ubica la mediar
en el
,
.""r"iot iuiroGioo a"r
yor, y luego se utiliza r" t: "ur*
'x
MEDIANA
I i',
t:t n1-!""1o, *6*¿¿6 (3:)
Mediana =
3.1 Medid¿s de tendcncia cental 97
Para analizar con mayór detalle la muesta de los 1 0 tiempos que toma prepararse para salir en
l¿ m¡ñena, podemos calcula¡ la mediana. Para ello se ordenan los tiempos diarios de la siguiente
manera:
Yalores ordenados: 29 31 35 39 39 40 43 44 44 52
Posición12345678910
T
Mediana : 39.5
Como el ¡esultado de dividir n + 1 ente 2 es (10 + 1/2 = 5.5 para esta muesüa de 10, debernos
utilizar la regla 2 y promediar las mediciones asociadas con el quinto y el sexto valores ordenados,
39 y 40. Por loluto, la mediana es 39.5. La mediana de 39.5 significa que, la mitad de los dlas, el
tiempo que toma prqrarane para salir es menor que o igual a 39.5 minutos y que, para la ota mitad
de los días, ese tiempo es mayor o igual que 39.5 minutos. En este caso, el ti€mpo medio de 39.5
minuios que toma prepararse para salir estri muy cerca de la media de tiempo que üon¿ esa activi-
da4 que €s 39.6 minutos.
o
=
3.2 Los datos nutricio¡ales acerca de una muestra de siete cereales para el desayuno (almacenados en o
incluyen el númoo de calorías por porción (véase el ejemplo 3 . I de la página
o
de la
el archivo !@$ o
96). Calcule la mediana del número de calorías en los c€reales para el d€saymo. N
de una
con SOIUC|ÓN Como el resultado de dividir z + I ente 2 para est¿ muestra de siete es, utilizando la
regla 1, (7 + l/2 = 4, la mediana es el valor asociado con el cuarto dato ordenado. Los datos del
número cle calorías por porción están ordenados del menor al mayor:
La mediana del número de calorías es 110, La mit¿d de los cereales para el desayuno tiene una
cantidad de calorías igual o menor que 1 I 0 por porción, y la mitad de los cereales para el desayuno
tiene una cantidad de calorías igual o nayor que 110.
Moda
La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. A difereucia de la
media y al igual que la median4 los valores extsmos no afectan a la moda. En ocasiones no existe
una moda en rm conjunto de datos, o bien, se encuentan varias de ellas. Por ejemplo, considoe los
sigurentes datos sobre el tiempo que toma prepararse para saiir:
29 31 35 39 39 40 43 44 44 52
Se observan dos modas, 39 minutos y ¿l4 minutos, ya que cada uno de esos valores se Pr€seúta dos
veces.
v
98 CAIiTULO 3 M€didas numédcas descnptlvas
001223333346726
que cualquier otro valor' la moda es 3' Por consi"
Puesto que el 3 se presenta cinco veces, más
falle tres veces en u!
;;;;"];it.;; le sist"m"s afrma quq 1o más.común es que el ser'idor
día. Para este conjunto de ütos' r" ttal^ou
tut¡le" es igual a 3 y la media es igual a 4'5' El nir'
p"tu .tto, datos, la mediana y la moda son mejores medidas de ten'
mero 26 es un valot €xtemo.
dencia central que la media.
de l0 bancos son:
f^ *.¡iooo ($) por emitir cheques sin fondos para una muestra
EJEMPTO 3.4
Datos sin moda 26 28 20 2t 22 25 i8 23 15 30
Caicule la moda.
Rango
Elraneoeslameditlanuméricadescriptivadevariaciónmrissencillaenunconjuntodedatos.
RANGO
miás pequeño'
El rango es igual al valor más grande menos el valor
(33)
Rango = .X.* o*u" - 4* n**""
)
3.2 Mcdidas de va¡i¡ción v de forma 99
Para analizar con mayor detalle la muestra de los 10 tiempos que toma prepararse para salir en
la mañan4 podemos calcular el rango. Para hacerlo, ordenamos los datos del más pequeño al mas
grarúe,
29 3t 35 39 39 40 43 44 44 52
Utilizando la ecuación (3 .3), el rango es 52 - 29 = 23 minutos. El rango de 23 ninutos indica que
la diferencia mris grande ente dos días cualesquiera en el tiempo que üoma pr€pararse para salir
en la mañana es de 23 minutos.
3.5 Los datos nutricionales acerca de una muesta de siete cereales para el desayuno (almacenados en
el archivo @@ incluyen el número de calorías por porción (véase el ejemplo 3 . I de la página
96.¡. Calcule el raogo del nrhnero de calorias en los cereales.
SOLUC|ÓN Ordenadas de menor a mayor, las calorias pa¡a los siet€ cer€ales son:
El rango mide la di.qp e'.rsíón totat q)ehnyen el conjunto de datos. Aunque el rango es una me-
dida sencilla de la variación tot¿l de los d¿tos, no üoma en cuenta cónto estos se distibuyen ente el
valor más pequeño y el mrás grande. En otas palabras, el rango no indica si los valores están distri-
o
buidos de manera unifomle a lo largo del conjunto de datos, si se agrupan cerca de la mitad o si se =
agrupan cerca de un exhemo o de ambos. Por esa razón, cuando al menos uno de los d¿tos es un
valor exüemo, es errgañoso utilizar el rango como uoa medid¿ de variación.
o
o
o
N
Varianza y desviación estándar {
o
Como el rango es una medida sencilla de variación, no toma en cuenta cómo se distribuyen o se
agrupan los valores etrtre los exEemos. Dos medidas de variación comlnmente utilizadas, y que sí
toman en cuenta cómo se distribuyen todos los valores de los datos, son la varirnza y la desvia-
ción estándar. Estos estadisticos miden la dispersión 'lromedio" alrededor de la medi4 es decir,
la manera en que los valores más grandes fluctuan por arriba de ella y la m¡nera en que los más
pequeños fluctúan por debajo de ella.
Una medida sencilla de la variación al¡ededor de la media podría toma¡ en cuenh la diferencia
entre cada valor y la media, y luego sumar esas diferencias. Sin emba¡gq si lo hiciáranos, encontra-
rlamos que como ia media es el punto de equiübrio en un conjunto de daÍos, para coda conjunúo esas
diferencias suman cero. Se requiere una medida de variación que r€st€ un conjmto de datos de oto,.
eleve al' andrado la diferencia ente cada valor y la media, y luego sr:me esas diferencias cusdradas.
En estadística esta cantidad se conoce como suüri de cu¡dr¡dor (,SC). Luego, para obtener la
varianza muesFal (,!'), esta suma se divide ente el núm€ro de valores menos I (!ara datos nu€stra-
les). La rriz cuadrada de la varianza muestal es la dewiacióu estáada¡ muesFal (S).
Como, de acuerdo con las reglas del álgebra, esta suma de cuadrados siempre será no negativao
ni la varianza ní la desviación estándar pueden ser negativas. Para pnicticamente todos los con-
juntos de datos, la varianza y la desviación estíndar serán un valor positivo. Ambos estadlsticos
serán cero solo si no hay variacióú en un conjunúo de datos, lo que ocurre únicamente cuando todos
los valores de la muesta son iguales.
Para una muestra que contiene ¡¡ valores , Xp X2, X3,. ,., Xn,la varia¡za muestal (dada por e1
símbolo J,) es:
La eouación (3.4) expresa la varianza muestal utilizando notacióu de sumatori4 mietrtas que la
ecuación (3.5) expresá la desviación estándar muestral.
?
1OO CA?ÍTULO 3 Mertidas nu¡¡é¡icas descriptivas
VARIANZA MUESTRAL
La varianza muestral es la suma cle las rliferencias alrededor de la media elevadas al
cuadrado' dividida ente el tamaño de Ia muestra menos 1'
S/v - ?\2
(3'4)
J- = ---------;-
n- L
donde:
i :j metlia ¡h¡estat
n númem de valo¡es o ta'n¿fro cle l¿ muestra
X= j-ésimo valor de la variable X
'n
i'/i\rLi*. - )t\2
" t = sumatoda
de'todas las diferencias aL cqadrado ente
¡=l .n
los xi valores y á
2(;¡',-x)'
s= \F= (35)
)
3.2 Medidas de variación y de forma 1 01
X :39.6
8tA 3'1 Paso I Paso 2
de la Tienpo (X) (x'--E (x, - 7)'
de los
que toma 39 -0.60 0.36
para salir 29 - 10.60 t12.36
43 3.40 I t-)o
52 12.40 l)J. /o
39 -0.60 0.3ó
M 4.40 19.36
40 0.40 0.16
J1 -8.60 I t-vo
44 4.40 19.36
35 -4.60 21.16
Paso 3 Paso 4
Sumar: Dividir entre (z - l):
412.40 45.82
La varianza tarnbién se puede calcular sustituyendo los valores de los términos de la ecua-
ción (3.4):
v,
2(ur, -h' =
n'l o
o
(39 - 39.q2 + Q9 - 3e.q2 + ... + (3s - 39.6)'? o
N
l0-l
ID
4t2.4
=9
= 45.82
S¿r. - 7tz
s=vF= = t/+tn = e.n
Esto indica que, en est¿ muestra, los tiempos que toma prepa¡arse para salir se agnrpan dento de
6.77 mi¡utos alrededor de la media de 39.6 minutos, es decir, se agrupan enhe X l,S = 32.83 y -
i + S = qASl . De hecho, siete de los l0 tiempos que toma prepararse para salir se localizan den-
ho de este intervalo.
Utilizando la segunda columna de la tabla 3.1, también es posible calcular que la suma de las
diferencias entre cada valor y la media es igual a cero. Para cualquier conjunto de datos esta suma
siempre será cero:
>
j=l
(X' - t) = 0 para todos los conjr:ntos de datos
Esta propiedad explica por qué la media es la medída de tendencia central mís utilizada.
V"
(almacenados q
de siete cereales para el desayuno
3 r de ra página
ffi-ilil;;; "'i'*" " L",'^-* ::?'"'.*:1"'*:"
Cá|cu|ode'. ";:il:[:ffi#;;;ilñ¡nesuá,ndardelascaloríasenlosce¡eales.
""n'uo
:"i:-ll'^T:
1300u
iéó 60 3'600
;6ó 7o 4'eoo
Paso 3 Paso 4
de la página 100:
Si utilizamos la ecuación (3 4)
n _^
Srr
,L) \'-' - X)'
c2 i=l
-
(so-130F+(1oo -130)2+"+(2oo-l3o)2
l- L
13,200
o
-- 2,200
estrindar muestal, ü es:
Si utilizamos la ecuación
(3.5) de la página 100, la desviación
t(x
Ft''
-t)'?
S=VF= =t/r4p=46.eM2
n- |
&nÍo
en 10s cereares se agrupan
est átndar de 46.g042indica que las ca10rías
La desviación Í- 1'S = 83'0958 y X + tr
de 130' es dicir' que se'agrupan'entre
de 46.9042 al¡ededor de la media de es(
(;;;;'d;*¿"liiO tle-las calorias se localiza dentro
= r16.9042.De hecho, 5i'1%
intervalo.
Si todos los valores. son iguales (de manera que no hay variación en los datos), el rango, la
varianza y la desüación estándar se¡an iguales a cero.
Ninguna de las medidas de variación (el rango, la varianza y la desviación esLíndar) puede
ser üesativa.
Coeficiente de variación
A diferencia de las medidas de variación que se presentaron antes, el coeficiente de variación es
vna medida relativa de variación que siempre se expresa como porcent¿je y no en términos de las
unidades de los datos en particular. El coeficiente de variación, que se denota con el símbolo C(
mide la dispersión de los datos con respecto a la media.
cr, = (!)non
, donde:
,S : desviación estánda¡ muestal
Í = media muestal a,
=
c)
Para la muestra de 10 tiempos que toma prepararse para salir, dado que X = 39.6 y S = 6.77 , el c)
c)
coeñciente de va¡i¿ción es: N
o
CV=
o
Para los tiempos que toma prepara$e para salir, la desviación estrlndar es 7.1% del tamaño de la
media.
El coeficiente de variación es especialmente útil para comparar dos o más conjuntos de datos
que estrín medidos en unidades diferentes, corno se ilustra en el ejemplo 3.7.
EJEMPTO 3.7 ¿Qué aspecto varía ruás de un cereal a oto, el número de calorías o la cantidad de azúcar (en gamos)?
Comparación de SOLUCIóN Como las calorías y la cantidad de azúcar tienen diferentes unidades de medición,
dos coeficientes es necesario comparar la variabilidad relativa en las dos mediciones.
. de variación cuando Para las calorías, a partir del ejemplo 3.6 de la página 102, el coeficiente de variación es:
las dos variables
tienen diferentes cvca*u= (,46191?)loo % : 36.08%
unidades de \ 130 /
medición
Para la cantidad de azúcar en g¡amos, los valores para los siete ceteal€s son
6244411 10
/? 1R?7\
C/-,i"* = l:\ ).ó) /1,/ltoo% = 57.84%
Así, con respecto a la media, la cantidad de azúcar es mucho mrís variable que las calorías.
I
"=- r
104 cAPÍTuLo3 Medidas numéricas descripuvas
VALOR Z
x-x (3.7)
J
39.0 - 39.6
b.//
= -0.09
Z para los l0 üas'
Lattbla3,3 Eesenta los valores
tiúor Z
TABLA 3.3 39 -{.09
Valores Z de los 10 29 -t.f /
0.50
tiemPos que toma,. {J
sallr 52 i.83
PrePararse Para
39 -{.09
44 0.6s
40 0.06
JI
44 0.65
J) -{.68
Medi¿ 39.6
o.tI
Desvi¡ción estándar
¡]tr
R
Jll
¡li Erryvorv{vrz¡:1.1?:T.l'-iii',HiiHi'j,'fi:"T'.i"trJ#1ilii{ü;'j'l:
li I
It i
;'"1m*::lfff 1""1':¿í;:*';ilñ;;i';r''T11'"'-",T'd;Jil:::[illJ:[:*;1
lll
l¡r #r"t qt :¡¡ " si es mayor que +3'0' Ninguno de
los tiempos er
li
para consi<terarlo un valor extremo'
i
ll r
¡¡;
ti (almacenados d
ñmuestra de siete cereales para el desayuno
iill €JEMFLO 3.8 Los datos nutricionales acerca
de
(véase el ejemplo 3'l de la págm
!!!@ io.tuvtn tt o'i#?Jll-t;ol* fo' pottión
'it
Cálculo de los
el archivo
siii;n#ñ-"""res Z de las calorias en los cereales'
t:
f,
I
t:*
valores Z Para el
número dé calorías ;ü;'" ?9':"';it'*li;it,ili
?
"T#ü:r#
;*:f ,?,ü:t:
;iffiíi:ifr que ninguno de
^^r^-.-. -- r^c cc
los
+3'o'
;;l;;;, ;; ."""r que -3'o ni maYor que
3.2 Medidas de variación y de forna 105
C¡lorías Yrlores Z
LA 3'4
80 -1.0'l
Z del
100 -0.64
de calorías
100 -0.64
110 -0.43
130 0.00
190 1.28
200 't.49
Media 130
DesYiaciónestándar 46.9M2
Forma
La forma es el patrón de la distribución de los datos a lo largo del rango completo de todos los va-
lores. Una distribución es simétrica o sesgada. Ea una distribución simétric¡, los valores que están
por debajo de la media se distribuyen exactametrte de la misma forna que los valores que están por
arriba de esta. Así, los valores altos y bajos se neutralizan. En una distribución sesgrilr, los valores
no se distribuyen de forma siméfica al¡ededor de la media. Este sesgo produce un desequilibrio
ente los valo¡es altos y los bajos.
La forma también puede afectar la relación de la media con la meüana. En la mayoría de los
casos: o
. Media < m.ediana: negativa o sesgada hacia la izquierda
. Media = mediana: siménca o sin sesgo o
. Media > median¡: positiva o sesgada hacia la derecha o
o
En la fizura 3. I se describen tres coniuntos de datos. cada uno con una forma diferente. N
o
U RA 3..I
de
conjuntos
datos con
forma Gráfca
Gráfica A Gráfica B C
Negativa o sesgada hacia la izqu¡erda S¡mét¡ica Positiva o sesgada hacia la derecira
Los datos en la gmfica A son negativos o sesgados hacia l¡ izquierda. En esta gnific4 la maye
ría de los valores se encuenrari en la parte superior de la distribución. El largo extemo y la distonión
hacia la izquierda son causadas por algunos valores exhernadamente pequeños. Estos valores hacen
que la media se deslice hacia abajo, provocando que esta sea menor que la mediana.
Los datos en la gnifica B son simétricos. Cada mitad de la curva es una imagen en espejo de la
otra mitad. Los valores altos y bajos en la escala estín equiübrados, y la media es igual a la mediana.
Los datos en la gnáfica C son positivos o sesgados hacia la izquierde. En esta gr:ífica, la ma-
yoría de los valores se eúcuenFan en la parte inferior de la distribución. El largo extemo y la dis-
torsión hacia la derecha son causadas por algunos valores exhemad¿mente grandes. Estos valores
hacen que la media se deslice hacia arrib4 provocando que esta sea mayor que la mediana.
Dos estadísticos relacionados con la fo¡ma son la simetría y la curtosis. La simetría mide el
grado en que un conjunto de datos no es simétrico. La curtosis mide la concentación relativa de
los valores en el cenho de la distribución de un conjunto de datos, comparada con los extemos.
Una distribución simétrica tiene un valor de cero. Una disnibución sesgada hacia la derecha
ls dene un valor de simetría positivo, y una distribución sesgada hacia la izquierda tiene un valor de
úa simetría negativo.
Una distribución en forma de campana tiene una cu¡tosis con un valor de cero. La distribución
que es rnás plana que una distrbución en forrna de carnpana tiene un valor de curtosis negativo. Una
1 0ó cAPÍTwo 3 Medidas trunéricas desc¡iltrvas
r
clistribuciónconunapuntamasmarcada(aquellaconunamayorconcenhacióndevaloresenelcq.
un valor de cudosis positivo,
no de ta distibución que wra distibución en forma de campana) tiene
FIGURA 3.2
obtenidos en 2009 por los tondos en bonos
Estadísticos descriptivos de Excel y Minitab para los rendimientos
;ür;.;;, ¿;#;t;"i;; y lo's fondos dn bonos corporativos a corto plazo'
bt !-.Irát Goctút
st€!¡ftre5s I
{¡
l'i
1I Alexaminarlosresultados,seobservaqueexistengrandesdiferenciasenlos¡endimie[t00
lll gubemamentales y b' f""*,t,:i
ott""-iü It ZOOS por los fondos en bonos intermedios 1111i
ll,l
ll,, comorativos a coft; plazo. Los fondos intermedios gubemamentales tuvieroD una utrlldac mcu'
f { r
#ffiil;.;ü'v í* "iiliüi L.¿i ana de 4.4,a d'iferencia de los fondos en bonos corporat-voo
y una mediana 9'1' Las medianas indic¡r
li l a corto plazo, los cuales tuvreron una media de 9'S959
'le rendinientos de 4'4Ú
oue la mitad de 1os fondos en bonos iotermeüo. gubáamentales
tuvieron
ll" ffi;il;ñ^ü.üJá"irl""a"s en bonos óorporativos a corto plazo tuvreron,r:liru::'.X
u de 9.1 o misilevados. Se concluye que los fondos en bonos
corporativos a corto pnzo ruvtv'""
.*di-i*to, .o"ho loi fondos en bonos intermedios gubernamenlal"t', ,,--*
más altos que
Losfondosenbonosintermediosgubemamentalestuvie¡onunadesvracronestanorng'"
il' ,o.rt. -a, t"¡u que los fondos el bonJs corporativos a corto plazo (5 3606 * :"-qi:.tó" ll
5.6867). Aunque ambos tipos de fondos en bonos plesentaron
un sesgo t *t",*
il fondos en bonos i¡termedios gubemamentales resultaron más sesgados
lo "jp^o,tl:::'(;
La curtosls oe los uuo "
oos de fondos en bonos fue muy po,itiu", ro que indica una
distribución con un pico mas pronuf
ciado aue una distribución en forma de campana'
I
Problemas para las secciones 3.1 y 3,2 107
o
o
Problemas para las secc¡ones 3.1 y 3.2 o
N
3.4 El siguiente conjunto de datos proüene de una muestra 6
APRENDIZAJE DE LOs FUNDAMENTOS N
3.1 El siguiente conjunto de datos proviene de una muestra
den=5.
7-5-879
7 4982 c) Calcule la media, la mediana y la moda.
á) Calcule el rango, la varianza, la desviación estándar y el
c) Calcule la media, la mediana y 1a moda.
coeficiente de variación.
ü) Calcule el rango, la varianza, la desviación est:iadar y el
c) Calcule los valores Z. ¿Hay algún valor exherro?
coeficiente de variación.
d) Describa la forma del conjunto de datos.
c) Calcule los valores Z. ¿Hay algún valor extemo?
4.20 5.03 5.86 6.45 7.38 7.54 8.46 8.47 9.87 0.57 1.51 0.57 0.55 0.86 1.41 0.90
a) Calcule la media Y la mediana. Fuetrte; Datos extlaidos de "Dark Chocolate: Wtich Bars A¡e Besfl
Consumer Reports, septiembre de 200?, p. 8.
ái Calcule la varianza, la desviación estandar, el rango y el
coefi ciente de variación. a) Calcule la media, la mediana y la moda.
c) ¿Los datos están sesgados? Si
así es, ¿de qué forma? ái Calcule la varianza, la desviación estándar, el rango, el
l) Óoo b"s. en los resultados de los incisos c) a c), ¿qué coeficiente de variación y los valores Z. ¿Hay algun valo
concluye con respecto a la cantidad que gastaron los extemo? Explique su lesPuestra.
clientes para el almuerzo? c) ¿Los datos estín sesgados? Si es asi, ¿de qué forma?
lista las millas tot¿les por galón á Óon base en los resultados de los incisos a) a c), ¿qué cot
3.9 El archivo $@ cluye con respecto a[ costo de las barras de chocolare os€r
2011'
fMPG) que rinden los automóviles sed,ín familiares
3.13 ¿Hay alguna diferencia en la
variació¡ del rendimi:nh
24 21 2s 22 23 34 34
it
20 20 22 44 32 20 20 p"tn aif.tát"i tipos cle inversiones? El archivo ![@
cluye d^tot sobr" los rendimientos para un certificado de de'
Fuente: Datos extraídos de "Ratitrgs" ' Consumer ReportJ, abril de
pOsito 1Cl¡ a un aAo y para un certificado de depósito (CD),r
2011, pp. 30J l.
cinco años'en 23 banios de Estados Unidos vigentes el 4
de
Fuent€: Datos extraídos de "Ratings", Consumer Reports, abrll de Fuente: Datos exÍaídos de www.hotels.com/pre3s/hotel-priceü
2011, pp. 30-31. dcx-summer-2010.htm1.
F'
3.3 ExPloración de d¿tos quméricos 109
PRIMER CUARTIL, 01
El 25.0% de los valores son más pequeños que o iguales a p,, el primo cuartil, y 75.09/o
de ellos son mrás grandés que ó iguales al primer cuartil, pt.
A, = +fvalor
+
ordenado (3.s)
TERCER CUARTIL, q
El 75.0% de los valores son pequeños que o iguales al tercer cuartil, Q3,! 25.0o/o de
miás
ellos son más grandes o iguales que el tercer cuartil, Q.
3{¡ + l)
ar = valor ordenado (3.e)
7
110 CAPÍTULO3
._l:
. Regla I Si el valor ordenado es un número entero, el cuartil es igUal al valor que conespo¡¿,
a ele dato ordenado. por ejemplo, si el tamaño de la muestra es n = 7, el
primer cuartil, p,.
valor asociado con el (7 + 1/4 = segundo dato ordenado'
es igual al
En Excel la función
CUARTIL utiliza
. Regla 2 Si el valor ordenado es una mitad fraccionaria (2.5, 4.5, etcétera), elcuartil es ig!¡l
diferentes reglas para al v;alor que conesponde al promedio de los valores de los dos datos ordenados implicados
calcular cuartil es. lJti lice Por ejen:plo, si el iamaño de la muesÍa es n = 9, el primer cuartil, Q,, es igual al dato o¡¿r.
/a hoja de oálculo nado (9 + ly4 = 2.5, que está ente el segundo y el tercer dato ordenado'
COMPUTE, del libro de . Regla 3 Si el valor ordenado no es un número entero ni una mitad fraccionaria, seredon¿q
trabajo Ouartiles, gue se
estudió en la sección el risultado al entero m¡is cercano y se selecciona el valor conespoodiente a ese dato or¿o
6E3.3 para calcular nado. Por ejemplo, si el tamaño d€ la muesta es n = 10, el primer cuartil' Qt, es igual al ¡¡
cuaftiles uülízando las + l)14 = Zjs dáto o¡denado. Redondeamos 2.75 a 3 y utilizamos el tercer dato ordenado.
reglas que se presentan
para analizar con mayor detalle la riuestra de 10 tiempos que toma prepararse para salir en ¡¡
en esta secdon.
mañana. Oodenos calcula¡ los cuartiles. Para ello, ordenamos los datos del menor al mayor.
Yalores ordenados: 2931 3539394043M4452
Posición: r2345678910
El primer cuartil es el (z + 1)/4 = (10 + 114 = 2.7 5 dato ordenado. utilizando la regla 3, se r¡.
dondeá al tercer dato ordenado. El tercer dato ordenado para 1os valores del tienpo que '
prepararse para sali¡ es 35, lo cual sipifica que 25% de los.días' el tiempo que toma preptu*"d
pr€'pa¡ase pan
para salir es menor que o igual a 35 minutos, y que 75% de los días, el tiempo que toma
salir es mayor que o igual a 35 minutos.
El terce¡ cuartil eJ eB @ + ll4 =3 (10 + 1)/ 4 = 8.25 ¿ato ordenado. Utilizando la regla 3 pan
¿[4 minutos. Asi' 75% de los días, d
los cuartiles, se redoodea al octavo dato ordenado, el cual es
tiempo que toma prepafafs€ para salir es menor que o igual a zl4 minutos, y 25% de los días, el tienp
zl4 minutos'
que toma prep¿¡ri¡rse para salir es mayor que o igual a
EJEMPLO 3.10 Los datos nutricionales ace¡ca de una muestra de siete cereales para el desayuno (alnacenados en
el archivo (!!!$incluyen el número de caloias por porción (véase el ejemplo 3'1 en la págiu
Cálculo de 96). CatcutLl pri-er cuartil (pr) y el tercer cuartil (Q) del núme¡o de calorías para los cereales.
cuartiles
SOLUCÉN Ordenados de menor a mayol los núme¡os de calorías de los siete cereales sonlc
sieuientes:
Valores ordenados: 80 100 100 110 130 190 200
fostcon: I 234567
Para estos datos,
ln + l)
e, = # valor ordenado
Por lo tanto, utilizando la regla 1, se sabe que g, es el seito valor ordenado Como
el sexlo
ü
$ valor ordenado es 190, Q, es 190.
,
- qu€ 0
i.l Ei prh.r .r.rtil áe-1b0 indica que 25% de los cereales tienen calorias_ que son menores
iguales a 100, y que 75% tiene calorías que son mayores que o iguales a 100. El tercer cuaftlr'¡
-r-go
:- de los cereales tienen calorías que son menores que o iguales a 190, y que
25Í'
I
rái." qrlisy.
tiene calorías que son mayores que o iguales a 190.
)
3.3 Exploración de datos numé¡icos 111
Rango intercuartil
El ralgo intercuartil es la diferencia enüe el tercer cuartil y el primero en un conjunto de tlatos.
El rango intercuartil mide la dispersión en el 50% intermedio de los datos. Por lo tanto, no sq
que
ve afectado por los valores extemos. Para analizar con mayor detalle la muesba de I 0 tiempos
tori¿ preparaNe para sali¡ en la mañana, podemos calcular el rango intercuartil. Primero se orde-
nan los datos como sigue:
29 31 35 39 39 40 43 44 44 52
de la página 110, pt = 3 5
utilizarnos la ecuación (3.10) y los resultados anteriores del ejemplo 3.10
Y Qt= 44.
Rango intercuartil = tA - 35 = 9 mi¡utos
Por lo tanto, el rango intercuartil del tiempo que toma prepararse es de 9 minutos. El intervalo 35
a o
44 a menudo se conoce cotclo cincuenta intermedio-
o
o
o
EJEMPTO 3.11 Los datos nuficionales acerca de una muestra de sieG cereales para el deSayuno (atnacenados en N
el archivo !S!$ incluyen el número de calorías poi porción (véase el ejemplo 3' l en la página o
Cálculo del rango 96). Calcule el rango intercuartil del número de calorías para los cereales'
5
para el
de calorías SOLUCIóN Ordenados del menor al mayor, Ios números de calorías de los siete cereales son los
los cereales siguientes:
80 100 100 110 130 190 200
Si utilizarnos la ecuación (3.10) y los ruultados anleriores del ejemplo 3.10 en la página 110, 9r =
100
v O,=190.
Rango intercuartil = 190 - 100 : 90
Por lo tanto, el rango intercuartil para el número de calorías en los cereales es de 90 calorías'
Como el rango intercuartil no toma en cuentra cualquier valor menor que Q, o mayor que-93'
no se ve afectaclo por valores extremos. Los estadísticos descriptivos, como lamediana, Qt, Qry
el rango intercuartil, que no se ven afectados por valores extremos, se denominan medidas re-
sistentes.
TABLA 3.5
Relaciónentreelresumende|oscinconúmerosyeltipodedistribución
TiPo de distribución
Simétrica Con sesgo a Ia derecha
Comparación Con sesgo a la izquierda
Las dos distancias La distancia desde
La distancia desde La distancia desde
'(* hasta la
-
r -
_úri6 p€qucno hasta la Y. - hasta Ia
'-m¡s p.$erc
son iguales. o**o
medíaia es menor que Ia
meüana, en comParacton mediana es maYor que ta
distancia desde la mediana
con la distancia desde la dist¿ncia desde la mediana
hasb,f,Á!
mediana hasta X,oÁ! hasta X,á"
Las dos distancias La dist¿¡cia desde
La distancia desde La distancia desde
X'*n*,";, es son iguales. X* **o hasta P, es
x**"a, lasta {r
en hasta Pt
menorqr¡e or$ancla
la '
compamclon con la mayor que la drstancra
d€sde 03 hasta Xr¡ s-d..
distancia desde 93 hasta desde Q, hastaX* o-*.
XrÁ"
Las dos distancias L¿ distancia desde gi
La distancia desde Qt La distancia desde Pt
son iguales. hasta la mediana es menor
hasta la mediana, en hasta la meüana es maYor
que la distancia desde la
comparación con la que la distancia desde la
mediana hasta Pr.
distancia desde la mediana mediana hasta Qr.
hasta Qr.
Diagrama de caja
Un diagrama de c¡ja es una representación grifica de los datos con base en el resumen de los cinco
números. Para analiza¡ con mayor detalle la muestr¿ de los l0 tiempos que tom¿ prepararse par¿ salir
qn l¿ 6añana, pedemss consüut tm diagr¿ma de caja como 9l que se muesba en la figura 3.3.
A 3,3
de caja
tiempos que
rtllllll
20 25 30 tl ot 50 55
n".oo1l''nr,or)
La línea vertical que se encuenta denao de la caja representa la mediana. La línea vertical que estií
al lado izquierdo de la caja representa la ubicación de p,, y la línea vertical que eslá al lado dere-
cho de la caja represent¿ la ubicación de 93. Asi, la caja contiene 50% cle los valores inrcrmedios'
El 25% inferior de los datos estri representado por una linea que conecta la parte izqüerda de la
caja con la ubicación del valor más pequeño, ,Y,* o"o*o. De maner¿ similu, el 25% superior de los
daúos es!á represeutado por una línea que conecta la'parte derecha de la caja con.(r. .n**'
La gráfica de caja con 1os tiempos que toma prepararse para salir de la figura 3'3 hdica un li-
gero sesgo hacia la derecha, ya que la distancia entre la mediana y el valor más alto es un poco
mayor que la distancia ente el valor más bajo y la mediana. Asimismo, el extremo derecho es un
poco más largo que el extremo izquierdo. at,
2.13 En la segunda parte de la sección referente a Choice Is Yours se busca comparar el desempeño an- o
terior de los fondos en bonos inGrmedios gubemamentales y el de los fondos en bonos corporati- o
de caja vos a corto plazo. Una de las medidas del desenpeño previo son los ¡endimientos de 2009. Ya se
o
N
los rendimientos definieron las va¡iables y se reunieron los datos de un:i muestra de 184 fondos en bonos. Construya o
por los el diagrama de caja de los rendimientos producidos por los fondos en bo¡os intermedios gubema- or
en Donos mentales y corporativos a corto plazo durante 2009:
y diagrarnas de caja de Ex-
v SOTUCÉN La ñgura 3.4 presentr los resr!¡enes de los cinco n{meros
a cono cel para los rendimientos producidos por los fondos en bonos intomedios gubenamentales y corpoftI-
durante 2009 tivos a corto plazo durante 2009. En la figura 3.5 se observan los diagramas de caja de Minitab para los
misrnos d¿tos. Observe que en la figura 3.5 aparecen varios asteriscos (t) eo los diagramas, los cuales
indican valo¡es extremos que se alejan mas de L5 veces el rango intercuartil a partir de los cuartiles.
FIGURA 3.4
Resúmenes obtenidos con Excel de los cinco números y diagramas de caja de los rendimientos
generados en 2009 por los fondos en bonos intermedios gubemamentales y corporativos a corto Plazo
MinÍmum
F¡r5t Quartile
La mediana de los rendimientos, los cuartiles y los rendimientos máximos y mínimos 5sa ¡x¡q¡t
mayores para los fondos en bonos corporaüvos a corto plazo que para los intermedios gubema¡neata-
les. La mediana de los rendimientos para los fondos en bonos corporativos a corto plazo es mayor
que los rendimientos del tercer cuartil para los fondos en bonos inte¡medios gt¡b€rnamentales.
F
114 CAP|IIJLO3 Medidas auméricas descriptivas
Diagramas de caja
de Minitab para los
rendimientos
producidos por los
fondos en bonos
intermedios
gubernamentales Y
corporat¡vos a corto
plazo durante 2009 _n_ j( +*
tt||d¡mldrto..¡ 2mt
El rendimie¡to del primer cuartil (5.70) para los fondos en bonos corporativos a corto plazo q
mayor que la mediana del rendimiento (4.,()) para los fondos en bonos htemedios gubemamenh.
les. Tan-to los fondos en bonos inte¡medios gUbemamentales como los corporativ$ a corto
plaa
están sesgados hacia la derecha, con un extremo muy largo en la parte superior del rango' E
result¿doi sol consistentes con los estadísticos calculados en la figrua 3.2 de la página 106.
En la figura 3.6 se muestra la relación entre el diagrama de caja y la cuwa de densidad pan
cuatro tipos diferentes de distibuciones. El área debajo de cada curva de densidad esüi dividida en
los cua¡tiles conespondientes al resumen de los cinco números para el diagrama de caja.
FIGURA 3,ó
Diagramas de ca.ia
para cuatro.distri-
buciones y las
curvas de densidad
correspondientes
F---m-----l t-------il}-i
Gráfica A Gráfica B
Distribución en forma de camPana Distribuc¡ón sesgads hacia la ¡zquierda
l---ú------l F---rr-l---r
Gráfica D
Gráfica C
OistÍbución s$gada hac¡a la deredra Distribución redangular
I
ú
Las distribuciones de las gráficas A y D en la figura 3.6 son siméticas. En esas distibucio¡s
a la longtud
la media y la mediana son igr.riles. Ademas, U tongtua del extemo izquier<lo es igual
J
del extremo derecho, y la línea de la mediana divide la caja a la mitad'
.:, La distribución de la gráfica B en la figwa 3.6 está sesgada hacia la izquierda. Los escasgs
bacü
( valores bajos distorsionan la media hacia el extremo izquierdo. En esta dishibución sesgada
(es decif' e[ €l
la izquierd! hay una gran aglomeración de los valores en el extemo alto de la escala
y e] e1
latlo ierecho); 7SX áe los-valores se encuentran entre el borde izquierdo de la caja(Qt)
tremo derecho (X* ooo*). Se observa un largo extremo izquierdo que contiene 25% de los valord
mris bajos, lo que cleñuéitra la falta de simetría en este conjunto de datos.
fa ¿istriUuciOn ¿e la gráfrca C en la figura 3 6 estrí sesgada hacia la derecha. Los valores sl
.
de ca.¡a
conceotr¿n en el extemo inicial de la escal4 es decir, en el lado izqüerdo del diagrarna
dgrecno-ofl
Aquí, 75% de los valores se encuentan entre el inicio del extremo izeuiadg y el lorde
diagáma de caja (e). Se observa un largo exkemo derecho que contiene 25% de los valores
ns
altos. lo que demuesta la falt¿ de simetría en este conjunto de datos.
)
Problemas para la sección 3.3 'l 15
siguiente es
DE LOS FUNDAMENTOS
un conjunto de datos de una muestra ffi :iá',#,sn::,ffi ;:"#T"*"ffi;
14 ban-¿s de chocolate oscuro.
12749073 0.68 0.72 0.92 1.r4 1.42 0.94 0.77 0.57 l.sr
(0) 0.57 0.55 0.86 1.41 0.90
el primer cuanil (Q'), el tercet cuartil
Fuente: Datos ext¿ídos de "Da¡k C\ocolalÉ: Which Bars Are Best?',
ro intercuaru' Corcuner Rqo*, sepienbre dc 2007, p. 8.
il resumen de los cinco números.
6L diagrama de caja y describa su forma. a) Calcule el primer cuartil (0,), el tercer cuartil (Q) y el
su respuesta €n el inciso c) con la del inciso d) rango intercuartil.
3.3 de la página 107. Come,nte al respecto. ó) Ddscriba el resumen de los cinco nrlmeros. ,
c) Constuya un diagrana tle caja y describa su forma-
El giguient€ es un coojuuto de datos de una muestra
3.23 El archivo l@ lista el precio promedio por habi-
tación (en libras briüánicas) que se pagó en seis ciudades del
74973t2 Reino Unido en 2010.
el primer cuartil (01), el tercer cuartil (Q) y el
110 98 78 70 76 62
intercuartil.
Fue¡tc: Datos extraldos de vww.botclr¡onlpr€.sAotel-prfue-itr-
el rcsume¡ dalos cinco números.
de¡<ummer2010.hhl
un diagrama de caja y describa su forma.
su rcspuesta en el inciso c) con la del inciso d) a) Calcule el primer cuartil (01), el tercer cuartil (Q) y el
broblema 3.2 de la página 107. Comente al respecto. rango intercuartil.
ó) Escriba el resumen de los cinco números. a,
El siguiente es un conjunto de datos de una muestra c) Constuya un diagrama de caja y describa zu forma.
4.2t 5.55 3.02 5.13 4.77 2.34 3.54 3.20 c) ¿Qué concluye con respecto a las diferencias enhe el ü!0
4.50 6.10 0.38 5.12 6.46 6.19 3.79 de fondo de bono (intermedio gubernamental y corpora.
tivo a corto plazo) con base en el factor de riesgo (baj0,
La gerencia de otra sucursal bancaria' localizad¿ en una promedio y alto)?
zoni residencial, también está preocupada por el horario del
d) Compare los resultados en los incisos c) a c) con los ¡6¡.
almuerzo, entre el mediodía y la l:00 p.m. Los siguientes
dimientos de tes años, de 2007 a2009 (almacenados er
tiempos de espera, en minutos, reunidos de una muesha de
15 ciientes durante esa hora están almacenados en el ar-
el archivo !![l@$.
chivolS!. 3.2? Para este problema utilice los datos del archivo @
9.66 5.90 8.02 s.79 8;73 3.82 8.01 8.35 EC@
10.49 6.68 5.64 4.08 6.17 9.91 5.4'l c) Construya una tabla multidimensional para la media ¿a
los rendimientos de cinco años según el tipo y el riesg¡.
a) Calcule los resúmenes de los cinco números para los
t) Construya un¿ tabla multidimensional para la desüación
tiempos de espera en las dos sucursales bancarias.
bsli¡dar de los rendimientos de cinco años segun el tip
,) Construya diagramas de caja y describa las formas de las y el riesgo.
distribuciones para las dos sucursales bancarias.
c) ¿Qué concluye cotr respecto a las diferencias ente el tip¡
c) ¿Qué similitudes y diferencias hay en las distibuciones de
de fondo en bonos (intermedio gubemamental y corpor¡-
ios tiempos de espera para las dos sucursales bancarias?
tivo a corto plazo) con base en el factor de riesgo ftajo,
3.27 Para este problema utilice los datos del archivo l@ promedio y alto)?
@ yu oo" tabla multidimensional para la media de
d) Compare los resultados en los incisos a) a c) con los
ffiirt dimientos de cinco años, de 2005 a 2009 (almacenads
los rendimientos de 2008 segun el tipo y el riesgo.
ó) Constuya una tabla multidimensional para la dewiación es-
en el archivo l![f@$.
üíndar de los rendimientos de 2008 segnn el tipo y el riesgo' 3.30 Para este problema utilice los datos del archivo @
c) ¿Qué concluye con respecto a las diferencias ente el tipo @
¿) CoDstuya una tabla multidimensional para la media lc
de fondos en bonos (intermedio gubemamental y corpo-
cle
rativo a corto plazo) con base en el factor de riesgo (bajo, rendimientos de 2008 segun el tipo, las cuotas y el riesgo,
promedio y alto)? á) Constuya una tabla multidimensional para la desviaciól
-Compare
d) los remltados ur los incisos a) a c) con los rendi- está¡da¡ de los rendimientos de 2008 segun el tipo' lu
rnientos de 2009 (almacenados en el archivo !![@' cuotas y el riesgo.
c) ¿Qué concluye con respecto a las diferencias entre el tipo
3.28 Para este problema utilice los datos del archivo !!@
de fondo en bonos (intermedio gubemamental y corpoo
@
Ij-diist oy" una tabla multidimensional para la media de
tivo a corto plazo) con base en el cobro de cuotas (si o
no) y el factor de riesgo (bajo, promedio y alto)?
los rendimientos de nes años según el tipo y el riesgo'
d) Compare los resultados en los mcisos a) a c) con los rer
á) Constmya una tabla multidimensional para la desviación
estáüdar de los rendimientos de 6es años según el hpo y
dimientos de 2009 (almacenados en el archivo l@
el riesso. @.
)
3.4 Medidas aumericas desc¡iotivas oar¿ una ooblación 117
Media poblacional
La media poblacional se representa con el símbolo p, la leta griega minuscula mq y la ecuación
que la deñne es la (3.11).
MEDIAPOBLACIONAL
La. media poblacional es la suma de los valores en la población dividida ente el tamaño
poblaclonal, .ry.
(3.1r)
M
= media poblacional
¡¿
X = i-ésimo valor de la va¡iable f
=, su,m4 de todos los valores X¡ en la población
Para calcular la media de los rendimie¡tos a un año para la población de fondos en bonos pre-
sentados en la tabla 3.6. se utiliza la ecu¿ción (3.11).
u,
\r.
+ + + +
lL= - =
6.9 6.6 5.0 6.4 5.6
=T=o' o
o
Por consiguiente, el porcentaje promdio de los rendimientos pam estos fondos en bonos es ó.1.
o
N
o
Varianza y desviación estándar de una población {
La varianza poblacional y la desviación estándar poblacional son parámehos que miden la va-
riación en una población. De manera análoga a los estadísticos muesfales, la desviación estandar
poblacional es la raiz cuadrada de la varianza de la población. El símbolo la letra griega mi- l,
ntiscula sipa elevada al cuadrado, represent¿ la vaxianza poblacional, y el símbolo r, la letra
griega minuscula sip4 representa la desviación estánd¿r poblacional. Las ecuaciones (3.12) y
(3-13) definen-esos parámetros.- Los denominadores,para los.términos del lado derecho de estas
ecuaciones utilizan N en lugar del ténnino (l - 1 ), que se utiliza en las ecuaciones para la va¡ianza
y la desviación estándar muestales [véase las ecuaciones (3.4) y (3.5) de la pág"a 100].
. .. .' ,,.
VARIAN¡ZAPOBLACIONAL
La varianza poblacional es la suma de las diferencias al cuadrado al¡ededor de h media
poblacional diüdi¿. .¡¡s sl r¡maño poblacional, jV
Srr. - ,, \2
t (3.L2)
¡l
donde:
It : media poblacional
xi : i-ésimo valor de la variable X
N
2(x' - t")t = suma de todas las diferencias al cuadrado eirte
los valores,{ y ¡r.
'F
118 cAPfrulo 3 Medidas auméricas deso'iptivas
(3.n)
Para calcular la variaoza poblacional de los datos que se presentan en la tabla 3.6, se utiliza ¡
ecuación (3.12):
>vt - pr
o-=
)M
=-"=0.488
5
l, ¿Á
= 0.6e86
"=17= !i?
pof lo tanto, el porcentaje de rendimiento típico difiere aproximadamente 0.6986 de la medi¿
producen resultadm
de 6.1. Esta pequeña cantidad de variación sugiere que estos fondos en bonos
sin muchas diferencias.
Regla empírica
cerca &
En la mayoría cle los conjuntos de datos, una gran parte de los valores tiende a agruparse
l.' l";dñ". En los conjr:ntos de datos sesgadoi haiia la derecha, este agupamiento ocure. a'
quierda de la-media, ei decir, en un-valor que es menor que la media. En los conjuntos de daro
es dec4 r¡
sesgados hacia Ia izquierda, ios valores tienden agnrparse ¿ [a derecha de la medi4
eú
valór mayor que la media. En los conjuntos de datos simétricos, donde la mediana y la media
so
y
iguales, a menudo los valores tienden a agnrpane alrededor de la mediana la media
producioú
para examinar la vant
$
ria ¿istribuciOn en forma de campana. Pódem¡s utilizar la regla emplrica
.f bilidad en las distribuciones que tienen forma de campana:
; :l:
. Aproximadamen te 68Vo de los valores se encuenÍan denho de +l desviación estrándar
¡
1
partir de la media.
. iproximadament e 95Vo de los v¿lores se encuentran dento de +2 desviaciones esüindaf¡
partir de la nedia.
. iproximadamente 99.7% de los valores se encuentran detrtro de +3 desviaciones estánd¡f
¿
l3 partir de la media.
y.porlt
La regla empírica ayuda a medi¡ la forma en que los valores se dishibuyen por aniba
,
U"¡o ae f"LAa f tamúien sirve para identificar valores extremos. La regla empfit" rypl11$to:%
t
'¡ para las distibuciones en forma de carnpan4 solo alrededor de 1 de cada 20 valores.e,staTn
rt ios rrás allá de dos desviaciones estandar a partir de la media, en cualquier dirección. Como rets"
general, podemos considerar valores que no se encuentran dentro del urteya]o-4^+ 2l como
p¡sl0re
valores v
i"lo.es rmo.. La regla también implica que solo alrededor de 3 de cada 1,000 esta¡aú_
"it
calüados más allá de ties dewiaciones esüindar a partir de la media Por lo tanto, los valores
qur "
3.14 Se sabe que ula población de botellas de 2 litros con bebida de cola tiene un peso de llenado de
2.06 ütos y una desviación estándar de 0.02 litros. Se sabe que la población tiene una distribución
de Ia regla en forma de campana. Describa la distribución de pesos de llenado. ¿Es muy probable que la bote-
lla contenga menos de 2 litros de bebida de cola?
sorucóN
tL x o = 2.06 x 0.02 = (2.04,2'08)
F x 2o = 2.06 i 2(0.02) = (2.02'2.10)
Por medio de la regla empírica, observamos que aproximadamente 68% de las botellas contendrán
entre 2.04 y 2.08 lihos, que alrededor de 95% contendran enf.e 2.02 y 2.10 liüos, y qüe más o me-
nos 99.7% contendní errre 2.00 y 2.lzlibos. Por lo tanto, es muy poco probable que una botella'
contenga menos de 2 litos.
Para conjrmtos de datos muy sesgados, y que no parezcan tener fonna de campana' en lugar de
la regla empírica se debe utilizar la regla de Chebyshev que se estudia a continuación.
Regla de Chebyshev
La regla de Chebyshev (Véase la referencia 1) establece que para cualquier conjunto de datos, sin
importar su forma, el porcentaje de los valores que se encuentan a distancias que estiín denho de & U'
desviaciones estándar a oarti¡ de la media deben se¡ al menos:
en
iat
BLA 3.7 7o de valores que se encüentrrn en interv¡log
alrededor de la media
Cómo varían los
i datos alrededor Reglr empírlce
:'de.la, media Chebyshev ldistibución con
Intervalo (cualquier distribución) forma de cempana)
o,¡t + o) Al menos 07o Aproximadamente 68%
2a, p, + 2o) Al menos 75% Aproximadamente 95%
3a, p, + 3o) Al menos 88.89% Aoroximadamente 99.7%
EJEMPLO 3.15 Como se planteó en el ejemplo 3.14, se sabe que una población de botellas de 2 lihos de bebiü de
cola tiene un peso de llenado de 2.06 litos y una desviación esuíndar de 0.02 linos' Sin ernbargo,
Uso de la regla
se desconoce la forma de la población y no podemos suponer que tiene forma de campana. Des-
de Chebyshev
c¡iba la distribución de los pesos de llenado. ¿Es muy probable que la botella contenga úenos de 2
liros de bebida de cola?
120 CAPÍTULO3 Medidas numéricas descriPtivas
50rucóN
u t c = 2.06 + 0.02 = (2.04,2.08)
P' t 2a = 2'06 r 2(0'02)
: (2'02'2't0)
p' t3o = 2'06 i 3(0'02) -- (200'2'12)
puesto que la distribución podría estar sesgada, no podemos utilizar la regla empírica'
Si uüliz¡.
Lasdosreglassepuedenutiiizarpaiaentendercómosedistribuyenlosdatosalrededorde¡
media cuando se tienen d¿tos Con cada regla se utilüa el valor calculado para ie¡
'u"'o"1.,.
para '9 en lugar de o' Los resultados que se obtienen utilizand¡
lu
üi*¿i;, ;;i;d"t scacuudo
son apronmacion", J.bido qo" t. utilizaron estadísticos muestales (-{. s1
esta¿ísticos muesaale "
y no pan{metos poblacionales (¡, o)'
y d€nto de +3 desviaciones estándar a partir de mero de acciones por su pt€cio en el mercado. El 8 de ab¡il
de 2011 la capitalización en el mercado de esas empresas
lo que eücuenüe con lo que se esperaría encon- iba de $19,200 millones para Alcoa, hasta $426,400 nillo-
regla emplrica' ¿Le sorprenden los re- nes pa¡a ExxonMobil. La población completa de los valores
acuerdo la
ebtenidos en el inciso á)?
de capitalización de mercado está ahnacenada en @[
desde el i¡rciso
a) hasta el c) sin tomar en cuenta @
¡ro de Columbia' ¿Cómo variaron los resultados?
Fuente: Datos exFaídos de money cnn.com, 8 de abril cle 20 I I .
Covarianza
La covarianza mide la fuerza de la relación lineal ente dos variables numéricas (Xy ,f). La ecua-
ción (3.14) defi:re la cov¡rianza muestrrl y en el ejemplo 3.16 se ilusta su uso. o
<
o
o
o
N
>6r-ngr-i) (3.14)
6
3.16 En la figura 2.15 de la página 55, usted constuyó un diagrama de dispenión que mosf¿ba la rela-
ción entre el valor y los ingresos anuales de los 30 equipos que conforman la National Basketball
Association (NBA) (extraído de ww*forbes.com/lists/2009/32lbrsketb¡ll-values-09-NBA-
Te¡m-Valu¡tions-Rankhtml; aLnacenados en el archivo S!!@'
Ahora usted dese¿ medi¡ la
relación, entre el valor de una franquicia y los ingresos anuales por medio del crilculo de la cova-
ria¡za muestral.
SOLUCÉN La tabla 3.8 de la página 122 indica el valor y los ingresos anuales de los 30 equipos.
En la figura 3.7 se presenta una hoja donde se calcula la covarianza par"a estos datos. La sec-
ción área de cálculos de la figura 3.7 divide la ecuación (3.14) enrm conjunto de cálculos más pe-
queños. A partir de la celda F9, o utilizando di¡ectamente la ecuación (3.14), encuentra que la
covarianza es 3,1 1 5.7241.
90.356
cov(¡, r) = *
.]U-I
= 3.115.7241
La covarianza tiene una importante desventaja comrc medida de la relación lineal ente dos
variables numéricas. Como la covarianza puede tomar cualquier valor, no es posible ut'rlizarla para
deternri¡ar la fuer¿a relativa de la relación. En otras palabras, no es posible saber si el valor
3 ,ll5 .7241 indica una relación fuerte o débil. Para determinar mejor la fuerza de la ¡elación, es
FIGURA 3.7
Hoia de cálculo de
Exéel para calcular
la covarianza entre
el valor y los
ingresos anuales de
los 30 equipos de la
NBA
4i
a!
i '.q
i \'r
i'rj
' .:l
I r,,
I 'dt
lli
i!
)
3.5 Covarianza y coeficiece de conelación 123
Coeficiente de correlación
El coefciente de correl¡ción mide la fuerza relativa de una relación lineal enae dos variables nu-
méricas. Los valores del coefrciente de correlación van de -1 para rma conelación negativa per-
fecta hasta +l para una conelación positiva perfecta. En este caso, perfecta significa que si los
puntos se graficaran en un diagrama de dispersión, todos se podrían conectar con una línea ¡ecta.
Cua¡do se tienen d¿tos poblacionales para dos va¡iables numéricas, la letra griega p (rho) se
utiiiza para simbolizar el coeficiente de correlación. En la figura 3.8 se ilustan t€s tipos de asocia-
ciones diferentes entre dos va¡iables.
Eu la gnífica A de la figura 3.8 se observa una relación lineal negativa p€rfecta enfie Xy F.
Así, el coeficiente de conelación p es igual a -1, y cuando Xaument4 f disminuye de una forma a,
perfectamente predecible. En ta gráfica B se observa una situ¿ción en la qr¡e no hay una relación
ente Xy L En este caso, el coeficiente de conelación p es igual a 0, y a medida que aumeÚa,! no
existe una tetrdencia de I a aumentar o disminui¡. La grífica C ilustra un¿ relación positiva per- o
fecta en la que p es igual a +1. En este c¿so, F aumenta de una manera pedectamente predecible
o
o
cu¿ndo aumenta X N
to
Una correlación, por sí misma, no demuestra que uisu un efecto de causalidad' es decir que
o
el cambio en el valor de una variable causó el cambio en la otra variable.U¡a fuerte correlación
puede ser simplemente producto del azar, o el efecto de una tercera variable que no se tomó en
cuent¿ en el cálculo de la conelación, o bieD, el resultado de "n¡ relación de causa y efecto. Es ne-
cesario realizar un anáüsis mlís profrmdo para determinar cual de esas tes situ¿ciones p¡odujo en
realidad la correlación. Por lo tanto, podemos decir que /c causalidad implica correlación, peto la
correlación, por sí misma, no implíca causalidad.
La ecuación-(3. I 5)-define.el.coeñcienle de corrd¡ción muestral (r).
124 cAPfruLo 3 Medidas numéricas descriplvas
* ... .,.
' ...l'¡
Oi8grama B
't
.:
Diagrama D
D¡agrama C
q Dt¡gm. d. d.P.dón P.ñ .: 0.9
{t Dhgr.m. d. (ftFrdó¡ 9¡r. t' 0.4
.ri
L¡:
j\
i,rj ' .. i:'
, ;li
i"l '..t ¡
r,{ t'.
: .'.
:¡f . .; i
l:16
rr¡ i' .
t! ...:. .:.. :
.q1Y ' :;..
t
.,, ( . .::-.'
!
3.5 Covarianza y coe{iciente de corelación 125
forma, los valores grandes de .{ tienden a apareane con valores pequeños de y. No todos los datos
caen sobre una línea recta, por lo que la asociación entre Xy Ino se puede describir como perfecta.
Los datos en el diagrama B tienen un coeficiente de correlación igual a -{.6 y los valores pequeños
de Xtienden a aparearse con valores grandes de fLa relación linealentre.f,y Idel diagrama B no
es tan fuerte como la del diagrama A. Así, el coeficiente de cor¡elación en el diagrama B no es tan
negativo como en A. En el diagrama C la relación lineal ente Xy I es muy débil, r = -{.3, y solo
existe una ligera tendencia a que valores pequeños de X se acoplen con valores grandes de L Los
diagamas D a F describen conjuntos de datos que tienen coeficientes de conelación positivos, ya
que los valores pequeños de Xtienden a acoplarse con valores pequeños de I, y los valores gra:rdes
de Xtienden a asociarse con valores grandes de f. El diagrama D presenta una correlación po-
sitiva débil, con r = 0.3. El diagana E muestra una conelación positiva más fuerte con ,'= 0.6. El
diagrama F muesha una conelación positiva muy fuede, con r = 0.9
IGURA 3'IO
de cálculo de
para calcular
coeficiente de
muesüat, a,
los valores
ingresos de 30
de Ia NBA. o
o
o
N
to
sorucróN
cov(X, I
SxSv
3,115.7241
(32.4s73)(e6.9te9)
= 0.9905
El valor y los ingesos de los equipos de la NBA estrin muy conelacionados. Los equipos con me-
nores ingresos tienen los valores mrás bajos. Los equipos con los ingresos mrás elevados tienen 1os valo
¡es más altos. Esta relación es muy fuerte, tal como lo indica el coeficiente de conelación r = 0'9901
En general, no podemos suponer que solo porque dos variables estén conelacionadas, los cam-
bios en una variable causaron los cambios en la otra. Sin embargo, en este ejemplo, tiene sentido
concluir que los cambios en los ingresos podrían causar modificaciones en el valor de un equipo.
126 cAPÍruLo3 Medidas numfi cas descriPttvas
r
enhe dos variabls
indica la relaciónLineal o asociación
En resumeq el coeüciente de conelación lineal entre las dos
coefici#it t"tlüt¡" " acerca a +1 o -1' la relación
numéricas. Cuando el una relación [nq¡
de conelaciónse acerca a 0' no existe
va¡iables es m¡ís fuerte Co^¿o
'ito"¡ti*t"
gl ,rpo i.i."".lJ"rt Je fonelación indica si los datos están
conelaciona.
o, si acaso, es muy un¡". los valoq
* d;#";;;;-tÁ g-ao at xsuelen estar apareados con
dos de manera posi i",' granda
los valores mas 4
de manera negativa' es decir'
mas grandes de f, o si está'n conelacionados tuerte
x sueren estar apareu¿o, .oo ro, ilñIlili' ntffi a" r' r" tilencia de una 9onei11on no
las 65
- r0 deuásquetuot
escuelas que participaron en Wonderlic. El archivo [![@ lista las puntuaciones pro-
de Ia NCAA de 2009' medio obtenidas en la prueba Wonderlic por los jugadores
l"'ñ
-Compensation for Division I Me¡'s Bas- de fi:tbol que buscan ingresar a la NFL y el índice de gra-
l. ,,^. ¡"
duación de los jugado¡es en las escuelas seleccionadas.
i;,*, ZjX3:l51ol9r*9,
T"i''drtt"i¡utl l^': l:l*'i'
D_ollars,by,schoo-l"' ltotrey'cnn' Fuente: Datos extaídos de S. Walker, "The NFL'g SEartest Tcam"'
The Wall Street Jounal, 30 de sepüembre de 2005, pp. W1, Wl0).
c) Calcule la covari¡nz¿.
de correlación. á) Calcule el coeñciente de correlación.
incisos ¿) y b), ¿qué concluye acerca
de
c) Con base en los incisos a) y b), ¿qué concluye acerca de
y
los salarios de los entrenadores los
in-
la relación entre la puntuación promedio en la prueba
Wondoüc y el índice de graduación?
de futbol colegial que quieren ingresar
la prueba de inteügencia estandarizada
mucho más altas que los fondos en bonos intermedios gubernamentales' ya que tuvielo[ uil
las, de
analiza¡ los datos y obtener conclusiones. En el capitulo 2 ción entre dos variables numéricas. En la tabla 3 9 se pre'
seota una üsta de los estadísticos descriptivos estudiados
aorendimos a visualizar datos mediante la construccióo de
graficas cle banas y gráficas circulares' histogramas y otos este capítulo.
tipos de gráiicas. En este capítulo aprendimos la forma en En el siguiente capítulo se presentan los principios basi-
que estadísticos descriptivos como la media, la mediana, los cos de la probabilidad con la finalidad de cenar la brecha
cuartiles, el rango y la desviación estándar se utilizan para ente el tema de la estadística descnptiva y el tema de laes
clescribir las características de tendencia central, variabili- tadística inferencial.
Datos nunéricos
TASLA 3,9 de análisis
Descripción de la tendencia central, Medi4 medi'n4 moda cuartiles, rango, rango intercuartil,
Resumen de
la variación y la forma de una varianz4 clesüación estándar, coeficiente de variación, valor
estadística
variable numérica Z, diagrama de caja 3.1I a 3.4)
(secclones J
ca.¡a (secciones J.
descriptiva
Describir la relación ent¡e dos Covananz4 coeficiente de conelación (sección 3 5)
variables numéricas
\r.
X (3.1) S=VF= (3.5)
,q
'!Í
t:;
.'ii
rli.:
Mediana Coeficiente de v¿riación
-
..¡:
n+1 (3.2) (3.ó)
;
Mediana = 1i¿ valor ordenado cv = lz..lloo%
, ;lt V/
r;!
3 iungo Y orZ
r*
z= X-X
Ra[go=X."ro.-X."oo, (3.3)
¡l! (3.0
j¡i
t
Yarianza muestral
{
Primer cuartil,
I
.-É
ii.-
Srv - ?r2 Q1
i
Problemas de repaso para el capituio 129
valor ordenado
(3.e) )lx, - tD2
(3.13)
Covarl¡nza muestr¡l
(3.10)
=Q-Qr
\{x'-hv'-h
cov(X, t) = (3.14)
n-l
(3.11) Coeñciente de correlación muestr¡l
cov (,{, I) (3.1s)
SxSv
(3.r2)
a,
Seis Sigma. En la siguiente tabla se ptesentan estadísticos iecibe la queja hasta que se resuelve.
descriptivos sobre los salarios para esos cuato puestos' <^ 5 1{ 1l )7 l|52 2 123
f17 81 74 2'I ll
T¡d¡no Dervliclór t9 126 rr0 110 29 61 35 94 31 ¿o 5t2 4
d. mueltn Mlnlúo Má¡iDo €.t¡¡drr M.dt¡ M'dlrtrr 165 32 29 28 29 26 2s 114 13 13 10 5
c.f.nt 1,438 10,400 212,000 26,455 88'93 86'000 ¿) Caicule la media, la mediana, el primer cuartil y el tenc
Ing.d.m de 831 25,000 175,000 19,878 16239 15'0fo
cortol de
cuartil.
c¡llüd á) Calcule el rango, el rango htercuartil, la varianza' la d*
M.dfro s6 60,000 l85,OO0 26,46 113276 112,650 viación esuándar y el coeficiente de variación'
Cln¡ Égr¡ c) Construya un diagrama de caja. ¿Los datos esüín sesp-
Fücntc: Ddo6 eúaidos de ¡ S€áde c I A[.¡''Rcvcaling lÑ11ct3", Qttli, dos? Si es asi, ¿de qué forma?
P/o8zúr, dicicDbrÉ de 2010, P. I l.
d) Con base en los resultados de los incisos c) a c)' si tu'
viera que informar al presidente de la empresa cuádo
Compare los salarios de los Cinta verde, los gerentes, los
tiempo debe esperar un cliente para resotver una que¡a'
ingenieros de control de calidad y los maestos Cinta negra'
¿qué le diría? Explique su
respuesta.
3.5ó En el estado de Nueva York est i permitido que los ban- 3.58 Un fabricante produce carcasas de acero para eqüpo
cos Dara el ahoro vendan un tipo de seguro de vida, llamado eléctico. La parte principal del componente de la carcasa 6
seguro de üda de banco para el ahorro (SBLI, por las siglas una bandeja úecha de lámha de acero de calibre 14 Se
'
de Savings Banklife Insurance). La aprobación consta de un duce utilizando una prensa moldeadora progresiva de
z'"
oroceso inicial, el cual incluye una reüsión de la solicihrd' Ia toneladas con una opiración que coloca dos formas de 9ff
verificación de la información médic4 la posible solicitud de en el acero plano para moldiar la bandeja' La distancil
información médica y exámenes médicos adicionales, y una desde un lado de la fo¡ma hasta 1a ofia es fi¡ndame¡tal'
ya
etapa de recopilación de pólizas, durante la cual se generan que debe lognr un aislamiento cuando se usa a la intenp'
las páginas de la póliza y se envían al banco para zu enbega' rie. Lu requiere que el ancho de 1a bandeja sea dc
La óapacidad para entregar las póüzas aprobadas a los clien- "mpiesu
.l¡ entre 8.31 y 8.61 pulgadas. Se obtienen los datos derl!¡
tes de manera opoltuna es firndamental para que este servlclo muestra de 49 band;jas y se alnacenan en el archivo E@
sea rentable pam el banco. Dur¿nte un mes se seleccionó
una
el cual lista el ancho de las bandejas en pulgadas como
,lL 5t
45 48 17 17 t7 91 92 63 50 51 69 16 17
8420
ii 8.460 8.444 8.429 8.4& 8.412 8.420 8.410 8.'105 8 321
8.396 8A47 8.405 8.439 8.411 8.4n 8.420 8.498 8.409
¿) Calcule la media, la mediana, el primer cuartil y el tercer
,,1., a) Calcule la media, la mediana, el rango y la desviacto¡r
cuartil. te!
estándar para el ancho. lnterprete esas medidas de
ó) Calcule el rango, el rango intercuartil, la varianz4 la des-
dencia central Y variabilidad.
viación esüfurdar y el coeficiente de variación'
á) Describa el resumen de los cinco números.
c) Conskuya un diagrama de caja. ¿Los datos están sesga-
dos? Si es así, ¿de qué fonna?
c) Constuya un diagama de caja y describa su fo¡rna'
Problqras de repaso para el capíhllo 131
del número de bandejas que cubri- gnmos, de una muestra de 50 bolsas de té producidas en
acerca
y
?, lu .npr.su d. tener enüe 8.3 I 8.61 una hora por una mriquina.
'! 5.65 5.44 s.42 5.40 5.53 5.34 5.54 5.45 5.52 5.41
m.e¡ci9nad1.e3 el problema 5.57 5.40 5.53 5.54 5.55 5.62 5.56 5.46 5.44 5.51
fabricante
ee aislantes eléctncos. Sl los
alslantes se 5.47 5.40 5.47 5.61 5.53 5.32 5.67 5.29 5.49 5.55
iJ"ra fu¡cionando, podría ocurrir un cor- 5.77 5.57 5.42 5.58 5.58 5.50 5.32 5.50 5.53 5.58
la resistencia de los aislantes, se lle- 5.61 5.45 5.44 5.25 5.56 5.63 5.50 5.57 s.67 s.36
d€structivas en laboratorios de gran c) Calcule la medi4 la median4 el primer cuartil y el tercer
cuánta fuerza se necesita para
cuartil.
se mide observando la cantidad de li-
á) Calcule el rango, el rango intercuartil, la varianza, la des-
ic¿r al aislante antes de que se rompa. viación estíndar y el coeficiente de variación.
:--;"ntes mediciones de una muesÚa de 30
c) lnterprete las medidas de tendencia cenFal y de variación
se üstan en el archivo @. deirto del contexto de este problema" ¿Por qué la compa-
t.6to 1,634 l,'1u 1,522 1,696 1,592 1,662
ñía que produce las bolsas de te debería preocuparse por
r,6ó2 1,734 t,774 t,5s0 1,756 1,762 r,866 las medidas de tendencia cenfal y de variación?
r,688 1,810 t,752 1,680 1,810 1.652 1,736 d) Constuya un diagrama de caja. ¿Los datos están sesga-
la mediana, el rango y la desviación dos? Si es así, ¿de qué forna?
fi¡alidad de determinar cuiint¿ fuerza se e) ¿La empresa está cumpliendo con el rcquisito indicado en
romper los aislantes. la etiqueta de que cada bolsa tiene, en promedio, 5.5 gra-
áedidas de tendencia central y de variabili- mos de té? Si usted estuüera a cargo de este proceso, ¿qué
a). cambios trataría de hacer con relación a la distibución de
diagrama de caja y describa su forma. los pesos en las bolsas indiüdu¿les si fuer¿ necesa¡io?
acetca de la resistencia de los aislantes si 3.ó2 El fabrica¡rc de las tejas de asfalto Boston y Vermont
que soporten al menos una fuerza de ofrece a sus clientes 20 años de garantía en la mayoria de o
del rompimiento? sus productos. Para determinar si una teja ó¡rará tanto como =
Ei.r.@E incluye datos sobre las calo- el periodo de garantí4 se realizan pruebas de aceler¿ción de
(€¡ gamos por porción) para una mues- vida en la fábrica" Las pruebas de aceleración de vida expo-
o
o
veget¿riarus. nen a una teja a las presiones a las que estaría som€tida en o
un uso normal de por vida, por medio de un experimento N
de "Healthful Burgers That Taste Good", to
de 2008, p. 8. en un ambiente de laboratorio que solo toma unos cuaotos 5
minutos. En est¿ prueba se raspa una teja de manera repe-
calcule la media, la nediana, el pri-
¿l tercer cuartil.
üü con un cepillo duranrc un üempo y se pesan los gni¡ulos
desprendidos por el cepillado (en gramos). Se espera que las
calcule el rango, el raúgo intercuartil,
tejas que experimentan una mefor pérdida de gnánulos du-
desviación estándar y el coeficiente de
ren más tiempo con rm uso normal que las tejas que experi-
mentan grandes pérdidas de gnínulos. En esta situación, una
construya un diagrama de caja. ¿Los
gi_es.esí teja no debe experimentar una pérdida de gránulos mayor
¿dequé_forma?
que 0.8 gramos, si se espera que dure €l tiempo que ofrece
de correlación entre las calorías y
la garantía. El archivo !@ presenta una muestra de 170
calificación total y el costo de una comida. (en millones de dólares) de los di¡ectores de 1ól empres¿¡
3.ó4 El archivo f,fi@ lista l¿s calorías, las proteínas y el públicas grandes y el retorno sobre la inversión eu 201¡,
colesterol de alimentos proteinicos populares (carnes rojas Responda lo siguiente en relación con el salario total 1q
frescas, came de aves Y Pescado). millones de dóla¡es).
Fuente: Departamelto de Agricultura de Estados Unidos. Fuente: Datos ext¡aídos de M. Krantz y B. Hansen, "CEO Pay Sqan
While Worken' pay Stalls", USI Today, I de abil de 2011' pp. I!,
a) Calcule el coeficiente de cor¡elación entre las calorías y 2B y money,usatod¿y.com.
las proteínas.
¿) Calcule la media, la media¡a, el primer cuartil y el tercq
ó) Calcule el coeficiente de conelación entre las calorias y
cuartil.
el colesterol.
ó) Qalcule el rango, el rango intercua¡til, la varianz4 la da
c) Calcule el coeficiente de correlación enfe las proteínas y
viación estíndar y el coeficiente de variación.
el colesterol.
c) Construya un diagrama de caja. ¿Los datos están sesg¿'
d) Con base an los resultados de los incisos a) a c), ¿qué con-
dos? Si es así, ¿de qué forma?
cluye con respecto a las calorias, las proteínas y el co-
d) Con base en los resultados de los incisos a) a c), ¿que
lesterol?
concluye con respecto al salario total (en millones de dü
3.ó5 El archivo f,@@ indica el precio promedio de uoa lares) de los directores?
habitación en hoteles de dos, Fes y cuato estellas en ciuda- ¿) Calcule el coeficiente de correlación ente el sala¡io
des de todo el mundo durante 2010, en libras brit¡ínicas retorno sobre la inversión en 2010.
(aproximadamente 1.56 dólares en enero de 2011). Responda /) ¿Qué concluye a partir de los resultados
del inciso e)?
lo siguiente pan los hoteles de dos, tres y cuato estellas.
3.ó8 Usted planea estudiar par¿ su examen de estadística co
Fuetrte: Datos extraídos de www.hotels.com/press/hotel-price-itr- un gn:po de compañeros de clase y desea impresiona¡ a uo o
der-summer-20l0.btml.
oarticr¡iar. El individuo se ofrece voluntariaúente a utiliur Er'
¿) Calcule la media, la mediana, el primer cuartil y el tercer iel o Minitab para obtener la información, las tablas y las gni$
cuartil. cas necesarias para un conjunto de datos que incluye divasa
ó) Calcule el rango, el rango intercuadil, la varianza, la des- va¡iables numficas y categóricas asignadas por el profesor cm
viación esüíndar y ei coeficiente de variación. f¡es de estudio. El compañero se le acoca coo una hoja in
c) Interprete las medidas de tendencia cenfal y de variación presa y exclama: "Tengo toda la infonnación: las mediaq
dentro del contexto de este problema. las medianas. las desviaciones es!índar, los diagramas de ca¡
d) Construya un diagrama de caja. ¿Los datos están sesga- y las gnificas circulares para todas nuestras variables. El pto
dos? Si es así, ¿de qué forma? blenn es que algunos de los resultados parecen exh'años, com
e) Calcule la covarianza enhe el precio promedio en hoteles los diagramas de caja para el génao y la caner4 y las gráficr
de dos y de tres estellas, entre hoteles de dos y de cuaüo circularts para la calificación promedio y la estatura" Admi4
estrellas, y entre hoteles de tres y de cuaho estrellas. tampoco entiendo por qué el profesor dijo que no podríaoc
/) Calcule el coeficiente de conelación entre el precio pro- obtener estadísticos descriptivos para algunas de las varial''-
medio ente hoteles de dos y tres estrellas, entre hoteles ¡los obtuve para todas! Vean, la media de
la estatura es óL
de dos y cuatro estrellas, y entre hoteles de tres y cuatro la media de la c¿lificación promedio es 2.76, la media <lel genel
estrellas. es 1.50, la media de la canera es 4.33". ¿QrÉ le respondería?
g) ¿CuáI estadístico cree que es más valioso para expresar Ia
relación entre el precio promedio de una habitación en EJERCICIOS DE INFORME ESCRITO
q hoteles de dos, hes y cuatro estrellas: la covarianza o el 3.ó9 El archivo [!ftS!!! contiene rntbrmacion sto¡
:,''jj coeftciente de conelación? Explique su respuesta. el porcentaje de alcoho!-l número de calorías y el núneÍ
liiir ú) Con base en el inciso/), ¿qué concluye acerca de la rela- de carbohidratos (en gramos) para 145 de las cervezas ¿re
,ni ción enfe el precio promedio de una habilación en hote- sanales de 12 onzas más vendidas en Estados Unidos'
ü les de dos, tres y cuatro esüellas? Su tarea consiste en redactar un informe con base en
t¡¡l
irri 3.óó El archivo ![!!@ lista los impuestos per cápita evaluación descriptiva completa de cada uoa de las valt¿'
para las propiedades en los 50 estados y el Distrito de Co- bles numéncas [plrcentaje ie alcohol, número de caloríd
x
ts. lumbia de Estados Unidos. en 12 onzas y número de carbohidratos (en gramos) e¡
nr'
¿) Calcule la media, la mediana, el primer cuartil y el tercer
y
.;3 onzas]. Anexe a sus informes todas las tablas, gráñcas
it cuartil. didas descriptivas numéricas pertinentes.
:¡! ú) Calcule el rango, el rango intercuartil, la varianza, la des- 20ll
-rf Fuente: Datos €xtnídos de www.Beer100.com, I de abril de
viación estánda¡ y el coeficiente de variación.
t1-;
c) Construya un diagrama de caja. ¿Los datos están sesga- PROYECTOS DE EOUIPO
dos? Si es así, ¿de qué forma? El archivo Bond Funds contiene info¡mación acerca.*
d) Con base en los resultados de los incisos a) a c)' ¿que nueve variables de una muestra de 184 fondos de inversl0'
concluye con tespecto a los impuestos per cápita sobre en bonos.
I
Problemas de repaso para el capítulo 1 33
de fondo: número de identificación para cada las variables porcentaje de costo, rendimientos en 2009,
bonos rendimiento a tres años y rendimiento a cinco años, y res-
?ondo en
oo, dpo d. bonot que confonnan el fondo de inversión ponda lo siguiente:
gubernamental o corporativo a c) Calcule la media, la median4 el primer cuartil y el tercer
i'r Uono. (inttnoe¿io
cuartil.
corto Plazo) ,
: en millones de dólares D) Calcule el rango, el rango intercuartil, la varianz4 la des-
cargos por venta (no o sí) viación estándar y el coeficiente de variación
de costo: relación de los gastos con los acdvos netos c) Construya un diagrama de caja. ¿Los datos están sesga-
en 2009: ¡endimiento de 12 meses en 2009 dos? Si es así, ¿de qué forma?
a tres años: ¡endimiento anualizado, de d) Con base en los resultados de los incisos a) a c), ¿ryé
ZAO'1 IZOO9 concluye con respecto a las diferencias entre los fondos
" a cinco años: reudimiento anualizado, de en bonos con base en el riesgo?
,2005 a2009
factor de riesgo de pérdida de los fondos de in-
:
BASE DE DATOS DE LA ENCUESTA
v.nión 1ba¡o, Promedio o alto) CON ESTUDIANTES
3.74 El problema 1.27 de la página 13 describe una en-
Responda 1o siguiente para el porcentaje de gasto, el
cuesta aplicada a 62 estudiantes de licenciatura (los datos
a tes años y el rendimiento a cinco años.
la medi4 la mediana, el primer cuartil y el tercer
están aknacenados en el archivo @[@[. Para es-
tos datos y para cada variable numérica, responda 1o si-
guiente:
el ¡ango, el rango intercuartil, la varianz4 la des-
c) Calcule la media, la median4 el primer cuartil y el tercer
estrindar y el coeficiente de variación
un diagrama de caja. ¿Los daros están sesga-
cuartil.
ó) Calcule el rango, el rango intercuartil, la varianz4 la des-
Si es así, ¿de qué fonna?
üación estrindar y el coeficiente de variación
n base en los resultados de los incisos a) a c), ¿qué
c) Construya un diagrama de caja. ¿Los datos están sesga- a,
concluye con respecto a esas variables?
dos? Si es así, ¿de qué forma?
Desea comparar fondos de inversión en bonos que d) Escriba un infor¡ne donde resr¡ma sus conclusiones.
cuotas con aquellos que no las cobran. Par¿ cada uno
3.75 El problema 1.27 de la página 13 describe una en-
o
dos grupos, utilice las variables porcentaje de costo, o
en 2009, rendimientos a tres años y rendi cuesta aplicada a 62 estudiantes de ücencian¡r¿ (los datos o
a cinco años, y responda lo siguiente: están almacenados en el ¿rchivo GEEñIID. N
la medi4 la mediana, el primer cuartil y el tercer c) Seleccione una muesta de estudiantes de licenciatura de to
or
su escuela y realice una encuesta similar con ellos.
el rango, el rango intercuartil, la varianza, la des- ó) Con los datos recolect¿dos en el inciso c), repita desde el
estitndar y el coeficiente de variación.
inciso a) hasta el c) del problema 3.74.
un diagrama de caja. ¿Los datos estiín sesga- c) Compare los resultados que obhrvo en el inciso ó) con los
Si es así, ¿de qué forma? del problerna 3.74.
base en los resultados de los incisos a) a c), ¿q,té 3,7ó El problerna 1.28 de la página 14 describe una encuesta
concluye coo respecto a las diferencias entre los fondos aplicada a 44 estudiantes de la maestría enadministración
de bono que cobran cuotas y los que no las cobran? (los datos estrin ahnacenados en el archivo GEE@. pura
cada variable numéricq responda lo siguiente:
Desea comparar los fondos en bonos intermedios gu-
b€mamentales con los fondos en bonos comorativos a corto c) Calcule la media, la mediana, el primer cuartil y el tercer
plazo. Para cada uno de los dos grupos, utiiice las variables cuartil.
porcentaje de costo, rendimiento a fies años y rendimiento a ó) Calcule el rango, el rango intercuafil, la varianza, la des-
cr:nco años, y responda lo siguiente: viación estándar y el coeficiente de variación.
'ol c) Construya un diagrama de caja. ¿Los datos están sesga-
c¿.ur.'rá
cuartil.
-eá¡,;;;i;;;;i p"-er cuarril y el tercer
dos? Si es así, ¿de qué forma?
ü) Calcule el rango, el rango intercuartil, la varianza, la des- d) Escriba un informe donde ¡esuma sus conclusiones.
vtación estiándar y el coeficiente de variación, 3.77 El problema 1.28 de la página 14 describe una encuesta
c) Construya un diagrama de caja. aplicada a 44 estudiantes de la maestría en administración
en
¿Los datos esrán sesga-
dos? Si es así, ¡.de qué forma?
yr r') Con base en lós reiultados
(los datosestrfur alrnacenados en el archiuo E!!!@$.
de los incisos a) a c), ¿qué a) Seleccione una muestra de estudiantes de la maestría de
concluye con respecto a las diferencias entre los fondos administración de su escuela y realice una encuesta simi-
)11, en bonos intermedios gubemamentales y los fondos en
lar con ellos.
oonos c¡rpomtivos a corto plazo? ó) Con los datos recolectados en el inciso a), repita desde el
caü 3.73 Desea comparar fond.os en bonos con base en el inciso a) hasta el c) del problema 3.76.
nesgo. Pam cada uno de los
:niór ftes niveles de riesgo (por debajo c) Compare los resultados que obtuvo eu el inciso b) con los
del promedio. promedio, por
arriba del promedio¡, utiliie del problema 3.76.
:
134 cAPfrIJLo
:r¡e
qué r"'
del uso adecuado de las de resumen las afirmaciones de EndRun? ¿De
',i"ii¿^ sus conoctmrcntos acerca en
Aolique
este Caso di8it41 se' nera afectarían esos estadisticos de resumen su per
numéricas descriptivas
ción del historial de EndRun?
anencial del caPínlo 2 '
2. Evalúe los métodos que EndRun utilizó
para resumir los
Revise nuevamente los datos oe cuesta a clientes". ¿Se le ocurre otra manera
en que pc
dRun Fi¡anciat Services'
que perdedo.res"
aoovo de EndRun para "Más ganadores dría resumir esos resultados?
.',"'ia diferencia del Gran ocho" y después responda lo 3. Observe que la última pregunta de la
encuesta ttent
Minitab' Inc'
! K' Ord, Kentlall's Advon' 3. Minitab Release l6 (State College, PA:
-l. Kendall, M. G', A. Shmrt y
2010).
ced Theory of Statistics , Volume I : Distribution
Theory
'
6a e<1. (Nueva York Oxford Univenity
Pres' 1994)'
Corpo-
2. Miuoioft Excel20l0 (Redmond, WA: Microsoft
ration,2010).
.ix
s
t:
.i1
t,il
'l-.i.
i,i.:
t¡:.
: :¡l
rs:
rl|{
1j
:::"
'lt¡
i{i
)
Guía del capítulo 3 para Excel 1 35
MEDIDAS DE VARIACIÓN
Y DE FORMA
varianza, desviación estándar
de vaflaoon a,
prorfundidad Utilice [a hoja de crilculo COMPUTE
Descriptive como modelo pan calcular medidas de
centr¿l, de variación y de foma. Esta hoja de cáicu-
o
o
se presenta en la figura 3 .2 de la pígina I 06, calcula o
icos descriptivos para la variable Rendimientos
N
to
en 2009 por los fondos de ilversión en bonos in- o)
gubernamentales y corporativos a codo plazo, uti-
los datos que se encuenban en las columnas A y B de
En la nueva hoja de cálculo:
DATA. La hoia de cáüculo utiliza las frm-
de cálculo
5. Seleccione la columna C, haga clic con el botón.dere-
VrlR (varianza muestral), STDEV (desüación eslin-
cho y luego haga clic en Delete en el menú rápido (para
MIN (valor mí¡imo) y MAX (valor rniximo)
eliminar las etiquetas de renglón dupücadas).
medidas de variación de una variable de inüerés.
6. Ajuste los encabezados de columna y el fornnato de las
1l. la hoia.de cálculo toma la--diferencia.ente
celdas utilizando la figtra 3.2 como guía. (Véase el
y MIN para obtener el rango. En el renglón 4, la hoja
apéndice B para realizar estos ajustes).
usa la ft¡nción COUNT oara determinar el ta-
de la muestra y luego divide la desviación estándar Para agregar el coeficiente de variación a esta hoja de
€nte la r¿íz cuadrada (SQRT) del tamaño de la mues- cálculo, primero ingrese Coefficient of variation en la celda
calcula¡ el error estándar. (Véase la sección 7.4 para A16. Luego escriba la fonnula =B7lB3 en la celda B16 y có-
mris sobre el enor estrindar). piela a la celda C16. Por ultimo, asigne formato a las celdas
a$egar el coeficiente de variación a la hoja de
'Para B 16 y C 16 para pesentat los datos en porceritajes.
üo COMPUTE, primero ingrese Coeflicient of varia-
en la celda A16. Después ingrese la fórmula =B7l83 en Valor Z
816 y luego cópiela a la celda C16. Por último, dé
Excel en profundidad Utilice la función STANDAR-
a las celdas B16 y C16 para presenar el porcentaje.
DIZE para calcular el wlor Z.Esci,ba la función con el for-
para análisis (Analysis ToolPak) Utilice mato STANDARDIZE(v alor, media, desviació n esiindar),
,.ue¡criptive Statistics para crear una lista que contenga me- donde valor es un valor de X. Utilice la hoja de trabajo
0l0as de variación.
forma v tendencia cental. TABLE-3.4 del libro Descriptive como modelo para calcu-
', Por ejemplo, para crear una hoja de cálculo simila¡ a la lar los valores Z. La hoja de cálculo utiliza las funciones
'0e .h
fi8ura 3.2 de la página 106. la cual presenta esradísti- AVERAGE y STDEV pará cálcular los valores dela media'
gos desc¡iptivos
para los rendimientos dL 2009 generados y la desviación estándar utilizados en la función STAN-
'po¡ los fondos enionos intermedios gubemamentales y cor- DARDZE.
13ó CA-PÍTULO 3 Medidas numéricas descriptivas
se presentaron en 1a sección 3.3 para calcular los cuartiles. separado de la hoja de cálculo que contiene el resumen de
Para obtener los cuartiles utilizando las reglas de la sección los cinco números.
3.3, abra la hoja de cálculo COMPUTE del libro QUAR- Excel en profundidad Utilice las hojas de calculo del übn
TILES. La hoja contiene los valores del ejemplo 3.10. Para Boxplot como plantillas para crear un resumen de los cino
calcula¡ los cuartiles en otro probleúa, sobrescriba esos va- números y un üagrama de caja. Utilice la hoja de cálml
lores (que aparecen en la columnaA). PLOT-DATA como plantilla para crea¡ un resumen de lo
Los cuartiles que rezuitan al utiliza¡ las reglas de la sección cinco números y un diagrarra de caja en una hoja de crílcuh
3.3 se muestran en la columoa D, la columna Book Rules. Los con datos que no se han agnrpado. Utilice la hoja de cálcr
resultados de la colurma D se basan en una serie de formulas lo PLOT como plantilla para construir un diagrama de cajal
avanzadas que están ubicadas desde la columna G hasta la co- partir de un resumen de cinco números conocido.
lumna I para aplicar 1as reglas de la sección 3.3. Abra la hoja Como Excel no incluye el diagrama de caja en sus gn'
de cálculo COMPUTE-FORMULAS para examinar esas ficas, la creación de un diagrama de este tipo requlefe d
fórmulas. (La explicación detallada de las fónnulas utilizadas "mal uso" avanzado y creativo de 1as aplicaciones de gnfi'
en esa hoja de calculo ¡ebasa el alcance de este libro). cación de Excel. Abra la hoja de cálculo PLOT-FORMII
LAS para examinar este "mal uso". (Una explica"''
Rango intercuartil
detallada rebasa el alcance de este übro).
Excel en profundidad Para obtener el rango intercuartil,
utilice una fórmula de la hoja de cálculo que reste el primer
cuartil del tercero. Por ejemplo, para calcular este estadís- ---
GE3.4 MEDIDAS NUMÉR|CA5 DESCR|PT|VAS
penn UNA POBLACIÓN
tico en el ejemplo 3.11 de la página 111, abra la hoja de
trabajo COMPUTE del libro Quartiles y escriba la fór- Media poblacional, varianza poblacional
'ür mula =D5 - D3 en una celda vacía. y desviáción estándar poblacional
i1e pafi
Excel en profundidad Utilice l¿ funcióü AVERAGE
Resumen de los cinco números y diagrama de caja
calcular la media poblacional. Utilice las funciones VARPI
# PHStat2 Utilice Boxplot para crear un resumen de los STDEVP para caicular la varianza y Ia desviación estfudr
:i
cinco números y un diagrama de caja. Por ejemplo, para de la población. resPectivamente. lngrese esas funcion6
: ;r¡r crear el resumen de los cinco números de la figura 3.4 y el p0!!:
::j, coo .i forrnuto AVERAGE(rang o de celdas de la
ti. diagrama de caja de la página I13, abra la hoja de cálculo cün),YLRP(rango de cetda's de It población) y STDEII
':i' DATA del libro Bond Funds. Seleccione PI{Stat Des' .) (rango de celdas de la Población).
;r.
:$
criptive Statistics t
Boxplot. En el cuad¡o de diálogo del
procedimiento (que se muestra a continuación): Regla empírica y regla de Chebyshev
,,tl 1. Ingrese Fl:F185 como el Raw Dats Cell Range y Excel en profundidad Utilice la hoja rle cálculo CoM'
marque First Cell Contains Lab€l. PUTE del übro Variability como plantilla que usa fórÚr
en u'
2. Haga clic en Multiple Groups-Stacked y escriba las aritméticas para examinar la variabilidad
81:8185 como el Grouping Variable Cell Range' distribución.
cuía del capítulo 3 para Midtab 137
yili'iff xTfl:::*:E#Tü*'el,--Tió!?-*M3.4MED|DA5N'UMÉRE$NDESCRTPI''¡¡'
^--- medid¿s'
la medi4 la mediana y la moda también calculan esas -^,¡:,t-.
Media poblacional, varianza poblacional
y deivibcion estándar poblaiional
\ "'"-'- EXPLORACIÓN- DE
GM3.3 - DATOS pan-
ÑüüEÉniói Minit¿b no cuenta con comandos que calculen estos
.i* metros poblacionales de manera directa'
Cuartiles, rango intercuartil y resumen
{i.*
\.: de los cinco números Regla empírica y regla de chebyshev
Utilice Descriptive Statistics para calcular esas medidas'
rlji ^^:^ -
LasinstruccionesdelasecciónGM3.lparaobtenerlame-uatculedeformamanuallosvaloresuecesariosparaaplidr,
.ir.ii;;;;td';' obtenidos con ras iÍs'
rii
¿á, i" ."o"." y r" -oau t.oui¿o
'qll mj:i;'fl:t;;,llL?:1i'n"os
:t.:
:;i
.{i Diagrama de caja
,'::, Utilice Boxplot para crear un diagrama de caja' Por-ejem- GM3.5 COVARIANZA YFOEFICIENTE
olo, oara criar los diagramas de caja de la figura
3 5 de la DE CORRELACION
tt::
pagina tt+, abra la hója de cálculo Bond Fund-s' selec- .
.^..
Loverlanza
L,. iio'ne Graptr + Boxplot. En el cuadro de diálogo Boxplot:
r-l L Haga clic en with Groups en one Y gallery y luego utilice
covariance para calcular la covarianza' Por
ej@';
)
Guía del capítulo 3 para Minitab 139
a,
o
o
o
N
to
o
Probabili,Cad
básica
4.2 Probabilidad condicional 4.4 Reglas de conteo GUíA DEL CAPíTULO 4 PAR,A
Cálculo de probabilidades Regla de conteo 1 MINITAB
condicionales Regla de conteo 2
conteo,
R Electronics World
omo gerente de marketing de M&R Elechonics World, usted está analizando los resultados de
la eniuesta cle un estudio sobre los planes de compra. En el estudio se preguntó a losjefes de
1,000 familias sobre sus planes para comprar un televisor de pantalla grande dur¿nte los si-
zuientes 12 meses. A modo de seguimiento, usted planea aplicar una encuesta a las mismas
/ meses us¡Pus¡
12 mgüEs
óersonas l.¿
oefsonas para ¡oue¡
después P4ra saber ¡r adquirieron
si 4s{uu I televisores. Ademiás de obtener esta in-
n. le zustaría saber si el televisor que compraron tiene una tecuencia de actualización rapida (120
) o uia frecuencia de actualización
estándar (69 }lz), si también comprar.on un reproductor de dis- o
en los últimos 12 meses y si est¿ban satisfechos con su compra del televisor de pantalla grande. =
;pera que usted utilice los resultados de esta encuesta para planear una nueva estategia de marke-
io.t r.ot. l*
u.otas y que se dirija sobre todo a los hogares que tienen mrás probabilidades de ad- o
mayor número de productos o artículos más costosos. ¿Qué preguntas podría plantear en esta
o
o
qué manera podría expresar las relaciones entre las diversas respuestas sobre los planes de
¿De N
las familias i¡dividuales? to
to
anteriores aprendió métodos descriptivos para resumir variables categóricas y numéricas. En
apre'ndení aspectos de la probabilidacl pan responder preguntas como las siguientes:
Con las respuestas a preguntas como estas podría empezar a tomar decisiones para su
'
estrategia de marketing. ¿Su estrategia para vender más televisores de pantalla grande -
debe dirigine a las famiüas que indicaron tener planes de comprar un televisot? ¿Debé ,,- . - -..
concentrarse en vender televisores con una frecuencia de actualización más ñápida?
¿Es probable que a las farnilias que compren televisores de pantalla grande con fre-
cuencia de actualización nipida se les pueda convencer con mayor facilidad de adquirir
también reproductores de discos Blue-ny? 14¡
LNDC¡ Snotolsld / Shun6l@k
142 cAPÍTuLo4 Probabilidadb¡isica
capífirlo 5.
'APriori
' Empirica
' Subjetiva
en el conocmrento pn'
de que ocurra un evento se basa
priori, la posibilidad
En la probabüda d a proh'
á.T t r"""ií.*¿". r" t¿t *iauo' donde cada resultado tiene las mismas
"r "".* 'it*" det'evento se define en la ecuación
(4 1)'
;ilü;iil;;;'r" p*,Uifr¿.¿ á.
"cñencia
PROBABILIDAD DE OCURRENCIA
(4.1)
Probabilidad de ocunencia = f
donde:
probabiüd¿d de sela'
rojas y 26 cartas ne*as. La
considere .na baraja estrindar con 26 carUs
hay X= 26 cartas---nlgr as y i =.52:*T i:t}
cionar una cana n eg.oes 26t52= 0.50 porque
después de ser seleccionatl4 istP'
¿Qué significa esta
probabilidad? Si se ieeáplaza cada carta porque no podero$
teleccionadas será neera? No'
t**
fica que una tle cada 2 de las puede decifqr¡esr
"g"[oi"'
ill'rlg"i.o,., ,.r.."iooes. sin ern-bargo, se
saber con certeza qu¿ o.urfi¿ de cartas negnr
este proceso de selección
"o
* ;;;;
continua' a la larga' la orooorción
seleccionadas se acercará a 0
"il;;
50;;i;ñ;t; ;i it"'t'u totoie
uoa probabilidr0
ialcula
"
a oriori.
dos' tres''cuatro'
o *'
Un dado estlíndar tiene c"r"s' Cad" cara del dado contiene uno'
sers :t:o
EJEMPLO 4.1 ae obtene¡ una cara con cinco puntos r
¿u¿0, po¿i utlaliobabiiidad
Cálculo de
ü;;il;h-tuo caras'll
ocurrir. Puesto que existen seis
probabilidades soLUclóN cada ca¡a tiene la misma probabilidad,cle
puntos es 1/6'
a priori orobabilidad de obtener una cara coú cinco
4.1 Conceptos de probabilidad básica 143
EVENTO CONJUNTO
Un evento conjunto es aquel que tiene dos o más características.
Obtener dos caras cuando se lanza una moned¿ dos veces es un'ejemplo de un ev€ttto conjunto, ya
que consta de una cara en el primer lanzamienJo y de ota cara en e!-segundo lanzamiento.
COMPLEMENTO
El complemento del evento I (representado por el símbolo I') incluye todos los wentos
que no forman parte del.
E1 complernento de una cará es una cn¡z porque es el único evento que no es tma cata" El com-
plemento de cinco puntos en un dado es no obtener cinco puntos. No obtener cinco puntos consiste '
ESPACIO MUESTRAL
El conjunto de todos los eventos posibles se coooce como espacio mnestral'
y cnrces' El
El espacio muestral para el lanz¡mieoto de una monedaconsta tle caras
tres, cuatro, cinco o
esDa;io muesbal deilanzamiento de un dado consta de uno, dos,
."i, p,-tor. En el ejemplo 4.2 se denuestr¿n eventos y espacios muest"ales'
World ¡¡¡u
EJEMFLO 4.3 La sección sobre el Uso de |a estadística en la página 141 se refiere a M&R Electonics
del compoq.
tabla 4.1 se presentan los resultados de la muestra de 1,000 hogares en términos
Eventos y esPacios miento de comDra de televisores de pantalla gande
muestrales
REATEÓ tA COMPRA
TABTA 4.1 PIANEÓ
COMPRAR Tot¡l
Comportam¡ento
200 50 250
de compra oe Sí
televrsores No 100 650 150
de pantalla grande 1,000
Totrl
y hacerla realmente.
.!llt cuentra dentro del círculo ,4 y del círculo I (fuea cenual) es la intersección de I yI (que se reptt-
il*i
sentacomolflB),yaqueforrnapartedelytambiéndeB.Eláfeatotaldelosdosctcüosesü
unión de I y B (que se .*pr.ru .o-o I U 8) y contiene todos los resultados
:3r que solo fonnan¡arE
l, que solo forman parte clel eventó B o que forman parte ánüo de I como de B EI rárd
t:l
dei evento
rili
en el diagrama fuera de I
U B contiene los resultados que no forman parte de '4 m de B
i de los eveútos se -..r.
pues:
'
j.,: Es n-ecesario defin A y B para uear un diagrama de Venn. cualquiera
eventos E[ u
:.i: I
definir como o B, siempre y cuando haya consistencia al evaluar los diversos
ü.1 ejemplo del televisor cle pantalla grande, podemos definir los eventos como sigue:
t:\{
I = planeó comprar B = realnente compró
rJ'.i
,-ii
l' = no planeó comprar B' = realmente no comp¡ó
;\. de venn (véase la figura 4.2) debemos determinar .I iá[o. d"-1á
int"
Al dibujar el diagrama
sección de ,,i y B para-poder dividir eiespacio miestral en sus partes. I
n B consta de las 200 faÚl'
lias que planearon comprar un televisor de pantalla grande y que realmente lo hicieron'
4.1 Conceptos de p¡obabilidad básica 145
AñB
I
La parte resta¡te del evento (planeó comprar) consta de las 50 familias que planearon compmr
un televisor de pantalla grande, pero que en ¡ealidad no 1o hicieron. La parte resta¡te del evento 3
(realmente compró) coosta de las 100 familias que no planearon comprar un bleyisor de partalla
gmnde, pero que en realidad lo compraron. Las 650 familias restantes representan aquellas que no
planearon comprar un teleüsor de pantalla grande y que en realidad no lo compraron.
Probabilidad simple
Ahora está en condiciones de responder algunas de las preguntas que se plantearon en la sección
Uso de la estadística. Como los resultados se basan en datos reunidos en una encuesta (remítase a
la tabla 4. I ), podemos utilizar el método de la probabilidad empírica.
Como antes se expuso, la regla más ñ¡ndame¡tal de las probabilidades es que su valor oscila
entre 0 y l. Un evento inposible tiene una probabilidad de 0 y un evento que ocurrir:í con toda
certeza tiene una probabilidad de l.
La probabilidad simple se refiere a la probabiüdad de ocunencia de un evento simple, P(l).
Una probabilidad simple en la sección Uso de la Estadlstica es la probabilidad de planear la con- o
pra de un üeleüsor de paatalla grande. ¿Cómo se puede determinar la pmbabiüdad de seleccionar a =
una familia que haya planeado comprar rm televisor de pantalla grande? Utilizando la ecuación
(4.1) de la página 142: o
o
o
Probabilidad de ocunercia = #I qt
o
P(planeó comprar)
250
= 1,000 =nr.
Así que hay una probabiüdad de 0.25 (o 25o/o) de que una famiüa haya planeado comprar un
televisor de pantalla grande.
El ejemplo 4.3 ilusta ofa apücación de la probabilidad simple.
4.2
CO]iIPRÓ UlI REPBODUCTOR DE BD
FRECUEI{CIA DE ACTUAUZACIOÍ{
DEL IEI."EVIS{¡R COÍTPMIX}
Rripida 38 80
Estlndar 70 150 220
Épida Tot¡l 108 192 300
(BD)
: :É=
146 cAPfTtlLo4 Probabilidadbásica
80
= 0.267
300
Hay una probabili dad de 26 .'7% de que un televisor de pantalla $ande comprado, elegido al ¿¿¡,
tenga fiecuencia de actualización nípida.
Probabilidad conjunta
Mientras que la probabilidad simple o marginal se refiere a la probabilidad de ocr¡r¡encia de eve¡.
tos simplei, la piobabilidad conjunta se refiere a la probabiüdad de una ocurrencia que involu
a dos o más evintos. Un ejemplo es la probabilidad de obtener cara en el primer lanzaniento d¡
una moneü y de obtener cara en el segundo lanzamiento.
En la tabla 4.1 de la página 144, el gnrpo de individuos que planearon comprar un televiso¡ &
pantalla grande y que reaünente lo compraron consta solo de los result¿dos de la celda "sí (planeo
conprar) y sí (realmente compró)". como este gru.po consta de 200 familias, la probabiüdad de seler.
cionar a una familia que planeó comprrar un televisor de pantalla grande y que realnente lo compó ec
EJEMFLO 4,4 En la tabla 4.2 las compras están clasificadas con base en el hecho de si los teleüsores tiene! uD¡
frecuencia de actualizalión rápicla o una fiecuencia de actualización estríndar, y si la familia com'
Determinación de pró un feproductor de discos Blu-ray. calcule la probabilidad de que una familia que comprf
la probabilidad ielevisor ie pantalla grande, elegida al azar, también haya comprado un televisor con frecuencia uv
conjunta de que actualización rápida y un reproductor de discos Blu-ray.
una familia compró
un telev¡sor de SOTUC¡óN Con la ecuación (4.1) de la página 142,
pantalla grande Número que comPró un televisor con
\ con frecuencia de
]N!¡ frecuenci¿ de actualización r.ápida y un rcproductor
iq _qdualjzación ráPida P(televisor con frecuencia de actualización de üscos Blu-raY
üs,d y un reproductor nípida y reproductor de discos Blu-ray) - Númerc total de compradores de televisores
1{i de discos Blu-ray de pantalla grande
Iti
ilii
;; =]L=o.t,
300
'¡*
'rli.l par
;"rl Por 10 t¿nto, existe una probabilldad de 12.7% de que una familia que compró un televisor de
*."
aiI talla grande, elegida al azar, también haya comprado un televisor con fiecuencia de actualizaoon
lli nipida y un reproductor de discos Blu-ray.
l:it
q,¡¡1
h.j
-i:
Probabilidad marginal
La probabiüdad marginal de un evento consta de u:r conjunto de probabilidades conjuntas Poda
.o, drt *riou, lu probabiüdad marginal de un evento en particular utilizando el concepto de prorf
4.1 Conce¡rtos de probabilid¿d básica '147
bilidad conjunta que se acaba de describir. Por ejemplo, si B consta de dos eventos, B, y 8",
entonces P(l), la probabilidad del evento l, consta de la probabilidad conjunta de que el ev'ento 7
ocura con eI evento B, y de la probabilidad conjunta de que el evento I
ocur¡a con el evento 8,.
Para calcular probabilidades marginales se utiliz¿ la ecuación (4.2).
PROBABILIDAD MARGINAL
Cara y crw en el lanzamiento de una moneda son eventos mutu¿mente excluyentes. El resultado
del l¡¡z¿miento de una moneda no puede ser al mismo tiempo una cara y lma cruz. Cara y cruz en
el lanzamiento de una moneda también son eventos colectivamente exlaustivos, ya que rmo tle ellos
debe ocuni¡. Si no ocur¡e una car4 entonces debe ocu¡rir una cruz. Si no ocur¡e una cruz, enúonces debe
ocu¡rú una cara. Ser mujer y ser hombre son eventos mutuamente excluyentes y colectivamente
exhaustivos. Ninguna pen¡ona es ambos (los dos son mutuamente excluyentes), y todos son uno u
oho (los dos son colectivamente exhaustivos).
Podemos utilizar la ecuación (4.2) para calcular la probabilidad marginal del evento "planeó
compraf' un televisor de pantalla grande. a,
Amenudoesm¡isfácildeten¡natP(AoB),laprobabilidaddelevento,4oB,utilizandolarq¡
general de la suma, que se deftne en la ecuación (4'3)'
probabilidaddelyB.
P(A o B)= P(A)+ P(B)- P(AY B)
(43)
¿" ¡, V fu-egJrestut la probabilidad del evento conjunto y B de ese I total' debido a que el evento
.oo¡'[to y"'nr. io.luido al calcular ta probabilidad de y la I
probabilidad de B. Remitiéndonos a h
)
Problemas para la sección 4.1 149
A 10 20 4.8 ¿En la actualidad toma mrás tiempo que antes ser elimi-
A' 20 40 nado de una lista de correo electrónico? Un estudio de 100
grandes minoristas en linea reveló lo siguiente:
es la probabilidad del evento
I{ECESITA DAR INESO MAS CTICS PARASBEJIIII{IUIO a,
Ati0 sí No
v82 2009 61
oBl o
2008 7 93 o
Considoe la siguiente tabla de contingencia: Fuc¡tc: Datos extraídos de "Ifo¡r Clicks to Escape a¡ Em¡il Lisf', flie
o
(D
New Yo* Tfnu,29 & mzno dc 2010, p. 82. o
(D
a) Dé un ejenplo de un evento simple.
A l0 30
á) Dé m ejemplo de un evento conjunto.
A' ?5 35 c) ¿Cuá'l es el complemento de 'Necesita dar tes o ¡ois cücs
para ser eliminado de una lista de correo electónico"?
es la orobabilidad del evento
d) ¿Por qué "Necesita dar fres o m,ís clic para ser elimi¡ado
de una lista de coneo electrónico en 2009" es un evento
Ay B2
conjunto?
a' v B'?
A' o B'? 4.9 Con respecto a la t¿bla de contingencia del problema
4.8, si un gran minorist¿ en linea se seiecciona al azar, ¿cual
DE CONCEPTOS es la probabilidad de que
4.5 Par¿ cada uno de los siguientes incisos, indique si el tipo a) necesite dar tres o más clics para ser eliminado de una
de probabilidad hvolucrada es un ejemplo de probabilidad a lista de correo electrónico?
p.nori, probabilidad empirica o probabiüdad subjetiva. á) necesite dar tres o más clics para ser eliminado de una
4) El siguiente lamamiento de una moneda justa dará como lista de correo electrónico en 2009?
resultado uaa cara. c) necesite dar tres o más clics para ser eliminado de una
ó) Ihlia ganará la Copa del Mundo de fr:tbol la próxima vez lista de coneo electrónico o de que sea un gran minorista
que se ¡ealice esta competencia. en línea encuestado en 2009?
c) La suma de las caras de dos dados será siete. d) Explique la diferencia en los resultados de los incisos á) y c).
d)El tren que lleva a un ernpleado a su trabajo llegará más 4.10 ¿Las penonas de distintos grupos de edad diñeren en su
de l0 minutos tarde. respuesta a los mensajes de coneo electrónico? Una encuesta
reaüzada por el Cenfro para el futuro digitai de la University of
4'ó Para cada uno de los siguientes incisos, indique si los
Southem Califomia (datos extaídos de A. Mindlin, "Older
eventos son mutuamente
excluyentes y colectivamente E-mail Usen Favor Fast Replies", The New York Ttmes, 14 de
ex[ausdvos.
julio de 2008, p. B3) informó que 70.7% de los usuarios mayo-
4) A los votantes
registrados en Estados Unidos se les pre- res de 70 años consideran que los mensajes de coneo elecho-
Suutó si estan registrados como republicanos o demócratas. nico deben responderse con rapidez, a diferencia del 53.6% de
50 =4
1 cArhulo Probabiiidad b¡ísica 1
dos, con base eu una muestra de 100 hornbres y 100 n',¡..
los usu¿nos que tienen entre i2 y 50 años de edad' Suponga
oue la encuesá se basó en 1,000 usuarios mayores de 70 años res, son los siguientes:
y
de edad y en 1,000 usuarios que tienen enhe 12 50 años
de
GEilERO
edad. Los resultados se resumen en la siguiente tabla: Hombre Mujer
PREFEREI{CIA PARA COMER 16¡r¡
f7ffi 4.12 Sesún una encuesta de Gallup, ta nagnltud de 543 mujercs, 276 respondieron que sí. Construya 'n4.h'
@ .o ou" loi empieados se ilvoiucran con su iugar bla de contingencia para evaiuar las probabilidades' ¿Cuil c
la probabilidad de que a un participante elegido al azar
de trabajo uuiíu d. uo país a ouo' Gallup informa que- el
a)1e guste ir a comprar ropa para él o ella?
porcentaje de trabajadores estadounidenses involucrados
á) sei mujery le guste ir a comprar ropa para ella?
con su lugar de trabajo es más del doble que el porcentaje de
t"" .ui.. , ,.u una persona a la que le gusta ir a conpru
los trabajadores alemanes. El estudio también revela que el "i ropa para ella?
hecho de contar con un mayor número de empleados invo- d) sea un hombre o una mujer?
lucrados conduce a una mayor innovación, productiüdad
y
personal En 4.'t5Cada año se reúnen evaluaciones con respecto alds
rcntabilidad, así como a una menor rotación de
'¡t I
sempsño de automóüles nuevos du¡ante los primrcros
la sizuiente tabla se resumen los resultados de la encuesta'
de uso. Suponga que los automóviles se clasific'
¡
PAIS
acuerdo con la iec.iidud d. *u ,"pn relacionada co¡
"ión la em
la garantía (sí o no) y según el pais en que se localiza
il¡volucRAillEt{To Estados Unidos Alem¡nia Total
nrJsa fabricante (Estados Unidos u otro país)' Con base
o
i!Í Fuente: Datos exfaido$ de M. Ni¡k, "EEployee Dise¡gagemed Plsguca ".or.r" de que un automóvil nuevo necesite una
orobabílidad
repe
abril de 2009'
üli Germany" , Gattup Monagement Joutnal, gm!'g¡lltp'com, 9 de iación por garaniía y haya sido fabricado por una empr$l
ur
localizada in ¡st¿d-os Únidos es de 0.025' Construya
lrjf l Si se selecciona un empleado al azar' ¿cuál es la probabili-
d'1 tabla de contingencia para evaluar las probabilidades$
"r;¡ dad de que
una reparación réhcionada con una garantía- icuá-l
es. ta{
ii:! ¿) esté involucrado con su lugar de tabajo? babiliáad de que un automóvil nuevo seleccionado al
az'r
¡r\ á) sea un trabajador estadounidense? c) necesite una reparación por garantía? .-
^. .-"r,
c) esté involucrado con su lugar de trabajo o sea un habaja-
ó) necesite una reparación por garantia / haya srdo taonc'*
'Ei dor estadounidense? por una empresa localizada en Estados Unido¡? .
^ . -^n
d) Explique la diferencia en los resultados de los incisosb) c)'
y
;rl c¡ necesite uná reparacion por garantia o haya sido fabncaor
i.'1|
gente para ordenar por una empresa localizada en Estados Unidos? , .-o
4.13 ¿Cuál es la forma preferida de la
Ar:'l:
^
una encuesta en 2009, pero no se d)- necesite unarepanción por garantía o no baya sido fabncal
comida rapicla? Se realizó
por un" emprésa localizada en Estados Unidos?
reportó el tamaño de las muestras. Suponga que los resulta-
4.2 Plobabilidad condicion¿l 15'l
Probabilidad condicional
Cada uno de los ejemplos de la sección 4.1 requiere calcular la probabilidad de un evento cuando
1¿ muestra se obtuvo de un espacio muestal completo. ¿Cómo se determina la probabilidad de un
doude:
o
P(,4 y B) = probabilidad conjunta l yBde o
:
P(l) probabilida<l marginal de I o
(D
P(B) = probabiüdad narginal de B o
A
=ffi:o.ao
Tambien podemos utilizar la ecuación (4.4ó) para calcular este resultado:
P(A v B)
P(BlA) = -rt^)
donde:
I : planeó comprar
B = en realidad compró
152 cAPiTULo4 Probabilidad básica
eatonces:
200/i,000
P(En reatidad compró | Ptaneó comprar) 250/i,000
=4=o.ao
250
condicional'
El eiemolo 4.6 ilustra de manera más clara la probabilidad
rápida
I = compró un teleüsor con fiecuencia de actualización
B = compró un reproductor de BD
entonces:
Puv B\ 38i 3oo
P(Bla) ='iÑ = s()tÑ = o'41s
Porlotanto,dadoquelafamiliacompróuntelevisorconaecuenciadeactualizaciónrápida,
,rou p.oUaiilidad ie a7.5% Je q* tutbi*
huyu tomprado.rm reproductor de üscos Blu"o}
."ist
la probabilichd,TTry"t,*-:":lT"1li.
i;;;, J";d* esta probabiliclad condicional0'36cono 36%' Estos resu-ltados:.:::i.11t"iii#"
productor de &scos Blu-ra¡ que es 108/300 =
proDaornu4w
ii^ qu. .o.p.afoo teleüsores con ftecuencia de actualización nápida tienen mayores
que compraron televisores de pantaüa
de adquirir un reproductor de discos Blu-ray que las famiüas
sandá con fiecuencia de actualización estíoda¡'
Árboles de decisión
de acuerdo con el hecho de qut plln'.ry
En la tabla 4.1 cle la págila l¿14 se clasificó a las familias
y realmente 1o com¡raron' Un árbol de decisi0¡
a<iquirir un televisor de pantalla grande o no, de si p¡r
es una altemativa a la tabla de contingencia. En la
figura 4.3 se presánta el rírbol de decisión
este eiemplo.
)
4.2 P¡obebilidad condicional 153
RA 4'3
decisión
Conjunto
A,lva)=ffi
complsto
de tamil¡as
A¡tA= lql,*
ñAy4= i9d5'0-
4.7 Utiüce los datos clasific¿dos enlatabla 4.2 de la página i45 para constuir el árbol de decisión.
Use e[ á¡bol de decisión para calcular la probabilidad de que una familia compre un reproductor de
del
discos Blu-ray, dado que la famiüa compro un teleüsor con frecuencia de actualización nipida. :
decisión
familias SOLUCTóN El árbol de decisión para las faniüas que compraron un reproducto¡ de discos Blu-
ray y un televisor con frecuencia de actualización rápida se presenta en la fgura 4.4 de la página
de 154. Utilizando 1a ecuación (4.4á) de la página 151 y las siguientes definiciones:
grande
150
ñAi y B'l =
300
lndependencia
grande' la probabiüdad condicional c
En el ejemplo sobre la compra de televisores de pantalla
'o.go
a" que la fanoilia seleccionada en realidad haya comprado el telwisor
de panta
ioolisí =
U.g'*¿",dadoquelafamiliaplaneóhacerlacompra'Laprobabilidadsimpledeseleccionur
de 300/1,000 = 0.30. Este resultado
una"familia que en realidad haya comprado el televisor es
i"a."q*.r.o'"cimientopreviodequelafamiliaplaneóhacerlacompraafectólaprobabilidd
eveúo dependeü
L Ñiit *4"¿ compraá el televisór' En otras palabras, el renrltado de un
¡esultado de un segmdo evento.
de ocurrencia de oüo evento, se dic
cuan<lo el resilodo de rm wento no afecta la probabiüdad
que los eventos son indep€rdient€s. l¿ independencia se detennira
utilizando la ecuación (4'5)'
INDEPENDENCIA
Dbs eventos,'/ y 4 son independientes si y solo si:
donde:
N
'{-*
En el ejenplo 4.8 se demuestra el uso de la ecuación
(4'5)'
.tl,i
que en realidad compraron tetgviioru,l
EJEMPLO 4.8 En la encuesta de seguimiento aplicada a las 300 familias
'F* Li"1^t]:j:::YiTi,f
I '.t-rl ;;;ü-gil., t. üs pregunto si estabansatisfechas con sus compras'
ta satisraccion con las respuestas a si el televisor tenia
u¡a ftecuo
Determinación íü;#;;;r;ñá so'ure
';iY
de independencia cia de actualización ráPida
, Fr.
[:1
.q,li CoMPf,A? '
Coil tA
';¡üt TABLA 4.3 mEcuEl¡clA DE ACÍUAUZAC¡fi ¿ESTA SAilSiFEC{q
No
,i'1,: DELIETEVIS{IR Sí Tot¡l
Satisfacción con la
compra de R.ipida & l6 80
televrsores ce
,
t76 44 n0
5i pantalla grande
Estándar
300
Tot¡l 240
--¿
4.2 P¡obabüdgd condicion¡l 155
&1300 64
=
,r/rra = S0 =
P(Satisfecho I Frecuencia de actualización nápida) O.¡O
que es igual a:
) Lt\
P(Satisfecho) =
ffi=0.80
Por lo tanto, senti¡se satisfecho con la compra y la frecueircia de act¡ulización del televisor adqu!
rido son eventos indeDendientes. Conocer un ev€úto no afect¿ la probabilidad del oto evento.
Reglas de la multiplicación
La regla general de lr multiplicación se obtiene utilizando la ecuación (4.tfc) de la página 1 51.
P(A y B)
P(AIB) =
P(B)
4.9 Considere a las 80 farnilias que compra¡on televisores con una frecuencia de actualización rápicla.
En la tabla 4.3 de la página 154 se observa que 64 familias esuin satisfechas con su compr4 y que
de la regla
16 familias esuán insatisfechas. Suponga que se eligen dos familias al azar del conjunto de 80.
de la
Calcule la probabiüdad de que ambas familias estén satisfechas con su compra-
P@y n) = P(atB)P(B)
La probabilidad de que la primera famiüa esté satisfecha con la compra es 64/80. Sin embargo'
la probabilidad de que la segunda familia tambien esté satisfecha con la compra depenle del ren¡l-
tado de la primera selección. Si la primera famiüa no se reincorpora a la mwstra después de deter-
minar su nivel de satisfacción (es decir, si el muestreo es sin reemplazo), el nrlmero de fa¡nilias
restantes es 79. Si la primera familia estrá satisfecha, la pmbabilidad de que la segunda tambien lo
esté es 63i79, ya que en la muesfia permanecen 63 familias satisfechas. Por lo anto,
15ó cAPfTULo4 Probabilidadbrisica
P(AYB) --(#X#):06380
estén satisfechas co¡*
Hay una probabilidad de 63.80% de que las dos famiiias muestreadas
compra.
I
Si esta regh és válida para dos eventos, y B, entonces I y B son independientes' Por lo tan''
,,:*.
[i";
f ii:
itil*
^^:i':;lif iiitii&r
\¡oo/\r,ooo/ \7ool\l.ooo/
\l
--l 200 50 250
1.000 1,000 1,000
Problemas Dar¿ la sección 4.2 157
¿En la actualidad requiere mrís tiempo que antes ser 4.23 ¿Cuil es la forma preferida de la gente para ordenar
una lista de correo electónico? Un estudio de comida Épida? Se ¡ealizó una encuesta en 2009, pero no se
minoristas en línea reveló lo sisuiente: reportó el rrmaño de las muestras. Suponga que los resulta-
dos, con base en una muestra de 100 honbres y 100 muje-
SE REQUIERE}¡ IRES O I'IAS CUCS PARA SER res, son los siguientes:
ELIMI]IADO
Si No GEI¡ERO
39 6l PREFEREi{CUI PARA C()MER Hombre Mujer Total
7 93 Comer adentro 2L t2 33
le: Datls €xFaídos de "More Click to Escape ad Email List", t e
Ordenar adentro. parr llev¡r 19 l0 29
York Ilnes,29 de muzn de 2010, p. 82. Ordenar de¡de el ¡utomóvil 60 78 138
Totel 100 100 200
i)'' Dado que se necesita dar tes o más clics oara ser elimi-
, [ado de ¡us¡te: Drúos €xtraídos de www.qtrE¡g¡zirc,c0n/rcFort/üive,
una lista de coneo electónico, ¿cúril es la proba-
thrü_tlme_!tudy¿009/2o(D_ch¡rtíwb¡bJourjref.r¡ed_w¡y_to_
bilidad de que esto ocurriera en 2009?
ord€r_f¡st_food.hh!1.
ó) Dado que
.l ZO09 está involucrado, ¿cuál es la pro-
babilidad de "¡o
que se necesiten tres o más clics para ser c) Si un participante es hombre, ¿cuál es la probabilidad de
, eltninado de una lista de coneo
electrónico? que prefiera ordenar desde el automóvil?
c) Exptique la diferencia
en los ¡esultados de los incisos ¿) D) Si un participante es mujer, ¿curírl es la probabilidad de
, vá). oue Drefiera ordeür¡ desde el automóvil?
158 cAPÍTuLo4 P¡obabüidad básica
probabilidad de que no esté involucr¿do? del año. ¿Una buena primera semana es un buen augurio ól
c) bado que un trabajador es de Alemania, ¿curil es la pro-
siguiente-año? La siguiente tabla proporciona el
desempeio
babilidad de que esté involucrado? .iol y a. U pti.ou semana durante ese periodo de 61 doc
la pro-
d) Dado que un nabajador es de Alemania, ¿curil es
babilidad de que no esté involucrado? OE¡EMPEfiO AI{UAI DE tAS S&P fN
preguntó: SEtlAt{A Más alto Má¡ b¡jo
4.25 En una encuest¿ aplicada a 1,085 adultos se PR|!¡IERA
"¿Le gusta ir a comprar ropa para usted?" -Los resultados Más ¡lto 34 5
)
4.3 Teorerna de Bayes 159
6s la probabilidad de que ambas cartas sean rei¡as? c) Si se seleccionan dos guantes de la caja al azar y sin re-
65 la probabilidad
de que la primeta carta sea un l0 emplazo (el primer guante no se tegresa a la caja después
c"tta sea un 5 o un ó? de ser seleccionado), ¿cuál es la probabilidad de que los
oL lu r"guo¿"
'hirira * ru.rt.o col reemplazo (la primera carta se dos guantes seleccionados sean de¡echos?
¿la baraja después de ser seleccion¿da), ¿cual se- ó) Si se seleccionan dos gu¿ntes de la caja al azar y sin re-
en el inciso 4)? emplazo (el primer guante no se regrcsa a la caja después
la resPuesta
juego de ventiuno, las cartas con figuras (sota,-reina, de ser seleccionado), ¿cuál es la probabilidad de que se
el
valen 10 puntos, el as vale I u 11
y puntos. Todas las seleccione un guante derecho y un guante izquierdo?
cart¿s tienen su valor nominal. Se consigue vein- c) Si se seleccionan tres guantes con reemplazo (los guan-
si dos cartas suman en total 2l puntos. ¿Cuál es la tes se regresan a la caja después de ser seleccionados),
ad de lograr veintiuno en este problema? ¿cuál es la probabilidad de que los fres sean izquierdos?
d) Si hiciera un muestreo con reemplazo (el primer guante
Una caja de nueve guantes contiene dos guantes iz' se regresa a la caja después de ser seleccionado), ¿curáles
Teorema de Bayes
El teorema de Bayes se usa para reüsar probabilidades calculadas previamente con base en infor-
mación nueva- Creado por Thomas Bayes en el siglo xvu (véase las referencias 1, 2 y 7), el teorema
de Bayes es una extensión de lo que anteriormente eshrdiamos como probabilidad condicional.
Podemos aplicar el teorema de Bayes a la situación en que M&R Electronics World estl consi-
derando vender un nuevo modelo de televisor. En el pasado, 40% de los nuevos modelos de iele-
visores han tenido éxito, en tanto que 60% no 1o ha tenido. Antes de i¡troducir el nuevo modelo de
at,
televisor, el departamento de ir:vestigación de mercados realiza un amplio estudio y entega un in-
forme, ya sea favorable o desfavorable. En el pasado, 80% de los nuevos modelos de televisores =
que tuüeron éúto ¡ecibieron infomes de investigación de mercados favorables, en t¿nto que 30%
o
de los nuevos modelos de televisores que no tuvieroo éxito recibieron informes favorables. Para el o
nuevo modelo de televisor que se está considerando vender, el deparlamento de investigación de o
(¡¡
mercados entregó un informe favorable. ¿Cuál es la probabiüdad de que el televisor tenga éxito? o
EI teorema de Bayes se desanolló a partir de la definición de la probabilidad condicional. P¿ra o
calcular la probabilidad condicional de 4 dado l,
considere la ecuación (4.4á) (que se presentó
originalmente en la página 151 y que se reproduce a continuación):
P(Av B\ P(AlB)P(B)
P(BIA)=
,ñ: P\A)
El teorema de Bayes se deduce al sustib:ir la ecuación (4.8) de la página 156 por P(,4) en e1 deno-
minador de la ecuación (4.4á).
TEOREMA DE BAYES
P(alB)P(B)
P(4lA): p(AlB)p(B) + P(AlBr)P(&z) +.. + P(alBk)P(Bk)
(4J)
evento ,S éxito
= teleüsor con evento F = informe favorable
l'J.t evento S'= televisor sin éxito evento F'= i¡forme desfavorable
fal yi
P(Fls)P(s)
P(slF) =
P(Fl s)P(s) + P(rls')P(s')
(0.80x0.40)
(0.80)(0.40) + (0.30)(0.60)
0.32 _ 0.32
0.32 + 0.18 0.50
= 0.64
La probabilidad de un televisor con éxito, dado que se recibió uo i¡forme favorable, es 0.64.
De esta maner4 la probabiüdad de un televisor que no tiene éxito, dado que se recibió un infon¡e
favorable, es I - 0.64 = 0.36.
En la tabla 4.4 se resume el cálculo de las probabilidades y en la ñgura 4.5 s€ pf€senta el á¡hl
de decisióo.
FIGURA 4.5
Arbol de decisión
para comercializar
un nuevo televlsor f,Sil = 0.4o
ñ9) = 0.60
X¡
;eq
-¡i
a;l.
:Í l'
t\; EJEMPLO 4.10 La probabilidad de que una persona tenga cierta enfermedad es rle 0.03. Se dispone de pruebastr
diagnóstico médico iara determinar si lá penona realmente padece la enfemedad. Si la enferne
I l'::
ffiiir
Uso del teorema
de Bayes en un
;f#;l#;ii.r*ür" p.t"uiüdad de que ta prueba de diagnóstico médico dé un resul
no e¡'
!l¡
:;i:l,l problema de
t¿do positivo (que indique que la enfermedad está presente) es de 0.90. Si la enfen¡edad
enftt'
"\¡t realm"ot" presáte, la probabilidad ae un resultado de prueba positivo (que indique que la
diagnóstico médico
medad está presente¡ es ae O.OZ. Suponga que la prueba de diagnóstico médico ha dado u¡
¡esü
s{.-
la probabilidad de que'
tado positiv; (indicando que la enfermedad está p¡esente). ¿Cuál es
enfermedad este realnente pfesent€? ¿cu.ál es la probabilid¿d de un resultado de pnreba posiüvoj
4.3 Tcoremade Bayes 1ó1
SOLUOóN Sean:
P(rlD)P(D)
P(Dlr) =
P(rlD)P(D) + P(rlD',)P(D',)
(0.e0)(0.03)
(0.e0x0.03) + (0.02)(0.e7)
0.0270 0.0270
0.0270 + 0.0194 0.0464
= 0.582
La probabilidad de que la enfermedad esté realnente presente, dado que ocurrió un resultado
positivo (el cual indica que la enfermedad estii presente), es de 0.582. En la tabla 4.5 se resume el
cálculo de las probabilidades y en la ñgura 4.6 se presenta el árbol de decisión.
a,
c,
rAB LA 4.5 Evento D, Prob¡bilidad Prob¡bilidsd Probabilid¡d o
del
previa condicion¡l conjunta Prob¡bilid¡d reüs¿da o
de Bayes {r) \rtD) (rtD)(D) P@tln q¡
o
a.el problema (D
D = t¡ene la 0.03 0.90 0.0270 P(Dln=0.0270t0.0464
qragnoflco enfermedad = 0.582
I/ = no tiene la 0.0194 P(D lD=0.0194/0.M64
enfermedad c0464 = 0.418
GURA 4,ó
fubol de decisión
para el problema
de diagnóstico
)
4.4 Reslas de conteo 1ó3
de publicidad está esrudiando los hábi- c) Si se selecciona un empresario al azar, y ese individuo
Un ejecunvo
y mujeres casados de ver la televisión du- espera que su nuevo tregocio tenga 20 empleados o más
homtres
en cinco años, ¿cual es la probabilidad de que este indivi-
horuio estelar. Con base en registros
previos de los
de ver la televisión, el ejecutivo ha detemrinado que
duo sea un empresario por decisión?
estiín viendo la televisión durante el horario es- ó) Analice varias razones por las que los empresarios por
dempo. Cuando el esposo esá viendo la tele- decisión podrían tener más probabilidades que los em-
f,6o70 del
del riempo la esposa también la está viendo. presarios por necesidad de creer que su empresa creceÉ.
" el40%
el esposo no está viendo la televisión, el 30% del 4.3ó El editor de una editorial de libros de texto está tra-
la esposa la está
viendo'
tando de decidir si publicani un libro de estadistica para nego-
ule la probabilidad de que si la esposa es¡ií viendo la
cios. La información sobre libros anteriores publicados indica
el esposo tambien la esté viendo.
que l0% ha tenido gan énto,20o/o ha tenido un éxito mode-
la probabilidad de que la esposa esté vieudo la rado, 40% no ha registrado pérdidas y 30% ha anojado pérdi-
dur¿úte el horario estelar.
das. Sin embargo, antes de tomar una decisión respecto a
4,34 Olive Constuction Company estrí deter¡ni- publicarlo o no, se hará una revisión del libro. En el pasado,
nando si debe presentar una licitación para un 99% de los libros que tuvieron mucho éxito recibieron rese-
centro comercial. En el pasado, el principal competi- ñas favorables, 70% de los iibros que tuvieron un éxito mode-
Olive, Base Construction Company, ha presentado rado recibieron reseñas favorables, 40% de los übros que no
70% de las veces. Si Base Constn¡ction Corn- registraron pérdidas recibieron reseñas favorables, y 20% de
no presenta una ücitación para un trabajo, la probabili- los libros que tuüeron pérdidas recibieron reseñas favorables.
que Olive Construction Company gane la licitación a) Si el libro de texto propuesto recibe una reseña favora-
0,50. Si Base Construcüon Company presenta una li- ble, ¿de qué manera el editor debe revisar las probabili-
para un habajo, la probabilidad de que Olive Cons- dades de los diversos resultados para tomar en cuenta
Company lo consiga es de 0.25. esta i¡formación?
Olive Construction Company consigue el trabajo, ó) ¿Qué proporción de los libros de texto reciben ¡eseñas o
es la probabilidad de que Base Consüuction Com- favonbles?
no oresente una licitación?
=
4.37 Un servicio de bonos de inversión municipales tiene
es la probabilidad de que Olive Constuction Com-
hes categorías de calificación (1, B y Q. Suponga que el año o
consiga el trabajo? o
anterior, de los bonos de inversión municipales emitidos en o
A los trabajadores despedidos que se convierten en todo Estados Unidos, 70% recibió la califi cacíón A,200/o reci- c¡
ios porque no pueden enconhar un empleo signifi- bió la calificación B, y l0% recibió la calificación C De los o
en o¡ra empresa se les conoce como empresar¡ü por bonos municipales con la calificaciónl, 50% fue emitido por
The Wall Street Jourzal infonna que los empre- ciudades, 40% por suburbios y l0% por áreas rurales. De los
or necesidad tienen menos orobabilidades de oue su bonos municipales con la calificación 8, 60% fue emitido por
ra crezca que los empresarios por decrsrrín (J. Bailey, ciudades, 20% por suburbios y 20% por á¡eas rurales. De los
Than Need- Builds a Business" , The Wall certiñcados municipales con la calificación C, 90% fue emi-
-More
'Jountal,2l de mayo de 2001, p. B4). Este artículo tido por ciudades, 5% por zuburbios y 5% por áreas rurales.
que 89% de los empresarios en Estados Unidos lo c) Si una ciudad emite un nuevo bono de inversión municipal,
decisión y que l1% son empresarios por necesidad. ¿cuíl es la probabiüdad de que reciba la calificar;iónA'l
de los empresarios por necesidad esperan que su á) ¿Qué proporción de los bonos municipales son emitidos
negocio tenga 20 o más empleados en cinco años, por ciudades?
ras que 14% de los empresarios por decisión esperan c) ¿Qué proporción de los bonos municipales son emitidos
20 o mrís empleados en-cinco años. por suburbios?
Reglas de conteo
En Ia ecuación (4.1) de la página 142, la probabilidad de ocunencia de un resultado se definió
como el número de maneras en que ocune el resultado, diüdido ente el número total de resultados
posibles. A menudo existe una gran cantidad de resultados posibles y es dificil determinar el nú-
mero exacto. Para tales ci¡cunstancias se han creado reglas que penniten contar el número de ¡esul-
tados posibles. Esta sección presenta cinco diferentes reglas de conteo.
Reqla de conteo 1
La regla de conteo I determina el número de resultados posibles para un conjunto de eventos mu-
tuamente excluyentes y colectivamente ex.haustivos.
164 cA?fTULo 4 Pobabilidad brísica
REGLA DE CONTEO 1
excluyentes y coletti]T** .. .
Si cualquiera de ,t eveotos dif€rcntes mutuametrte posibles
."l"Gt"t pt ¿. ocur¡i¡ en cada uno áe n ensayos' el número de rezultados es
(4 10)
Porejerrplo,utilizandolaecuación(4'10),elnúmerodedifer-entesresultadosposiblesall¿¡'
*u.oo"dt.oo dos caras cinco veces es 25 = 2 X 2
X 2x2x2=32'
"",
Regla de conteo 2
y permite que el número dt
La segunda regla de conteo es una versión mas general de la primera
REGLA DE CONTEO 2
eventos en el segunto ensayo' "' y ¡t¿ €ventos
Si hay t, evenos en el primer ensayo' k,
* el ,-é'simo eosayo, entonces el número d€
resultados poslbles es:
g$'
establ de vehiculos autoñotores le
Por ejemplo, a la administración de un departamento dt-Tt-?Y
considemndo que et
taria saber cuántos núneros de ptacas están disponibtes' "Y"ro por tes nuno
del ingrés no incruye ra ñ) segurdas
consta de tes letras (recuerde que er abecedarió portes trúm€ros'
,". i¿.1. S).Ut*¿i ta ecuacién i+tt¡, si *S p]3."I9T3.*tres letras seguidas
ur
oue consta de una entrada'
.o.pl.tu . pr.cio fijo
EJEMPLO 4.12 ffi du
5 enfaL' 10 platos fuertes'
3 bebi
Dlato fuerte, una bebida y un po*
U'tt¿ pu"¿t tlegr 9fe
Determinación del '¿* y O p"t*r. Determine el número total de menus posibles'
número de comidas
diferentes SOIUOóNsiutilizalaecuación(4.11),elnúmerototaldemenusposibleses(5)(10)(3)(Q=90
Regla de conteo 3
el número de maneft$ etr que se puede
ordenar un cor
La tercera regla de conteo pennite calcular
iunto de elementos.
4.4 Reglas de conteo 1ó5
REGLA DE CONTEO 3
El número de maneras en que se puede ordenar todos los n eler¡entos es:
A.13 Si un conjunto de seis libros se colocara en una repisa, ¿de cuántas maneru se podrían ordena¡ los
seis libros?
SOLUC|óN Para empezar, debe tener clarc que cualquiera de los seis übros podría ocupar el pri-
mer espacio en la repisa. Una vez que se cubre el primer espacio, se puede elegir eúre cinco übros
para ocupar el segundo espacio. Se conthria con este procedimiento de ordenamiento hasta que todos
los espacios estén ocupados. El número de maneras en que se pueden ordenar seis übros es:
Regla de conteo 4
En muchos casos necesitamos conoce¡ el núme¡o de naneras en que un subconjunto de un gnrpo
completo de elementos se puede acomodat en orden. Cada aneglo posible se conoce como permu-
t¡ción. a,
o:
n.x 'l x)l (4.13)
\n -
donde:
u¡ botón
: = número de objetos a ordenar
nPr, l¿ cual nl = n factorial= n(n- l) ... (1)
lr€¡Eutacro-
se utiliza eri P = símbolo para permutacionesl
4.14 Modificando el ejemplo 4.13, si se tienen seis libros, pero en el entepaño solo hay espacio para
cuato, ¿de cüfutas maneras podrá acomodar estos libros en el entepaño?
P= nl = 6!
n'x =
(6XsX4X3X2X1)
= 360
(n - x)l (6 - 4)! (2Xl)
Re_gla de conteo 5
En muchas situaciones, lo que nos interesa ¡o es el orden de los resultados, sino el número de
maneras en que x elementos se pueden selecciona¡ a partir de ¿ elementos, sin importar el orden.
A cada selección posible se le llam¿ combin¡ción.
1 66 cAPiTULo 4 Probabilidad básica
? I
n-x
(1=-
;rl(z - r)!
(4.14)
donde:
Si comparamos esta regla con la regla de conteo 4, vemos que la única diferencia
es que o¡
todos los arre'r^'
incluye un iérrnino ¡! en el denominador. Cuando se utilizaron permutaciones,
de 10; r objetos eran distinguibles. En el caso de las combinaciones, los x! aneglos de objetos ,
€JEMPLO 4.15 Modificando el ejemplo 4.14, si el orden de los libros en el enhepaño es irrelevante, ¿de cuánbs
ol (6XsX4X3)(2X1)
a =- ,f!
ñvx .r!(n - x)! 4!(6 - 4)l (4x3x2xrx2xl)
tres discos, cada uno con 30 posiciones' Para que la caja cada tipo?
fuerte se abra, cada ¡no de los tres discos debe estar en la
4.42 A usted le gustaría preparar una ensalada que cotso
oosición correcta.
a¡ ¿Curíntas combilaciones diferentes posibles de los discos de lechuga, jitomate, pepino y pimiento. Va al supermu'
u¡o
hay en esta cerradura? cado con-la intención de comprar una variedad de cada
$
á) ¿Cu,il es la probabilidad de que, si se elige al azar una po- de esos ingredientes. Descubre que en el supermercado
deJt
iición en cada disco, se logre abrir la caja fuerte dél banco? venden ocho vanedades de lechuga, cuatro variedades
c) Explique por qué las "combinaciones de discos" no son tomates, tres variedades de pepinos y tres variedades¡0
sr
las combinaciones matemáticas expresadas por la ecua-
pimientos. Si compra todas, ¿cuántas ensaladas difere
ción (4.14). ^¡AÁa ¡¡¡¡e¡ct'l
trr
a,
U[/IEN
Este capítulo inició con el desarrollo de los conceptos bá- dades que antes ya se habían calculado con base en ¡
sicos de la probabilidad. Aprendimos que la probabilidad información. También se describieron varias reglas de cott
es un valor numérico entre 0 y l, el cual representa la pro- teo. A lo largo del capínrlo se utilizaron tablas de condnget
babilidad o posibilidad de que ocuna un evento en particu- cia y árboló de decisión para mostrar i¡fommción Er¿l
lar. Además de la probabilidad simple, estudiamos las siguiente capitulo se esrudianín imponantes distribuclord
probabilidades condicionales y los eventos independien- de probabilidad discreras, como la disribución binommtl
tes. Se utilizó el teorema de Bayes para revisar probabili- la de Poisson.
general de
la mulüPlicación Regla d€ conteo I
(4.6) (4.r0)
Y B) = P(AIB)P(B)
fondos de bonos (intennedio gubema¡nen- d) Compare los resulados del inciso c) con los del inciso b)
á de
ivo a corto Plazo) del problema 4.67.
s Dor ventas (no o sí) 4.ó9 El problema 1.28 de la página 14 describe una encuesta
dil riesgo de perdi<ta de los fondos de bonos que se apücó a ,14 estudiantes de una maestía en administa-
del promedio, promedio o por arriba del ción (los datos están alnacenados en el archivo [!!!@$
Utilice estos daüos para constuir tablas de contingencia del
tablas de contingencia de tipo y cuotas, genero y el posgndo, del genero y la canera, del genero y la
y cuotas Y nesgo. situación laboral, del genero y la computadora preferida, del
tabla de contingencia calcule todas las probabi- posgrado y la carler4 del posgrado y la situación laboral, y
gondicionaleS Y marginales. del posgrado y la computadora preferida
en el inciso a), ¿qué concluye con respecto a si ¿) En cada una de estas tablas de contingencia, calcule todas
son independientes? las probabiüdades condicionales y ma¡gi!¿les.
ó) Con base en el inciso ó), ¿qué concluye acerca de la inde-
DATOS DE tA ENCUESTA pendencia de las variables?
a,
A ESTUDIANTES
|.21 de lapig;na 13, se describe una 4.70 El problema 1.28 de la página 14 desc¡ibe una en'
el problema
¡uose aplicó a 62 estudiantes de ücenciahrn (véase
cuesta que se aplicó a 44 estudiantes de una maestría en o
Utilice estos datos oara constuir administración (los datos están almacenados en el ar- o
o
del género y la carrera, del género Y chivo@. (D
deseado, del género y la situación labo¡al, del ¿) Seleccione úna muestra de estudiantes de l¿ maestría
en administración de su escuela y realice una encuesta A
computadora preferida, de la clase y el posgrado
de la clase y la situación laboral, de la canera y el
similar.
deseado, de l¿ ca¡rera y la situación laboral, y de la ó) Utilice sus ütos para constn¡ir tablas de contilgencia del
la computadora preferida.
genao y el posgrado, del género y la canera, del genero
una de estas tablas de contingencia, calcule to- y la situación laboral, del género y la computadora prefe-
probabilidades condicionales y marginales. rida, del posgrado y la carrera, del posgrado y la situa-
en el inciso a), ¿qué concluye con respecto a sl ción laboral, y del posgrado y la computadora preferida.
son indeoendientes? c) Con base en el inciso ó), ¿qué concluye con respecto a la
independencia de estas variables?
el problema 1.27 delapáryiaa 13, se describió una
d) Compare los resultados del inciso c) con los del inciso á)
a 62 estudiantes de licenciatura (véase el
del problema 4.69.
sus conocimientos sobre las tablas de conüngencia fusa la aseveración? ¿De qué manera calcularía y estable-
adecuada de las probabílidades simple y cería la probabilidad de tener un índice de ¡endimianto
a 6te u$o digital secuencial del capíulo 3. anual no menor a 15%?
2. Con la tabla bajo el encabezado "Show Me The Winning
la "Guía oara inverti¡" de En-
Probabilities", calcule las probabilidades adecuadas para
Services y lea la información acerca del Pa-
el grupo de inversionistas. ¿Qué error se cometió al
inversión garantizada (PIG). Lea las aseveraciones
reportar la aseveración de 7% de probabiüdad?
los datos de respaldo. Luego responda las si-
3. ¿Existe algún cálculo de probabilidad adecuado para ca-
Feguntas: lificar un sewicio de inversión? Explique su respuesta.
tan orecisa es la aseveración sobre la probabilidad
del PIG de EndRun? ¿En qué aspectos es con-
]
172 cAPfruLo 4 Prcbsbilidad b¡isica
T
l. Bellhouse, D. R, "The Reverend Thomas Bayes, FRS: A
Biography to Celebrate the Tetcentenary of His Birth"'
4. Mínitab Release 1ó (State Collegc, PA.: Minit¡b,
2010 ).
,-l
Stttistícal Science, 19 (200a), p,p. 343. 5. Paulos, I. A. Innumeracy (Nueva York Hi[ and Vog
2. Low4 D. y C. Meek, "Good Word Attacks on Statistical le88).
Spao Filters", presentado en la Seguoda conferei¡cia so- 6. Silberman, S.,'"The Qu€st for Meaning", W1rcd 8.02,ta
bre correo electrónico y antispao, CEAS, 2005. b¡ero de 2000.
3. Miuosofi Excel 20J0 (Rednon4 WA: Microsoft Corp.' 7. kllq,T., "fheFigbtAgainst V1@gra (and Other Spq¡
2010). The New Yo* frmes,2l de nayo cle 2006, pp. 81,86.
i)
N
N
N
*;
.\.-:
rBA
:sn
tl
.lt
{':
'_a''lr
:i.:
**r
!ri
r['{
.ri*
:a: i
tr
I
,--
6uía del caoih:lo 4 para Excel 173
a,
o
o
o
(D
or
160.
7" fotd: 0.5 Joint Revi5ed
Escriba sobrqesos valores cuando inerese los datos de
otos problemas. =85 ' C5 =D5l$0S7
una expresión
que utilice el operador exponencial Escriba una expresión que utilice la función PERMU-
ejemplo,la expresión 6 ** 2 calcula la respuesta TATIOI{S(2, x) par¿ calcular el núme¡o de maneras de aco-
ejimplo 4. 1 I de la Página 1 64. modar r objetos seleccionados de n objetos en orden. Por
ejemplo, la expresión PERMUTATIONS(d, 4) calcula la
de conteo 2 respuesta para el ejemplo 4.14 de la págin¿ 165.
a,
o
o
o
(D
o)
Distribuciones
de probabilidad discreta
\\\
\i:.:
+;a.:
"'itr,-.;
..,']
_ r:.:
iL;';
!;
i,, l1
ll;.11-
¡; r.r',
''l 'l
'lrr.l
q:11: tj
'1,¡Il
r.i,, "l
n Saxon Home Improvement
sted trabaja como cont¿dor en Saxon Home knprovement Company, una empresa que
adminisba sus operaciones contables y funncieras utilizando un sistema muy modemo
de infonnación para contabilidad
Los sistemas de información contable reúnen, procesan, almacenan, tansforman y
distribuyen información financiera a los individuos que toman decisiones tanto en el
interior como en el exterior de una organización empresarial (véase la referencia 4). Estos sistemas
auditan de manera continua información contable, buscando errores o información incompleta o a,
improbable. Por ejemplo, cuando los clientes de Saxon Home Improvement Company envían pedidos
en 1íne4 el sistema de información contable de la empresa reüsa los formaúos de pedido par¿ enconÍar
posibles enores. Cualquier factura cuestionable se marca e incluye en un inforne diario o
o
de excepciones. Datos recientes ¡ecolectados por la empresa indican que la probabüdad de o
que un formato de pedido esté marcado es de 0.10. A Saxon le gustaría (D
't77
178 CAPÍTULo 5 Distribuciones de prob¿bilidad disqeta I
¡
¡ De qué manera pgdría Saxon Home Improvement Company deterninar la,solución par¿ on I
.i tipo de problema de probabilidad? Una forma consiste en uttlizar un modelo, o ma rep¡eser l
a pequeña escala, que se aproxime al proceso. Utilizando una aproximación ¿s ish
futu"iOo
tipo, tos gerentes de Saxon podrían hacer inferencias acerca del proceso actual de los pedidos ¡j
es dwir, modelos nabná.
este casolos di¡ectivos podrían utilizar distribuciones de probabilidad,
ticos adecuados pam resolver el tipo de problemas de probabilidad que los gerentes enftent¿¡1
de proba¡i[
En este capítulo se presenta el concepto y las caracteústicas de las disnibuciones
y
dad Ademas. se estudia la manera en que se aplican las distribuciones bl¡omial de Poisson p¡¡
resolver problemas de negocios.
por díael
Por ejemplo, en la tabla 5.1 se presenta la distribución del número de intemrpciones
que todos los result¡'
un" gran ."d de computadoras. La lista de la tabla 5.1 es exhaustiva debido a
dos iosibles estrí,n,incluidos.
por consiguiente, las probabilidades suman 1. La figlra 5.1 es urú
representación gnifica de la tabla 5.1.
interrupoones 2 0.20
por día 3 0.10
4 0.05
) 0.05
FIGURA 5.1
Distribución de
probabilidad.
del número de
intenupciones
por día
o t u x
,ntluo",otn"" oo1o,"
dondé:
Para la distribución de probabilidad del número de intemrpciones por día en una gran red de
computadoras (tabla 5.1), el valor esperado se calcula de la siguiente manera, utilizando la ecua-
ción (5.1), lo cual también se muesta en la tabla 5.2.
.1V
tL=E(X)=)x¡P(X=x¡)
= (0)(0.35)+ (r)(0.25)+ (2)(0.20)+ (3)(0.10)+ (4)(0.05)+ (5)(0.05)
a,
FLA s.2 Interrupciones por
del valor dla (.r¡) P(X = r) xf(X = x¡)
o
Para
de 0.3s' (0x0.35) = 0.00 o
o
0.2s (l)(0.25) = 0.25 (D
0.20 (2)(0.20) = 0.40 o
0.10 (3)(0.10) = 0.30
0.05 (4x0.05) = 0.20
0.05 (5X0.05) = 0.25
1.00 p=E(4=r.to
El valor esperado es 1.40' El valor esperado de 1.4-para el número deinterntpciones por día no
es un resultado posible, ya que el número real de interrupciones en un dia determinado debe ser rm
valo¡ entero. El valor esperado representa el oúme¡o medio de interrupciones en un día determinado.
DESVIACIÓNESTAI\DARDEUNAVARIABLEALEATORIADISCRETA
i - i.+¡'1o.os) + (s -
1+
1.4)'?(0.05)
= 2.04
TABLA 5.3
Interrupciones
Cálculo de la por dla ( x-- :¡P(X = -x¡ lxt - E(x)12 P(X =
varianza y Ia
desviación estándar 0 0.35 (0x0.35) = o.oo (o-1.4)'?(0.35) =0.686
para el número I 0.25 (l)(0.25)= 0.25 (1 -1.4)'?(0.25):0.040
de intenuPclones z 0.20 (2)(0.20) = 0.40 (2-1.4)2$.20):0.w2
por día
J 0.10 (3x0.10) = 0.30 (3-1.4)'z(0.10) =0.256
0.05 (4)(0.05) = 0.20 (4-1.4)'?(0.05)=0.338
5 0.05 (s)(o.os) = o.zs ls-r.4)2(0.05)=0.648
l---.---------¡-
1.00 P=E(x)=t'40 o" = 2.M
o=r/7=\,5.04=1.42t3
es l 4' la varialza es 2 04' y la desna
De esta maner4 el número medio de intemrpciones por dia
por üa'
ción estandar es aproximadamente 1'43 intempciones
.1
).1 Distribución de probabilidad para una variable aleatoria disc¡eta 1 81
i Recie emente, un concesionario regional de automóvi- c) Calcule el número esperado de llegadas por mhuto.
publicitarios a clientes potenciales, rndicán- á) Calcule la desviacióo estándar.
e¡vtó folletos
oue habían ganado uno de tres premios diferentes: un 5.ó El gerente del departamento de crédito comercial de un
"
6ptima valuado en $15,000, una tarjeta para gasolina de banco grande ha reunido datos du¡ante los últimos dos años
Án v una tarjeta para comprar en Walmart con un valor
con respecto al número de hipotecas comerciales aprobadas
ii.'para reclamar el premro, el prospecto de cliente necesi-
fotteto publicitario en la sala de exhibición por semana. Los result¿dos de esos dos años (104 semanas)
aJresenar el
indicaron 1o siguiente:
concesionario. En la parte trasera del folleto, con lehas
estaban impresas Ias probabilidades de ganar. Las
de ganar el automóvil eran de I en 31,478; ){úmero de hipotecas
probabilidades de ganar la ta{eta para gasolina eral de I
comerciales aprobadas Frccuencia
j1,418,y las Vobabilidades de ganar la ta{eta de Watnart
0 IJ
de3t,476 en31,418. I 25
rCuántos folletos publicitarios piensa usted que envió el 2
io¡cesionario de automóüles?
J t7
Con su respuest¿ al inciso a) y las probabiüdades descri-
9
tas en el folleto, ¿cuál es el valor esperado del premio
f 6
samdo por un cliente potencial que recibe un folleto?
Óonsiderando su respuesta al inciso a) y tas probabilida- 6 I
des descrit¿s en el folleto, ¿cuíl es la desviación estiíndar 7 I
lel valor del premio ganado por uu cliente potencial que
a) Calcule el número de hipotecas comerci¿les aprobadas
recibe un folleto?
que la promoción sea eficaz? Explique su respuesta. por semana.
á) Calcule la desüación est¡índar.
En el juego de feria Under or Over Seven se laoza un
de dados legales (no trucados) y la suma resultante de- 5.7 Usted está tratando de desanollar una estrategia para a,
ina si el jugador gana o pierde su apuesta. Por ejemplo, invertü en dos acciones diferentes. El rendimiento anual an-
dor puede aposhr $ I a que la zuma seni menor que 7, es ticipado para una inversión de $ 1,000 en cada acción, en
2,3,4, 5 o 6. En esta apuesta, el jugador gana $1 si el cuaho condiciones económicas diferentes, tiene la siguiente o
es m€nor que 7 y pierde $1 si el resultado es igual distibución de probabiüdad: o
que 7. De manera similar, el jugador puede apostar o
(D
a que la suma será mayor que 7, es decir, 8, 9, 10, I I o 12.
Rendimientos
est€ caso, el jugador gana $ I si el resultado es inayor que 7; Probsbilidad Condición econémica Accién X Acción Y ro
pierde $ I si el resultado es 7 o menos. Un iercer método
juego consiste en apostar $ I al resultado de 7. En esta
0.1 Recesión -50 -100
eljugador gana $4 si el resultado del la¡z¿miento es
U.J Crecimiento lento 20 50
pierde $ I con cualquie¡ otro resultado. 0.4 Crecimiento moderado 100 130
Constrya la distribución de probabilidad que represente 0.2 Crecimiento nápido 150 200
Ios dife¡entes resultados posibles para una apuesta de $ I Calcule:
a un número menor oue 7. c) El rendimiento esperado para la acción.{y para la acción Il
Co¡shuya la distribución de probabilidad que represente
á) La desviación estríndar para la acciónXy para la acción )¡.
los diferentes resultados posiibles para uoa ápuesta de I
para utr nümero mayor que 7.
$ c) ¿Invertiría en la acciín X o en la acción I? Explique su
respu€sta.
Lonshuya la distribución de probabilidad que represente
los drterentes resultados posibles para una
apuesta de $l 5.8 Usted planea invertir $ 1,000 en un fondo de bonos cor-
at numero 7. porativos o en un fondo de acciones comunes. Se dispone de
) Demuestre que, sin importar cuál método de juego utilice, la siguiente información acerca del rendimiento anual (ror
. us ganancias (o pérdidas) del jugador esperadas a largo cada $1,000) de cada una de esas inversiones en diferentes
Plazo son las mismas. condiciones económicas, así como acerca de la probabilidad
registró el número de llegadas por mrnuto a un
Se de ocurrencia de cada una de esas condiciones económicas.
localizado en el dist¡ito de negocios de una gran ciu-
)
durante un periodo de 200 minuios.
Los ¡esultados fue- Condición Fo¡do de bono¡ Fondo de
los slguientes: Prob¿bllidadeconómica corpor¡tivos accione¡comune¡
MODELO MATEMATICO
un nodelo matemático es ima expresión maternrática que representa una variable de interes.
la probabilidad exacr
cuando se dispone de una expresión matemrítica" es posible calcular
Ia ocunencia de cualquier resultado específico de [a variable'
útiles. Se utiliza cuando l¡
La distribución binomial es uno de los modelos maiemáticos mrás
muestra de ¿ observacions'
variable aleatoria clisüeta es el número de eventos de interés en u¡a
La distribución binomial tiene cuatro propiedades básicas:
. La muestra consta de un número fijo de observaciones' n'
. Cada Observación está clasificada en alguna de dos categorías
mutuamente excluyent€sy
col€ctivamente exhaustivas'
.Laprobabüdaddeqrreunaobservaciónseaclasificadacomoeieventodeinteés'''e3c0ls
de que una observacion
tante de una observación a otra. Por consiguiente, la probabilidad
observaciones'
no sea el evento de interés, I - z, es constante a lo largo de todas las
.El¡esult¡dodecualquierobservaciónesindependientedelresultadodecualquielohaobsel.
vación.
de Saxon Home Impmve
Regresemos a la sección sobre el sistema de información contable
qu€ el evento de interés se defin
ment C"ompany, presentada en la página 177, y supongamos
comounformatoclepeaoomarcado.Ustedestáinteresadoenelnúmerodeformatosdepedi,lt
a.'::..)
marcados en una muestra determinada de estos'
qu
Si Ia úuestra contiene cuatro pedidos' uno podría ser
¿Qué resultados pueden ocurrir?
ningrin' pedido upar"zc" marcado' o que uno' dos, tres o cuatro
formatos de pedido estén mafia
'[,],¡i
r,,ÉlS
i.ir .\ Primer pedido Segundo pedido Tercer pedido Cuarto pedido
:
a = 0.10 zr=0;10 1-¡'=0.90 z¡=010
;
¡
5.2 Dis¡ibución binonial I 83
Cada resultado es ind.ependiente de los otos, ya que los formatos d€ pedido se seleccionaron
de una población muy grande o casi infinit4 y cada formato de pedido solo puede seleccionarse
una vez. Por lo tanto, la probabilidad de que ocura esta secuencia en particular es:
rr(l-r)r=i(r-n)l
= 1n r n.I3/o oo)l
= (0.10x0.10x0.10x0.e0)
= 0.0009
Este resultado indica solo la probabiüdad de tes formatos de pedido marcados (eventos de
interés) de
'na muesta de cuato formatos de pedido en una secuezcía específca.Pan calcular el
número de maneras de seleccionar ¡ objetos a partir de n objetos, independientemente de Ia se-
cuencia, se utiliza la regla de las combinaciones dada en la ecuación (5.4), la cual se definió
c.lculado¡¡s previamente en la ecuación (4.14) de la página 166.
eriste uD botóo
l¡ cu¿l lr
;"l.rlsr"c,,
cl qti@efo de COMBINACIONES ' ,.:
:. 't ' ..' '.:, ,r' ,
l
E¡ csa8 cálcu_
El nrúdero de. combinaciones al selecciónar ¡ objetosr a par-tir de 1 objaos esÉ dado pot:
clsimbolo ¡sc utiliza ' ' ', I | ,! , .
-
nC' =
.
(5'4)
,(r- ,).
donde: r ' .
Usted podni obtener intuitivamente los oÍos resultados posibles de la variable aleatoria (cero,
uno, dos y cuatro formatos de pedido marcados). Sin embargo, a medida que aumenta z, el tamaño
de la muestra, los cálculos que se tienen que hacer al utilizar este método inhritivo requieren
más tiempo. La ecuación (5.5) es el modelo matemático que proporciona una fórmula general para
calcular cualquier probabilidad a partir de la distribución binomial con el número de evetrtos d€
interés,.r, dados n ya.
184 cAPrrulos Distibuciones de probabilid¿d discreta
DISTRIBUCION BfNOMIAL
donde:
rr -- pmbabilidad de un
evento de interés
.
1 -7 = p'robabilidad de no tener un evento de interés
d(l - r)-'
r eventos de interés a partir de n observaciones en u¡
representa la probabilidad de exactarnente
seatencía parlictlar'
El térmi¡o :
nl
r(, - "I
de combinaciones de los ¡ eventos de interés a partir de ¡ observaciones posibla
es el número '
de un evento de interes' r¡' h
Por lo tanto. dado el núme¡o oe observaciones, n, y la probabiüdad
probabiüdad de;r eventos de interés es:
: - nl --i(I-rr)'-'
' x!(n - fJ!
Los ejemplos 5.2 y 5.p muesÍan los cálculos para otos valores deX
= 4!(o)!
-1-ro.r)o(o.s)o
''
= l(0.1X0.1X0.1X0.1Xl) = 0.0001
Así, la probabilidad de que haya al menos tes formatos de pedido marcados es:
P(x>3)=P(x=3)+P(x=+)
= 0.0036 + 0.0001
' = 0.0037
o
Hay una probabilidad de 0.37% de que haya al menos tres formatos de pedido marcados en una =
Euesta de cu¿to.
o
o
o
(¡¡
5.3 Si la probabiüdad de un formato de pedido marcado es 0.1, ¿cuál es la probabiüdad de que haya
N
m€nos de tes formatos de pedido ma¡cados en la muesFa de cuato?
< 3), dados SOIUC|óN La probabüdad de que haya metros de tes formatos de pedido marcados es:
yn=0.1 P(x < 3) = P(x = 0) + P(r= r) + P(x = 2)
Utiliz^ndo la ecuación (5.5) de la página 184, esas probabilida<les son:
4l
P(x = oln = 4,.1t = o.t) =
oGi oll
(o.l)0(l - 0.1)a-0 = 6.5561
. P(x=Iln=4,t=0.1)' =;;Ll
l!(4 - *(0.1)r(1
l)! ' -0.1)1-r =0.2er6
4t-
4,Í = 0D =
P(x = 2ln =
tg _ r);(0.1f(1 - 0.1)a-2 = s.0436
Por lo tanto, P(X< 3) = 0.656 t + 0.2916 + 0.0486 = 0.9963. P(X <3) tambien se podría calcu-
lar a partir de zu complemento, P(X> 3), como sigue:
P(x<3) = 1-4x>3)
=1-0.0037=0.9963
n=4y¡r=0.1
+rl'85
{¡. {r -05} Eiseia1 ritb n = 4 ard P = ¡.t
=5or{8rl
¡ Ptf =r)
o 0. at61
{rñoMors(^l4 S8$4 5835, t úq L 9.29L6
:8tNOMO|snAú, s6s4 s855, F^UE)
t^$q
2 0. 0t!86
4tñ oMors{a16 s8s4 s89t,
{rt{oMDlf(alt, i8s¡. s€s5, faLlE)
3 0.00É16
=sl¡¡oMoltrl^l& 98S4 SBS5' t uE) ,l 0. OOgl
valores de n y a. SieEre
La forma cle una distribución de probabilidad binomial depende de los
grande o pequeño sea el v a
que z = 0.5, la distribución binomial es simétic4 sio importar qué tan
se aproxima z a 0'5 y nayor ed
de n. Cuando z * 0.5, la distribución es asimétrica' Cuanto miás
Por ejemplo, la distribu
núme¡o de observaclones, n, menos asimétrica se vuelve la distribución'
hacia la derecha debido¡
ción del número de fonnatos de pedido marcados tiene un gran sesgo
que zr = 0.1 yn=4(véaselafigura53).
Histograma de
la distribución
de probabilidad
binomial con n= 4
yr=0.1
*
s
¡{
, '{i;
jrl!
:.ii:
' :.¡:
i. '.i.
conti¡uas de la"set
observe en la figura 5.3 que, a diferencia del histog¡ama para variables
r¡i;
:jl i' ción 2.6, las banas para los valores son muy delgadas y existe un
gran traslape
:"nt
tY#;.
:..i (Teóricament€' r?D *
valores.'Esto se debi a que el histograma representa una variable discreta.
i,it.
,i$, nas no deberían ser anchas, sino líneas vefticales), - - Fr
producto o".:!
xü$
t.¡!ti La media (o el valor esperado) de la disfibución bi¡omial es igual al ,::";
:! ]r lugar de utilizar la ecuación (5.1) de la página 179 pal:"- calcular la media de
d]'ho"itjljj-tt
I
vanables que hentu *'
uatiti¿a¿, podemos utilizar la ecuación (5.6) para calcular la media de
distribución binomial.
.1
)
5.2 Dist¡ibución binomial 187
Y'=E(X)=mr (5.q
4(o.lxo.e) = 0.ó0
o
Para las cadenas de comida nipida es muy import¿nte tomar pedidos precisos eu l¿ vent¿nfla de
o
5.4 o
sewicio al automóvil. !s m¡nsra psri$dic4 QSR Magazine (http:ihrww.qsrnagazine.com/) pu- qt
blica los resultados de sus encuestas. La precisión se mide como el porcentaje de pedidos que se N
N
entegan de manera correcta. Recientemente, el porcentaje de pedidos entegados de manera co-
necta en Wendy's fue de aproxi:nadamente 89%. Suponga que usted va a la ventanilla de servicio
al automóvil de Wendy's y hace un pedido. Al mismo tiempo, y de manera independiente, dos
arnigos suyos hacen pedidos en la ventanilla de servicio al automóvil de la misma tienda. ¿Cu.íles
son las probabilidades de que los Ees, ninguno de los tres y al menos dos de los tes pedidos se
en[eguen de manera correcta? ¿Cuáles son la media y Ia desviación estándar de la distribución
binomial para e[ número dcpedidos entregados.de manera correct¿?
p=E(n=nr=3(0.8e)
"= l7
= \/V",@ =
= \,6(osrxot D
= \/o2w = 0.5419
:;;*(o'¡e)r(o ll)o
de J !(J - Jrr
1en
= 1(0.8e)(0.8e)(0.8e)(1) = 6.7e5s
1 88 cAPíTWo 5 Distribuciones de probabilidad discreta
1l -
P(x = oln = 3,r = 0.4s) = --j (0.8ef(l - ¡.se¡r-o
=
0!13-0)t ' "
=:a-(0.¡9)o(o.ll)3
= 1(l)(0.11)(0.11)(o'tt¡ = ¡6et'
- 2t(3 - (0.s9)2(o.l
-;i: - 2\l' " I )'
= :(O.se)(0.8e)(0.11) = 0.2614
P(x>2)=P(x=2)+P(x=3)
= 0.2614 + 0.7050
= 0.9664
Muchos esü¡dios se basan en conteos de las veces en que ocuue un ev€nto en partiq¡ld enqerlaórca
de oporhmidad.Un área de oportunld¡d es u¡a unidad continua o un intervalo de tiempo, volumen
o cuatquier rárea fisica donde pueda haber mrás de un¿ ocunencia de uo eveno. Ejerylos de vaiables
que siguen la distibución Poisson son los defectos en la superficie de un auwo refrigerador, el oú-
mero de veces que falla una red en un di4 el número de penonas que llegan a u banco y el número de
pulgas que üven en el cuerpo de un perro. Podemos utiliz¡r la distribución Poisson para calcular
probabilidades en sih¡aciones como estas, siempre que se cumplan las siguientes propiedades:
. . Usted esüí interesado en contar el número de veces que ocurre un evento en particular en u:r
área de oportunidad dada. El rárea de oportmi¡¡d se define como tiempo, longitud, rírea de
superficie, etcétera
. La probabilidad d€ que un evento ocurra en un á¡ea de oportunidad dada es la misma para
todas las áreas de oportunidad.
. El número de eventos que ocurren en un área de oportunidad es independiente del número
de eventos que ocurren en cualquier ot¿ área de oporh¡nidad.
. La probabilidad de que dos o más eventos ocuran en un rírea de oportunidad se aproxima a
cero a medida que esta se vuelve más pequeña.
Considere el número de clientes que llegan durante el almuer¿o a un banco localizado en el
distrito central de negocios en una gran ciudad. A usted le interesa conocer el número de cüentes
que llegan cada minuto. ¿Esta situación cumple con las cuatro propiedades de la dishibución Pois-
son descritas anteriormente? En primer lugar, eI nento de iaterés es la llegada de un cliente, y el
área de oportunidad dada se defne como un intervalo de un minuto. ¿Llegaún cero clientes, un
cliente, dos clientes, etcétera? En segundo lugar, es razonable suponer que la probabilidad de que
un cliente llegue durante un intewalo específico de un minuto, es la misma que para todos ios otos
i¡tervalos de un minuto. En tercer lugar, la ilegada de un cliente en cualquier intewalo de un mi-
nuto uo tiene efecto alguno, es decir, es independiente de la llegada de cualquier oto cliente en
t__.
cualquier otro intervalo de un minuto. Por último' la probabifdad de que.lleguen dos o *is c¡er
tes en un periodo dado se aproxima a cero a medida que el intewalo de hempo se welve ¡¡¿, n.
queño. Por ejemplo, la probabilidad de que dos cüentes lleguen en '¡ intervalo de 0 01 seg¡¡[[
es pnicticanentó de ceio. Por lo tanto, podemos utilizar la distribución Poisson para deter¡,ol
probabiüüdes que involucran el número de clientes que llegan al banco en un intervalo deu¡ri
nuto durante la hora del almuerzo.
La distribución Poisson tiene una característica, llamada ,\ (la letra griega minuscula /dnódul
que es la media o el númao esperado de eventos por unidad- I¿ varianza de 'na distrfuución Pois¡i
también es igual a ,\, y la desviación estándar es igUal a ,\ . El número de eventos,..l de la va¡iablc
aleatoria Poisson oscila de 0 a infinito (co).
La ecuación (5.8) es la expresión matemática para la distribución Poisson que permite calculat
la probabilidad de f= ¡ eventos, dado que se esperan ,\ eventos.
Pafa ilusü'ar una aplicación de la distribución Poisson, suponga que el número medio de cüet :
tes que llegan por minuto al banco enhe el mediodía y la I p.m. es igual a 3.0. ¿Ctuíl es la
probabr' :
'
uaaa oe que en un minuto dado lleguen exactamente dos clientes? ¿Y cu.il es la probabilidad &
que lleguen más de dos clientes en un minuto dado?
utilizando la ecuación (5.8) y I = 3, la probabilidad de que en un minuto dado lleguen exrt' -
para determina¡ la probabilidad de que lleguen más de dos clientes en cualquier minuto d¡¡^
que Xsea menor que o igual a 2, es decir, 1 - P(X< 2). Por lo tanto,
, + n * a l
fe-3.0(3.0)0 r3.0(3.0)r ¿-3.0(3.0)2.l
p(x>z)=t-L
= I - [0.0498 + 0.1494 + 0.2240]
=I-0.4232=0'5768
en el mtstno
De esta manera, existe una probabiüdad de 57.68% de que lleguen mrás de dos cüentes
mrnuto.
El cálculo de probabilidades Poisson tal vez sea tedioso. En la figura 5 4 se mu:sTa]i
fli#
(derer'
en que se calculan probabilidades Poisson por medio de Excel (izquierda) y Minihb
en el ap¡up-
Este tipo de probabüdades tambien se pueden buscar en una tabla, como se analiza
Poisson, disponible en línea en la página de descargas de este libro.
Problemas pan la sección 5.3 191
A 5.4
cálculo de
para el
irobabili-
<ón con
o
o
Se sabe que el número de lesiones de trabajo me$n¡ales €n una planta de meufactura sigue rma disti- o
(D
bución Poissoq coo uDa media de 2.5 lesiooes de babajo mensuales. ¿Cu.il es la probabilidad de que en
N
un mes determinado no ocuran lesiotr€s de fabajo? ¿Y de que ocuna al me[os una lesión de fabajo? A
SOLUCóN Utilizando la ecuación (5.8) de la página 190, con ,\ = 2.5 (o Excel, Minitab o 'rn,
tabla de Poisson), la probabiüdad de que en un mes dado no ocurr¿n lesiones de tabajo es:
o-2.5 ¡1 5¡0
P(X=0lr=2.5)=-
' il'-'=
u! (2.7r82q2s0)
= 0.0821
P(x>1)=1-P(x=0)
= 1 - 0.0821
= 0.9179
oue esta situación cumple con las propiedades c) se reciban hes o más llamadas telefónicas?
en el inciso a), ¿cuál es la
probabilidad de que du- d) ¿Curíl es el número mrlximo de llamadas telefonicas que se
recibinín en un periodo de un minuto el 99.99% del tierpo?
f"flIJ;:'. llamadas telerónicas?
=
o
o
o
caoítulo estudiamos la esDeranza matemática (el va- ¿Hay un número ñjo de obsewaciones, n, cada una de
(¡¡
Y- Poisson
Cornbinaciones e-^ E
akl
P(X = ;r l,\) = (s.8)
(s.4)
.r!(n - .r) |
194 CAPÍTULO 5 Distibuciones de probabilidad discreta
I
l
,RN/,iltt\Í'os 'ejLA ¿
I
distribuciónPoisson 189 valor esperado, P, de una variable
área de oporhrnidad 198
modelo matemático 182 aleatoria disc¡eta 179
desviación estandar de una variable
regla de combinaciones 183 varianza de una variable aleatona
aleatoriadiscreta 180
valor esperado 178 discreta 179
distribuciónbinomial 182
distribución de probabilidad para una
variable aleatoria disc¡eta l7E
a) el siguiente año?
VERIFIOUE SU COMPRENSÉN
á) el año posterior al siguiente?
5.32 ¿Cuál es el significado del
valor esperado de una dis-
ci en cuatro de los siguientes ci-nco años?
tribución de Probabilidad? l¡ en ninguno de los siguientes crnco años?
5.33 ¿Cuáles son las cuatro propiedades que deben estar ,Í Put" .itu situación, ¿qué supuesto de la distribución bi'
juego Van-
Hvbrid al aiotar 15 goles en 24 segundos en el ¿) ocho tensan un teléfono celular?
couver Canuck Nanonal Hockey League (B' Ziemer"Darwtn ái al menoiocho tengan un teléfono celular?
óe fe'
Evolves into an I¡stant Miilionaire", Vancower Sun, 28 c) los l0 tengan un teléfono celular?
dinero para-pagar muesb:¿ en una zona geogranca o
brero de 2008, p. 1). Head dijo que usaría el d) Si usted seleccionara la
su hipoteca y dar manutención a sus hijos,
y que no teDla pla' partrcular y encontrara que mnguno de los l0 paficipants
-tenia
nes de renuncia¡ a zu t-abajo. El concuno en pafe del
Chevro' teléfono celular, ¿qué diría acuca de que el porceDqe
de 8570?
let Malibu Million Dollar Shootout' paüocinado por General de dueños de teléfonoJ cilula¡es en esta rárea er¿
Motors Canadian Division. ¿La GM de Canadá amesgó el 5.38 Una teoría respecto del Índice Dow Jones lndustrui
los anos de
millón de dólares? ¡No! GM de Canadá adquirió un seguro Dlantea que es probable que este aumente durante
!i.".ioo.t p..ri¿.ociales en Estados Unidos De l9ó4 a 2trE
para eventos con una empresa especializa<la en prcmoclones en
de biás- ei Ío¿i.. Oo* ¡ones Industnal aumentó en 9 de los 12 a¡os
eventos deportivos, como un ti¡o desde media cancha
quetbol o un regalo por un hoyo en rmo en el tomeo de golf lo- áL .I...ion", pr.tidenciales en Estados Unidos' Suponte.
ál de candad. La empresa de seguros para eventos estima Ia 0". Iti. i"c.á¿ot un evento aleatorio sin valorpredietivo'
que "s
el indicador fuera conecto 50% de las veco'
probabilidad de que un participaote gane el concuno y' por un si esperaría
;t' que el Índice Dow Jones au'
iobro ¡nodesto, asegurá el evento. Los promotores pagan
la ;¿;i ü probabilidad cle
prima del seguro. pero no asumen ningún riesgo adicional' ya irente ";
en 9 ó más de los 12 años de elecciones
presidocir'
Ies en Estados Unidos, si la probabilidad de un
incre¡ne¡to
que la emp.eia deieguros pagará la cantidad mayor en el caso
N i-p.oU"Ut. de que un participante gane' Para ver cómo firn- en el Índice Dow Jones es de 0.50?
á) ; Cuál es ta probabilidad de que el indice Dow
Jones au
.,( ciona esto, .upoog" qrl" la ernpresa de seguros estima-que
la -'
t,¡ gane rm tiro de un millón de it.nt" .n S o rn^ de los 12 añós de elecciones presidenoa'
orobabrlidad de que ur participante
les en Estados Urudos, si Ia probabilidad de un
incremeru
if\!r iólares es de 0.0bt y que la anpresa de seguros cobra $4,000' de 0 75?
en el Índice Dow Jones en iualquier año es
.:l c) Calcule el valor esperado de las ganancias de la empresa
:.ii. de seguros' 5.39 Los enores en el proceso de facfi'ración a menudo-DtÚ
es una ¿'*,
: :!i^ á) Muchos consideran que este tipo de situación vocan i¡sarisfacción en los clientes y, en último termuu
de seguros y eÍ
i..* oporhnidad de ganar-ganar para la empresa nn las ganancias generales. Un artículo plblicado yuo:::
i ..1 ptomoto. ¿Está de acuerdo? Explique su respuesta' Progresi 1L. Tatikonda 'A Less Costly nilline ftggess
"i -'"v;
fityhrogress, enero de 2008, pp. 30¡38) se refirió
a unx
i.i\ 5.3ó Enhe 1896, el año en que se creó el índice Dow Jones' y ",u
',:: enOrcs "
(datos extraídos-de oresa doinde 4002, de las factur¿s emiridas contedan
1;ü 2009, el índice aumentó en 64% de los años que
M. úulbert, "What üe Past Can't Tell Invutors", The New ,, p...tun 10 facturas, ¿cuíl es la probabilidad de
:,$ c) cero facturas contengrn enores?
est¿ ut-
York Times,3 de enero de 2010, p BUZ)' Con base
{,-l en
distribución binornial' ¿cuál cree ,) exactamente una factura co[tenga un error'f
formación y suponiendo una
aumente ci dos o m:ís facturas contengan erores?
que es la piobabilidad de que el mercado bursátil
Problemas de repaso del capítulo 1 95
Cuáles son
la media y, La desüación esrándar de Ia disfi- 5.44 Una teoría respecto del Índice S&P 500 plantea que si
,,/:iótr de ProbaDl oflo l este aumenta durante los primeros cinco días comerciales del
problema 5.39. Suponga que una inicia- año, es probable que aumente durante el año completo. De
Remítase al
la calidad ha reducido el porcentaje de 1950 a 2010, el indice S&P 500 tuvo estas tempmnas ganan-
o¿¡a mejorar
errores a 20010. Si se procesan l0 fac- cias en 39 años. En 34 de esos 39 ¿ños el índice aumentó du-
¡¿s que contienen
la de que rante todo el año. Suponiendo que este indicador es un evento
is, ¿c,ríl es Probabilidad aleatorio sin valor predictivo, se esperaría que el indicador
'cero
facturas conteng¿rn errores /
una facfilfa contenga un enor? fue¡a conecto 50% de las veces. ¿Cu.ál es la probabilidad de
i*u,*rn " que el indice S&P 500 aumente en 34 o más años si la proba-
fachuas_contengan enores?
¿¡s o más
bilidad verdadera de un incremento en el índice es de
,ruriles son la media y la desviación estíndr de la distri-
¿) 0.50?
iución de Probabilidad2
b) 0.701
Cgrnpare los resultados
de los incisos a) a c) con las res-
de los incisos a) a c) del problema 5.39. c) 0.90?
d) Con base en los resultados de los incisos a) a c), ¿cuál
¡,1 El inicio de sesión en rma red social implica recomenda¡ cree que sea la probabilidad de que el I¡dice S&P 500
ir un artículo que se haya leído en línea. En el primer
aumente si existe una ganancia temprana en los primeros
de 2011 (T. Wayne. One Log-In Catches on for Many
dias comerciales del año? Explique su respuesta.
*", Drilling Down, The New York Times, 2 de mayo de
ll, p. B2), segun Janr¿in, 35% de los usuarios iniciaron se- 5.43 Una conelación upuria xrefiete a la relación aparente
por m€dio de Facebook y 3 I % por medio de Google. entre variables que no tieúen una verdadera relación o que
Si se selecciona una muestra de 10 i¡icios de sesión en la estiín relacionadas coD otras v¿riables que no se ban medido. Un
social, ¿cual es la probabilidad de que índice del mercado de valores muy conocido en Estados
miás de cuatro inicien sesión utilizando Facebook? Unidos, que es ejemplo de ''¡¡ correlación espuri4 es la rela-
de cuaho inicien sesión utilizando Goosle? ción ente el ganador del Super Bowl de la Nation¿l Football
nineuno iricie sesión utiüzando Facebook? League (NFL) y el desempeío del lndice Dow Jones du¡ante a,
¿Qué suposición debe hacer para responder a los incisos ese año. El "indicado/' establece que el año en que un equipo
a c)? que existía antes de que la National Football League se fusio-
Una de las mayores tustaciones para la industia de los nara con la A¡nerican Football League gana el Super Bowl, el o
electrónicos es que los clientes están ¿costumbra- Índice Dow Jones aumentaní. (Desde luego, cuaQuier corre- o
a devolver los productos por cualquier razón (C. lación ente esto es espuri4 ¡ya que un a¡¡unto no tiene abso- o
(D
"The War on Retums", The Wall Steet Journal, 8 lutamente nada que ver con el ota!). Desde que se realizó el N
mayo de 2008, pp. Dl, D6). Recientemente se reportó que primer Super Bowl en 1967 hasta 2010, el indicador ha estado o)
de las devoluciones "no se encontró un Droblema". en lo corecto en 35 de ,14 veces (datos exü"aidos de W. Powo,
una muestra de 20 clientes que devolvieron los '"The Bulls Want Jets Grounded", Ifr¿ Wall Steet Journal,22
electónicos que adquirieron. Utiiice el modelo bino. de enero de 2011, p. B2). Suponiendo que este indicador es
par¿ rcsponder las slgulentes pregufitas: un evento aleatorio sin valor predictivo, se esperaría que el
¿Cuál es el valor esperado o la media de la distribución indicador esh¡viera en lo conecto 50% de las veces.
binomial? c) ¿Cuál es la probabilidad de que el indicador esté en lo
¿Cuí,I es la desviación esríndar de la
distibución binomial? conecto 35 o más veces en 44 años?
¿Curíl aprobabiiidad de que 15 de los 20 cli€ntes devuel-
la á) ¿Qué le indica esto acerca de la utilidad de este indicador?
van un aparato en el que 'ho se encontó un problema"?
5.4ó En 2009 se perdieron aproximadamente 300 millones
¿Cuál es la probabilidad de que no más de 10 de los
de pelotas de golf en Estados Unidos. Suponga que el nú-
clientes dewelvan un aparato en que ,,no el se encontró
problema"? mero de pelotas de golfperdidas en un partido de 18 hoyos
un
se distribuye como una variable aleatoria de Poisson con
¿Cr:.íl es la probabilidad de que l0 o m¿ás de los clientes de-
vuelvan un aparato en el que una media de 5 pelotas.
'ho se mcontró un problema"?
a) ¿Qué supuesto se necesita hacer p¡¡ra que el número de
¡.43 Remítase al problema 5.42. Durante el mismo pe-
pelotas de golfperdidas en un partido de 18 hoyos se dis-
nodo, 27oA de las devoluciones se debieron ,.anepenti-
a tribuya como una variable aleatoria de Poisson?
¡uento del comprador".
¿)
Si se hacen las suposiciones del inciso a), ¿cu.íl es la proba-
¿Cuál es el valor esperado o la media de Ia distribución
bnomial? bilidad de que
ó) á) se pierdan 0 pelotas en u¡ partido de 18 hoyos?
¿Curíl es la desviación estrindar de la
distrbución binomial?
F c) ¿Cuál es ta probabilidad c) se pierdan 5 o menos pelotas en un partido de 18 hoyos?
de que ninguno de los 20 clien-
Ies devuelva un aparato "porque d) se pierdan 6 o m:is pelotas en un pafido de 18 hoyos?
€s. si ,, se arrepintió"?
d)¿Cuál es
la probabilidad áe que no más de 2 de los clien- 5.47 Según una encuesta de Virginia Tecb, los esh¡diantes uoi-
Ies hagan una
-, devolución "porque se arrepintieron"? versitarios realizan un promedio de l1 llamadas por teléfono
¿)
¿Cuál es la probabilidad dl qúe 3 o más de los clientes celular cada día. Ademrís, 80% de los estudiattes encueshdos
laga¡ nn¡ (sy6[¡6ión "porque se arrepintieron"?
indicaron que sus padres pagan los gastos de su teléfono celular
196 CAPÍTITLO 5 Distibuciones de probabilidad disc¡eta
servi 3 6
no se agregan canales de alta calidad a la ofert¿ del
s
litu
cio 3-For-All, dados los resultados anteriores' ¿cuál es
probabilidad de que
la 4
5
6
,7
.iil
.f,{} ¿) menos de tes clientes se suscriban al seúicio 3'For-All?
calidad gratuitos debe recomendir
ái cero clientes o un cliente se suscriban al servicio ¿Curintos canales de alta
t,h la directora de investigación que se incluyan en el
servici0
I' irtr 3-For-Alf!
rrii:
c) más de cuato cüentes se suscriban al sewicio 3'For'Al!l 3-For-Alll Explique su respuesta.
l:ir t¡c
3. Minitab Release 16 (State College, PA: Mínrtab'
,: i* l. Levine, D. M., P. Ramsey y R. Smidt, Applíed Statistics
l0).
$$ - - ¿t ¿ ngineers and Scientkts (Jsing Miuosoft Excel and
'M¡n¡tib
20
A., M. G simkin y N A Bagranofl
[od
ll CtJooer Saddle River, NJ: Pientice Hall' 2001)'
4. ü;r.0"., S.
L io'-
'
\ Concepts of Accounling Informatíon Syslems'
2. Microsoft Éicel2010 (Redmond, WA: Microsoft Corp''
2010). fNueva York: WileY, 2010).
uura oe I caplruo ) para txcet ly I
PIENSE EN LO SIGUIENTE:
¿Qué es normal?
EXPLORACIONES
VISUALES.
Exploración de la
distribución normal
probabilidades a partir de
distribución normal para re
,--l
OurCampus !
201
202 .**tJ-^.oució¡norm¿l
T
fl n el capínrlo S,.los di¡ectivos de Saxon Home lmprovement Company deseaüan respqnl I
ff preguntas acerca del número de articulos m¿rcados en un tamaño de muesra ¿eterhi¡; i
IJComo diseñador de OurCampus!, usted enfrenta una tarea dif€rente, la cual inplie J E
medición continua debido a que el tiempo de descarga podría tomar cualquia valor y no s¡¡fr !
núme¡o entero. ¿Cuáles serían sus respuestas a preguntas como las que siguen acerca ¿s,fr i
variable mtmérica continua'l t
. ¿Qué proporción de las descargas del video toman más de 9 segundos? [
. ¿Cuantos segundos transcurren antes de que se complete el 10% de las
descargas?i
. ¿Cufurtos segundos üaúscurren atrtes de que se complete el 99olo de
las descargas?i
. ¿Cóno influhán las mejoru en la tecnología de ta¡smisión mullimedia que se utilice e[ ¡¡¡ |
respuestas a estas Pregultas? !
Al igual que en el capítulo 5, puede utilizar una distibución de probabilidad como modelo.lr
lecfira de este capíhrlo le ayudará a conócer las características de las distsibuciones de probabili¿¡¡
continuas y la manera de utilizar la distibución normal para resolver problemas de negocios.
FIGURA ó.1
Tres distribuciones
u,
de probabilidad
continuas
o
Valores de X Valores de X Valores de X o
Gráfica A Gráfica B Gráfica C
o
(D
D¡stribuc¡ón normal Distribuc¡ón uniforme Distribución exponencial N
to
La gnífica A describe ¡nt distribución ¿orn¿l. La distibución normal es siméúica y forma w
campan4 lo que impüca que la mayoría de los valores tienden a agnrparse alrededor de la mdi4h
cu¿I, debido a la foma siménica de la distibucióq es igual a la mediana- Aunque e,n una distrtuciot
nonnal los vaiores pueden variar desde el infinito negativo hasta el infilito positivo, su forma h¡a
= que sea muy improbable que ocun'aa valores extemadame,nte grandes o muy pequeños.
-
i La gniirca b describá wa disnibución unifurme, donde cada valor tiene la misma probabiü
dad de ócur¡i¡ en cualquier parte del rango, ente el valor mrás pequeüo y el valor más grande i'a
distibución unifon¡e, que también se conoce como d¿s tribución rectangular, es simétric4 por Io
oo'f"Tffi:'¿#
ili?#ff;^^"rn
exponenciat,taotal eshi sesgada hacia ra derecha,Eo
¡t vocando que la media sea menor que la mediana. El rango para una distribución exponenculvl
*, _ , -
d9!99¡o aiinfurito positivo, pero su forma hace que sea muy improbable la ocunencia de valorel
..-
,ñ.
. rfreptdametite giandesr'
,l
't
-*I
.
',i
'-6.2 Distribuciónnormil
- -
-:--
.ir : -. La distribución.normal (en ocasiones conocida como distribución gaussiara) es la distribuoor
,,i
1¡
conti¡ua de uso m¡ís común en Ia estadística. La distibució¡ normal es muy importante pars
.i estadística sobre todo por hes razones:
¡r{ . Diversas variables continuas que son comunes en la adminisF¿ción tienen distribucio¡d
t.:;
i[.]
.- parecen
^,,- se
que -,,^La aa la
^".-^- mucho r. distribución normal. . !:ri_
+ . La distibución normal se puede utilizar para aproximar varias distribuciones de probour
.'i
'\,, .
dad discretas.
a9
La distribución normal conformq las bues parala inJer.m! eydí:t(y cl,á1!9¿ debido
relación con el teorc¡na del límite central (que se estudia¡á en la sección 7.4)'
6.2 Distihxión ¡orn¡l 203
A ó.2
ray
de
relat¡va
de
en 1 0,000
de una
gaseosa
datos
de /a
1.025 1.035 1.045 1.055 1.065 1.075
1.03 1.04 1.05 1.06 1.07 1.08
C€nt¡dades de llenado {litros}
204 cA.Pfrulo 6 Distibución normal
Para esos datos se cubren aproximadamente las primeras tes propiedades teóricas
de la disq6
ción no¡mal. Sin embargo, la cuart4 esto es, que tenga un raago i¡finito,.no se cum¡le. c¿¡t¡* la
de lle,¡ado en una botella no puede ser cero o menos de cero, y es imposlble renafla q1s dlá Oo,
capacidad. En la tabla 6.1 se óbserva que se espera qurc solo 48 de cada 10,000 boqlT,l*td^ -;
que 1'025 üfos
tengan 1.08 litos o más, y se espera que el mismo número conteogn€nos
Elsimbolo/(l)seuol-p-n'.p..'*t''unafimcióndedensidaddeFobabilidad.I.¿folcü[
póbabilidaá parala distribución normal está dada por la ecuación (6.1).
de densirtad dá
Aunque la ecuación (6. i ) tal vez parezca complicad4 ya que como .¿ y t¡ son constantes m&. ,
valores particulare s de p y o, se genera una distribución de probabili dad Ñtual diferente.E\h '.
Io
FIGURA ó.3 c¡
Tres distribuciones
c¡
normales
o
Ti€mpo de d$cargE
d6lv¡d€o de Ourcamousl
I 11 13 Escslsx(p=7,a=21
+1 +2 +3 Escalazlt¡=0.o=1)
Z= - ¿ = -3
='
En la figura 6.4 se obsen a que la dewiación estrá¡dar es la unidad de medición En otra6 pala-
bras, un tiempo de 9 segundos es 2 segundoo (t desviación estÁndar) mayor (;zrÍs brro) que el tiempo
promeilio de 7 segundos. De m¡aera simila¡', un tiempo de I segundo es 6 segundos (3 dewiacio-
nes esüindar) menor (nas rópido) qre el tienpo promedio.
Pr:¿ ilustar más l¡ f&mula dc transformacióD, srponga que el tie."Fo de descarga de un video
de oto sitio web se disnbuye de manera nomal, con
"n¡ media p = 4 segundos y una desviación
esüínda¡ o = I segundo. En la ñgura 6.5 se presenta esta distibución.
4 Esca¡a X{p= 4, a= 1)
-3 -2 -1 0 +1 +2 +3 Esc8l8 Z(p= 0. d = l)
_._: il
206 cAriTuLo6 Distibución nonnat F
I
A1 comparar esos resulados con los del sitio web de OurCampus!, se observa que un tie6* í
descarga de 5 seguodos estrí I desüación esüinda¡ por arriba del tiempo medio de descarga pqrqt- "
a-L
Z=:------ =+l
Un tiemrpo de I segrmdo esüi 3 dewiaciones estrindar por debajo del tiempo nedio de descarga porqq
Después de obtener el valor Z buscamos la probabilidad normal utilizando una tabla de v¡¡"
res a partir de la distibución no¡mal esuindar acumuladg como la tabla E.2 del apendice !. 5|l.
ponga que quiere calcular la probabilidad de que el tiempo de descarga para el sitio web de
OrCampus! es menor que 9 segundos. En la página 205 vimos que la tansformación de X= 9 a
unirtadesZestándar,dadasunamediadep=Tsegundosyunadesüaciónest¡indaro=2se$¡.
dos, conduce a un v¡e¡ / ds + 1.00.
Una vez que tenemos este valor, utilizamos la tabla E.2 para calcular el área acumulativa bg6
la curva ¡o¡mal menor que (a la izqui erdz de\ Z = + I .00. Para leer la probabilidad o rárea bajo ¡¡
cuwa menor que Z = + 1.00, buscamos hacia abajo en la coh¡¡na Z en l¿ tabla 8.2 hasta locatia¡
el valor Z de interés (en décimas) en el renglón Z para 1.0. Después, buscamos a lo la¡go de we
renglón hasta interceptar la column¿ que contiene el centésimo del valor Z. Por lo t¿nto, enei
cuerpo de la tabl4 la probabilidad para Z = 1.00 conesponde a la intersección del renglón Z = 1.0
con la columna Z = 0.00. En la abla 6.2, donde se reproduce una parte de la tabla 8.2, se mues¡¡
esta intersección. La probabilidad que se muestra en la intersección es 0'8413, lo cual signlu
que hay 84.13% de probabilidades de que el tiempo de descarga sea menor que 9 segundos. Er o
la ñgura 6.ó se muesta una gnifica de esta probabilidad
=
TABLA ó.2 o
Probabilidades acumu.ladas o
Cálculo del área
.07
o
acumulada bajo (¡t
(¡t
la curva normal .5040 .5080 .5120 .5160 .s199 .5239 5279 .5319 .5359
0.0
0.1 .5438 .5478 .5517 / .)JvO .5636
.5JJ .5675 .57t4 .s153
0.2 s832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
0.3 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
0.4 .6591 .6628 .666/. .6700 .6736 .67't2 .6808 .6844 .6879
0.J .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
0.6 .729t .1324 .135'7 .7389 .7422 .7454 .7486 .7518 .1549
0.7 .1612 ;1642 .7673 .7704 .7'134 .7764 .1794 .7823 .7852
0.8 ;7910 .7939 .1967 .199s .8023 .8051 .8078 .8106 .8133
0.9 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
.8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8ó21
Fu€nt€: Extaído de la tabla E.2.
,t.
.i!
1 3 5 7 9 11 13 Escala X
:t,
-3,00 -2.00 -1.00 0 +1.00 +2.00 +3.00 Escals Z
Sin embargo, para el otro sitio web se observa que un tiempo de 5 segundos está I umdad
quo''
estandar por arriba del tiempo medio de 4 segundos. De esta manera, la Probabiiidad de
i
tiempo de descarga sea m€nor que 5 se$mdos tambien es de 0.8413. En la figura 6.7 se observa
que, sin irnportar el valor de la media p y de la desviacióu estándar a de una va¡iable üstribuida de
maaera normal, la ecuación (6.2) puede transformar el valor X en un valor Z.
Íansformaclon
¡las Pañ¡ ,
acumulaoaS
de dos curvas
Ahora que ya aprendimos a usa¡ la tabla E.2 co¡ la ecuación (6.2), estaremos en condiciones
de reqponda muchas preguntas relacionadas con la descarga de üdeos en OurCampus! utilizando
la distibución normal.
A' ¿Curíl es la probabiüdad de que el tiempo de descarga de videos en el sitio web de OurCampus !
FIGURA ó.8
deflX>9)
Area = 0.1587
¡JEMPLG é"3 ¿Curíl es la probabilidad de que el tiempo de descarga de videos en el siüo web de OurCampus !
l'¡E 7 9 11 13 Escala X
-3.00 -2.00 -1.00 0 +1.00 +2.00 +3.00 Escala Z
1 3 5 7 9 11 13 Escala x
-3.00 -2.00 -1.00 0 +1.00 +2.00 +3.00 Escala Z
En el ejemplo 6.1 de la página 207 se calculó que el área bajo la curva normal menor que9
segu:rdos es 0.8413. Para obtener el área bajo la cuwa normal menor que 5 segundos,
7 = :------ --
-2
Usamos la tabla E.2 para,ter que Z = -l .00 y encontar 0.1587' Por lo unto, 1a probabilidad dc
que el tiempo de descarga sea de entre 5 y 9 segundos es de 0.8413 - 0.1587 = 0.6826, co¡no st
observa en Ia figura 6.10.
El resultado del ejemplo 6.3 nos pen::ite afirmar que;para cualquier distibución normal, 68 2é%
de los valores caen dento de *1 desviación estandar de la media En la figura 6.1 1 podemos obser'
var que 95.44% de los valores caen denfo de +2 desüaciones esüánd¿r de la media. AÉi,95.44%&
los tiempos de descarga estiín ente los 3 y los 11 segundos. En la figura 6'12 podemos ver
que
99.73% de los valores están def,to de +3 desüaciones estándar por amiba o por debajo de la media
Por consiguiente, 99.73% de los tiempos de descarga están ente 1 y 13 segundos. Por lo tanto'
er
qtÉ
poco probable (0.0027 o solo 27 en 10,000) que un tiempo de descarga sea tan Épido o tan lento
(es decr. I
tome menos de I segundo o más de 13 segundos' En general, podemos utilizar 6o desot
desviaciones estáadar por debajo de 1a media hasta 3 desüaciones estríndar por arriba de la me¡nl
como una aproximación práctica del rango para los datos qüe se distibuyen de manera nonnal'
5 7 9 11 13 Escala X
z=
r:! =-s.oo z=
X-F
= +3.00
o o
x<13],
1 3 5 7 I 11 13 Escala X
-3.00 -2.00 -1.00 0 +1.00 +2.00 +3.00 Escala Z
En las ñguras 6.10,6.11 y 6.12 se ilustra que para cuaiquier distribución normal,
Este resultado es la justificación para la regla empírica que se presenó en la página I I 8 . La preci-
sión de la rcgla eIpírica aumenta a medida que el conjunto de dafos se aproxima má" a la distibución
normal
Los ejemplos 6.1 a 6.3 requieren el uso de la tabla E.2 de la distibución normal para calcular
un area bajo la curva nonnal que corresponda a un valor X específico. Existen nuchas circunstan-
cias en las que se desea calcula¡ el valorXconespondiente a un área específica- Los ejemplos 6.4
v 6.5 ilu$aa este tioo de situaciones.
6.4 ¿Curánto tiempo (en segundos) tanscunini antes de que el 10% de las descargas más rápidas de los
videos de OrCampus! se completen?
def valor
Pan¡ una Prooa- SOLUCIóN Como se espera que 10% de los videos se descarguen en menos de ,( segrmdos, el
acumulada rirea bajo la curva nomal menor que este valor es 0. 1 000. Utilizando al cuerpo de la tabla 8.2 bus-
0.10 camos el área o la probabilidad de 0.1000. El resultado más cercano es 0.1003, como se observa
en la t¿bla 6.3 (que se extajo de la tabla E.2).
AB[A ó,3
Probabilidades ¡cumuladas
ۇlculo del valor Z
conespondiente a
.03 .04 .05 .06
área-acumulada
particular (0.10)
debajo de la curva
normal
-1.5 .06ó8 .0655 .0643 .0630 .0618 .0606 .0s94 .0582 I .U))v
-1.4 .0808 .0793 .0778 .0764 .0749 .0735 .0721 .0708 .0681,
-1.3 .0968 .0951 .0934 .0918 .0901 .0885 .0869 .0853 .0823
.0985
Si partimos de esta área hacia los nrÁrgenes de la tabla, enconFamos que el valor Z correspon-
diente al renglón Z (-1.2) y a la colunna Z(.08) específicos es -1.28 (véase la figura 6.13).
FIGURA ó.13
Cálculo de Z para
oeterminar X
210 cA?ÍTuLo6 Disribución normal
Una vez que se obtiene Z, se utiliza la ecuación (6.2) con la fonnula de transformación ¿, ¡,
páeina 204 para determi¡ar el valor X. Dado que
7 =x -ú t"
entonces,
1¡= ¡1 + 7,o
SustituYendo P = 7, o = 2 Y Z = -1.28
X = 7 + (-1.28X2) = 4.'l4segundos
Por lo anto, 10% de los tiempos de descarga son de 4.44 segundos o menos.
Para calcular un valor partictlar xociado con una probabilidad conocida se siguen los paso
que se üstan a continuación: a,
l.Dibuje la ctwa normal y luego coloque los valores para la media yXen las escalas.f,y Z
2. Calcule el áLrea acumulada menor que X o
3. Sombree el área de interés.
o
o
4.Utilice la tabla E.2 para determinar el valor Z correspondiente al iirea bajo la curva nornai (D
menor que X. (D
(D
5. Utilice la ecuación (6.3) y despeje X
1¡=¡t+Zc
EJEMPLO ó.3 ¿Cuáles son los valores inferior y superior de X, distribuidos de manera simét¡ic¿ al¡ededor
de la media, que incluyen el 95oA de los tiempos de descarga de un video en el sitio web de
Cálculo de los
OurCampus !?
valores X que
induyen el 95% SOLUOóN En primer lugar, necesitamos calcular el valo¡ inferior de ,f, (llamado Xr) y despuá
de los tiempos de el valor superior deX(llamado fJ. Puesto que 95% de los valores esuin entreX, Y Xoy oomo X,! Xs
descarga son equidistantes de la media, 2.5% de los valores están por debajo de Xr (véase la figura 6.14)
FIGURA ó.14
Cálculo de Z para
determinar X,
Xt7 Escala X
-1.96 0 Escala Z
Aunque no se conoce ,f, es posible calcular el valor Z corespondiente debido a que el á:d
bajo la curva nonnal menor que esta Z es 0.0250. Utilizando el cuerpo de la tabla 6.4 se buscs'"
orobabilidad 0.0250.
6.2 Dstrtusion ncmal 211
Si partimos del cuerpo de la tabla hacia los márgeires, observamos que el valor Z conespon-
diente al renglón Z (-1.9) y la colunna Z (0.06) especíñcos es -1.96.
Una vez que se obtiene Z, el riltimo paio consiste en utiliza¡ la ecuación (6.3) de la página 210
como sigue:
¡= ¡t" + Zo
= 7 + (_1.e6)(2)
=7 -3.92
= 3.08 segundos
Para obtena x, se utiliza un proceso similar. Puesto que solo 2.5% cle las descargas de video
ta¡dan m.ís de .X, segundos, 97 .5% de las descargas de üdeo tardan menos que .{" segundos. A
partir de la simetría de la distribución normal se obtiene que el valor Z deseado, coño se muestra
en la figura 6.15, es +1.96 (dado que z c¿e a la derecha de la media estanda¡izada de 0). Este valor
Z tanbien se puede obtener de la tabla 6.5. Podemos ver que 0.925 es el rirea bajo la curva normal
me,nor que el valor Z de +1.96.
GURA ó.I5
Cálcllo de Z para
X.
Escala X
Escala Z
Por lo t¿nto, 95% de los tiempos de descarga estrÍn ente 3.08 y 10.92 segundos.
212 c.A?iTLao 6 Dist¡ibución normal
En lugar de buscar las probabilidades acumul¿das en uoa tabl4 poderoos utilizar Excel o ivli.
nitab para'calcular probabiiidades con la normal La frgura 6.16 es una hoja de cilculo de ei¡i
que calcula probabilidades con la normal para problemas similares a los planteadosen los e¡qol
plos 6.t a 6.+. En la figura 6.17 se presenian los resultados de Minitab Para los ejemplos 6.1 y 6¿
FIGURA 6.1ó
Hoja de cálculo de
Excel para ca lcular
probabilidades con
ta normal
=5rAñ DAnDr¿E{P,84.8t
="ro*oot*{rlr*ri} :5IAl 0A¡D¡iE(El,S4e5l
-roRr¡ 0rs(08,0+85,I¡u€¡
:!¡O8 ol5rIs.B+85,If,UE
+¡onMDr5T{ E¡,g+R5,IUq
+rs{Eu-E14
=S[ANoAROf ¿ElB1l,8¡,85)
:l-¡i oRMDrsf {8t3,84,85,¡¡UE)
+lo¡I'¡SINV(E161
+,aoRr¡¡v{E¡6,¡¡,grl
=8!¡x¡ú
calificaciones. un fenómeno que realmenle ocuffe colapso global {véase 'A Finer Formula for Asst
De manera irón¡ca. el especialista en estadistica
que populadzó el uso del lérm¡no 'normal' para en muchas escuelas. sin embargo, ¿alguna vez ha sing Risk', tre /vew forir l7nes, 11 de mayoú ,
pensado qu€ una 'prueba' de esa inlación (que 2010, p. B2). H uso de la disfibución n0ma¡P
describir ta distr¡bución que se estudió en la sec-
hay 'muy pocas'puntuaciones ba¡as porque las vocó que estos bancos sobrestimaran la prdaü
ción 6.2 n0 pretendí.a dar a la distribución el sen-
l¡do de una ocunencia anücipada y coüdiana que püntuac¡ones están sesgadas hacia A y B) ¡mpl¡ca dad de contar con condiciones de nerc¡dl
suele sugerir el adjetvo ,?oma¿ eróneamente que las calif¡caciones deben disüi- estables y subestimaran la probabilidad dep¿d '
En una publicación de 1894, l(arl Pears0n ar- bu¡rse "de manera normal"? cuando termine de das de mercado exces¡vamente'grandes. seg|¡
queiir
gumerÍó qu€ las mediciones de los fenómenos n0 leer este libro tal vez comprenda que, puesto que esb teoria, el uso de ofas distribuciones
los estudlanles universitarios repr€senlan peque' nen un áfea menor en la zona media de sus cuY6
cumplen de manera natural o "normal" con la clá-
ñas muestns no aleatorias, existen abundantes ra- y, por lo tanto, un área mayor en las "c0la$" qü ,
s¡ca forma de campana. Aunque en la actualidad
zones para sospechar que la distribuc¡ón de las repres€ntan resulbdos de mercado inusuales,P
este es un principio subyacente en la eshdíst¡ca, el
punto de visb de Pearson era radical para los con- puntuaciones no es "normal". dían haber pmvocad0 pérdidas menG grav¿s
A lo largo de los años han ocurrido mal0s en- A medida qüe estudie este capitülo, ase{lt
temporáneos que veian el mundo como algo estan-
rese de entender los sl.lpuestos que deben
cln
dadzado y normal. Pearson camb¡ó la mentalidad al tend¡d0s acerca de la distribución normal en los
demostar qüe algunas poblaciones están Sesga- negocios y en el ssclor públlco. Esbs malos enten- oi¡rrro.rá a uso adecuado de la distr¡buci¡l
yace en bdos los fenómenos. enfe bs que 9e incluyen los que provocaron el c0- imoorhnte. tenqa siempre preseÍte que elteÍÍ|¡
en eisdr
Por desgracia, en la actual¡dad las peBonas lapso de grandes instituciones fnancieras en 2008, dist¡bución normai no significa normal
De acuerdo con una teoría 6l haberapl¡cado la d¡s- t¡do cotidiano de la oalabra.
continúan cünetendo el t¡po de eror que Pearson
rebat¡ó. Como estudiante, tal vez usted esié fami- tribución normal a la industria de las inversiones
liaIizado con d¡scus¡ones sobre la iflflación de las bancarias para evaluar riesgos quizá contribuyó al
)
hoblem,as para la sección ó.2 213
buye normalnente con una media de 50,000 millas y una ente 180 y 300 segundos?
desviación estríndar de 12,000 millas. c) ¿Curíl es la probabiüdad de que rma llamada haya du6¡o
' ente 110 y 180 segundos?
a) ¿Qué proporción de camiones se puede esperar que via-
jen enne 34,000 y 50,000 millas en un año? d) ¿El l% de las llamadas durarán menos que cuánto¡
ó.10 Un conjunto de las puntuaciones obtenidas en el exa- en un agujero de válvula. Un diseño particular requtere u
men final de un curso de htroducción a la estadística se dis- eje con un diámeto de 22.000 ñm, aunque los ejes con diá'
tribuyen de manera normal con una media de 73 y una metros entre 21 9g0 ñtn y 22 .0 i 0 mm son aceptables. St
desviación est¡hdar de 8. ponga que el proceso de manufactu¡a produce e3es col
a) ¿Cuál es la probabilidad de que un estudiante haya obte- dirimetros que se distribuyen normalmeD.te con una meo[
nido una puntuación menor que 91 en este examen? de 22.002 mm y una desviación estínda¡ de 0.005 mm Pa'¡
á) ¿Cual es la probabilidad de que un estudiante haya obte- este proceso, ¿cuál es
nido una puntuación entre 65 y 89? a) la proporción de ejes con un diámeto entÍe 21.99 rrtn'!
c) ¿Existe una probabilidad del 5% de que el estudiante que 22.00 mm?
responda el exarnen obtenga una puntuación mayor que un ó) la probabilidad de que un eje sea acepnble?
c) el diámetro que será excedido únicamente por el l%
ul
valor determinado? Si es así, ¿cuál es ese valor?
d) Si el profesor califica sobre rma cr¡rva, es decir, asigna los ejes?
una calificación de A al l0% mejor de la clase, sin impor- d) ¿Cuáles serían sus respuestas a las pregunras de los Úct
ur
tar la puntuación que obtenga en el exameq ¿a usted le sos a,/ a c) si la desviación estándar de los diámeÍos
irá mejor con una puntuación de 81 en este examen o con los ejes fuera 0.004 nm?
una puntuación de 68 en oüo examen donde la media es
Muchas va¡i¿bles continua¡ tiena caacterísticu que se aproximan a estas propiedades teoricas.
Sin embargo, con frecuencia otras va¡iables conti¡uas no están distibuidas norm¿lmente ni se
apnoximan a una disnibución normal Pa¡a estas variables, las carac'terísticas descriptivas de los da-
tos son incongnt€ntes con las propiedades de uaa distibución no¡mal. Un método que pemit€ deter-
mina¡ si la variable sigue nn¡ disribución no¡nal consiste en comparar las caracterír1¡s¿5 6S5grrad¡q
de la variable con lo que se esperaría si est¿ tuviera una distrbución norm¿l. Par¿ ello, podeoros
. Constuir gáficas y obsewar su apariencia- Para conjuntos de daúos pequefros o de tanafio
moderado, podemos crear uu diagrama de tallo y hoja o un diagrama de caja. Para conjuntos
de clatos grandes también podemos constuir un Listograma o un poügono.
. C¿lcular estadísticos descriptivos y compararlos con las propiedades teoricas de la distibucion
normal. Compare la media y la mediana ¿El rango intercuartil es aproximadamente 1.33
veces la desviación estándar? ¿El raago es aproximadamente 6 veces la desviación está¡da¡?
' Evaluar có,mo se distitn¡yen los valores. Det€mdnar si aprorimadanente dos t€rc€ras part€s de
los v¿lores se ubican ente la media y +l tlewiaciones eslándar Det€rmina¡ si ahededor de cuato
quiobs part€s de los valores se ubica¡ e,nte la media y +2 desviaciones estínda. Determi¡¿¡ si
agorinadaente 19 de cada 20 valces se ubicaa ente l¿ media y +2 desviaciones estánda.
Por ejemplo, estas técnicas se pueden utilizar paa deterninar si los rendimientos de 2009 que
ss enaliz¡rotr s¡ lss capltulos 2 y 3 (almaceoados eir el archivo l@@ siguen el paton de
,'na distribución normal. Las figuras 6.1 8 y 6.19 presentan resultados relevantes de Excel para
esos datos, y la figura 6.20 muestra una gnifica de caja de Minitab para los mismos datos.
URA ó.18
Par¿
I.
de cinco
y diagrama
Par¡¡ los
i.n¡ro 2O9
216 CAPÍTULo 6 Distibuciór normal
Diagrama de caja
de Minitab
-10 0 l0 20 30
Returñ 2Ol¡9
A partir tle las figuras 6.18 a 6.20 y del arreglo ordenado de los rendimientos (que no se nues.
qü nada debido a 1a asimetía, pode;os concluir que lÁ caricterísticas de los datos correspondien'
*¡ tes a los rendimientos de 2009 difiefen de las propiedades teóricas de una distibución nonnal.
;i,*
,".i
ii Construcción de la gráfica de probabilidad normal
si los
Una gráfrca rle probabiüdad normal es una representación visual que nos ayuda a evaluar
I;,
dat¡s estan distibuidos de manera normal. Una gnífica comun es la llarnada gnifica cuantil+uansl
Para crear est¿ gráfic4 primero se tansforrna cada valo¡ ordenado en un valor Z. Por ejemplo'
sr¡o
.;ir. de:
tieoe r¡na muesta de n = lg , el valir Z para el dato m.ás pequeño conesponde al área acumula<h
:li
''I I 1 I ^^,
.
,+t=19il=t=uu)'
€r
El valor Z para un área acumulativa de 0.05 (de la tabla E.2) es -1.65. En 1a tabla 6.6 se ilustra
t,iü'
:,$ conjunto completo de valores Z para una muesta de n = i9.
"En
una gráfica cuantil-cuantil, Ios valores Z se grafican en el eje -ly los valores coresp0ú
¡t.''::. dientes de la variable se grafican en el eje f. Si los datos se distribuyen normalmente, los
vatu'"
)
6.3 Evaluación rtc l¿ so¡nalidad 217
la
yor rapidez con los valores más altos de la variable grafic¡d¡.
l.z
RA 6.21
de proba-
í
normal para
hacia la
una disui-
normal y una
sesgada
rl
Sesgada hacia la izquierda
Gnífica A
Normal
Gráfica B
Sesgada hac¡a la dEredrs
Gráfics C
derecha
En la figura 6.22 se muestra una gráfica de probabilidad normal para los reodimientos <te 2009
creada por Excel (resultados a la izquierd4 una gráficá cuaotil-cuantil) y Minitab (resultados a la
derecha). la gnáñca cua¡tikuantil de Excel que pres€nta los rcndini€ntos de 2009 se eleva lenta-
mente en un inicio y después con nayor rapidez. Por lo tanto, podemos concluir que los rendi-
mi€ntos de 2009 están sesgados hacia la derecha-
La gráñca de probabilidad no¡mal de Minitab co¡tiene la variable Rendimientos de 2009 so-
bre el eje Xy el porcentaje acumulado par¿ r'n¡ distibución normal sobre el eje L Como ocune
con la gnifica cuantil-cuantil, si los datos están distibuidos normalnente, los puotos fonnarán una
línea más o menos recta. Sin embargo, si los datos están sesgados hacia la derecha, la curva se
RA 6.22
de probabilidad normal de Excel (cuantil-cuantil) y Minitab pan los rendimientos en 2009
Itorrnal Ptob€b¡llty Pld ol lxD Reün¡s Pmüabl¡lty Pbt of 2009 Retums
llor||r.l
;.r
l-_l
.¡i
¡1 to 20
t !'t| zmt
.¡¡ i--_.-_
218 cA-PÍTtLo 6 Distibución no¡rnal
elevará con mayor rapidez en un hicio y después se nivelañi' Si los datos están sesgados hacie t.
izquierd4 la curva se eleva¡á lentamente en un inicio y después se elevará de fon¡a nás nl¡i¿'
con los valores miás altos de la variable graficada. Observe que los valores aumental con ¡*i.'*
en rm inicio y después se nivela¡, lo que indica una distribución sesgada bacia la de¡echa"
' -'
i!' datos se distibuyen de manera nás o menos nomnl 157 185 90 1t6 172 lll 148 213 130 ló5
..1 a) comparando sus ca¡acterísticas con las propieüdes teóricas. 141 149 206 r75 123 128 144 168 109 ló7
ó) construyendo una gmfica de probabilidad normal. 95 163 150 154 130 143 t87 166 Úg 149
ó.19 L¿ DJIA esta compuesa por 30 empesas. ¿Qú tan gmn- 108 l 19 183 151 r 14 135 191 137 09 tt,g
.i], .' des son esas ernpresas? Un metodo comun para medir el tamaño
Detomine si parece que los datos se distribuyen de rna!ú
de una empresa consiste en considerar su capit¿lización de
mercado, la cual se calcula multiplicando el número de accio- más o nenos normal
t.,
nes bursátiles por su precio de mercado. El 8 de abril de 2011, a) comparaado sus car¿cterísticas con las propiedades teonras
la capitalización de mercado de esas empresas iba de $i9,200 á) constnryendo una gnífica de probabiüdad normal'
I
Ecu¿ciones clave 219
En OurCampusl, Revisión
n 1¿ sección sobre OurCampus!, supusimos que usted tabajaba
como diseñador de un sitio web para redes sociales. Quería ase-
gurane de que un video pudiera descargane con rapidez para que
los visitantes pudiaan reproducirlo en zu navegador. (La repro-
ducción nipida de los videos ayudaría a ataer y a cons€rva¡ a esos üsitantes).
Realizando experimentos en las oficin¿s corporativas, usted determinó que la
canticlad de tienpo, en segundos, que t'a¡scrme desde el primer coDtacúo con
el sitio web hast¿ la present¿ción completa del video es una distribución en forma de c¿¡mpana
con un tiempo medio de descarga de 7 segundos y una desviación est¡inda¡ de 2 segundos. Por medio
de la distibucion non¡al, usted calculó que aproximadamente 84% de los tiempos de descarga son
de 9 segundos o menos, y que 95% de los tiempos de descarga est¡in ente 3.08 y 10.92 segundos.
Ahora que sabe cómo calcular probabüdades a parti¡ de la distribución normal estrí en condi-
ciones de evaluar los tiempos de descarga de un video utilizando diferentes diseflos de página
web. Por ejemplo, si la dewiación está¡dr permaneciera en 2 segundos, reducir la media a 6 se-
gundos reduciría la disnibución coryleta en I segundo. Por consiguiente, aproxina.damente 84%
de los tieryos de descarga seriao de 8 segundos o menos, y 95% de los tieryos de descarga serían de
ente 2.08 y 9.92 segundos. Otro cambio que podría reducir los largos tiempos de descarga sería la
disminución de la variación. Por ejemplo, considere el caso de que la media siguiera siendo de 7
segundos, pero que la desviación estíndar se redujea a I segundo. Nuevamente, al¡ededor de 84%
de los tiernpos de descarga serían de 8 segundos o menos, y 95% de los tiempos de descarga esta-
rían ente 5.04 y 8.96 segundos.
N
y en el anterior estudiamos los modelos m¿- media y su mediana son iguales. También tiene forma de
como distibuciones de probabilidad, campan4 y aproximadamente 68.26% de sus observaciones
en que se utilizan para resolver problemas esuinderto de I desüación estándar de la medi4 mác 6 ¡s-
En el capitulo 5 utilizamos disribuciones de ¡os 95.4404 de sus observaciones estín dentro de 2 desvia-
discretas eD situaciones en que los resultados ciones estándar de la media, y alrededor de 99.73% de sus
un proceso de conteo (por ejemplo, el número observaciones están dento de 3 desviaciones estánd¿r de la
estii tonando o el número de formatos de De- media. Aunque muchos conjunüos de datos en los negocios
en un ¡eporte gene¡ado por un sistema de i.n- se aproximan a la distibución normal, no üodos los datos se
). En este capítulo aprendimos que las pueden aproximar utilizando este tipo de distribución. En la
el resultado de sección 6.3 se'estudiaronvarios métodos'para evaluar la nor-
medición (por ejemplo, la estatua de nna p€r- malidad con la finalidad de determinat si la distribucién
de descarga de un üdeo). Las distribuciones no¡¡nal es un modelo matemático razonable v aplicable a si-
continuas tienen varias formas, pero la más tuaciones específicas.
importante en los negocios es la disfibución En el capitulo ? se utiliza la distribución norrnal para
normal es simérica, por lo que su desa¡rolla¡ el tema de la inferencia estaüstica-
transformación
(6.2)
220 cAPiTWo 6 Distribución normal
TÉRMINOS CLAVE
1 r
d) ¿Al menos qué cantidad de bebida gaseosa contiene 99olo ¡ormal con los nempos de espera. ¿Cree que estos ¡!¡"
de las botellas? pos de espera se asemejan más a una dist¡ibucto¡ u'"
e) ¿El99% de las botelias contienen una cantidad que está forme. a una exponencial c a una normal?
entre cuáles dos valores (distribuidos de forma simética) d) Consn-uya Lrn hisograma y "n¡ gráñca de probabrldads
al¡ededor de la media? mal con los riempos que los clientes ocupan la rn€sa;\"'
Problemas dc rc¡nso del capínrlo 221
que o"*an la m€sa s€ asqllej¿¡n mas a-uD'¿¡ prueba esta teoría utilice un periódico o I¡temet para selec-
Arcs tiemPO-S
i,-;óo miforme, a t'n¡ ex[onencial o a una normal? cronar una empresa que opere en la NYSE, ota que opere
pnncipll^es^índices del mercado bu¡sátil en American Stock Exchange y una compañía que opere en
Todos los el NASDAQ, y luego haga lo siguiente:
El ¡endimiento- medio anual
Át gln^acias_ tl_29
-l
0._
grupo de 500 empresas l. Registe el precio accionario de ciene diario para cada
,cciones de S&P 500 de un
,.,r¿s fue de 12.8o/o. El rendimiento medio anual una de esas empresas durante seis semanas consecutivas
(para que tenga 30 valores por empresa).
Ñ¡S¡,CQ, un g¡upo de 3200 empresas pequeñas y
de 16.9o/0. En el pasado, los rendimientos 2. Calcule los ca¡¡bios diarios en el prccio accionario de cie-
"" fue distribuido de una manera aproximad¿mente rre para cada nna de esas empres¡¡s durante seis semanas
se han
consecutivas (para que tenga 30 valores por eqresa).
l¡ desviación esuinda¡ en las empresas de S&P 500 es
del 20%, y la desviación estíndar de NASDAQ Para cad¿ uno de sus seis conjuntos de valores, determine si
30%. los datos se distribuygq ds ma¡qa más g menos normal
es la probabilidad de que una acción de la¡i empre- a) constuyendo un diagrama de tallo y hoj4 un hisúograma
S&P 500 haya aument¿do su valo¡ en 2010? o un poligono y un diagrama de caja"
es ta probabüdad de que una acción cle las empre- ó) comparando las caracteisticas de los datos con las pro-
cb S&P 500 baya ganado 10% o más €tr 2010? piedades teóricas.
es la probabilidad de que tn¡ acción de las empre- c) constuyendo una gnáfica de probabilidad normal.
de S&P 500 haya perdido 20olo o m.is en 20 I 0? d) Analice los resultados de los incisos a) a c). ¿Qué diría
es la probabiüdad de que 'rn¡ acción de las empre- acerca de sus tes acciones con respecúo a los precios diaios
de S&P 500 haya pe¡dido 40% o más en 20 I 0? de ciene y a los cambios diarios en los precios de cie¡re?
los incisos a) a d) pa¡a una ¿cción de las empresa¡r ¿Curil de los conjuntos de datos se distribuye de maner¿
a. aproximadanente normal, si es que alguno lo hace?
un breve resumen de sus hallazgos. Asegúrese de NolA:. La leoría de b carninata aleotoia se 6¿t¿ a los c@ibías diorios eñ el
un análisis de los riesgos asociados con una des- pecio d¿ ciene de lat occiones l no al precio diarío de ciqn d¿ las a¿ciones.
esLíndar grande.
ó.41 El problema 1.27 delapág)na 13 describe una encuesta a) comparando 1as características de los datos con las
FG
aplícada a 62 estudiantes de iicenciatura (y se encuenha al- oiedades teóricas.
macenada en el archivo EEEEE!ÑID. á) ionstuyendo una gráfica de probabilidad norma¡
a) Seleccione una mueska de estudiantes de licenciatura y ó.43 El problema 1.28 de la página 14 describe ¡¡r.,
aplíqueles una encuesta similar.
cuesta aplicada a 44 estudiantes de la maestría.en a¡ij'
á) Para los datos reunidos en el inciso a), repia los incisos nistración (y se encuentra almacenada en el a¡ch¡"^
a) y b) del problema 6.40.
c) Compare los resultados del inciso á) con los del pro- G@,
a) Seleccione una muestra de estudiantes de posg¡ado u
.
blema 6.40.
aplíqueles una encuest¿ similar.
ó.42 El problema 1.28 de la página 14 describe una encuesa á) Para los datos reunidos en el inciso a), repita los insis.t
aplicada a 44 eshrdiantes de l¿ maestria q! adroini-stración $ a) y á) del problena 6.42.
sé encuentra aknacenada en el archivo ![!!@$. Deter- c) Compare los resultados del inciso b) con los del p¡6
mine, con estos valores y para cacla variable numericq si Ios blema 6.42.
d¿tos esüfur distribuidos de manera aproximad¿mente non¡al
cAso
Aplique sus conocimientos acerca de la distribución normal informe interno que documenta el trabajo del equipo y sls
en este Caso digital que amplía la sección sobre el Uso de la conclusiones. Después, responda lo siguiente:
estadística de este capítulo.
1. ¿Los datos reunidos pueden aproximarse pol medio dt
Para reducir las preocupaciones de sus posibles clientes, la una distribución norm¿l?
administración de OurCampus ! realizó un proyecto de in- 2. Reüse y evalúe las conclusiones planteadas por el equip
vestigación para conocer la cantidad de tiempo que les toma de ir:vestigación de OurCampus! ¿Cuáles conclusione!
\ a los usuarios cargar una página con aplicaciones complejas son correctas? ¿Cuiíles son incorrectas?
de video. El equipo de investigación reunió datos e hizo 3. Si OurCampus! pudiera mejorar el tiempo promedio ett
ciertas afirmaciones con base en el supuesto de que los da- cinco segundos, ¿cómo cambiaran las probabilidades?
tos trenen r¡na distribución normal.
Abra OC_QRTStudy.pd{ que documenta el trabajo de
un equipo de respuesta de calidad en OurCampus ! Lea el
REFERENCIAS
1. Gunter, 8., "Q-Q Plots", quality Progress (febrero de 3. Micmsofi Excel 2010 (Redmon4 WA' Mic¡osoft Cor!"
o,arl. R., "Karl Pearson, 1857-1936", Journal ofthe 8. Walker, H., "The Contnbutions of Karl Pearson", "/ournal
',l,ian S taris tic al Ass ociation, 3 I (I 936), 653-664. ofthe American Sntistical Association, 53 (1958), 11-22.
í"",.on, E. S.. "Some Incidents in the Early History of
and Statistics, 1890-94", Biometrika, 52
SilÚ]rtty
[rrs¡':-ts'
¡. ab.¿ la boia de cálculo Bond Funds, sgleccione Haga clic en la pestaña Date Disptay. Haga clic en
¿ ProbabiütY Plot Y: Synbols onl¡ quite la marca del cuad¡o Show conf-
Probability Plot haga clic en
denceinterv¡I.
el cuadro de diálogo Hasa ciic en OK.
y luego en Oli
cuadro de diálogo
Probability Plot - Sirgle (que se
abajo):
I
I
I 1 De regreso en el cuadro de ürilogo Probability Plot-
I
I Single hrga clic en OK