5 PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 224

CURSO: HERRAMIENTAS

ESTADÍSTICAS

PROFESOR: TOMÁS MINAURO


LA TORRE

2014
T 1 '/
lntroduccton

uso DE LA est¡oísflc¡ Revisión del UsO DE LA GUíA DEL CAPíTULO 1

en GT&M Holdings eStlOíSrtCl en GT&M Holdings PARA MINITAB

GM1.'l Introducción a Minitab


1.1 Lectura. escritura ¿Y GUíA DEL CAPfTULO 1
GM1.2 Ingreso de datos Y
estadística? PARA EXCEL
tipos de varjables
GE1.1 Introducción a Excel
GM1.3 Cómo abrir Y salvar
1,2 La estadística es
GE1.2 Ingreso de datos hojas de cálculo Y
fundamental para Y
la administración
tipos de variables Proyectos
Por qué la estadística se ha GE1.3 Cómo abrir y salvar GM1.4 Creación Y coPia de
vuelto tan importante libros de trabajo hojas de cálculo
GE1.4 Creación y coPia de GM1,5 lmpresión de Partes
'f.3 Datos y variables hojas de cálculo de un ProYecto
Tipos de variables
GE1.5 lmpresión de hojas GM't.ó Datos y referencias de
de cálculo la hoja de cálculo
1.4 El vocabulario básico
,i
de la estadística GE1.ó Entradas y referencias GM1.7 Uso de los apéndices
de la hoja de cálculo DyF
i 1.5 Aplicaciones de la estadís- GE1.7 Referencias de celdas
I
tie para la computación absolutas y relativas
s
ll GE1.8 Ingreso de fórmulas
li
1.6 Cómo utilizar este libro en hojas de cálculo
!l
.tl
Lista de requisitos para
I GE1.9 Uso de los apéndices
I iniciar
DvF

aDren
.f

En este capitulo usted apr:enderá:

¡ Oué es la estadística.
r Por qué la estadística es fundamental para la administración.
. I l^ ^^+^)l^+:
Los conceptos baslcos y el vocaDularlo oe td EJ --
Ld\l t) LtLo.

. Cómo utilizar Microsoft Excel v/o Minitab con este libro.


En GTtM Holdings

os gerentes de GT&M Holdings está,n preocupados por la salud financiera de zu princi-


pal acüvo, la cadena de productos electónicos Good Tunes & More. La cadena inició
como Good Tunes, una empresa minorista que vendía música por meüo de pedidos
por correo. En los inicios de Internet, los gerentes toma¡on la decisión estratégica de
ofrecer el negocio en línea, donde Good Tunes prosperó. Varios años después, los di-
rectivos decidieron abrir una tienda fisica "hadicional", y la empresa se convirtió en Good Tunes & More, la
o
minorista de aparatos electónicos de servicio completo. Durante la ütima oisis económica, GT&M Hol-
dings tomó ventaja de la depresión en el mercado de bienes irmuebles y de que algrmos de sus competidores =
cerr¿ron sus tiend¿s; fue así como la empresa logró convertirse en una cadena con varias sucunales. o
En 1a actualid¿d, GT&M Holdings enfienta varios retos. Los gerentes de GT&M debeo, a cofo plazo, o
presentar información relevante para demostar que su negocio tiene salud financioa y esú en condiciones
o
N
de obtener nuevas líneas de c¡édito. A largo plazo, necesitan disipar las preocupaciones que han expresado (r¡

algunos inversionistas privados respecto a qué tan viable será Good Tl¡nes & More al paso del tiempo. Los
o
directivos debedn identificar formas de mejorar el negocio, ya que, durante muchos años de evolución, ha
sido necesano modificar parte de sus políticas y pnícticas, las cuales se han convertido en un conjunto de
enmiendas que probablemente no constituyen buenas pautas administativas y ocasionan que se pasen por
alto oportLrnidades de mayores utilidades.
Para enfrenhr estos ¡€tos, los gerentes oecesitarán tener éxito al aplicar las divenas habilidades admi-
nistativas que adquirieron a través de su formacióaacadémicay experiencia- Todo esto es-m¡isque
evidente. Lo que no es claro es el papel que desempeñaría la estadistica en la aplicación de di-
chas habilidades y 1¿ toma de decisiones que determinarií el futuro de Good Tunes &
More.

Mibri Siffii¡/Pto¡orcm
4 CAPÍTULO 1 Inüoducción

a estadistica ayuda a fransforma¡ números en información


útil para quienes toman decisiones'
p...it de negocios' y tam-
,ooo"o los riesgos asociados con el hecho de tomar una decisión
decisiones.!:
i¿o .yoÁ u .""o¿o y i reducir la variación en el proceso de toma de lTg
ti." a.r..ipú". n hye los métodos que ayudan a reunir, resumir, presentar y antli'"
911^1j1:
co":l]":*t^Tt:j:#
;;;ffiird'"iá..".'"r i"a"vJ los m&odos que permiten obtener
;;r; ñ;;;'.i¡" ú;;"i*.i;" v el análisis de.los. dato'. d'* Tp: ry1Y:i^i':-d:":"1:
J¿i"dq ., o...r*o
ilr'.uílquier saúe. si este es el^adecuado para t?t d^t:t y:i:i:T*i::'
condicionesosuposicionesasociadasconél'Paraenfre¡tarco.fléxitolosretosl"t*p1i::-t1-t*-
cimientodeGr&MHoldings,losgerentesnecesitanutilizarambostiposdemetodosestadísticos.

1.1 "Lecturar escritura ¿y estadística?"


Nadieponeendudalafornaenquelashabilidadesdelectura'escritrrraymatemáticasbasicascon-
nituy**e*i.*adémicodeunestudiante(yaldelaspenonasqueparticipanenuegocios).Adenás'
de contar con las habilidades infonnáticas
los es¡¡diantes de admimstración vaioran la'inportancia
p"". *t*tal sus estudios y futuros empleos' Sin embargo' cuando surge el tana
de la es-

"*"rJ^
udística, iguos cu¡so htoductorio que dest¿caba los métodos desÜiptivos
recuerdau un
panre-
.,. de todo, estadística su¿¿a muy parecido a
sumir y presentar datos, otros expresan temor (desfués
lri¿i.á'i, ooor ntiis recuerdan varios dichos populares acerca de Ia estadístic* enüe los que destaca
v
.i q". ,.íu,
..g¡rt* tres tipos de mentiras: las mintiras, las malditas mentiras y las estadísticas" ' .
pocos reconocen que ia estadistica es una habilidad fundamental en su educación de negocios,
Aunque esta frase a
cotidiana para descri-
menudo se atribuYe a y .olno á, p.*ite comprender mejor los números que se utilizan de manera
Ma*Twain, Ya había úl y anatizar et munOo. Las siguientes noticias ejemplifican lo anterior:
fases imPresas similares
al menos 12 años antes .*Másclicsparaeütarap¡Iecerenun¡listrdecorreoelectrónico''(TheNetYork
de que Ia de él se grandes minoristas en linea reportó
Tímes,2g de marzo de 20i0, p. 82) Un estudio de 100
feg6Ían. les excluyera de una List¿ de
oue 39% de ellos necesttaron áar hes o más clics para qué se
co¡reo electrónico en 2009, en comparación con 7% en
2008'
.(¿Losprinerosdosañosdeestutliosuniversitariosdesperdiciados?"(M'Marklein'
de 3000 estudiantes
isl riaoy,lg de enero de 2011, p. 3A) una encuesta aplicada a más
de tiempoiompleto reveló que dedican 51% de su tiempo
a.socializar, a divertirse y a otras

actividades, 9% a asistir a clases y laboratorios, y 7% a estudiu'


. i.Sigalos tveets" (H. Rui, A. Whinston y E. Winkler, The Wall Steet Joumal,30 de
que el número de veces
noiembre de 2009, p' R4) En este estudio los autores encontraron
de mensajería socia
[ue un producto específicó se menciona en comentarios del servicio
i*in.r,-ti*" d" b*. para hacer predicciones de las tendencias de ventas'
que se habla en estas noticias represen-
La estadística pemrite dekrmi¡ar si los "números" de los
son significativas
u¡ i¡formación údl, ya que ayuda a establecer si las diferencias enue los números
patones en grandes cantidades de
o si solo se deben al azar. Sin estadística, sería imposible detectar
datos (por ejemplo, que dos quintas partes de los
principales minoristas necesitan dar tes clics para
(como la que sos-
,.. .liirinuáo, á" .oneos elecnónicós), o validar las aftrmaciones de causalidad
de ventas de ciertos productos)'
tiene que el número de tweets es un indicador del nivel
La estadística mejora la habiüdad aritmética o los conocimientos numéricos de los estudian-
tes de admidstración. ¡La estadística desempeña un
papel tan importante en esta capacidad que'
escritura y ariünética- bien
para los estudiaates de administración, las tres habilidades -lectura,
podrían expresarse como lectura, escritura y estadística!

1.2 Laestadística es fundamental para la administración


que toÚar uo curso de computación' y no es-
Es probable que usted, como estudiante, haya tenido
peába utilizar las computadoras única e'i" et ese curso' De igual manen' por lo expuesto en la
que los conocimientos que adquiera en el curso
sección anterior, debería empezar a darse cuentr de
que en el ámbito académico'
de estadística iendrán una aflicación mucho más arnplia
I 1.2 La estadística es fimdamental par¿ la administración

!
La estadística biisica para su educación en administración, ya que desempeña un papel fi:n-
es
damental en los negocios. Permite que los profesionales de la administración realicen las siguien-
tes tareas rmportantes:

. Visualizar y resumir datos (uso de métodos descriptivos).


. Ext¡aer conclusiones acerca de un gmpo grande con base en los datos obtenidos en un grupo
pequeño (uso de los métodos rnferenciales).
. Realizar pronósticos confi¿bles a partir de modelos estadísticos que ilfieren información
(otro uso de los métodos ilferenciales).
. Mejorar los procesos admi¡istrativos mediante el uso de métodos gerenciales como el Seis
Sigp.a, que se enfoca en mejorar la calidad (uso de métodos descriptivos e inferenciales).

Por qué la estadística se ha vuelto tan importante


La estadística es fundamental para la administración debido a dos tendencias que se han observado
con el tiempo: el constante aumento tanto en la accesibílidad a las henamientas estadísticas como
en las cantidades de datos que los negocios pueden reunir, alnacenar y manejar.
Alguna vez los avances en 1a estadística dependían principalmente de las necesidades del go-
No confunda la biemo de ¡euni¡ datos sobre los ciudadanos, lo cual requiere la realización de censos. Por ejemplo,
p r e d i cci ó n e stadí sIica
en Estados Unidos, la Constitución establece que debe realizarse un censo cada 10 años. En Esta-
con las conJefuras
informales que hacen bs dos Unidos, a finales del siglo ru el crecimiento de la población estimuló el desanollo de mríquinas
camentar¡stas de tabuladoras mecánicas para registar los datos de censos, así como nuevos métodos estadísücos des-
departes para " ptedec¡r " criptivos para restunirlos y presentarlos.
el resuhado de un evento
También a finales del siglo xx se empeza¡on a observar avances en la teoría de probabilidad
deporúvo o las que se o
hacen en la industna del
matemática que estimula¡on el desanollo de nuevos métodos inferenciales, especialmente los mé-
entretenimi€nto respecto todos de predicción estadístic¿ utilizados para realizar pronósticos confables.' En un inicio, estos
a quiénes serán los métodos estaban fuera del alcance de los administradores promedio debido a que requerían de o
ganadores en un
cálculos complejos. Las primeras generaciones de computadoras para negocios permitían que los o
p@grama de entega de
negocios en general tuvieran acceso a estos métodos, pero aún no era posible que los trabajadores
o
prenios. La predicción N
eladístlca es un proceso indiüduales los tuvier¿n disponibles en su computadbra en el momento en que los necesitaban. Poste- (¡
formal que se utilíza para riormente, los avances en la informática personal y en las comunicaciones de datos, aunados a
inferir informaci6n. software in¡ovador, permitieron que estos métodos estuvieran accesibles de manera inmediata en
la computadora de cualquier persona.
F" ¡^^-a.hla l¡
Más recientemente, los avances en informática y en el atnacenamiento de datos han permitido
¡mpoftancia de los
que las empresas reúnan y procesen cada vez mris cantidades de datos en periodos muy cortos.3 Estos
camb¡os que con el paso
deltiempo han ocunido avances han estimulado el desa[ollo de nuevos métodos descriptivos e inferenciales que conforman el
en la leaologia de las campo emergente de la analítica, la cual combina sistemas de cómputo y estadística para crear nuevas
co m p utad o r a s. Mi e ntra s formas que permitan analiza¡ datos de corporaciones, en particular, conju¡tos de datos históncos. La
que en una demostración
analítica se presenta en varias forrnas y como pade de muchos tipos de aplicaciones administ¡ativas
de l4M Corporation en la
década de 19ó0 fue modernas, entre las que se rncluyen hteligancia empresarial, indicadores y sistemas para la administra-
pos¡ble recuperat e ción de las relaciones con los clientes ach:ales, Tom Davenport y Jeanne Harris, autores de dos libros
imprimi hechos acerca ¡ecientes sobre el tema, argumentan que las empresas deberían utilizar la analítica como parte de su
de una fecha en
estrategia compeútiva (véase las referencias I y 2). Sin importar lo que pase en el fuhro, la estadistica
particular que enviaron
los miembros del público continuaní siendo al menos tan importante y ñrndamental como lo es hoy.
m¡entras veían una
película de 12 minutos
de duración (véase la Reconsideración del escenario 1 de GT&M Holdings
referencia 9), en una Puesto que es una pequeña cadena minorista, Good Tunes & More utiliza sistemas de cómputo
d em o straci ó n r e aliz a d a
para sus actividades operativas diarias, como el registro de las ventas y el mantenimiento del in-
en 2011 se presentó un
s¡stema de cómputo ventario. Los gerentes de GT&M Holdings pueden utilizar métodos estadísticos descriptivos paxa
llamado Watson, que estudiar los datos que obtienen como resultado de esas actiüdades. Con los métodos descriptivos,
jugaba el programa de podrían resumir y presentar el estado actual de su empresa, lo cual sería útil para su meta a corto
televisión Jeopady! y
plazo de obtener crédito. Si Good Tunes & More fuera una empresa más grande, pod¡ía utilizr un
deducía /as respuestas de
una gama completa de cuadro de mando analítico en tiunpo real, que actualizaría de manera constante los datos estadísticos
temas en unos cuantos de sus negocios. Si utiiizaran un cuadro de mando de este tipo, los directivos poddan responder
milisegundos (véase la con rapidez a los problemas de inventario, de sewicio ai cliente y de otro tipo que suelen surgir
referencia 10).
durante un dia laboral normal.
CAP1TULO 1 Innoducción

1.3 Datos y variables


Enestecapitulosehautilizado|apa|abradatosenvariasocasiones.Esprobablequeeltérmino
d4'ojformepartedesuvocabulanoyquetengalavagaideadequelosdatossonel..material',que uso
se utrl;; ;;dír,iru, p.ro, ¿poeaó
aimirto .on precisión? ¿Y los datos siempre implican el
datos?
de números? ¿Qué son exactamente los
Larespuestaaestaúltimapreguntaesimportanteporquesinodeneclaraladefmicióndeltér-
atgunos de los conceptos importantes de
milo, no podrá comprender, sin importar c,ráto estudie,
estelibro.Paralosfinesdelapresenteobr4losdatossonlosva/or¿sasociadosconunrasgoocony
Levine"
*" p;i.d.¡ que sirven para distingui¡ la ocunencia de algo. Por ejemplo, "David
..rirnotnyrreluiel,,sonvaloresqueayudanadistinguiraunautordeesteiibfodelotrcautor'
g^?f p*-* et t¿rnino ¿aros se define como colección o
conjunto de valores' Aunque
")(,0,
sepodría<lecirqueunsolovalorcomo..DavidLevine''esundalo,lostáminosquemássuelen
utilizarse Dara descnbir un solo valor son: dato
ptfitual' observación' respuesta o valor'tinico de
probable es que
¿",rr]t"si !g*"- ,r"J ¿ir a tém¡ino d¿ros un significado en singular, lo más
".,
p."nruoao en todo el conjunto de valores recolectados,
el cual, después de todo, es una
"rtouiou las ftases"un conjunto de datos", "archivo de datos"
o"a¡chivo" se utili-
sola cosa. En este libro,
.
i' zan para referirse a toda la información recabada)'
', variable er
e.lr, ,frrgrin.ado del término datos ry\da a definr el término variable. una
algunodelosrasgosodelaspropiedadesquealudanadistinguirlaocurrenciadealgo.Eneiejempto
' son valores para una variable que podría denomi-
-r;;6;;id;"uioe' dely 'himotly Krihbief
autor.sustituir la palabra cardcterística pof la frase
"rasgo o propiedad
na¡seNombre o Nombre
por el término algo produce la
qr" .y"¿. ar*Ñ,, y sustitut la frase 'ü objeto o individuo"
"
definición estadística estiíndar de voria ble y datos '

VARIABLE
Una ca¡acteristica de un objeto o indiüduo'

DATOS
una va¡iable'
El conjunto de valores individuales asociados con

Cadavariablequeseutiliceclebetenerunadefiniciénoperacional,lacualpermitequetodc
valoreo
variable y cuáles son sus
b, q;. pJ.ip* en un análisis comprendan qué representa la
de ios investigadores que
i.
p"rrii.rl ;Jp"nancia de lo anterioi queda clarl enel flmos.o¡remnlo
que los par-
i"* i"áu" p-" reunir datos demogrificos escribieron la palabra "sexo", esperando
se encontraron con que va'
;;t"*t .trpirtd ierm ma.sculino ofemenino; al revisar los formatos
(Quizás a esto se deba que en
;;;;;;;""r'..tpondieron Sí, en lugar tle la respuesta esp.erada
,.Género" en vez del'Sexo" para denomrnar a esta vanable'
,. p..flra utilizar el términi
".^[r",
ya que su definición operacional es más evidente)'
Aveceslasdefinicionesoperacionalestarnbiénnecesitandefinirvaloresindividuales.Por
que puede adoptar los cuatro
.j..pfo, p*n iu uariable "gradó académico", definida como aquella
de tercer año.y de último año' sería necesano
valores de estudiante de primer año, de segundo año'
de los créditos logrados) con la finalidad
de
definü cad¿ uno de A.fro, uo¡orr, (ioi u.ien términos va-
asegurarse de que todos .ompreoduo' Quizás
el ejemplo mlís famoso de defidciones vagas de
lores fue la elección a"l pr"slaeote Je eita¿os Uni¿os
to el año 2000 en el estado de florida' laen
de contoversta'
cual las definiciones de úoletas "válidas" e "inválidas" fueron motivo

Tipos de variables
Lalatura|ezadelosdatosasocradosconunav¿riabledeterminaeitipodeesta.Esimpoftante
conocereltipodevariable,yaquelo"smétorlclsestadísticosqueseutilizanenunan:ílisisvaríande
acuerdo con este.
1.4 El vocabulario básico de ia estadística

Las variables categóricas (también llamadas variables cualit¡tivas) tienen valores que solo
pueden colocarse en categorías, como sí y no. Ejemplos de variables categóricas son: "¿Tiene cer-
tificados de inversión actualmente?" (sí o no) y el nivel del riesgo de un certificado de i¡versión
(por debajo del promedio, prom€dio o por amba del promedio).
Las variables numéricas (también llamadas variables cuantitativas) tienen valores que re-
presentan cantidades. Las vanables numéricas, a la vez, se clasifican como discretas o continuas'
Las variables discretas tienen valores numéricos que surgen de un proceso de conteo. ("El
número de canales de televisión por cable al que se suscribió" es un ejemplo de una variable numé-
rica discreta, ya que la respuesta es uno de un número finito de enteros. Las personas se pueden
suscribir a cero, uno, dos o miis canales. Otra variable numérica discreta es "el número de artículos
comprados", porque se cuenta el número de productos adquüdos.
Las variables continuas producen respuestas numéricas que surg€n de un proceso de medi-
ción. Ei tiempo que uu persona espera pam ser ateDdida por un cajero de un banco es un ejemplo
de una variable numérica continua, ya que la respuesta asume cualquier valor dento deuo conti-
nuo o trt intervalo, dependiendo de la precisión del instn¡mento de medición. Por ejemplo, su
tiempo de espera podría se¡ de I minuto, 1. 1 minutos, 1.1 1 minutos o I .l 13 milutos, dependiendo
de la precisión del aparato utilizado. (En teoría, dos valores continuos nunca son idénticos. Sin
embargo, como nhgún aparato de medición es perfectamente preciso, quizis ocurran valoles con-
tinuos idénticos para dos o más objetos o indiüduos).
A primen vista parece que es sencillo identificar el tipo de vanable, pero en ocasiones es nece-
sario estudiar algunas variables que podrían ser categóricas o numficas, dependiendo de la forma
en que se hayan definido. Por ejemplo, parecería que la "edad" es un valo¡ numérico evidente,
pero, ¿qué sucedería si ese valor se utilizara para comparar los hábitos de compra de niños, adultos a,
jóvenes, adultos maduros e individuos jubilados? En tal caso, tendría rnás sentido definir la "edad '
como una va¡iable categórica. Esto ilustra nuevamente el coment¿rio anterior acerca de que, sin
definiciones opencionales, las variables carecen de significado. o
Para determinar el tipo de variable que se necesita, a menudo es muy útil hacer preguntas
o
o
acerca de las variables a estudiar que se identificaron. En la tabla 1.1 se Presenta el proceso. N
(D
N

TABLA 1.1 Pregunta Respuestas Tipo de datos

Tipos de variables ¿Cuenta con un perfil de Facebook OSíONo Categórica


actualmente?

¿Cuántos mensajes de texto envió la


...-* Numérica
semana pasada? (discreta)

¿Cuánto tiempo tardó en descargar _ segundos Numérica


un videojuego? (continua)

1.4 El vocabulario básico de la estadística


Sería prácticamente imposible aprender los métodos estadísticos que se estudian en este libro si no
se comprende primero el significado de cuatro términos: p oblación, muestra, parámetro y estadís-
tico.
Los datos provienen de unapoblación o de una muesta. Una población consta de todos los
objetos o individuos sobre los que usted desea obtener conclusiones. Todas las transacciones de
ventas de Good Tunes & More de un año específico, todos los clientes que realizaron compras en
Good Tunes & More este fin de semana, todos los estudiantes de tiempo completo matriculados
en una universidad y todos los votantes registados en Ohio son ejemplos de poblaciones.
CAPITIJLO I lntroducción

una muestr¡ es una paÍe que se selecciona de una población para someterla a análisis. D.e los
una muestra de esfiJdio de
cuatro ejemplos de pobhóiones que se nombraron, usted podría obtener
azar por un auütor' uT
200 uansacciones de ventas de Good Tunes & More, elegidas al Tue.sP
de 30 clientes de Good Tunes & More a los que se pide responder
una encuesta sobfe satisfaccióD"
para un estudio de marketing, y una
una muestra de 50 estudiantes de tiempo completo elegidos
política por teléfono'
muestra de 500 votantes registrados enbhio quieoes se aplica una encuesta
" o las personas en la muestra representan una parte
Eo .ud" *o
d. .rtos ejemp-los, las tansacciones
de los objetos o individuos que confonaan la población'
que siwen para.describir
Los áros dos ténnino sbáEicos,pdfámet\o y esfddísnco, son medidas
que describe una.variable.que
los datos asociados con una vanabié. Un parámetro es uua medida
vanabLe que uü[za
utiliza datos de una población. un estadístico es una medida que describe
una

datosdeunamuestra,Elpromediodelastra¡saccion€sdeventasdeGoodTunes&Morepanunaño
.rf..in.o ., * .¡..plo de un panámeno, po¡que la medida, el promedio' descnbe los datos de pro-
una
En contasle' el
p"ii..lo", q.t ."ista ¿e to¿as tas transaccionei realizadas en un año específico
me¿io ¿e itiO tansacciones cle ventas de Good Tunes & More, elegidas al azar por un auditor para su
estudio,esunejemplodeunestadís'ticoporquelamedidadescribelosdatosdeunamuestra.
parámetro y estadís-
como se obse¡va en el stguiente resumen de definiciones, los conceptos
y referirse de manera
tico también se pueden definir utilizando la palabra caracteistica evitando
explícita a variables.

VOCABULARIO BASICO DE ESTADISTICA


que se desea obtener
Una población consta cle todos los objetos o indiüduos sobre los
conclusiones.
Una muestr¡ es una parte de una población, seleccionada para su análisis'
población'
Un parámetro es una medida que describe una car¿cterística de una
de una muestra'
Un estadístico es una medida que describe una característica

Problemas para la sección 1.4


APRENDIZAJE DE LOS FUNDAMENTOS d) Si existe una conexión de Intemet de alta velocid¿d en el
hogar.
-,-1.1 En un ¡estaur¿nte de comida rapida se venden cuato bebi- e) Si la anpresa que le brinda el servicio telefónico en el hog'
:,.:6^ ¿¡¡ffen¡s5' 6ebidas gaseosas' té, café y agua embotellada' es la misma que le proporciona el servicio de Intemel

Explique por qué el tipo de bebida que se vende es un fl Número de teléfonos celulares en el hogar.
ejemplo de una variable categónca. 1.5 La siguiente información se obtuvo de estudiantes
1.2 Un restaurante de comida nápida vende bebidas gaseo- cuando salian de la libreia de la universidad durante la pri-

sas de hes t¿maños: chic4 mediana y grande. Explique


por mer¿ semana de clases.
qué el tamaño de una bebida gaseosa es un ejemplo de una a) Cantidad de tiempo dedicada a comprar en la librerla
variable categórica. á) Número de libros de texto adquiridos
c) Carrera que estudia
1.3 Suponga que mide el tiernpo que tarda en descargar un d l Género
üdeo de lotemet. Explique por qué el tiempo de descarga es Clasifique cada una de estas varíables como categórica o
una variable numfica continua. numérica. Si la variable es numérica, establezca si es dis-
creta o continua.
APTICAOÓN DE CONCEPTOS
1,ó Determine si cada una de las siguientes variables es ca-
1.4 Determine si cada una de las siguientes vana- tegórica o numérica. Si la variable es numérica, establezca
bles es categórica o numérica. Si la variable es nu- si se [au de una variable discreta o contrnua'
méric4 establezca si se tr¿a de una variable discrela o conhnua' o) Nombre del proveedor del servicio de Internet
a) Número de líneas telefonicas fijas en el hogar' ú) Tiempo en horas por semana dedicado a navegal en
ó) Duración (en minutos) de la llamada telefónica más ex- Intemet
tensa realizada en un mes. c) l{úmero de mensajes de ter'to enviados er ¡rna semana
c) Si un miembro de la familia posee un teléfono celular d) Número de compras en li¡ea realizadas en un mes
con caoacidad Wi-Fi.
e) Si el individuo tiene un perfil en Facebook
T 1.5 Aplicaciones de la estadística para la computación

si cada una de las siguientes variables es ca- que "seleccione el círculo que corresponde a su nivel de in-
1.7 Deternine
o ¡uménca. Si la variable es numéric4 establezca gesos" y se le presentan varios rangos de ingresos entre los
tesórica
vanable discreta o continua. cuales debeni elegir el suyo.
siie rata de una
o) Explique por qué, en el primer formato, el ingreso podría
¿) Canudad de ¿inero gastado en ropa durante el mes anterior
conside¡arse discreto o continuo.
ri Tientla departamental favorit¿
á) ¿Cual de los dos formatos preferiría utilizar si tuviera que
,i' prtiodo durante el cual es más probable que se compre
¡6p¿ (entre semana, noche enhe semana o ñn de semana) realizar una encuesta? Explique su respuesu.

/) Número de pares de zapatos que posee 1.1 0Si dos estudiantes obtienen 90 en el mismo examen,
que ia va-
l.E Suponga que ia siguiente información se obtuvo de la soli- ¿qué argumentos se podrían utilizar para demostrar
riable subyacente (la calificación en el examen) es continua?
citud de un préstamo para crédito hipotecario que hizo Robert
Keeler a la Meto Counf Savings and Loan Association. '1 .'l1 El director de investigación de metcados de una gran

c¡ Pagos mensuales: $ 1,927 cadena de tiendas departamentales quiere realizar una en-
á) Número de empleos en los últimos 10 años: 1
cuesta a 1o largo de una zona metropolitana, para determinar
cj Ingreso familiar anual: $76,000 la cantidad de tiempo que las mujeres trabajado¡as dedican
y') Est¿do civil: casado.
a comprar ropa durante un mes normal.
Clasifique cada r¡na de las respuestas de acuerdo con el a) Describa tanto la población como la muesfa de interés. In-
tipo de datos. dique el tipo de datos que podría necesitar reunir el director.
1.9 Una de las va¡iables que se incluye con mayor ftecuen- á) Elabore un primer borrador del cuestionario que se le'
'' 'cia en las encuestas es el ingreso. En ocasiones, la pregunta quiere en el inciso a) redacando tes preguntas categóricas
se redacta de la siguiente forma: "¿Cuál es su ingreso (en
y tes p¡eguntas numéricas que considere adecuadas para
miles de dólares)?". En otras encuestas se pide al individuo esta encuesta.

at,

1.5 Aplicaciones de la estadística para la computación o


Los avances de la inform.ítica durante los últimos 40 años han llevado la computación estadística a o
las mesas de negocios. La funcion¿lidad estadístrca es t¿n común en la actualidad que muchas ta-
o
N
reas estadísticas sencillas que antes se ¡ealizaban exclusivamente con lápiz y papel o calculadoras (¡¡
(¡¡
rranuales ahora se llevan a cabo de fomra electrónic4 con la a¡,r:da de aplicaciones estadísticas.
Excel y Minitab son ejemplos de aplicaciones computacionales muy útiles en estadística. Excel
es la aplicación para análisis de datos de Microsoft office que evolucionó de las hojas de cálculo
electónicas anteriores, las cuales se utilizaban en aplicaciones financieras y de contabilidad. Mini-
tab, una aplicación dedicada a la estadlstica o paquete estadístico, se desanolló con la finalidad de
realizar análisis estadísticos lo más precisos posibles. Las versiones de Minitab conen en gnndes
sistemas de cómputo y pueden realizar. análisis corporativos para trabajos pesados que impüquen
conjuntos de datos muy gtandes. Excel y Minitab son dos proglamas muy diferentes, y sus diferen-
cias han generado un continuo debate sobre cuál de ellos es más adecuado para un curso de intro-
ducción a la estadística para negocios. Los partidarios de cada programa destacan sus puntos
fuertes: Minitab es una solución estadística completa; Excel es una herramienta computacional
común que se utiliza en muchas ernpresas (y también en muchas escuelas de administración).
Aunque es probable que usted esté más familiarizado con Excel que con Minitab, ambos pro'
gramas tienen muchas similitudes, empezando porque ambas utilizan hojas de cálculo para alma-
cenar los datos a arralizar. Las hojas de cálculo son ordenamientos tabula¡es de datos en los que las
intersecciones de frlas y columnas forman celdas, es decir, casillas en las que Se rngresan datos. En
Minitab los datos para cada variable se colocan en colum¡as separadas, lo que tambien suele ha-
cerse en Excel. Por lo general, para realizar un análisis estadístico con cualquiera de los programas,
se selecciona una o más columnas de datos y luego se aplica el comando adecuado.
Tanto Excel como Minitab le permiten guardar las hojas de cálculo, la información progra-
mada y los resultados en un solo archivo llamado libro de trabajo en Excel y proyecto en Mini-
tab. En Excel los libros de trabajo son conjuntos de hojas de cálculo y hojas gáficas. un libro de
trabajo se guarda cuando se almacena "un archivo de Excel" (ya sea como un archivo .ds o xlsx).
En Midtab un proyecto incluye hojas de cálculo de ütos, todos los resultados que se muestr¿n en
una ventana de sesión y todas las gfáficas creadas para los datos. A diferencia de Excel, en Mini-
tab es posible guardar tanto hojas de cálculo individuales (por ejemplo, archivos de hojas de
cálculo .mtw) como todo el proyecto (por ejemplo, un archivo de proyecto .mpj).
10 CAPfTLO I Intoducción

para aprender y practicar los métodos estadísticos que se estudian en €ste libro, puede usar
det¿lla-
Excel o Minitab. Ai final de cada capítulo se presentan guías que contienen ilstl¡cciones
que estudiaron. Esas guías
das para apticar Microsoft Excel y Minitab a los métodos estadísticos se

de Éxcel y Minitab utilizan algunos de los rchivos descargables que se analizan


en el apéndice C,
para ilustar paso a paso el prúeso de aplicación de ua método. Las guías de Excel, ademris'
ofre-
que le permiten uülizar
cen una selección de técnicas (todas conducen a los mismos resultados)
de arena"
Excel de una forma semiautomatizad¿ para obtener resultados nipidos, o como una "caja
en la que usted co¡xrtuye los resultados desde el principio o a partir de planlillas modelo. Esto se

exnlica de manera máq detallada en la sección EGl.l de la guía de Excel del capítulo l-

1.6 Cómo utilizar este libro


El material de este übro esti organizado con base en cuato usos irrportantes de la est¿dística de los
los datos de nego
negocios (véase la sección 1.2). Los capítulos 2 y 3 presentan métodos que resumen
cio-s para üevar a cabo la primer¿ de las t¿¡e¿s listadas. Los capítulos 4 al l l analizal métodos que uti-
tarea)' Los capíttfos
lizan'datos muesF¿les para sacar conclusiones acerca de poblaciones Qa segunda
12 y 13 describen m*odos pua realizar pronósticos confables (la tercera tarea).
El capítulo 14 pre-
senta los métodos que se puldeo utiLiz- para mejorar los procesos admi¡ist'ativos (la cu¿fta tarÉ
que le ayudará.a aprenucr
Ademrás, en el capífulo 2 ie presenA un método de solución de problemas
estadística.
m¿to¿os indviauah y a aplicar sus conocirnientos fuer¿ del contexto del curso de
las cuales le tlaran las bases pa¡a tomaf
Para ayudarle a desanollar e integar esas habilidades,
sobre el uso de
me¡ores dáisiones, cada capítulo de nsadú dca para negocios inicia con una sección

h éstadística. Cada sección describe u¡a situacióu de negocios reaüsa y plantea pregunt¿s que ayu-
dan apresentar conceptos o métodos estadísticos específicos. Por ejemplo' la descripción sobre la
y algunos tcnas
enpresa GT&M Holdings de este capítulo presenta los tipos de métodos estadísticos
tratan
relacionados con la deñnición de una variable. En otros capitulos las secciones iniciales
qué zona de un supamercado aumentan mrás
temas ñás eqEcíficos utilizando preguntas como: "¿En
¿¿El ventas?'.
las ventas de una bebida de cola?; o tamaño de una tienda minoriSra influye en las
-
Al final de cada capíh¡lo se retoma la sección inicial para describir cómo se podrían utiüzar los
también se
métodos específicos disc¡itos en el capítulo para responder las preguntas planteadas_;
'!f y de repaso del
incluyen secciones como Resurnen, Términoi clave, Ecuaciones clave Problemas
capítulo, las cuales le ayudarán a reforzar lo que aprendió'
' En ía mayoría de lás capítulos, tlespués de este material de repaso, enconüará un estudio.de
!t
caso seriado iue le permitiri aplicar la estadística a los problemas que etfrenta la administ"ció¡
I La mayoría
de Ashland Multicomm services, un prove¿dor de telecomunicaciones residenciales.
tf; que examinará una variedad de doo"-
los capítulos también incluyen un caso digital, en el usted
problemas o ana-
mentos electónicos y aplicani sus conocimientos de estadística para resolver los
'. respecto
I lizar las cuestiones que istos plantean Muchos de los casos digitales lo hanin reflexionu
(La sección "Aprendizaje con los casos digitales", in-
al uso adecuado o éiico de la estadística.
cluido en la página 14, presenta este conjunto único de casos de.negocios). Por ultimo,_al final de
Minitab que
cada capítr ó, J*."po il últi-o, se presentan las Guías de Excel y las Guías de
a las

se hizo ieferenci¿ en la sección I .5 .


de-u:;
No se preocupe si su profesor no cubre todas las secciones de cada capítulo. Los cursos
y número de créü-
toducción a la estadistica de negocios varían en cuanto a su alcance, duración
elegido
tos universitarios. Es probable que el área funcional de especialización que usted haya
también influya en los temas que
(contabilidad, administración, frnanzas, marketing, etcétera)
aprendeni en clxe, o en las lecturas que le asignen o que elija en este libro'

Lista de requ¡s¡tos Para ¡niciar


y y utilizar u-
Para darle el mejor uso a este libro necesita trabajar con Excel o Minitab, descargar
descargasde este
chivos, así como otos recursos electrónicos que estan disponibles en la página de
Para reducir al nuáximo los problemas
ilo cual se describe de manera detallada en el apéndice C).
que podría enfrentar mrás adela¡te al utilizar esos recursos, revise y responda la lista de.requisitos
d. U tobto 1.2. Cuando haya marcaCo todas las tareas que son necesarias para su propio trabajo,
estará listo para émpez¿r a ies¡ la Guía de Excel o de Minit¿b del capitulo
l, y para utilizar el mate-
rial complementa¡io de los apéndices B, C, D' F y G, cuando sea necesano'
1.6 Cómo utiliza¡ este libro 11

fABLA 1.2 o Seleccione cuál progama, Excel o Minitab, utrlizaÉ con este libro. (Es probable que su profesor
haya tomado esta decisión por usted).
Lista de requlsllos
D Lea el apéndice A si necesita aprender o repas¿r notación y conceptos matemáticos básicos.
para empezar a
iabajar con o Lea el apéndice B si necesiia aprender o repasar conceptos y habilidades básicas de cómprlto
Estadíst¡ca Para a Descargue los archivos y ohos recursos electrónicos necesarios p¿ra tnbajar con este libro. Lea
negocios. Un curso el apóndice C para saber más acerca de las herramientas que puede descargar de la página de
básico descargas para este iibro. @ste proceso requiere el acceso a Intemet).
O Instale adecuadamente el programa elegido y aplique todas las actualiz¿ciones disponibles para
el mismo. Lea la sección D.1 de los apéndices pará saber cómo enconaar y aplicar las
actualizaciones. (Este proceso requiere el acceso a Intemet).
D Si planea utilizar PHStat2 con Excel, responda la lista especial de requisilos incluida en la
sección D.2 de los apéndices. Si planea utilizar las Herramientas para Aarílisis (Analysis
ToolPak) con Excel, lea y siga las instrucciones de la sección D.5 de los apendices.
o Revise los apéndices F y G pa.ra que sepa en qué le podrían ayudar estas secciones cuando utilice
este libro con Excel o Minitab.

Una vez que temrine de responder la lista de requisitos estará listo para empezar a utilizar las
Guías de Excel y las Guías de Minitab que aparecen al final de los capítulos. Estas guías le indican
cómo aplicar Excel y Minitab a los métodos estadísticos que se estudiaron en el capítulo. Las
Guías de Excel y l¿s Guías de Minitab para este capítulo (las cuales inician en las páginas 16 y 21, o
respectivamente) revisan las operaciones básicas de estos programas y explican la manera en que
esos programas manejan el concepto del tipo de variable que se explicó en l¿ sección 1.3.
Las instrucciones en las Guías de Excel y las Guías de Minitab, así como los apéndices rela- o
cionados, utilizan los términos acostumbrados para las operaciones de cómputo que se presentan
o
o
en la tabla 1.3. Lea y repase el apéndice B si parte del vocabulano de la tabla es nueva para usted. N

5
Operación Ejemplos Intero retación
TABLA 1.3
Teclas Enter Los nombres de las teclas siempre son el objeto directo del
Términos utilizados Ctrt vetbo presionar, como en "presionar Enter".
para las operaciones
shift
de cómputo
Combinación Chl+C Algunas acciones del teclado reqüeren que se presione más de
de teclas Chl+Shift+Enter una tecla al mis¡ro tiempo. Ctrl+C significa presionar la tecla
C mientras se mantiene presionada la tecla Ctrl.
Ctrl+Shift+Enter significa presionar Ia tecla Enter mientras
se mantienen presionadas las teclas Ctrl y Shift.

Hacer clic en Clic en OK Hacet clic con el mouse sobre un objeto. Cvnü los objetos sobre
un objeto Clic Todo en la los que se hace clic pertenecen a rma ventana que contiene más de
sección Núnero de una pane, umbien se lndica el nombre dela pane; por ejemplo'
páginas "en la sección Núnero de ptÁginas". Revise la sección B.2 de los
apendices para saber qué verbo se utiliza en este übro con los
obietos sobre los que se hace clic.

Una secuencia de elecciones del menú o cinia esli representada


Selección del Archivo ) Nuevo
)
Archivo
por una üsta de opciones, separadas por el símbolo
menú o cinta Presentación +
Tendencia ) ) Nuevo signifca que primero se seleccionaArchivo y después,
Tendencia lineal de la lista de opciones que aparece, se selecciona Nuevo.

Objeto Selecciona¡ Un objeto en ililicas significa que el objeto real vría,


marcador variablename dependiendo del contex.tio de ta instrucciórl "Seleccionar
de posición variablename" podrn significar "seleccionar la variable Yentas
anuales" para un problema y "seleccionar la variable Yentas
mensuales" para oto.
tz CAPÍTWO 1 Inhoducción

En GTuM Holdings, Revisión

n la sección inicial sobre GT&M Holdings, se describió cómo


los

gerentes enfrcntaban problemas a corto y largo plazos' Para resol'


ierlos, necesitan utiliz¿r mé¡odos estadísticos de forma adecuada"
que
Su primer¿ t¿¡ea co¡siste en identificar y definir las variables
que podrí,an
son relevantes para esos problemas. Como algunas de las variables
aprender
identificar tienen miles de valores de datos, los gerentes necesitan
2)'
fomas de organizarlas, resumirlas y prcsentarlas (el tema del capítulo

R E.S'UM E
cos con-fiables y para mejorar los procesos administ'ativos'
En
La estadística es el conjunto de métodos que ayudan a dar sen-
y este capitr:lo usted aprendió el vocabula¡io básico de la estadís-
tido a los datos que se utilizan todos los días para describir
tica y los diversos tipos de datos que se utilizan en los nego
, analizar el mundo. El manejo de la estadística es una habilidad
cios. En los siguientes dos capín:los se estudianí 1a recolecciór'
fundamental necesaria para una educación completa en adru-
y de datos, así como las divenas tablas, gnificas y medidas des
nisración. Los gerentes utilizan la estadística para resumr
pronósti- criptivas que se utilizan para presentar y analizar datos'
obrener conclusiones a parur de los datos. para hacer

rÉnMlNOS
habilidad numérica 4 variable categórica 6
analítica 5
muesta 8 variable continua 7
datos 8
paquete estadístico 9 variable cualitativa 6
definición oPeracional
pariírmeno 8 variablecuantitativa 7
estadística 4
4 población 7 variable discreta 7
estadística descriPtiva
4 predicciónestadística 5 variable numérica 7
estadística inferencial
estadístico 8 variable 6

VERIFIOUE SU COMPRENSÉN APLICACIóN DE LOs CONCEPÍOS

y una 1.19 \iisite el sitio web oficial de Excel o de Minitab, www


1,12 ¿Qué diferencia existe entre una muestra offrce.microsoft .com./excel o www.minitab.com/products/
población?
minitab. Lea acerca del programa que eligió y luego piense
',|.13 de un parámetro? en cómo podría serle útil en los anáüsis estadísticos'
¿En qué diñere un estadístico

y la esta- 1.20 En 2008 una univenidad del Medio Oeste de Estados


1,14 ¿Enqué difieren la estadística descriptiva
Urudos apücó una encuesta a sus estudiantes de primer año de
dística inferencial?
úerrpo completo después de que taminaron el prima semeste'
entre una variable categórica y los
1.15 ¿Qué diferencia existe Las incuestas se distribuyeron por medios electónicos a
3,727 estudiantes, de los cuales respondieron 2,821' De los eshr-
una variable numénca?
diantes encuestados, 90. I % indicó h¿ber estudiado con otos
Lló ¿Qué diferencia existe entre
una variable numérica
alumnos y 57.i% dijo haber dado tr:toría a oto alum¡o' El in-
discreta y una variable numérica continua? forme también señaló que 61.3% de los estudiantes encuest¿dos
y por que estas llegaron tffde a clase al menos una ocasión y que 45 8% adru-
't.17 ¿Qué es una definición operacional uó que se abumó en clase al menos en una ocasión'
definiciones son tan imPortantes?
a) Descnba la población de interés'
,1g una variable y los datos? á) Descnba la muestra que se obtuvo.
1 ¿Qué diferencia existe entre
Problemas de renaso del caoíhrlo 1 3

uD parámetro de interés' c) Describa la población de interés.


c) Describa
utilizado para estimar el parámeno ú) Describa la muestra que se obhrvo.
/) óescriba ei est¿dístico
c) Indique si cada una de las cuatro variables demognáficas
en el inciso c)'
mencionadas es categórica o numérica.
Gallup publica los resultados de son-
1,21 La orgnización
su sitioweb www'g¡llup'com Visite este 1.2ó Un fabricante de alimento para gatos planeaba en-
áro, rr.i.ot.t en
sido Ylea algun art¡"lP d: Tt"tt' cuestar hogares estadounidenses con la finalidad de deter-
oe mteres' minar los hábitos de compra de los dueños de gatos. Entre
c) Describa [a pootacron
que,se. obh]vo las variables a obtener se encuentan las siguientes:
¡i Descnba la muesra
a) Describa un parame¡ro
oe lnteres' i. El principal lugar de conpra de alimento para gatos.
Á Describa el estadístrco utilizado
para estimar el parámetro ii. Si se adquiae alimento para gatos seco o húmedo.
en el inciso c)' iii. El número de gatos que viven en la casa.
iv. Si alguno de los datos que üve en la casa tiene pedigrí.
1,22 IJna enuesta Gallup indicó que 74% de los est¿douni-
c) Indique si en cada uno de los cuato elementos listados,
activos co¡sideran las cuentas de re-
denses económicamente
importantes para lajubilación. la variable es categórica o numérica. Si fuera numérica,
úro como fuentes económicas
interesante, 40% también dijo que considera las ¿es discreta o continua?
De manera
ó) Redacie cinco preguntas categóricas para la encuesta.
acciones con los fondos de inversión mutua del me¡cado
ju- c) Redacte cinco preguntas numéricas para la encuesta.
de acciones como fuentes €conómicas importantes para la
bilación. (Datos obtenidos de D. Jacobs, "Investon Look Be- 1.27 Una muestra de 62 estudiantes de licanciatura respon-
vond Social Securi¡r to Fund Reti¡ement", www.ga[up.com' dieron la siguiente encuesta:
i8 de marzo de 2011 ). Los resultados se basa¡on en las ent¡e- l. ¿Cuál es su género? Femenino _ Masculino _
vtstas telefónicas realizadas a 1,000 o miís adultos que vivian 2. ¿Qué edad tiene (a partir de su último cumpleaños)'l
en Estados Unidos, de I 8 años o mris, el 24 de mazo de 201 1. 3. ¿En qué grado académico estrii¡scrito actualmente?
a) Descnba la Población de hterés. Primer año Sesundo año Tercer
u,
ó) Describa la muestra que se obtuvo. año_ Cuarto año_
c) ¿Qué es para usted7 4o/o, \tn parámetro o un estadístico? 4. ¿Qué canera estudia? =
Expiique su respuesta. Contabilidad _ o
d'lY 40%, Les un parametro o un est¿dístico? Sistemas computarizados de i¡formación o
Economía/Finanzas o
f.23 La Data and Story Library (DASL) es una biblioteca N
efl Lhea de a¡chivos de datos e historias que ilustan el uso de Negocios intemacionales (¡l
Administación (,l
métodos estadísticos b¡isicos. Visite lib.stat.cnu.edr¡,/index.
php, haga clic en DASL y explore un conjunto de datos que Ventas al menudeo,4Vfarketing _
le interese. Ota _ Indeciso_
c) Describa una variable en el conjunto de datos que selec- 5. ¿Planea estudiar un posgrado?
cionó. Sí No _ No estií seguro
ó) ¿La variable es categórica o numérica? 6, ¿Cuál es su calificación promedio acumulada actual?
c) Si la variable fuera numérica, ¿es discreta o continua?
7. ¿Cuál es su situación laboral actual?
1.24 Descargue y examine el documento "2007 Survey of
Business Ov¡ners and Self-Employed Persons" del U.S. Cen-
Trabaja tiempo completo _ Trabaja medio tiempo

sus Bureau, que está disponible directamente en bhs,econ.


Está desempleado _
¿Qué sueldo anual inicial esperaría recibir si buscara un
census.gov/BHS/SBO/sbol_07.pdf o a través de la liga Get
trabajo de tiempo completo inmediatamante después de
Ilelp with Your Form en www.census.gov/econ/sbo.
obtener su tíhrlo univenitario?
a) Dé un ejemplo de una variable categórica que esté inclu-
9. ¿En cuántos sltios de redes sociales esta registrado?
ida en la encuesta.
10. ¿Qué tan satisfecho se siente con los servicios de ali-
á) Dé un ejemplo de una variable numérica que esté inclu-
mentos oue se ofiecen en la universidad?
ida en la encuesta.
1234567
1.25 Tres profesores de la Northern Kentucky University Muy Neutral Muy
compararon dos métodos diferentes de enseñanza en la escuela insatisfecho satisfecho
de administración pf. W. Ford, D. W. Kent y S. Devoto, "Lear- 11. ¿Aproximadamente cuánto dine¡o gastó este semestre
nurg From the Pros: Influence ofWeb-Based ExDert Commen- en libros de texto y materiales? _
lary on VicaÍious Leaming About Financial Markets", ,ec6ion 12. ¿Qué tipo de computadora prefiere utilizar para sus
:niences Jounal of Innovative Education, enero de 2007, 5(l), estudios?
43-631. Cuando se realizó el estudio había 2,100 estudiantes en De escritorio Portátil Tablet/noteboold
la escuel¿ de administ¡ación, 96 de los cuales participaron netbook
en é1. Los datos demográficos que se obtu,rierón de üs 96 13. ¿Cuántos mensajes de texto envía en una semana
estudiantes incluyen grado académico (primero, segundo, normal?
tercero y cuafio años), edad, género y carrera.
14 CAPÍTULo I Intoducción

8. ¿Cuántos trabajos de tiempo completo ha tenido en los


14. ¿Curínta riqueza (ingresos' ahorros, inversiones, bienes
últimos 10 años?
ümuebles y otros bienes) tendría que acumular (en mt-
rico? 9. En caso de conseguir un empleo de tiempo completo,
llones de d6lares) para considerarse un individuo
inmediatamente después de
a) ¿Qué variables de la encuesta son categóricas? ¿qué sueldo anual esperaría
terminar sus estudios de posgrado?
l¡¿qoe uariutt"s de la encuesta son numéricas?
10. ¿Aproximadamente cuánto dinero gastó este semestre
c¡ ¿qué variables son numéricas discretas?
en libros de texto Y materiales? -
resultados de la encuesta están almacenados en 11. ¿Qué tan satisfecho se siente con los servicios de aseso-
ia del programa de posgrado que se ofrecen en la uni-
-
versidad?
1,28 Una muestra de 44 estudiantes de posgrado respon-
dieron la siguiente encuesta:
1234567
Hombrg Muy insatisfecho Neutral Muy satisfecho
1. ¿Cuál es zu genero? Muja ,= . 12. ¿Qué tipo de computadora prefiere utilizar para sus
Z. ique eaaaliene (lparrir de su último cunpleaños)'!
estudios?
- - De esc¡itorio Portátil Tablelnoteboold
3. ñtr,áGs su a¡eu de estudio en la actualidad?
netbook
Contabilidad
13, ¿Cuántos mensaJes de texto envia en una semana
EconomíalFinanzas
Administración -- normal?
-
14. ¿Cuánta riqueza (ingresos, ahorros, inversiones,.bienes
Ventas al menudeo/I4arketing mt
inmuebles y otros bienes) tendría que acumular (en
Otra Indeciso
- llones de dóhres) para considerarse un individuo nco?
-
su calificación promedio ¿cumulada actual?
4. ; Cu,il-es
5. ICuál es et área de estudios de su ücenciatura?
-
Óiencias biológicas Admidstración o-¡pue uatiubl.s de la encuesta son categóricas?
lngeniería ó) iQué variables de la encuest¿ son numéricas?
Ilformátrca
c¡ iqué variables son numéricas discretas?
Otra - -
fue su calificación promedio acumulada en la
6. ¿Cu-n - - Los resultados de la encuesta están almacenados en
licenciatura?
- _- @
7. ¿Cuál es su situación laboral actual?
irabaja tiempo completo Tnbaja medio tiempo
Está desemPleado

-
-
D E,L
denciales. También podrá encontrar una serie de
casos
Al final de casi todos los capirulos, se encuenra un estudio
a los dieitales que amplían muchas de las secciones del Uso de '
,) de .aso seriado que le permitirá aplicar la estadística
problemas que enftenta la administración de Ashland Mult! .rá¿irtr.á que sé presentan al inicio de cada capítulo'
'Comm proveedor de telecomunicaciones resi-
S.-ic.s, un

de un es-
y pre- estadística y luego corregir los enores. A diferencia
La gente utiliza tecnicas estadísticas para comutricarse muchas situa-
los demiás tanto dantro como tudio de caso nádicional, pero al igual que en
seniar i¡formació¡ importante a
sera
todos ciones de negocios, no toda la información que aparece
fuera de sus empresas. A1 igual que en estos ejemplos, ocaslones d€s-
de manera inade- relevante para la tarea, y es probable que en .
los días las penonas uúlizan estas técnicas para
gerentes cubra información en conflicto que deberá resolver
cuada. Una responsabilidad importante de todos los
y eütar el mal uso de la estadístic4 ya comoletar el caso.
consiste en idenhfcar
desano' iaru opoyu, ,u up..ndizaje, cada caso digital comienza
sea o no intencional. Los casos digitales le ayudarán a
problema o
con un objátivo de aprendizaje y un resumen del
llar las habüdades necesarias para esu importante t'area' necesa-
tema a tratar. Cada caso lo conduce a la información
En un caso' digital se le pide que revise documentos y responder las
ria para obtener sus propias conclusiones
electrónicos relacionados con una empresa o con un
tema
documentos para
la estadística orauuotut. Usted puede trabajar con los
estadístico que se analüó en la sección Uso de ".uro,
reüsa el contenido de esos documen- io, dieitales fuera de línea después de bajarlos de la
de ese capíürlo. Usted
oásina de déscargas de esre libro lvéase el apéndice C)'
o
y asevefaclones ln-
tos, Ios cuaies pueden coniener hechos capitulo por
teáas confidénciales o públicas, con la finalidad de tiá. rabaiar.on lot.utot digitales en línea'
de Ia caoirulo. en el sitio web complementario'
identifrcar los casos en los que se haya hecho mal uso
Refe¡encias 15

nunca serían utilizadas por quienes buscan utilizar represen-


DE UN CASO DIGITAL
EJEMPLO taciones gráficas de manera adecuada.
Écr, sección ilusna el
aprendizaje con ut caso digital Para
Ademiás de esto, su¡ge la duda de si los datos de ventas
archivo GTM'pdf del caso digital, que in-
ilpr"*, uar^
"ldel sitio web de Good Tunes & More Re- representan el número de unidades vendidas u ot:¿ cosa. La
matenal
"i,i'". forma en que se utilizaron los símbolos da la impresión de
.u-rr¿. qu. la empresa privada Good Tunes & More' tema de
que se presentan datos de ventas de unidades. Si es así, ¿es-
t'a se.ci6n
Uso de lu-estadistica de.este capítulo, busca fman-
tos datos sustentan de la mejor manera la aseveración dada?
ampliarsu radio de acción abriendo tiendas
c]a¡niento para
los direcüvos están ansiosos por demos- ¿O acaso alguna otra informacióq como el volumen en dó-
-ino¡stus. Como lares, sería un mejor indicador de las ventas al menudeo?
que Good Tunes & More es una compañia
próspera' no
trai Y después esLlr las ambiguas leyendas de las gráficas:
., ro.pr.na.t que en la primera página de la sección

..Good Times at Good Tunes & More" se encuenfe la ase- "los últimos 12 meses", ya que podrían inclui¡ tanto meses
mejor año de ventas"' del año ¿ctual como meses del año anterior y, por lo tanto,
ve¡ación "nuestro
podrian no ser un equivalente al poiodo de "hace dos añ0s".
Haga clic en la liga nuestro mejor año de ventas para
esta a6nnación. ¿Usted cómo res- Sin embargo, la empresa se fundó en 1997 y se hace refe-
abrir la página que respalda
una tabla de números? ¿Con rencia al "mejor año de ventas"; entonces, ¿por qué la admi-
oal.daría esta aseveración? ¿Col
atibuibles a una fuente cono- nistración no incluyó citas de ventas p ua cada aÍLo2
una Erífica? ¿Con observaciones
..do*? Good T*.s & More uhlizó una gnfica pan presentar ¿Los directivos de Good Tunes & More estar¡fur ocul-
y "de los últimos 12 tando algo o es que desconocen el uso adecuado de la esta-
los datos de ventas "de hace dos años"
dística? De cuaiquier forma, no lograron comunicar de
meses" por categoría. ¿Hay algun problema con las decisiones

oue se tomaron en esta página web? ¡Definitivamenle sí!
manera adecuada un aspecto yital de su historia.
,t.
li En primer lugar, observe que los símbolos utilizados no En casos digitales posteriores se le pedirá que realice
tienen escala, por lo que es imposible saber cuáles son los este tipo de análisis utilizando como guía las preguntas
i volúmenes de ventas reales. De hecho, como veremos en Ia abiertas del caso. No todos los casos son tan di¡ectos como v,
sección 2.8, las gráficas que incluyen los símbolos en esta este ejenplo, y algunos incluyen aplicaciones perfectamente
=
fon¡a se consideran ejemplos de gzdT1cas áasura, las cuales adecuadas de la estadística

:s
o
o
t o
N
REF.ERE 9¡

¡ 1. Davenpof, T. y J. Harris, Competing on Analytics: The 6. Microsofi Excel2010 (Redmond, WA: Microsoft Corpo-
:T
New Science of Winníng (Boston: Harvard Business ration, 2010).
School Press, 2007). 7. Minitab Release l6 (State College, PA: Minitab, Inc.,
'I 2. Davenport, T., J. Harris y R. Morrison, Analytics at Work 20lo).
(Boston: Haward Business School Press, 2010). 8.Nash, J. C., "Spreadsheets in Statistical Practice-
3. McCullough, B. D, y D. Heiser, ''On the Accuracy of A¡other Look", The Amerícan Statistician, ó0 (2006),
Statistical Procedures in Microsoft Excel200':'", Com- pp.281-289.
putational Statistics and Data Analysis, 52 (2008), 9. "New York 1964 World's Fatr", National Geographic,
pp. 4568-460ó. abril de 1965, p. 526.
4. McCullough, B. D. y B. Wilson, "On the Accuracy of 10. Thompson, C. "What Is I.B.M.'s Watson?" http://www.
Statistical Procedures il Microsoft Excel 1997" , Com- nytimes. com/20 I 0 I 0 6 I 20 | ma,ga,zine/20Computer-t.
putat¡onal Statistics and Data Analysis,3l (1999), html,20 de junio de 2010, p. MM30 de la revista do-
DD. ¿t-Jt. minical.
5. ir.icCullough, B. D. y B. Wilson, "On the Accuracy of
Statistical Procedures il Microsoft Excel 2003", Coz-
putational ,Srat¡stics and Data Analysis,49 (2005),
pp. 1244-1252.
16 CAPÍTULOI Int¡oduccióo

GEl.1 INTRODUCCIÓN A EXCEL


Si ya respondió la lista de requisitos de la tabla I .2 y revisó la tabla 1.3 con los términos para las
operaciones de cómputo en la págila I 1, entonces ya esta casi listo para utilizar Excel. A¡tes de ir
más lejos, decida cómo utilizar Excel con este libro. Las Guías de Excel incluyen las instucciones
de Excel en profundidad, que no requieren software adicional, y las instrucciones de Pl,S/a12, que
utilizan PHStat2, una extensión que simplifica el uso de Excel creando resultados idénticos a los
que se obtendrían utilizando las instrucciones de Excel. En la tabla EG1.l se listan las ventajas y
desventajas de cada tipo de insfucción. Debido a la equivalencia de ambos tipos, puede altenar
entre ellas en cualquier momento al utilizar este libro.

TASTA GE1.1 lnstracciones de Excel m profundidad

Tipos de Proporciona instrucciones paso a paso para aplicar Excel a los métodos estadísticos del capítulo.
instrucciones para Ventajas Se aplica a todas las veniones de Excel. Crea hojas de cá1cu1o y hojas gráficas "vivas"
la Guía de Excel que se actualizan de manera automática cuando cambian los datos básicos.
Desventajas Podría tomar mucho tiempo, ser frustrante y provoca¡ muchos enores, especialmente
para los novatos. Podría obligarlo a concentr¿rse en detalles de Excel de bajo nivel, distrayéndolo
del aprendizaje de la estadística.
Instrucciones de PHStat2

Brinda instrucciones paso a paso para utilizar el auxiliar PHStaO con Excel. (Para conocer más
acerca de PHStat2, véase el apéndice G).

Ventajas Crea hojas de cálculo y hojas gráficas'Vivas" que son iguales o similares a las que se
pueden crear con las instrucciones de E¡¿el m pmfundídad-Lo libe¡a d€ tener que concentrarse en
det¿lles de Excel de bajo nivel. Se utiliza para conoborar con rapidez los resultados oeados por las
I hstrucciones de Exc el en profundidad .
i
Desventajas Se debe instalar de fbn¡a separada y, por lo tanto, requiere conocimientos sobre la
{ instalación del software en su computadora. (Véase el apéndice D para los detalles técnicos). No es
'I
compatible con versiones Mac OS de Excel.
i!

tt)
t '. -, Si desea dominar Excel y ganar práctica en constuir las soluciones de manera ascendente, de-
berá utilizar las instrucciones de E¡ cel en profundidad. Si prefiere nabajar de forma descendente, es
decu, si primero quiere obtener resultados nípidos y después estudiar los detalles de una solución,
entonces quená aprovechar al máximo el uso de las instucciones de PHStat2. En cualquier momento
puede altemar el uso de estos métodos sin sacrificar su comprensión. Ambos métodos conducen a
resultados idénticos o casi idénticos, los cuales se presentan prhcipalmente en forma de libros de
trabajo reutilizables. Estos libros de trabajo, al igual que los libros de trabajo descargables (véase
et apéndice i), se pueden guardar y reutilizar con otros problemas, así como en otros cursos o en el
lugar de trabajo.
Cuando es necesario, las Guías de Excel también incluyen instrucciones de las Herrami€ntas
para Análisis (Analysis TootPak), un componente opcional de Excel que Microsoft distribuye con
nuchas versiones de este programa, excepto con la versión actual de Mac Excel.
Las instrucciones de la Guía de Excel contienen las versiones 2010 y 2007 de Whdows Excel y
señalan zus dife¡encias, cuando estas son significativas. Las instrucciones están redactadas de tal ma-
nera que sean lo más compatibles posible con las veniones actuales de Mac Excel y OpenOfrce.org
Calc, que funcionan de manera muy similar a Excel. Si utiliza Mac Excel u OpenOffice org Calc,
El resto de esta Guía podní uülrzar casi todos los libros de aabajo que se mencionan en las instucciones de Excel en prcfin'
de Excel revisa los didad. Si empleala versión mrís antigua de Excel 2003 para Windows, puede utilizar las instrucciones
conceptos básicos y las
de PHStat2 y descargar del sitio web que complementa este libro el documento Uso de Excel 2003
operác¡one5 comunes
que encontrará al utilizar con Estadística basica para negocios, que adapta las instrucciones de Excel en profundidad patala
Excel con este libro. versión 2003 de Excel.
Guía del caDiiulo I Para Excel 17

GE1.2 INGRESO DE DATOS Y TIPOS DE VARIABLES


Como se expuso en la sección 1.5, los datos para cada variable se ingresan en una columna sepa-
rada. Por costumbre, se inicia con la columna A y se anota el nombre de cada variable en las celdas
del primer renglón, y luego se ingresan los datos de la variable en los renglones subsiguientes,
como se muesta en la fieura EG l.l

FIGURA GE1.1
d¡ una cas. 6r,
Un ejemP]9 0J0 9, 6l LloE ¡iel¡te
hoja. de catcuto 0,7t rr: 5.6 av€r{l

de datos

Excel hfiere el tipo de variable a partir,de los datos que se ingresan en una columna. Por ejem-
plo, si Excel descubre que una columna contiene ntlneros, la trataní como variable numérica' Si
Excel descubre que una columna contiene palabras o d¿tos alfanuméricos, la tatará como una va-
riable no numérica (categórica). Este método imperfecto funciona la mayor parte del tiempo en
Excel, especialmente si usted se asegura de que las categorías de su variable categórica sean pala-
bras o fiases, como "sí" y "no", y no valores codificados que podrían confundirse con valores nu-
méricos, como "l","2" y"3". Sin embargo, como no es posible definir el tipo de variable de forma
explícita, en ocasiones Excel comete "errores" al sugerir o permitir accio¡es absurdas como utili-
zar un método estadístico que está diseñado para variables numéricas con variables categóricas.
A1 ingresar datos, nunca se salte renglones en una columna ¡como regla general, evite sal-
tarse cualquier columna. Ponga atención a cualquier instrucción especial que apa¡ezca a lo largo u,
del libro con respecto al orden en que debe ingresar sus datos. Para algunos métodos est¿üsticos,
ingesar los datos en un orden que no es aceptado por Excel producirá resuliados incorrectos.
=
La mayoría de los libros de trabajo de Excel que puede bajar del sitio de descargas de este libro o
(apéndice C) y utilizar con las Guías de Excel contienen la hoja de cálculo DATA que sigue las re- o
o
glas de esta sección. Cualquiera de esas hojas de cálculo sirve como un modelo adicional para el N
(¡l
método con el que decida ingresar los datos de variables en Excel.

GE1.3 CÓMO ABRIR Y SALVAR LIBROS DE TRABAJO


Los libros de trabajo se pueden abrir y guardar seleccionando primero el arcbivo que almacena dicho
libro y luego especificando el nombre del archivo de este último. En Excel 2010 se selecciona
File I Open para abri¡ un archivo de un libro de Íabajo o File I Save As para aknacenarlo. En
Excel 2007 se selecciona Office Button t
Open paxa abrh un a¡chivo de un libro de tabajo o Office
Button + S¡ve As para almacenarlo como libro de habajo. Los comaados Open y Save As presentan
cuadros de diá1ogo casi identicos, los cuales varían solo ligeramente ente las diferentes veniones de
Excel. En la figura EGl.2 se observan los cuadros de dirí,logo Open y Save As de Excel2010.

FIGURA GE1.2 11,. i8.*' -,i*f:r, '.J}:í '. ll


Cuadros de diálogo
¡'.:,,.
lrrf I
cro@
Open y Save As de
¿ro.n*r ¡': !h \¡'
Excel 2010

Para seleccionar el a¡chivo de almacenamiento. se utiliza la lista desplegable que ¿parece en la


parte superior de cualquiera de esos cuadros de diálogo. Ingrese o seleccione de la lista el nombre
de un archivo para el libro de trabajo en el recuadro File name, haga clic en Open o Save para
't8 CAPITULO 1 Intoducción

completar la t¿rea. 41 guardar archivos, algunas veces deseará cambiar el tipo de archivo antes de
hacer clic en Save. Si desea aknacenar su libro de fiabajo en el formato utilizado por Excel 2003 y
versiones anteriores, seleccione Excel 97-2003 Workbook (*'xls) de la lista desplegable Save as
type (que se muestra en la figura GEl.2) antes de hacer clic en Save. Si desea guardar los datos en
un formato que se pueda abrir con programas que oo abren übros de trabajo de Excel, podría selec-
cionar Text (fab delimited) (*.trt) o CSV (Comma delimited) (*.csv) como el tipo de guardado.
Cuando quiera abrir un archivo y no encuentre su nombre en la lista, verifique que la carpeta
¿ctual de Look in sea la adecuada. Si lo es, cambie el tipo de archivo a All files (*,*) para ver todos
los archivos en la carpeta actual. Est¿ técnica le ayudará a descubrir erroles ortográficos ó exten-
siones de archivo faltantes que no permiten que se mueste el archivo.
Aunque todas t¿s versiones de Microsoft Excel hcluyen el comando Save, debe evitar esta
opción hasta que tenga experiencia, ya que si utiliza guardar es muy fácil que sobrescriba su tra-
bajo de manera inadvefida. Además, no puede utilizar el comando Save para cualquier libro de
trabajo abierto que Excel haya marcado como de solo lectura. (Para aknacenar este tipo de libros
de tabajo, utilice Save As.)

GE1.4 CREACIÓN Y COPIA DE HOJAS DE CÁLCULO


Se pueden crear nuevas hojas de cálculo creando un nuevo libro de trabajo o insertando hojas de
cálculo nuevas en un libro de habajo abierto. Para crear un libro de habajo nuevo, seleccione File
) New (Excel 2010) u Office Button I
New (Excel 2007), y en la ventana que aparece, haga
doble clic en el icono Blank workbook.
Los nuevos libros de tabajo se crean con un número fijo de hojas de cálculo. Para borr¿ las ho-
jas de crílculo sobrantes o insertar miis hojas, haga cüc con el boton derecho del mouse en la pestaña
de um hoja y haga clic en Delete o Insert (véase la figrrra GEl.3). Por defecto, Excel asigna nombres
en serie a las hojas de crilculo, como Sheetl, Sheet2 y así sucesivamente. Usted debení cambia¡ estos
nombres para reflejar mejor el contenido de zus hojas de críiculo. Pan cambiar el nombre de una hoja
de crí{culo, haga doble clic en la pestaña de la hoj4 escriba el nuevo nombre y presione Enter.

FIGU RA GEI.3
Menú rápido en la
hr.n-
pestaña de una hoja grktr
y.. e, -..-t-^v l^
^t Luou' uE
diálogo Move 8ar¡as

Copy. ldov. or Copt .


,',.o gkw C¿rr.

F¡l.d st¡r{.-
I.b Colr.
lldr

¡Él.d A! 3h.rlt

También puede hacer una copia de una hoja de cálculo o moverla a otro lugar en el mismo
libro de trabajo o en un segundo libro. Haga clic con el botón derecho en la pestaña de la hoja y
seleccione Move or Copy en el menú rápido que aparece. En la lista desplegable To Book del cuadro
cle diálogo Move or copy (véase ta figura G81.3) primero seleccione (new book) (o el nombre del
libro de trabajo elegido ya existente), marque el cuadro Creat a copy y luego haga clic en OK.

GE1.5 IMPRESIÓN DE HOJAS DE CÁLCULO


Para imprirnir una hoja de cálculo (o una hoja gráfica), primero abra la hoja con un clic en la pes-
taña. Luego, en Excel 2010, seleccione File 9
Print. Si la vista preliminar de la impresión que se
muestra (véase ta figura GEl.4) contiene errores o presenta 1a hoja de cálculo de una forrna no de-
seada, haga clic en File, realice las cor¡ecciones o los ajustes necesarios y repita File Print. )
Cuando esté satisfecho con la vista preliminar, haga clic en el botón gra:rde Print.
Guía del capítulo I para Excel 19

FIGURA GE1'4
de,
Vista Preliminar
impresión de Exce¡
z}ilo,fizqu¡erdal Y

F-J.cel ¿wl
(insertado), Y cuaoro
de diálogo de rage
SetuP (derecnal

En Excel 2007 el mismo proceso requiere un mayor número de clics. P¡imero haga clic en
Oflice Button y luego mueva el cursor sobre Print (pero sin hacer clic). En la galería de Preview
and Print, haga clic en Print Preview. Si la vista preliminar mostrada (véase la figura GEl.4) con-
tiene enores o presenta la hoja de cálculo de una forma no deseada, haga clic en Close Print Pre-
view, realice los c¿mbios necesarios y vuelva a seleccionar la vista preliminar de impresión. Una
vez que termine de hacer las co¡recciones y los ajustes, haga clic en Print en la vent¿na de Print o
heview para desplegar el cuadro de diálogo Print (que se muestra en la sección B.3 de los apéndi-
=
ces). Seleccione la impresora que se usará de la üsta desplegable Name, haga clic en AII y Active
Sheet(s), ajuste el número de copias en Number of copies y luego haga clic en Otr( o
En caso necesario, puede ajustar el fonnato de impresión mietrfras se encuenta en la vista pre- o
o
liminar de impresión haciendo clic en el icono de Page Setup @xcel 2007), o bien, en la liga de N
Page Setup (Excel 2010) para abri¡ el cuadro de diálogo Page Setup (la imagen derecha de la fi- (¡
gura GE1.4). Por ejemplo, para imprimir su hoja de cálculo con cuadrícula y encabezados de ren-
o
glón numerados y encabezados de columna con letras (similar a la apariencia de la hoja de cálculo
en la pantalia), haga clic en la pestaña Sheet en el cuadro de diálogo de Page Setup, marque Gri-
dünes y Row and column headings y luego haga cüc en OK.
Aunque todas las versiones de Excel ofrecen la opción (de inpresión) de Entire workbook,
obtendrá mejores resultados si imprime cada hoja de cálculo (u hoja grrifica) por separado cuando
necesite imprimir más ds
''na.

GE1.ó ENTR,ADAS Y REFERENCIAS DE LA


cuando cambian los valores dependientes en las otras cel-
HOJA DE CÁlCUt-O
das. Este proceso, denominado recálculo, fue la caracterís-
Cuando abre una hoja de cálculo especifica en un libro de tica irurovadora original de los programas de hojas de
habajo, utiliza las teclas de movimiento del cursor con su cálculo, la cual llevó a que estos progamas empezaran a
dispositivo de señalización para mover un indicador de utilizarse ampliamente en contabilidad. (Las hojas de cálculo
celda a lo largo de la hoja de cálculo y seleccionar una celda que contienen fón¡ulas en ocasiones se conocen como hojas
especifica- Cuando escribe una enhada, aparece en la barr¿ de cálculo 'Vivas" para distinguirlas de las hojas de cálculo
de fórmulas, y coloca esa información en la celda presio- "muertas", es decir, las que no contienen fórmulas y que,
nando la tecla Tab o la tecla Enter. o bien. haciendo clic en por tanto, no tienen la capacidad de recalcular).
1o
el botón de marca de la barra de fón¡ulas. Para referirse a una celda eD una fómula, utiüce una di-
. En las hojas de cálculo que utiliza para realizar cálculos
ntemedios o resultados, puede ingresar fórmulas, es deci¡,
rección de celda c on Ia forma Sheetl,{antelColumnRow. Por
ejemplo, DatalA2 se refrere a la celcla en la hoja de cálculo
nstucclones para efectuar un cálculo o alguna otra tarea, Data que se encuent¡a en la columna A y en el renglón 2.
además de la i¡formación numérica v del texto cue inüo- También puede utilizar solo la pafie Columna-Renglón de
duce en las celdas. Las fórmulas sueldutilizar valor., qu" ,. una dirección completa, por ejemplo, A2, si se esüi remi-
encuentran en ot¡as celdas para calcular un r.-sultado que tiendo a una celda en la misma hoja de crílculo en la que estrí
se muestra en la celda que;lmacena [a fórmula. Con ias ingresando una fórmula. Si el nombrc de la hoja contiene es-
formulas, el resultado mostado se modiñca automáticamente pacios o caracteres especiales, por ejemplo, CITY DATA o
20 CAPiTUto I lnftoducción

Figura-l.2, debe encer¡ar el nombre de la hoja entre comi- 83 se copie en la celda C3, que la fórmula =A4 + 84 se c0-

llas sencillas, como en'CITYDATA'IA2 o 'F'igura-1'2'!A2. pie en la celda C4, y así sucesivamente.
Cuando necesite refenrse a un gnrpo de celdas, como las Hay cücunstancias en las que quizás usted no desee que
celdas de una columna que ahnacena los datos de una variable Excel ajuste una parte o toda la fórmula. Por ejempio, si co-
en particular, utilice un rango de celdas, el cual nombra Ia pia la fórmula de la celda g2 =(tr2 + B2)lBl5' y la celda
celda supoior izquierda y la celda inferior derecha del grupo 815 contiene e1 divisor que utilizaÉ en todas las fórmu-
se

con el siguiente formúo SheeName'lUpperLeflCell: Lowe' Ias, no desear:i que la fórmula =(A3.. B3)/816 se copie eu
rRightCett. Por ejemplo, el rango de celdas DATAIAI:AII C3. Para evitar que Excel ajuste una referencia de celd4 uti-
identifica las pnmeras I I celdas en la primera columna de la lice una referencia de celda absoluta insertando un siglo
hoja de cálculo DATA. Los rangos de celdas se extienden so- de dólares ($) antes de las refe¡encias de columna y de ren'
bre muitiples columnas; el rango de celdas DATAIAI:DII se glón. Por ejemplo, la referencia de celda absoluta $B$15 en
refiere a las primeras 1l celdas en las primeras 4 columnas de la fórmula de la celda C2 copiada =(A2 + B2)i$B$15 provo-
la hoja de cálculo. caría,que Excel pegue =(A3 + B3y$B$15 en la celda C3.
Al igual que cuando se remita a una sola celda, puede (Para facilitar 1a lectura, las fórmulas que se muestran en
omitir la parte ,lheetNamel delz referetcia ¡emiüendose a u¡ ilustaciones de las hojas de cálculo en este libro, por lo ge-
rango rle celdas de la hoja de cálculo actual, y debe utilizar neral, no incluyen referencias de celdas absolutas).
un par de comillas sencillas si el nombre de la hoja contiene No conirnda el uso del símbolo de dó14¡es en una refe-
espacios o caracteres especiales. Sin embargo, en algunos rencia absolut¿ con la operación de formato que mu€sta los
cuadros de diálogo debe incluir el nombre de la hoja remi- números con valores de moneda estadounidense.
tiéndose a una celda para obtener los resultados adecuados.
(En tales casos, las instrucciones de este libro incluyen el
GE1.8INGRESO DE FÓRMULAS EN HOJAS
nombre de la hoja; de 1o conta¡io, no se incluyen).
DE CÁLCULO
Aunque en este libro no se utilizan, las referencias de las
il celdas oueden incluir el nombre de un libro de fabajo con el logrese las formulas escribiendo el signo de igual (=) seguido
il formato de una combinación de operaciones matemiíticas y de proce-
I Tal vez des- samiento de datos. Para las fórmulas senc las, utilice los sím-
f¡i cubra este tipo de referencias si, de manera inadvertida' bolos +, .-, *, l; y para las operaciones de suma, resta,
copia ciertos tipos de hojas de cálculo u hojas gnáficas de un nultiplicació4 diüsión y exponenciales (rm número elevado
t
ti libro de fabajo a oto. auna potencia), utilice ^. Por ejemplo, la ñmrula =DATA!B2
ill + DATAIB3 + DATAIB4 suma los contenidos de las celdas
i,
GE1.7 REFERET'ICIAS DE CELDAS 82, 83 y 84 de la hoja de cálculo DATA y muesha la suma
$ ABSOLUTAS Y RELATIVAS como el valoi en la celda que conti€ne la formula.
También se utilizan funciones de hoja de cálculo en las
Muchas hojas de cálculo contienen columnas (o renglones)
fórmulas para simplificarlas. Para utilizar una fimción de hoja
fl con fórmulas aparentemente similares. Por ejemplo, la co-
de cálculo en una formula, escriba la fimción como se mues-
il lumna C en una hoja de cálculo podría contener fórmulas que
F ha en las instrucciones de este libro, o bien, utüce el Asi'
[. los contenidos de los renglones de la columm A y de
' suman tente para funciones de Excel para insertar la función. s'
la columna B, La fórmula para la celda ¿2 tgn¿=L2 +82,la
I

fórmula pam la celda C3 seúa =A3 + 83, para la celda C4,


utiliza esta herramienta, seleccione Formulas t
Insert
Function y luego ilgtese Ia infomación necesaria; después'
=A4 +84,,y así sucesivamente hacia abajo de la columna C.
seleccione las opciones en los siguientes cuadros de diálogo.
Pa¡a evitar la monotonía de escribir muchas fómrulas simi-
Si ingresa las fórmulas en sus hojas de cálculo, deberá
lares, puede copiar una fórmula y pegarla en tod¿s las celdas
revisadas y verificarlas antes de utilizar sus resultados. Para
de un rango de celdas seleccionado. Por ejemplo, para copiar
ver las fórmulas en una hoja de cálculo, presione Ctrl+'
una fórmula que se introdujo en la celda C2 hacia abajo a
(acento grave). Para restaurax la vist¿ original, con 1os resul-
roda la columna hasta el renglon 12:
tados de las formulas, presione Ctrl*' por segunda vez. (La
1. Haga clic con el botón derecho en la celda C2 y haga clic
mayoría de las ilusfiaciones de hojas de cálculo en este libro
en Copy del menú nípido. Con esto aparece un marco sF
van acompañadas por una "vista de fónnulas").
aular al de una marquesina alrededor de la celda C2.
2. Seleccione el rango de celdas C3:C12. (Véase el apén-
GE1.9 USO DE LOS APÉNDICES D Y F
dice B si requiere ayuda para seleccionar un rango de
celdas). Los apéndices D y F contienen material adicional sobre Excel
3. Con el rango de celdas resaltado, haga clic con el bo- que tal vez necesite conocer, dependiendo de la forma en que
tón derecho sobre el rango de ceidas y haga clic en Paste utilice este übro. Si planea utilizar PIISüatz, as€gurese de leer
del menú rápido. las secciones D.l a D.3 del apéndice D. Si quiere aprender
Cuando se realiza esta operación de copiar y pegar, Excel detalles sobre e1 formato de las hojas de cálculo, por ejemplo'

ajusta las referencias de oeldas en las fótmulas, de manera cómo lograr que los contenidos de una celda aparezcan en
oue si se copia la fórmula =!,2 + B2 de la celda C2 a la negritas o cómo controlar el número de decunaies que apare-
."ldu E3 r" obti"n. .orno ¡esultado que la fórmula =A3 + cen, lea las secciones F.l y F.2 del apordice F.
Guía del caoín¡]o I Dara Minitab 21

GM1.1 INTRODUCCION A MINITAB


Si ya respondió la lista de requisitos de la tabla 1.2 y revisó la tabla 1.3 con los tén:rinos para las
operaciones de cómputo en la página I l, entonces ya esá casi üsto para utiüzar Minitab. A¡tes de
uúlizar Minitab para un análisis específico, debe practicar con su interfaz de usr¡ario.
Los componentes de un proyecto de Minitab aparecen en vent¿nas s€paradas d¿Ítro de la ven-
tana de Minitab. En la figura GMl.l se traslaparon estas ventanas, pero usted puede ocultarlas o
acomodarlas como desee. Cuando se abre Minitab, por lo general, aparece un nuevo proyecto que
contiene solo el iirea de sesión y una ventanp con la hoja de cálculo. (Se visualizan otros compo-
nentes seleccionándolos en el menú Window de Mi¡itab). Es posible abrir y guardar un proyecto
completo o, como se ha¡á en este libro, abrir y guardar hojas de cálculo individuales.

FIGURA GM1'1
Hoia de cálculo
princiPal de Minitab
con las ventanas
sobrePuestas de
sesión, hoja de
cálculo, 9ráfica Y o
administrador de
proyectos (Session,
Woiksheet, Chart Y
o
Project Manager) o
o
N

GM1.2 INGRESO DE DATOS Y TIPOS DE VARIABLES


Como se expuso en la sección 1.5, los datos para cada va¡iable se ingresan en u¡.a columna sepa-
rada. Por costumbre, se inicia con la primera columna, etiquetada al principio por Minitab como
Cl, se escribe el nombre de cada variable en las celdas del primer renglón sombreado y sin númuo,
y luego se ingresan los datos.de la variable en los renglones numerados, como se muestra en la
figura GM 1.1.
Minitab infiere el tipo de variable a partir de los datos que se ingesan en una columna. Si Mi-
nitab descubre una columna que contiene números, la tratará como variable numé¡ica. Si Minitab
descubre una colum¡a que contiene palabras o datos alfanuméricos, la tratará como variable "de
textos" (adecuada para utilizarse como variable categórica). Si Minitab descubre una columna
que contiene información que puede interpretarse como fechas o tiempo, la tratará como una varia-
ble de fecha./tiempo, que es un tipo especial de variable numérica. Este método imperfecto fun'
ciona la mayor parte del üempo en Minitab, especialmente si usted se asegun de que las categoúas
de su variable categórica son palabras o frases como "sí" o "no".
Cuando Minitab identifica una variable de texto o de fecha/tiempo, añade "-T" o "-D" al enca-
bezado de la colum¡a para esa variable. Por ejemplo, en la figura GMl.l:
. Cl-T y C5-T significan que la primera y la quinta columnas contienen variables de texto.
' C2-D y C3-D signrfican que la segunda y la tacera bolumnas conhenen variables de fecha/tiempo.
. C4 y C6 significan que la cuarta y la sexta colurnnas contienen variables numéricas.

Puesto que Minitab define de forma explícita el tipo de vanable, a diferencia de Excel, la posi-
bilidad de realizar acciones absurdas es limitada (como utilizar un método estadístico que está ü-
- señado para variables numéricas con datos categóricos). Si Minitab malinterpreta sus datos, usted
:
tiene la posibilidad de cambia¡ el tipo de variable seleccionando Data )
Change Data Type y
I lueso seleccionando en el submenú el cambio adecuado.
22 cAPÍTt'Lo I Introducción

mterpreta los rengio-


Cuando ingrese datos, nunca se salte renglones en una columna' \f1fb.
que se bajan de la
o., u""io, .oJo ualores faltantes. Puede utilizar los libros de trabajo de Minitab
páginade<lescargasdeesteiibro(véaseelapéndiceC)comomodelosparaelmétodoqueusepara
ingresar datos de variables de Minitab'

GM1.3cÓMoABR|RYSALVARHoJASDEcÁLcULoYPRoYEcIoS
ParaabriryguardarhojasdecálculooarchivosdeproyectosenMinitab,primeroseleccionela
del archivo del libro. Para
,orp.o qué imacena un libro cle trabajo y luego especifique el nombre
uuri, *u no¡u a. .álculo, seleccione Fíe t
open worksheet. Para abrir un proyecto, seleccione
Fite + Open fro¡ect' Para guardar una hoja di cálculo' seleccione
File t
S¡ve Current Work-
sheetAs, y para guardar un proyecto seleccione File )
Save Proiect As'
la figura
e,o¡á'.".il¿or pan aurir y guaraar mueshan cuadros de diálogo casi idénticos. En Work-
comandos open
GMl.2 r;;r;.;1¿a los cu"dror áe-diálogo rle Minitab 16 que muestran los
sheet Y Save Current Worksheet As'

FIGURA GM1'2 rtir:.:-- Eg


,:t
I {.edE'
Cuadros de diálogo
de Minitab 1ó que & tx3
5¡Ó
l*
Lf
muestran los
comandos OPen
I tlo
rgt
5¡3

üt Worksheet y Save EB 5¡O

Ílr¡ Current Worksheet ,n


*
t
.!.!{
5g
t
:l
;t
¡tt
5I'-
,1 t-: fr¡r..r |¡- l¡¡¡¡br¡d-- :l '¡.-
t
it hdrF ¡arúft'i¡ s...r'" lE--------- 'd I

H
rri
1{ur,rr*a*o.rr* o.*..1
lrii
'-"J"1
| ü-¡ | '*' l 'ú
;1.
iii
TI
la carpeta de almacena-
f$
tt Dentro de los cuadros del diálogo de abrir y guardar, se selecciona
ft
¡tl miento utilizando la üsta desplegable que aparece en la parte superior
de cada cuadro En el ¡e'
para el libro de trabajo. Para completar
¡f.

:
dro File nane se anota o selecciona de una lista el nombre
latarea,hagacücenOpenoSave.Esprobablequealal¡mcenarunarchivo'deseecanbiareltipo
-antes
de hacer clic en save. si des"a guurdar sus datos como
hoja de cálculo de Fxcel,
de arcbivo
seleccio¡eExcel97-2003delalistadesplegableSaveastypeantesdehacerclicenSave.Sidesea
que no abren libros de trabajo de
zuardar los datos en un formato que pueda abrirse con programas
Éxcel, podría seleccionar las opciones Text o CSV en Save as type'
io*do ¿.r., abrir un archivo y no encuentre su nombre en 1a lista, conobore que la carpeta
de Look in actual sea la adecuada. si lo es, cambie el tipo de
archivo a All (*;*) para ver todos los
de ortografia o extensio-
archivos de la carpeta achlal. Esta técnica debe ayudar a descubrir faltas
nes de archivo faltantes que evitan que se muestre el archivo'
Cuandoguardeunproyecto'puedehacerclicenoptionsenelcuadrodediálogoSaveProject
en el cuadro de diálogo de Save
As luego Ápecfrcai que partes del proyecto desea guardar
y
aquí)'
-Project4ptions (el cual no se muestra
i*qu. fnlioioU incluye los comandoi Save Current Workheet y Save Project (dos coman-
,.As,'), debeni evitar estas opciones hasta adquirir experiencia Si usa el conrando
dos sin eitérmino
Save,esmuyfácilquesinquerersobrescribasufi¿bajo'Además,nopuedeutilizarelcomandoSave
almacenar este tlpo oe
.oo íibro, atiertos que Minitab haya marcado como de solo lectura (Para
libros de rabajo, utilice Save As).
gráficas individuales y una ven-
En Minit;b también se abren y se guardan de manera separada
en este libro'
tana de sesión de proyecto, aunque tales operaciones no se utilizan
Güía del caDítulo I Dara Miniiab 23

cne¡g|ÓN Y COPIA DE HOJAS FIGURA GM1.3


"n¡r.+ DE CALCULO Cuadro de diálogo Print Options de ventana de datos
hojas de crílculo se elabora¡ c¡eando un nuevo
Las nuevas
l,nuecto o msertando una nueva hoja de cálculo en un proyecto
l¡iír. p* cr.r * proyecto nuevo, seleccione File) New, F PrhtRort*.¡
i en el cuadro de diálogo New baga cüc en Miniab Project y
AiÉc*E |'$¿ {.!, c0
P
'¡ego en OK. Para i¡seriar una hoja.de cálculo nueva también
File ) New, pero en el cuadro de diálogo New F ftr*cd!|f¡n
..É..ioo.
clic en Minitab Workheet y luego en OK
F Fi*cdt¡rt
haga
Un proyecto nuevo se cre¿ con una hoja de cálculo dmrhlrrdl.tk
nueva. Pi¡a insertar
otra hoja de cálculo, seleccione File ) 13 kñ¡rr*d
New y en el cuadro de diálogo New haga clic en Minitab c grgcd
Workshe€t Y luego en OK' a Ell*tdd
También puede msertar una copia de una hoja de cálculo a nEtFdÉ}!ÉgdT!úka¡!l6
dc otro proyecto en el proyecto actual. Seleccione File ) IUt!
Op€n Worksheet y seleccione el proyecto que contiene Ia
hoia de cálculo que desea copiar. La selección de un pro-
yr.to (y oo de una hoja de cálculo) ocasiona que se muesüe
un cuadro de diálogo adicional, en el cual podrá especificar
cuáles hojas de cálculo de ese segundo proyecto se copiarán
proyecto actual.
e insertariin en el
Por defecto, Minitab asigla nombres de forma serial a
Si necesita carnbiar el tamaño o la orientación del papel
las hojas de cálculo, en la forma de Worksheetl, Works- de impresión, seleccione File IPrint Setup antes de selec- o
heet2, y así sucesivamente. Deberá cambiar estos nombres cionar el comando Prin! realice las selecciones adecuadas en
pua reflejar mejor el contenido de sus hojas de cálculo. el cuadro de diálogo que aparcce y después haga clic en OK
Para cambiar el nombre de una hoja de cálculo, abra la ven- o
tana del Project Manager (véase la ñgura GM1. 1), haga clic
o
GM1.ó DATOS Y REFERENCIAS o
derecho en el nombre de la hoja de críiculo en el cuadro iz- N
DE LA HOJA DE CÁLCULO A
quierdo, seleccione Ren¡me del menú rápido, escriba el
nuevo nombre y presione Enter. También puede utilizar Existen dos maneras de referirse a variables individuales.
o
el comando Save Current Worksheet As que se comentó en Puede utilizar su número de columna, como Cl en la figura
la sección GMl.3, aünque este comando también guarda la GMl.1 de la página?|, que aparece en la part€ superior d€
hoja. de cálculo como un archivo separado. una hoja de cálculo; o bien, utilizar el nombre de la variable
que ingresó en las celdas del segundo renglón sombreado y
F GM1.5 IMPRESIÓN DE PARTES sin número, como Centro u Orden (en la figura GMl. 1). En
F DE UN PROYECTO la mayoría de los anrílisis estadísücos, Minitab presenta una
lista de números de colurma y los nombres de las variables
Para imprimir una hoja de cálculo, una gráfica o los conteni-
,o conespondientes (si los hay) para elegir. Para un nombre de
dos de una sesión, primero seleccione la ventana que corres-
l, variable como Utilidades 2009, que contiene espacios u
ponde al objeto que desea imprimir. Luego seleccione File
otos caracteres especiales, Midtab muesta el nombre con
) Print object., donde el objao es rna hoj a de cálculo, una
comillas sencillas fuor ejemplo, 'Utilidades 2009') y es
gráfica o un¿ vent¡na de sesión, dependiendo del objeto
necesario incluir esas comillas cada vez que se escriba el
que haya seleccionado.
IA nombre de la va¡iable en un cuadro de diálogo de Minitab.
Si desea imprimir una gráfica o una ventana de sesión,
)S Para ser claros, y con 1¿ finalidad de reducir los enores,
la selección del comando Print muestra el cuadro de diá-
l este libro por lo general se refiere a las columnas por los
logo Print, el cual le permite elegir la impresora, las páginas
nombres de sus variables. En capítulos posteriores verá que
a imprimir y el número de copias que se producirán. Si ne-
ct Minitab te permite referirse a varias columnas consecudvas
cesita cambiar est¿ confrguración, hágalo antes de hacer clic
te utilizando un guión. Por ejemplo, C1-C6 o Centro-Distancia
en OK Dara c¡ear su salida de imoresión.
se refieren a las seis columnas de los datos de la hoja de
Si desea imprimir una hoja de cálculo, la selección
cálculo Shippilg (Envío) que se muestra en la figura GMl.1.
:t- Print Worksheet muestra el cuadro de diáloeo Data Win-
Lo dow Print Options (véase la figura GM1.3). En este cuadro
¿ de diálogo se especifican las opciones de formato para su
GM1.7 USO DE LOS APÉNDICES D Y F
*
i salida de impresión (las opciones por defecto son adecua- Los apéndices D y F contienen material adicional general
¡
q
das), ingrese un ritulo en Title y haga clic en OK. Después. sobre Minitab. Consulte estos apéndices si tiene alguna
[- lvlinitab presenra el cuad¡o de diálogo Print que se men- duda acerca del uso de Minitab que no se responda en las
clonó en el párrafo ante¡iot Guías de Minitab de este libro.
/-\"/
urganrzauon
y presentación
,r 1 r 1

grátrca de los datos

USO DE LA ESTADísTICA EN Presentación gráfica de 2.8 Uso indebido de datos


datos <ategóricos v errores comunes en
Choice ls Yours, PaÉe I iu presentación gráfi<a
Gráfica de barras
2.1 Recolección de datos Gráfica circular
Revisión del USO DE LA
Gráfica de Pareto
ggf¡oÍtnCl en Choice ls Yourr
Gráfica de barras agruPadas
ORGANIZACIÓN DE LOs DATOS parte I

2.2 Organización de datos 2.s Presentación gráfica de


culn oEu c¡Pírulo 2 PARA
categóricos datos numéricos
EXCEL
Diagrama de tallo Y hoja
Tabla-resumen
Histograma
Tabla de contingencia cuí¡ oel cePírulo e
Polígono porcentual
PARA MINITAB
Polígono porcentual
2.3 Organización de datos
acumulado (oiiva)
numérico¡
Datos agruPados Y no
r

agrupados Presentación gráfica de
fE: dos variables numéricas
Arreglo ordenado
Diagrama de disPersión
r,i Distribución de frecuencia
ir' Distribución de frecuencia Gráfica de series de tiemPo
it
lii
relativa Y distribución
n porcentual 2.7 Organización de datos
T.i
I
'. .
La distribución acumulada multid¡mens¡onalés
Tablas de contingencia
multidimensional
PRESENTAC¡ÓN GRÁHCA
DE LOS DATOS Suma de variables numéricas

t.
apfef|orzale

¡ A construir tablas y gráficas para datos categóricos'


r, A construirtablas y gráficas para datos numéricos-
,,. Los principios para construir gráficas de manera adecuada'
En Choice Is Yours, parte I

I servicio de inversiones Choice Is Yours ayuda a sus clientes con sus opciones de inver-
sión. Choice Is Yours evalúa i¡versiones en bienes raíces, inversiones direchs de capital
privado, productos derivados y diversos tipos de fondos de inversión especializados.
Usted fue contratado para asesorar a los clientes que quieren inverth en fondos de inver-
sión, los cuales agnrpan el dinero de muchos clientes hdividuales y lo invierten en una
combinación de valores diversos y en ofios tipos de inversiones. (Para aprender miís acerca de los
U'
fondos de ilversión, visite investopeüa.com/university/mutualfunds).
Puesto que los fondos de inve¡sión constituidos por una alta inve¡sión en acciones comunes re-
cientemente han tenido rendimientos variables, Choice Is Yours qüere examinar los fondos de inver- o
sión que se concentan en i¡vertir en ciertos tipos de bonos. Analistas de la empresa seleccionaron o
una muestra de 184 fondos de este tipo que, según creen, podrían interesar a los clientes. A usted se o
N
le pidió que presentara datos acerca de esos fondos de una forma que ayude a los clientes a toma¡ 5
buenas decisiones de inversión. ¿Qué datos acerca de cada fondo de inversión en bonos reuniría
para ayudar a los clientes a comparar los diferentes tipos de fondos?
Un buen punto de partida sería reunir datos que ayuden a los clientes a clasificar los fondos
de inversión en diversas categorias. Usted podría investigar factores como el riesgo que tiene
una estrategia de inversión en fondos y el tipo de bonos en que el fondo invierte prin-
cipalmente. Desde luego, tambien querría cooocer el desempeño del fondo
en el pasado para informar al cliente varias medidas del compor-
tamiento previo de cada fondo. (Aunque el desempeño previo
no es una garantía del desempeño futuro, los datos delpasado
pueden hformar a los clientes cómo se ha administado cada
fondo de inversión).
Cuanto más piensa acerca de su ta¡ea, se da cuenta de que
la información que anojan los datos de los 184 fondos de in-
versión es tanta, que resulta muy dificil revisarla por completo.
A usted le pidieron que presentara los datos sobre estos fondos
de una forma que sirva para que los clientes tomen buenas deci
siones de inversión. ¿De qué manera podría revisar y explorar
este tipo de datos de una manera sencilla? ¿Qué datos acerc¿ de
cada fondo reuniría para ayudar a los clientes a comparar los dife-
rentes tioos de fondos?

Dotr F¡¡BlvPhotodildcciry ioass 25


26 CAPiTULO 2 Orgalüación y presentación gráfica de los datos

I reto que enfrenta,en la parte I de la sección anterior es el de ex¡ñinar utra gra¡ cantidad de

datos y sacar conclusionls con base en ellos. Esta tarea


adminisffativa podda sef más mane-
jable si la separa en los siguientes cmco pasos:

. Defina las va¡iables que desea estudiar para resolver un problema de negocios
o cumplir un

objetivo admidstrativo.
. Reúna 1os datos de las fuentes adecuadas'
. Organice los d¿tos reunidos por medio de tablas'
. Preiente los datos resumidos por medio de gnificas'
. Analice los datos examinando las tablas y las gmficas adecuadas (y en capítulos postenores
utilizando ohos métodos estadísticos) para sacar conclusiones'

Estos cinco pasos, conocidos por el acrónimo DROPA (Defuir, Reunir'


Organizar' Presentar
gáficanente y Lafizar), se utiliian a lo largo de este libro como base para la solución de pro-

tie. (véase la referencia 2). En el capítulo 1 vimos que, para definir una variable'
estudísti.os
se debe elaborar una definición operacional e identificar el
tipo de variable. En este capítulo apretr-
la present¿ción gnífica y el
dení nás sobre los pasos implicados en Ia recolección, 1a organización,
análisis dé los datos.
Pa¡a ilustrar el modelo DROPA, en los ejemplos de este capítulo con
frecuencia se utiliza la
en bonos que se mencionar^-
muestra de 184 fondos cle inversión especializados en las inversiones
iuf^.t" I a. U ,ección sobre Choicé i, Yo*t. (Pra examinar esta muestra abra f![f@[
r..
"o explica en el
de los archivos de datos que puede descargar y utilizar con este libfo,
tal como se
las preguntas planteadas
op¿n¿ice C). Cuando llegue ai final del capítulo, será capaz de responder
que comparan dos categorías de fon-
en la seccién iniciat. Porejemplo, podrá rJsponder preguntas
dosenbonoscomo:..¿eústealgunadiferenciaenlasrendimientosdelosfondosenbonosinterme-
t clios gubemamentales y los fondos en bonos corporativos a corto
plazo?" o "¿los fondos en bonos
que los fondos en boúos cor-
interáedios gubemament¿les tienden a ser inversiones menos riesgosas
{ porativos a corto plazo?".
i
i
É
2.1 Recolección de datos
Algunos ejem-
una vez que ha deñnido sus variables, necesitará reunir los datos conespondientes.
plos de recolección de datos son los siguientes:
I
.Unanalistademarketingdeseaevaluarlaeficaciadeunnuevoanunciodetelevisión.
. Un fabricante farmacéuiico necesita determinar si un nuevo fármaco es más eficaz que los
que se usan en la actualidad.
. ún gerente de operaciones desea mejorar un proceso de manufactura o'de servicio.
. Uu iuditor quiáre reüsar las trausaóciones financie¡as de una empresa con
la finalidad de

deterrninar si cumplen con los principios de contabilidad comúnmente aceptados


secundaria de
cuando se reúnen datos, se utiliza una fuente primaria de d¡tos o una fuente
para un análisis' y
datos. Una persona utiliza una fuente primaria cuando reúne sus propios datos
de datos a
una fuente secundaria cuando utilizJlos que alguien más recopiló. La recolección
de cada objeto o indi
menudo implica obtener infor¡n¿ción de una muestra, ya que reunir datos
viduo en una población suele requerir demasiado tiempo o stt moy dificil'
(Véase el capítulo 7

para conocer más acerca do los métodos de selección de muestas)'


'- Las orgaoirn.iones y los individuos que reúnen y publican datog con ftecuencia
los utilizan
Por ejemplo,
como ula fuente primari4 y permiten que otros los utilicen como fuente secundaria.
públicos y
el gobierno federal de Estaáos Unidos ieune y distribuye datos de esta fonn¿ con fines
distribuye el índice
oriiados. El Bureau ofl,abor Statistics reúne datos sobre el empleo y también
'Inao.rui ¿, praa¡s al consumidor. El census Bureau supervisa diversas encuestas continuas sobre
especiales sobre temas como delincuencta'
fobhción, vivienda y manufactura, y realiza estudios
viajes y atención médica.
La información que puede constituir una fuente de datos se obtiene de cuatro maueras:
. De los datos que distribuye una organización o un individuo
. De los resultados de un experimento
2.1 Recol€cción de d¿tos 27

. De las respuestas que se obtienen al aplicar una encuesta


. De los ¡esultados observados al realizar un estudio

Las empresas de investigación de mercados y las asociaciones comerciales distribuyen da-


tos sobre industrias o metcados específicos. Los sewicios de inversión, como Mergent (www.
mergent.com), proporcionan datos financieros por empresa. Servicios de i¡formación, como los
de Nielsen, brildan a los clientes datos que les permiten comparar sus productos con los de sus
competidores. Por otro lado, los periódicos son fi¡entes secundarias que estan llenas de información
numérica sobre precios de acciones, condiciones climáticas y resultados de eventos deportivos ob-
tanidos de fuentes primarias.
Los result¿dos de un experimento constituyen ota fuente de datos. Por ejemplo, en un experi-
mento se podrían someter a prueba varios detergentes para ropa con la finalidad de comparar y de-
terminar la utilidad de cada uno para eliminar cierto tipo de manchas. El diseño de experimentos es
un tema que rebasa el alcance de este libró, ya que este tipo de diseños suelen requerir proce-
dimientos estadísticos complejos. Sin embargo, en el capítulo 10 se analizan algunos de los con-
ceptos fundamentales del diseño de experimentos.
Un tercer tipo de fuente de datos cor¡esponde a las encuestas. En una encuesta se plantean pre-
guntas a los individuos acerca de sus creencias, actitudes, conductas y otras características. Por ejem-
plo, tal vez se les pida su opinión acerca de cu.ál detergente para ropa elimina mejor cierto tipo de
manchas. (Esto podría conducir a un resultado diferente al de un experimento diseñado para buscar la
* misma respuesta). Una forma adecuada de evitar fallas en la recolección de datos al utilizar una en-
cu€sta como esta consiste en distibuir el cuestionario a una muesta aleatoria de individuos. (En el
capítr:lo 7 se explica 1a manera de obtener un¿ muesta aleatoria). Una forma inadecuada sería utilizar
un sitio web dedicado a evaluar negocios, el cual pemrite que los visitantes en línea califiquen a un
comerciante. Estos sitios web no garantizrn que las personas que realizaron la evaluación sean repre-
o
senktivas de la población de cüentes (ni siqüera que realnente se¿z clientes).
La cuarta fuente de datos conesponde a los estudios observacionales. Un ilvestigador reúae o
datOs observando direct¿mente una conducta, por lo general €n u¡ ambielte natural o neutral. Los o
estudios son rma herramienta común de recolección de d¿tos en los negocios. Por ejemplo, los inves- o
N
tigadores de mercados utilizan gnrpos de enfoque para obtene¡ respuestas poco esÍuch¡radas a pre- 5
guntas abiertas que un moderador plantea a un público meta. Las técnicas de este tipo de estudios N
tambien se utiliza¡r para mejorar el trabajo de equipo o la calidad de productos y servicios.

Problemas para la sección 2.1


APLICAC|óN DE CONCEPTOS

2,1 Data, and Story Library (DASL) es una biblioteca en 2.3 Una cadena de supermercados desea determinar el me-
línea de archivos de datos e historias que ilustran el uso de jor lugar para colocar una marca de bebidas gaseosas en sus
t los métodos estadísticos básicos. Visite lib.stat.cmu.edu/
index.php, haga clic en DASL y explore un conjunto de da-
tiendas. ¿Qué tipo de fuente de ¡ecolección de datos cree
que debería utilizar la cadena de supermercados?
$ tos que sea de su interés. ¿Curíl de las cuatro fuentes de datos
t{ se utilizó para el conjunto de datos que eligió?
2.4 Visite la página "Longitudinal Employer-Household
Dlnamics" del sitio web del U.S. Census Bureau, lehd.did.
t
2.2 Visite el sitio web de la organización Galiup en www. census.gov/led/. Examine la sección titulada "Did You
t gallup.com y lea la principal historia del día. ¿En qué tipo Know". ¿En qué tipo de fuente de datos se basó la informa-
* de fuente de datos se basa? ción que aquí se presanta?
*
i
{
ORGANIZACIÓN DE LOS DATOS
Después de definir sus variables y reunir sus datos, debe organizar el material de nane¡a que' mas
adelante, pueda realizar una presentación gráfica y analizar Ia información. Las técnicas que debe
.
utilizar para organizar sus datos dependen del tipo de variable (categórica o numérica) relacionada
i con los mismos.

I
L
28 CAPiTULO 2 organización y presentación gráfica de los datos

2.2 Or gasizaciín de datos categóricos


Losdatoscategóncosseorganizancontandolasrespuest¿sporcategoríasycolocandolosresulta-
datos de una sola variable categórica se construye
dos en tabhs ñor lo g.o"r"i, para organizar los
o más variables categóricas, se construye una
A panir de aquí, las una tauta-resunen y, iara organizur los datos de dos
seccicjnes de las Guías tabla de contingencia.
de Excel y Minítab
reorodúce n las se cclones
dátcapítuloprincipal Tabla-feggmen
o porcentajes para
llriJll&!'l;,'ri!1,r,,", una tabla-resumen presenta el
""'"1,1":1!T:T.::-:""T"i:"T::uencias
que hay entre las categorias mos'
o M¡n¡tab
-ffnalidad conla cada categoría. una iabla-resumen aluda a ver las üferencias
de catego¡as en una
de organizal t*¿o ircuencia, la cantidad o el porcentaje de elementos en un conjunto
"1* tu
;;;u¿u- si ru tu¡ru 2.1 se'observa una tabla-resumen (incluida en ffil@$
con el
la sec'c¡ón GE2'2 o ta
l:l:;i,:.iZZ:.;:y:*"
oiri"ili" i"rpo.stas de.una encuesta reciente en la que se pregntó a uo gn¡po de adultos cómo
Pagan sus gastos mensuales'

D¡go Porcentaje (%)


TABLA 2.1 Forma de
Efectivo
Tipos de pagos
de gastos Cheque 54

línea
Electónico/en 28

Oho/no sabe 3

Fvc¡te Datos ertaídos de "Eow AMtt Prt Mo'tthly


Bitts"'USATo&y,4 de ocabn de 2007'p l'

personas pagan con cheque y


A partir de la tabla 2.1 se concluye que mas de la mitad de las
que 82% utiliza cheques o formas de pago electónicas o en linea'

EJEMFLO 2.1 Losl84fondosenbonosmencronadosenlapartelclelaviñetadeChoicelsYours(véaselapá.


d.::?:"i'l
gi* ZS) .r,¿o .f*ificados de acuerdo con su.nivel de riesgo' y categorizados:1T:T:
pam 1os fondos en
Tabla-resumen
ir"..ii", pt...¿io y por aniba del promedio' Construya una tabla-resumen
de los niveles de bonos categorizados Por su nesgo.
riesgo de fondos
mismo número de fondos tienen un
en bonos SOLUCÉN En la tabta 2.2 se observa que aproximadamente el
que 69 5'70/o de
i*áo po, a.tu¡ ¿el promedio, promedio y ior aniba del promedio Esto significa
por aniba del promedio'
io, ioo¿o, táoos eitan clasificados con'r¡n nivel de riesgo promedio o
"o

Número de fondos Porcentaje de fondos


TABLA 2.2 Nivel de de los fondos
)o 30.43%
Tabla-resumen Por debajo del promedio
de frecuencia Y 69 37j0%
Promedio
porcentaje Para el 59 32.0'l%
Por arriba del Pronedio
nivel de riesgo de 100.00%
184 fondos en Total i84
bonos

Tabla de contingencia
Unatabladecontingenciapermiteestudiarpat¡onesquepodríanexistireohelasrespuestasde
cruzadas o conteos conjuntos
dos o urás variables categóricas. este tipo de tabla hu"e iabul""ion"t
á;;;*p"*^ a las viiables categóricas. En el caso más sencillo de dos variables categóricas,
-en
;r;ñstas.oo;.-t". se ordenan la tabla de modo que los conteos de las categorías de una
2.2 Organización de datos categóricos 29

variable se localizan en los renglones, y los conteos de las categoías de la oha variable se locali-
zan en las colur¡¡as. Las hte¡secciones de los renglones y las columnas se llaman celdss, cada
y
celda contiene un valor asociado con un pat único de respuestas par¿ las dos variables (por ejem-
plo, cuota: Si y Tipo: Inter¡nedio gubemamental en I a labla 2.3). Las celdas pueden incluir la fre-
cuencia, el porcentaje del total general, el porcentaje del total por renglón o el porcentaje del total
por columna" dependiendo del tipo de tabla de contingencia que se utiüce.
En 1a parte I de la sección referente a Choice Is You¡s se podría crear una tabla de contingencia
para examinar si existe algúl patrón entre el tipo de bono del fondo (intermedio gubernamental o
corporativo a corto plazo) y si el fondo cobra una cuota (sí o no). Primero se cuentan las respr'lestas
conjuntas para cada uno di los 184 fondos en bonos de la muestra (incluidos en l![f@' Se

anota la reipuesta en una de las cuako celdas posibles de 1a tabla, dependiendo del tipo de fondo y
de si este cobra una cuota. Por ejemplo, el primer fondo listado en la muestra se clasifica como un
fondo intermedio gubemamental que no cobra una cuota. Por lo tanto, se incluye esta respuesta
conjunta en la celda que se localiza en la intersección del renglón de lntermedio gUbernamental y
la colunrna de No. En la tabla 2.3 se presenta la t¿bla de contingencia complet4 después cle que se
consideraron los 184 fondos.

TABLA 2.3 CUOTA

iabla de contingencia TIPO


que rnuestra el IIPo Int€rmedio gubernamental 34 53 87
dé fondo Y si cobra
Corporrtivo a corto plazo 20 7'.1 9'7
una cuota
Tot¡l 54 130 184 u,

=
Para buscar otros paaones enhe el tipo de fondo y el cobro de una cuota, se pueden construir
o
o
tablas de contingencia que presentan los valo¡es de 1as celdas como un porcentaje del total geoelal o
(los i 84 fondos), los totales por renglón (los 87 fondos intermedios gubemamentales y los 97 fon- N
y 5
clos en bonos a corto plazo) y los totales por columna (los 54 fondos que cobran una cuota los ul
130 fondos que no la cobran). Las tablas 2.4,2.5 y 2.6 presentan estas tablas de contingencra.
En 1a t¿bla 2.4 se observa que 47.28% de los fondos corporativos de la muesta corresponden a
fondos intermedios subemamentale s, 52.72o/o a fondos en bonos corporativos a codo plazo y

TABLA 2.4 CUOIA

Itr Tabla de contingencia nP0 Total


que muestra el tipo 47.28
Intermedio gubern¡mental 18.48 28.80
L de fcndo y si cobra
Corporativo a corto plazo 10.87 41.E5 a) 11
una cuota, con base
en el porcentaje del Total 29.35 70.65 100.00
total general

18.48% a fondos intermedios gubemamental€s que cobran una cuota; En la tabla 2.5 se obserya
que 39.08% de los fondos intermedios gubemamentales cobfan una cuota, mientas que 20.62% de

TABLA 2.5 cumA


Tabla de contingencia TIPO No Tot¡l
que muestra el t¡po
Interm€dio gubernamental 39.08 60.92 100.00
le; de fondo y si cobra
100.00
ls d, una cuota, con base Corporativo a corto plazo 20.62 79.38
en el porcentaje del Tot¿l 29.35 70.65 100.00
tota I por reng lón
I

30 cArirL'i.o 2 Organización y presentación gr.áfica de los datos

una cuota La tabla 2 6 indica que' de los


los fondos en bonos corporativos a corto plazo cobran
gubernamentales' En las
i""4", qt. ."U.r" una cuota, 62.96% conesponde a fondos intermedios gubemamentales cobren
que los fondos intermedios
tablas se obsewa que es mucho más probablá
una cuota.

CUSTA
TABLA 2.ó
sí No Totrl
TIPO
fabla de contingencia
que muestra el tlPo 62.96 40;17 47.28
lntermedio gubernamental
cje fondo y si cobra 37.M 59.23 52.72
Corporativo a corto Plazo
una cuota con base 100.00
Tot¡l 100.00 100.00
en el porcentaje del
total Por columna

Problemas para la sección 2.2


APRENDIZAJE DE LOs FUNDAMENTOS
2.ó Los siguientes datos rePreseútan las respuestas a d(
2.5 Una variable categórica tiene hes categorías con las
preguntas flanteadas en una encuesta aplicada a 40 estu-
sizuientes frecuencias: género?
di"o't", d. íu .t.o.la de administración: ¿Cuál es su
(C = con-
fH = hombre; M = mujer) y ¿Qué canera estudia?
Categoría Frecuencia
tabilidad; I = informática de negocios; M = marketing)'
c) Ordene los datos en una tabla de contingencia en la
IJ que
genero y las
B 28 los dos renglones representen li¡s categorías de
9 fes columnas representen las categorías de canera'
porcen-
ó) Construya tablas de contingencia con base en los
por-
tajes de las respuestas de los 40 estudiantes, en los
c) Calcule el porcentaje de datos en cada categoría'
ce¡tajes por renglón y en los porcentajes por columna'
ó) ¿Qué concluye con respecto a las categorías?

HHHMI{ MMHMHMHH HHMMHMM


Género:
Carrera: CIIMC ICCIICCC MIMCCCi
HHHH MHMMHHMH HIIHMHMHH
.
Género:
C¡rrera: IICC MM I C C C I I CCCCIICI

2.8 La siguiente tabla replesenta el consumo


APTICACIóN DE CONCEPTOS petróleo en millones de baniles por
mundial de
2.7 La Transportation Security Atlministration infonnó día du¡ante 2009.
oue. del primeio de enero de 2008 al 18 de febrero de
2009'
,e ,e.ole"taron má. de 14,000 artículos prohibidos en el
ae-

ropuerto intemacional de Palm Beach Las categorías fue- Región Consuno de Petróleo
ron las siguientes:
Europa desanollada r4.5

Categoría Frecuencia Japón 4.4

InflariableVtritantes 8,350 Est¿dos Unidos 18.8

Cuchillos Y navalas
4 114 Resto del mundo 46.7

Herramientas Prohibidas i)J


Fueúe: EÍergy Info¡matiol Administ¡atio¡, 2009
Objetos filosos 49't

Ohos 357 -
c) Calcule el porcentaje de los datos en cada categoría' .
petróleo.
á) ¿Qué concluye con respecto al consumo de
a) Calcule el porcentaje de 1os datos en cada categoría'
durante 2009?
ú¡ ¿Qué conclilye con respecto a los artículos prohibidos?
t
,
r 2.3 O¡ganización d€ datos numéricos 31

federales en Es¡ados Unidos para los 2.1 1 En un hospital se realizan varios cientos de pruebas de
2,9 Las obligaciones
prestaciones Y latzuda nacional ascendieron laboratorio cada día. La tasa de pruebas realizadas de fo¡rna
i'rogtu.ut de rnadecuada (y que, por lo tanto, necesitan repetlrse) parece ser
l'áí¡ Uittoo"t ¿" Aótaresen 2008. EI costo por familia l$)
categorías fue el siguiente: estable, de aproximadamente 4%' En rm esfi.rer¿o por encontrar
iara las difer.ntes
lo que provoca que las pnrebas no cumplan los requisitos, es
decir, que necesiten repetine, el director de laboratorio decide
Costo por familia ($)
cxtegofi^ llevar registros durante una semana. Las pruebas de laborato-
15,851
Jubilación de funcionarios rio se subdividieron de acuerdo con el tumo de 1os trabaja-
5¿ 5??
Deuda federal dores oue las realizaron. Los resrftados son los siguientes:
Seguro médico
284,288

Jubilación de milit¡res
29,694 TURI{O
PRUEBAS flE TAEORATORIO
Seguriüd social 160,21ó
REALIZAOAS Noche Total
2,172 lo a^ 40
Otros No cumplen con Ias normas
"What We Owe", US'4 Ioday'29 dernayo de Cumplen con las normas 654 306 960
Fuente: Datos €xiaídos de
2009, P, lA. Total 6T0 330 1,000

o) Calcule el porcentaje de los datos en cada categoría' a) Construya tablas de contingencia basadas en los porcen-
ói conctuye con respecto a los programas de presta-
¿Qué tajes totales. Ios porcentajes por renglón y los porcentajes
ciones?
por columna.
2.'t0 En una encuesta aplicada a 1,085 adultos se pregr¡ntó ó) ¿Qué tipo de porcentaje (por renglón' por colurnna o to-
lo siguiente: "¿Le gusta salir a comprar ropa para usted?"' tal) cree que oftece más i¡for¡nación con rcspecto a estos
Los resultados (datos extraídos de "Split decision on clothes datos? Explique su respuest¿
shopping", USA Today,28 de enero de 2011, p. lB) indica- c) ¿A qué conclusiones podría llegar el director de laborato- o
ron que a 51% de las mujaes les gusta salir a comprar ropa rio con respecto al patrón de las pnrebas que no cumplen
para ellas, en tanto que solo a 44% de 1os hombres les gusta con las normas?
Lacerlo. No se informó sobre el tamaño de las muestras de
o
2.12 ¿En ta acnralidad le toma mas
tiempo que antes ser eü- o
hombres y mujeres. Suponga que los resultados son los que o
minado de una lista de coneo electónico? Un esn¡dio de 100 N
se observan en la tabla:
de los principales minoristas en línea reveló lo siguiente: s
5
¿LE GUSTA SALIR
GEI'IERO SE ¡¡ECESITA llAR TBES O MAS
A CÍIMPRAR ROPA
PARAUSTED? Hombre Mujer Total CI-ICS PARA SER ETIMIMDO

238 514 A1{0 No



No 304 261 571 2009 39 ol
93
Total s42 s43 1,085
2008 7

Fueote: Datos exF¿idos de"DnllDo.9"I¡" ne Nee fork


'
nmes,2g de marzo de2010,P 82
c) Construya tablas de contingencia basadas en los porcen-
tajes totales, los porcentajes por renglón y los porcenta.¡es
acerca de si más minoristas
por columla. ¿Qué le indican estos resultados
ó) ¿Qué concluye a padir de estos análisis? in línea reouerían aes o m¡ás clics en 2009 que en 2008?

2.3 Organizacíón de datos numéricos


de
Los datos numéricos se organizan creando arreglos ordenados o diskibuciones. La cantidad
datos con que se cuenta y lo que se busca descubri¡ acerca de las variables ilfluyen
en los métodos

que se eligin, al igual que la iorma en que se presentan los datos en la hoja de cálculo'

Datos agrupados y no agrupados


de cá{culo.
En la sección 1.5 se describió La forma de ingesar las variables por columnas en las hojas
si será necesa¡io analizar una variable
Al organizar datos numéricos, también se áebe considerar
numéiica por subgmpos que se clefinen mediante los valores de una variable categónca.
fo. es probable que en el archivo quiera analiza¡ la variable numérica
!![f@!
neturn 2ó01 lRendi;ientos 2009), el porcentaje de rádirnientos que tuvo un tipo de fondo en el
"¡^emplo,
32 cAfiTULO 2 organúación y presentacióú $áfica de los datos

que se definen por la variabr€ categónca Tipo,


los fondos
año 2009 mediante los dos subgn¡pos tipo de análisis por
a corto plazo' Par-¿ realizar este
futermedios gubernamentales y los'corpáratiuos forma no
hoja de cálculó e1.una foya aerunada o
en un¿
subgrupo, debeÉ ordena¡ los oatos de iu
de la aplicación estadística que planee-utilizar"
aeruoada, dependiendo d. tot oqu"iititntás
"" HTl ;il;;ffi, r"t J"tot *
iog"'too uo fonnato agrupado €ú el que todos los
'"unacolümna, y una se$mda colunm separada
aparecen;n
in-
yarores pañr una va¡iabte num¿nca
a cuá1 subgrupo pertenecen los valores
numéricos'
cluye los valores categóricos que identifican
ta variable Return 2009 (Rendimientos
2009) esLín en una co-
il;"froi;ñrlor'uutor"ri" para de'
ililli-y;i;iÑi", f, ,egoná .otur,oa 1pa¡a ei Tipo de variable) se usarían
*
Ninguno de Jos ""f"r., un valor individual de Return 2009
termi¡ar a cuál de los dos subgrupos Tipo
pertenece
conjuntos de d¿tos que
se ut¡l¡zan en los (Rendimientos 2009).
paÉ cada suberuoo de una variable numérica
eiemPlos Para las Guías En el fonnato no agrupado se separan los datos
de Excel Y Minitab y se colocan en cot-ou, ffiñ;i;'-t'l -tn;; @i""*:"jJ: |re-
reguieren que los datos "pu'uiuJ y src_Return-2009, que incluyen tos datos oe
se agruPen (o
i"i.."", á. r", lG_Return_2009
los dos subgrupos
desagruPen). Sin. , ,
"J"ules
turn 2009 (Rendimientos 2009) ;;;
Árm;to no agrupadq de acuerdo con
corporatlvos a corto
enbargo, es Probaote ;ffi;;;;ií;, intermedios gubemamentales (IG) y los fondos
los fondos
que usted necesite plazo (STC, por las siglas de s}orltetm corporate)'
de forma nanual' Minitab y PHStat2
cuen'
agrupar (o desagruPat)
Aunque es posible pt o i"tugopar los datos sin PHS
datos pata resotvel "gt de manera automática. Si utiliza Excel
alounos de los tan con comandos que ¡ealizan estas ojeáciooes
"
píoblemas de este libro' w2. debe urlllzar tnprocedimiento manual'

Arreglo ordenado
Unanegloordenadoacomodalosdatosdeunavariablenuméricadelm,ísoequeñoalrnásgrande.Un
de ros daios-y es especi¿lnente útil
arreslo ordenado si-" p"." .oooJr*J+*i.*g"
a.
""lores datos que se
ffii t*;;;ñ;"' du.t' P;r ejempio' en la tabla 2 7A se observan los en una
áe los alirnentos eú 50 rest¿urantes localüados
reunieron al realizar un es¡¡dro dll costo ciudad (alnace-
ubicados en los subr¡rbios de la misma
ciudad iúportante v tos ¿" So r"Jt"orantes
no ordenados de la tabla 2.7A no penniten
obtener
il;, #:i;;;;^ffii. ;;;i",
conclusiones Épidas ace¡c¿ del costo de los alimentos'

Costo de alimentos en rest¡ur¡nt$ cit¡di¡os


TABLA 2.74 43 39 43
l'et23793238 46
44
Costo Por Persona
. en 50 restaurantes 44 29 59 56 32 56 40 45

79
A' 2T
)i 43 49 28 35
citadinos Y 50 40
restaurantes 64 48 41 34 )J 27
40 49 54
suburbanos 61 59 48 78 65 ^a
44 58 68 59

Costo de alimentos en restaur¡ntes suburbanos


29 37 34 JJ
'40
54 30 49 44 34 )) 48 JO 29
42
38 38 55 43 33 44 +l 45 41

46 J) 40 ll
37 56 60 31 68
)J
28 44 26 a37 63 22 OL

per'
arreglo ordenado de los mismos datos' nos
En contraste, \a rabla 2-7B,la versión con e1 y
mite ver con rapidr" qu" el .otto d" i'i nti,o'oto
to toJttttau¡¿ntes de 1a ciudad va de $21 $79
a
a $ó8'
;;i;;;;;ñ alimento en los restaurantes suburbanos va de $22
que incluye una gran cantidad de valorcs iesulta
dificil
Cuando se tiene un conlunto de datos
una distnbu-
sacar concrusiones a partir de un aneglo
oidenado, En este caso, sería mejor crear
porcentual acumulada (véase las siguientes
ción de frecuencia o porcentajes y un"u airt.ltu"ioo
secciones).
2.3 Oreanización de datos nüméricos 33

Costo de ¡linenfos en restaurantes cit¿dinos


21 23 23 27 28 29 JJ 34

40 4l )l'l 42 43
J] 38 39 40 40
43 44 44 44 45 45 46 48 48

49 49 )J 54 fo fo 57 )ú )v )v
59 6l 62 & 65 67 68 78 79 79

Costo de ¡linentos en restaur¡ntes suburbanos


22 26 28 29 29 30 JI 5¿ JJ JJ

34 34 35 36 )l 38

38 39 40 40 4l 4l 42 42 43 43

44 44 AA
44 45 45 46 48 49 )l
)J 53 54 )) )) ftl 60 62 63 68

Distribución de frecuencia
Una distribución de frecuencia resume valores numéricos organizríndolos en un conjunto de cla-
ses ordenadas numficamente. Las clases son gru.pos que representan un rango de valores, denomi-
nados intervalo de clase. Cada valor puede pertenecer solo a una clase y debe estar incluido en
una de las clases.
Para crear una distibución de tecuencia útil, es necesario pensar cufutas clases son adecuadas
v,
para los datos y también deteminar un ¡azcío adecuado para cada intervalo de clase. En general, una
-dirtibu"ióo
d.t **.ia debe incluir al menos 5 clases, aunque no más de 15, ya que el hecho de te- =
ner mrry pocas o dernasiadas clases brinda muy poca inforriación nueva- Pa¡a det¡rmina¡ el tam¡ño o
o
ancho rlet interv¡lo de clase (véase la ecuación 2.1), se r€sta el valor más bajo del valor más alto y se o
diüde el resultado ente el ¡r!rcro de clases que se desea en la distribución de fiecu€ncia- o
N
5
or

DETERMINACIÓN DELANCHO DEL INTERVALO DE CLASE

valor más atg_l¡"lgI .nas igig


Atrcho det mtervalo- =-
.,
Q.r)
de clases
---;Geto

Como los datos del restáurante citadino constan de una muesta de solo 50 ¡estaurantes, serÍa
aceptable utilizar entre 5 y 10 clases. A partir del aneglo ordenado de los costos en 1a ciudad que se
preientan en la tabla 2.78, la diferencia enhe el valor miás alto de $79 y el valor más bajo de $21 es
$58. Si se utiliza la ecuación (2. I ), se calcula el ancho del intewalo de clase de la siguiente manen:
.58
A¡cho del mtervalo = = ).ó
l0
Este resultado sugiere que se debe elegir un ancho de intewalo de $5.80. Sin embargo, el ancho siem-
pre debe ser una cantidad que simplifique la lectrua y la interpretación de la distibución de frecuen-
cia- En este ejemplo * d.l iotrrvalo de $10 sería mucho miís adecuado que un ancho de $5-.80.
-"Lo
Como cada valor solo puede aparecer en una clase, es necesario establecer límites de clase
para cada una, definiéndolós de forma clara y apropiada- Por ejemplo, si elegimrcs $10 como el
r- intervalo de clase para los datos de los fest¿urantes, necesitaríamos establecer límites que incluyan
v todos los datos y simpliñcar la lectura y la interpretacióú de la distribución de frecuencia. Como el
costo de un alimento en los restaurantes citadinos varía de $21 a $79, cumplimos con los requisitos
il si establecemos el prim-er intervalo de clase de $20 a menos de $30, el seguudo de $30 a menos de
ir¡'
l- $40, y así sucesivamente hasta el último intewalo de $70 a menos de $80. En la tabla 2.8 se presen-
tan las dist¡ibuciones de frecuencia de los costos por alimento de 1os 50 restaurantes citadinos y de
1.1

)s il
i los 50 restaurantes suburbanos utilizando estos intervalos de clase.
34 CAPÍTULO 2 Organización y presentación gráfica de los datos

Frecuencia rest. citadino Frecuencia resl suburbano


TABLA 2.8 Costo por alirnento ($)
6 )
20 pero menos que 30
Distribuciones de tl
30 pero menos que 40 7
frecuencia del costo
17
por alimento en 50 40 pero menos que 50 19
restaurantes cltadlnos 9 7
50 pero menos que 60
y en 50 restaurantes A

60 pero menos que ?0 6


suburbanos
70 pero menos que 80 -=J -=0
]U )U
Tot¿l

acerca de las caractedstlcas impor-


La distibución de frecuencia permite obtener conclusiones
ta¡tesdelosdatos.Porejemplo,latabla2'8indicaqueelcostodelosalimentosenlosrestaurantes
que en los restaurantes suburbanos el costo de
citadinos está concentrado ente $40 y $50, miennas
los alimentos esti concentado ente $30 y $50'
capítulo' los intervalos de clase se
En algunas gráficas que se analúan iosteriorme¡te en este
que se encuentan a la mitad entre los lí-
identifican por sus marcas de clase, es d-eci¡, los valores '
para las distribuCiones de frecuencia de la tabl¿ 2.8'
mites inferior y superior de.a¿a ciase.
$S5, $65 y $75 (cantidades que son fáciles de leer e interpret¿r)'
-.c^ de "las. soo $ZS' $¡S, $+S, de datos' diferentes grupos de intervalos
Si un conjunto de duto, oo io.tuyt * glan númrcro
perceoción de este tipo de cam-
d. .h";;;d;; trear distint¿s irnpi"'loot-t tott" los datos' La
De la misma forma' el hecho de
bios tiende a disminuir a mediOffi s"ittoftttan nás
datos'
podría afectar las impreslones.
ifegi. dif"rentes límit s superiores i i¡fe¡iores de clase también

los rendimientos que produjeron los


En la sección sobre eI Uso de la estadística se busca comparar
EJIMPLO 2.3 y fondos en bonos corpor¿tivos a
fondos en bonos de certificados mtermedios gubernamentales
frecuencia para los fondos en bonos de cer-
Distribuciones corto plazo durante 2009. Constuya ástribocines de
de frecuenci¿ de interme<lios gubemaúen;les y fondos en bonos
cotporativos a corto plazo'
tificados
los rendimientos intermeüos gubernamentales
para los {ondos en SOLUCÉN Los rendi:nientos producidos por los fondos en bonos
durante 2009 se concenhan pnncrpalmente ente 0
y 10' en tanto que los rendimientos de los fon-
bonos intermedios ente 5 y 15
dos en bonos corporatlvos a durante 2ó09 se concentran principalúente
gubernamentales
"ono'fLo
y corPorativos (véase la tabla 2.9).
a corto plazo En los datos de los fondos, el número de d¿tos en los dos
gnrpos es difoente' Cuando el "
o ftecuencias rel'- -
durante 2009 mero de daros en los dos g¡lpos no es igual, es necesariodilizar'proporciones
vas y porcentajes para reali2ar comparaciones'

Frecuencia de fondos Frecuencia de fondoo


TABLA gubernamentales corPorativos a corto Plazo
Rendimientos en 2009 intermedios
Distribuciones de 1

-10 pero menos que -5


frecuencia dg los
IJ
rendimientos Para -5 pero nenos que 0
los fondos en 35 t)
0 pero menos que 5
bonos intermedios 30 38
qubernamentales 5 puo menos que 10
R 31
! los fondos en. 10 pero menos que 15
o
bonos corPóratlvos 15 pero menos que 20 I
a corto Plazó I
20 pero menos que 25 I
durante 2009
1
i
25 pero menos que 30
1

30 pero menos que 35 0


!
;;
lou 87
2.3 orsaoización de dstos ¡umericos 35

Distribución de frecuencia relat¡va


y distribución porcentual
Cuando se comparan dos o miis grupos, como en la tabla 2.10, es más útil conocer la proporción o el
porcentaje del total de cada grupo que conocer el co¡teo de frecuencias de cada uno. En estos casos,
se c¡ea una distribución de frecuencia relativa o una distibución porcentual en lugar de una distribu-
ción de frecuencia. (Si los dos o mrás gnrpos tienen muestas de tamaños diferent€s, como en el ejem-
plo 2.2, se debe u+ilizar rma distibución de ftecuencia relativa o una distibución porcentual).

cITADtlto suEuRBAl{0
BLA 2.I O
Frecuencia Porcent¡je Frecuetrcia Porcentaje
relativas c0sr0 PoR AulrEilTo ($) rel¡tiv¡ (%l rel¡dv¡ (o/n')

20 pem menos que 30 0.12 12.0 0.10 10.0

30 pero menos que 40 0.14 14.0 0.34 34.0

40 pero menos que 50 0.38 38.0 0.34 34.0

50 pero nenos que 60 0.18 18.0 0.14 14.0

60 pero menos que 70 0.12 12.0 0.0E 8.0

70 pero menos que 80 0.06 6.0 0.00 0.0

Tot¿'l 1.00 100.0 1.00 100.0

v,
La proporción o frecuenci¡ rel¡tiva en cada grupo es igual al númuo de d¿ros en cada clase
dividido ente el número total de d¿tos. El porcentaje en caü grupo es su proporción multiplicada
por 100%. o
o
o
N
CALCULO.DE LA FROPORCIÓN O FRECUENCIA RELATIVA A
La proporción, o fiecuencia ¡elativa, es el número de daros en cad¿ clase üvidido entre
el número total de datos:

número de datos-;;:-i:;t:-
en cada clase
tfoporclon = lrecuencla rentrva = --------;------ Q.2)

Si existen 80 datos y la frecuencia en cierta clase es 20, la proporción de datos en esa clase es:

2!=n^
80 ---
y el porcentaje es

0.25 x l00o/o = 25o/o

La distribución de frecuencia rel¡tiva se calcula determinando primero la frecuencia relativa


en cada clase. Por ejemplo, en 1a tabla 2.8 de la página 34 se mencionan 50 restaurantes citadinos;
e1costo por alimento en 9 de esos restauantes se encuentra entre $50 y $60. Por lo tanto, como se
observa en la tabla 2.10, la proporción (o frecuencia relativa) de los alimentos que cuestan enfe
$50 y $60 en los restaurantes citadinos es:
o

3d=u.ró
La distribución porcentual se calcula multiplicando cada proporción (o frecuencia relativa)
por 100%. Así, la proporción de alimentos en los restaurantes citadinos que cuest¿ ente $50 y $60
es 9 üvidido entre 50, o 0.18, y el porcentaje es 18%. Eü la tabla 2.10 se presentan la distribucióo
3ó CAP1TULO 2 Organización y presertación gráfica de los datos

defrecuenciarelativayladistribuciónporcenhraldelcostodelosalimentosen¡estaurantescitadi-
nos y suburbanos
un poco más en los restaurantes
be h tabla 2 10 podemos concluir que los alimlentos cuestan
citadinosqueenlosrestaurantessuburbanos.Asimismo,12%delosalimenloscuestanen[e$60y
de 8% de los alimentos en los restaurantes subu¡ba'
$70 en tos .estau."nniJs .üáin"r,. ¿r.r"ncia
citadinos, a diferencia de
nos; y 14% ¿" ro.;i.*á. .uestan enne $30 y $40 en 1os restaurantes
34% de los alimentos en los restaurantes suburbanos'

EnlasecciónsobreelUsodelaestadísticasebuscacompararlosrendimientosqueprodujeronlos
EJEMPLO 2.3 y.fondos e tuT]:t-:1,!ll"'l.ll3l:
Áo¿o, a. iou..r¡On en bonos i¡termedios gubernamentales y distribuciones
Distribuciones de .i"á. " ""n pf.o durante 2009. Constriya distribuciones de ftecuencia relativa
frecuencia relativa porcentuales esos fondos.
Para
y distribuciones
porcentuales de soluoÓNseconcluye(véaselatabla2.11)que,<lurante2009,losren<iimientosdelosfondos
gubemamen-
intermedios
los rendimientos In-¡lo* *éo*,iuos fuáron mucho más elevadoi que los de los fondos
corporativos tuvieron rendimientos de ente l0
para los fondos tales. Por ejemplo, 3I.96% de los fondos en bonos
tuvieron rendimientos de
de inversión en ;l;, ;;ilr'qr; 6.g0% delos fondos intermedios gubernamentales
soio 15 4ó7o h¡vo rendimientos de enhe 0 y 5'
bonos intermedios enhe 10 y 15. De los fondos en oonos corporativos'
gubemamentales'
gubernamentales u dif"rrn"i" d. 40.23% de los fondos intermedios
y fondos de
inversión en bonos
corporativos a corto
plazo durante 2009

F0¡{00s llfTERilEDlOS FOilDOS C0RP0RATIVoS


TABLA 2.11 A G0Rf0 Pl.¡20
GUBERI¡AMEI{TAITS
Distribuciones de
RENDIMIEI{TTIS Eil flNg
frecuencia relativa 1.03
0.0000 0.00 0.0103
y distribuciones -10 pero menos que -5
0.0000 0.00
irorcentuales de 0.1494 1.4.94
I
-5 pero menos que 0 15.46
os rendlmlentos 0.4023 40.23 0.1546
0 pero menos que 5
para los fondos de 0.39r8 39.18
0.3448 34.48
inversión en bonos 5 pero menos que 10
6.90 0.3196 31.9ó
intermedios 10 pero menos que 15 0.0690
gubernamentales 1.15 0.0928 9.28
_Y 15 pero menos que 20 0.0115
fondos de inversiÓn 0.0115 1.15 0.0103 1.03
20 pero menos que 25
en bonos 0.0103 1.03
0.011s 1.15
coroorat¡vos a cono 25 pero menos que 30
0.00 0.0103 r.03
plalo durante 2009 30 pero menos que 35 0.0000
r00.00 1.0000 100.00
Total 1.0000

I
Distribución acumulada
rl Ladistribuciónporcentua|acumuladaesunaformatlepresentarinfomaciónacercadelporcen.
taje de los datos sue ,oo...no"''q* u* :T'ty-':T."1::"i"t::":1"rH*
n*:
I
L

qu€ H"üT;ff¿
i

.'
cül es el porcentaje de los alimentos de restaürantes crtadmos distribución por-
pil.*":J.r.J iienos de $50. S. otiti". U Art itución porcentual para ffear.la
de lo.s intervalos
i""*f l"r."i"¿" .En la tabla2.l2 se muesta cómo se combinan los porceütajes
del costo de alimenbs el
porcentual,acumulada
de clase individuales para tbrmar la distribución
rest¿uantes citadinos. En esta taula-sJ "ürrrv"
q"á ,irg"ro de _los alimentos (0%) cuesta menos de
$30' que 26% de los alimentos cuestan menos
$20, que 12% de los allmentos cuestan menosie
y
14% de los alimentos cuestan entre $30 $a0)'
y así sucesivamente hasta que
;;litb;tqt.
100% dJlos aLimentos cuestan menos de $80'
Enlatabla2'l3seresumenlosporcentajesacumuladosdelcostodelosalimentosenrestau-
que el costo de los alimentos es un
*rrt", y *u*Uunor. tu Ji'i'ito"ión acumulada indica que
"iáaioo,
en los reshura es que en los citadinos En la tabla 2'13 se observa
poco menor 26Yo de
'ubu'buno' cuest¿ menos de $40' a difere¡cia de
44Vo de losalimeútos en los restaurantes suburbatros
2.3 organización dc datos numéricos 37

iÁett z'tz
Porcentaje de alimentos que cuest¿n menos
Costo por alimento ($) Porcentaje (%) lfnite inferior del intervalo de clase (%)
que el
de la
20 pero menos que 30 12 0
30 pero menos que 40 I4 T2

nituJu ptt' 40 pero menos que 50 38 26= 12 + 14


"t
n de los alimentos 50 pero menos que 60 18 64= 12+ 14+38
restaurantes 60 pero menos que 70 1.1 82=12+14+38+18
70 pero menos que 80 o 94=12+14+3E+18+12
80 pero menos que 90 0 100=12+14+38+18+12+6

los alimentos en los restaüantes citadinos: 78% de los alimentos en los ¡est¿urantes subu¡banos
cuestan menos de $50, a diferencia de 64% de los aiimentos en los restaurantes cit¿dinos; 92% de
los alimentos en los restaurantes suburbanos cuestan menos de $60, a diferencia de 82% de los
alimentos en los restaurantes citadinos.

A 2.13 Porcent¡je de rest¡ursntes citldinos Porcentaje de restaurrntes suburbanos


con alimentos que cuest¡n menos d€
con ¡limentos que cu6t¡n menos de la
Costo ($) la cantidad indicada cantidad i¡dic¡da
del costo 20 0 0
al¡mentos en 30 t2 l0
citadinos 40 26 44
50 o¿t 78
v,
60 82
70 94 100
80 r00 100 o
o
o
N
2.4 En la sección sobre el Uso de la estadística, se busca conp¡¿¡ lqs ¡g¡dimientos que produjeron los A
fondos de inversión en bonos intermedios gubemamentales y corporativos a corto plazo durante \¡
2009. Construya distibuciones porcentuales acumuladas para los fondos de inversión en bonos
niveles de intermedios gubernamentales y corporativos a corto plazo.
de fondos
bonos SOLUC|óN La dishibución acumul ada de la tabla 2.!4 indica que los rendimientos son mucho más
bajos para los fondos en bonos interm€dios gubemamentales que para los fondos corporativos a corto
plazo. En la abla se observa que 14.94% de los fondos intermedios gubernamentales tienen ¡endimien-
tos negativos, a.diferenciadell.0l%-de-los fondos.enboros-corporativosa corto plazo; que 55.1?% de
los fondos intermedios gubemtrmentales tienen rendimientos menores que 5, a difercncia del 16.49%
de los fondos corpor¿tivos ¡ corto plazo; y que 89.65% de los fondos intermedios gubenumentales tie-
nen r€ndimientos menor€s que 10, a diferencia del 55.67% de los fondos corporativos a corto plazo.

'ABLA 2.,I 4 Porcentaje de fondos intermedios Porcentaje de fondos cor¡rorativos


Rendimientos gubernamentales menores que el ¿ corto plazo menores que eI
en 2009 rendimiento indic¿do rendimiento indicrdo
acumuladas de los -10 0.00 0.00
dimientos para 0.00 1.03
tondos en bonos 0 t4.94 1.03

.gubernamentales y 5 55.17 16.49


corporativos a corto 10 89.65 )).o /
ptazo durante 2009 15 vó.)) 87.63
20 97;t0 96.91
25 98.85 97.94
30 100.00 98.97
J) 100.00 100.00
38 cefÍfui,o z organización y presentación gnífica de los datos

Problemas para la sección 2.3


2.18 El archivo @E qo. se muestra despué¡
APRENDIZAJE DE LOs FUNDAMENTOS
del inciso c) incluye los siguientes datos acerca
2.13 Construya un arreglo ordenado, considerando los si del costo de la energía eléctrica durante julio de 2011 para

suientes datos de una muestra de n = 7 calificaciones de una muestra aleatoria de 50 depanamentos con un dormito'
ixámenes de contabilidad: rio en una gran ciuüd.
a) Construya una distribución de &ecuencia y una disaibu'
68 94 63 7s 71 88 64
ción porcentual con intervalos de clase que tengan lími-
2.'14 Construya un arreglo ordenado, considerando los si tes superiores de $99, $119, y así sucesivamente.
guientes datos de una muestra de caüficaciones de exáme- ó) Constuya una distribución porcentual acumulada.
nes de marketing: c) ¿Alrededor de qué cantidad parece estar concentrado el

costo mensual de la energía eléctrica?


88 78 78 73 91 78 85

adni- Datos brutos sobre cobros de energía ($)


2.15 Las calificaciones obtenidas en un examen de
a un progama de pos-
sión por una muestra de 50 asptantes 96 171 202 r78 r47 102 153 197 r27 82
erado en administración indican que ninguno de ellos 157 185 90 rt6 r72 111 148 213 130 tb)
óbtuvo menos de 450 puntos. Se elaboró una distribución de 141 149 206 t7s t23 128 144 168 109 lo /
frecuencia eligiendo intervalos de clase de 450 a 499' 500 a 95 163 150 154 130 143 r81 166 139 l4
549,y así suiesivamente, hasta el intervalo de la última 108 119 183 151 114 135 r9I 137 129 15¡

clase que iba de 700 a 749. Dos aspirantes obtuvleron una 2.19 l,a operación de una codadora consiste en cort¿r tozos
c¿lificación en el intervalo de 450 a 499, y 16 obtuvieron de acero en partes, que después se utilizarán como estruchua
una calificación en el intervalo de 500 a 549. para los asientos frontales de un automóüI. El acero se corta
c) ¿Qué porcentaje de los aspirantes obtuvieron una califi- ion una siera de diam¡nte y se requiere que las partes resultan'
cación menor que 500? ¡es esténdento d€ a 0.005 pulgadas de la longitud especificada
á) porcentaje de aspirantes obtuvieron una califica-
¿Qué por la empresa automotiz. Se reunieron clatos de una muesfra
ción entre 500 Y 549? ie tOO partes Oe acao y se aünacenaron en el archivo !@l' I ¡
c) ¿Qué porcentaje de aspirantes obtuvieton una califica- medición reportada es la diferencia en pulgadas enüe la longt-
ción menor gue 550? tud real de la parte de acero, medida por medio de un aparato
e) ¿Qué porcentaje de aspirantes obtuvieron una califica- de medición láser, y la longihrd especiúcada para la misma' Por
ción menor {ue 750? ejemplo. el primer valor, -0.002. ¡epresenta una parte de acero
2.1ó Un conjunto de datos incluye valores que van de 11'6 que es 0.002 pulgadas mas corta que la longitud especificada"
a9'7.8. d) Construya una distribución de frecuencia y una distribu-
¿) Si estos datos se agnrparan en nueve clases, indique cuá- ción porcentual.
les serlan los límites de clase á) Construya una distribución porcentual acumulada'
'. r á) ¿Qué ancho de intervalo de clase eligió? c) ¿La cortadora de acero está cumpliendo con los requ'
'
'i"' c) ¿Cuáles son las nueve ma¡cas de clase? tos establecidos por la empresa automotriz? Explique '-
respuesta.
APLICACIÓN DE CONCEPÍOS
2.20 llna empresa produce carcasas de acero para equipo
2.'t7 El archivo l!!!@@ incluye datos sobre el costo elfuco. La parte principal de la carcasa es una bandeja hecha
total (S) de cuatro boletos, dos cervezas, cuatro bebiüs ga- de kírnina de acero de calibre 14. Se produce utilizando una
seosas, cuatro emparedados de salchich4 dos programas de prensa moldeadora progresiva de 250 toneladas, mediante
juegos, dos gonas de béisbol y la tarifa de estacionamiento una operación que coloca dos formas de 90o en el acero plano
para un vehícrrlo en cada uno de los 30 estadios de las ligas para fonnar la bandeja. La distancia desde un lado de la forma
mayores de béisbol durante la temporada 2010. Los costos iasta la otra es fi¡ndamental, ya que debe estar aislada cuando
la
fueron los siguientes: se usa a la intemperie. La emEesa reqüere que el ancho de
bandeja sea de ente 8.3i y 8.61 pulgadas. Se obtienen las an-
tn335,2s0, t8b, Ú3,162, \32,2Ü7,316, r78' 184, 141, 168,208, 115 la
churas, en pulgadas, de la siguiente muestra de 49 bandejas;
158. 330, l5l, L6L, t70,212,222. t60,n'7.22',7.127.211' t2t.221,216 información esta almacenada en el archivo ft@l!:
Fuente: Daios extraídos de teammarketing'com, 1 de abril de 2010'
8.3r2 8.343 8.317 8.383 8.348 8.410 8.351 8.373
a) Organice esos costos en un ¿rreglo ordenado. 8.481 8.422 8.476 8.382 8.484 8.403 8.414 8.419
á) Construya una distribución de ftecuencia y una distribu- 8.385 8.4ó5 8.498 8.447 8.436 8.413 8.489 8.41'l
ción porcentual Para esos costos. 8.481 8.415 8.479 8.429 8.458 8.462 8.460 8.444
c)' ¿Alrededor de qué agrupamiento de clase se concentra- 3.129 8.460 8.412 8.420 8.410 8.405 8.323 8.420
ion, si es que lo hicieron, los costos de asistir a unjuego 8.396 8.447 8.405 8.439 8.411 8.421 8'420 8.498
de béisbol?: Explique su respuesta'
8.409
2.4 Presentación gnifica de datos categóricot 39

una-distibución de frecuencia y una distribu- Fabricante A Fabricante B


Consüuya
684 697 720 773 821 819 836 888 897 903
:''ll#lil',fi1"'tibución porcennral acum'lada'
E3l E35 848 852 852 907 912 918 942 943
de bandejas que cum-
ñI .oortoy. acerca del número 8s9 860 868 870 876 952 959 962 986 992
iiJn .oo tot..qo¡.itos que marca la empresa de que las 893 899 905 909 9ll 994 1,004 1,005 1,007 1,015
tetrgan eltre 8.31 y 8.61
pulgadas de ancho?
922 924 926 926 938 1,016 1,018 1,020 t,022 t,034
mencionada en el problema 2 20 939 943 946 954 971
1 L¿ empresa fabricante 1,038 t,012 1,0't'7 t,0'77 t,082
aislantes Si los aislantes se 912 977 984 1,005 1,014
.bién produ.. .eléctricos' 1,096 1,100 I,113 I,113 I,l1ó
est¡ín funcionando, podría ocurrir un cor-
r mientas r,016 1,041 1,052 1,080 1,093 1,153 1,154 t,114 1,188 1,230
los aislantes, se lle-
ito. Para probar la resistencia de

a cabo pruebas
destructivas en laboratorios de gran c) Co¡struya una distibución de fecuencia y una distrbución
ncia para determtnar Cuanta Juend Se necesrta
pala porcentual para cada fabricante utilizando el siguiente
La fuerza se mide observando la cantidad de li- ancho para el intervalo de cl¿se de cada distribución:
is que se deben aplicar
al aislante antes de que se rompa.
Fabricante A: 650 pero menos que 750, 750 pero menos
obtienen las siguientes mediciones de fuerza de una que 850, y así sucesivamente.
de 30 aislantes; la infonnación está alnacenada en
Fabricante B: 750 pero menos que 850, 850 pero menos
archivoEEl: que 950, y así sucesivaúente.

1,870 1.728 t,656 1,610 1,634 1,784 r,522 1,696


ó) Construya distribuciones porcentuales acumuladas.
:r <0, 1,662 1,866 \J&
1,734 1,662 1,734 1,774
c) ¿Curíles bombillas tienen una üd¡ más larga, las del Fa-
J,550 1,756 1,762
1,866 1,820 1,7,14 1,788 1,688
bricante A o las del Fabricante B? Explique su rcspuesta.
t.slo 1.752 t.680 1,810 1,652 r,736

una distribución de frecuencia y una distribu- 2.23 Los siguientes datos (almacenados en el archivo EED
porcentual. representan el contenido de bebida gaseosa en una muestra a,
una distribución porcentual acumulad¿ de 50 botellas de 2 litos.

concluye acerca de la resistencia de los aislantrs si 2.109 2.086 2.066 2.075 2.065 2.057 2.052 2.044 2.036 2.038
empresa eúge la medición de una fuetza de al menos 2.031 2.029 2.025 2.029 2.923 2.020 2.01s 2.014 2.0t3 2.014
o
o
übras antes de que se rompa el aislante? 2.012 2.0t2 2.012 2.010 2.005 2.N3 1.999 1.996 1997 1.992 o
1.994 1.986 1.984 1.981 1.9'13 1.9'15 t.97r 1.969 1.966 1.967
N
El archivo !![!
contiene información sobre la vida
|.963 1.951 1.951 1.951 t9ü r.94r l.941 1.938 1.908 1.894
5
o
) de una muestra de 40 bombillas de 100 watts
por e[ Fabricante A, y una muestra de 40 bom- a) Construya úna distribución porcentual acumulada.
de 100 watts producidas por el Fab¡icante B. En la á) Con base en los resultados del inciso a), ¿la canticlad de
tabla se presentan los datos como un par de arre- bebida gaseosa vedida en las botellas se concentra alre-
ordenados. dedor de valores esoecíficos?

NTACIÓN GRAFICA DE LOS DATOS


Al orgrniz¿¡ ls5 da1os, en ocasiones empezamos a descubri¡ p¿tones o relaciones en ellos, como lo
ilustran los ejemplos de las secciones 2.2 y 2.3. Para explorar y descubrir mejor'dichos pafones y
relaciones, podemos visualizar los datos c¡eando diversas gráficas y "presentaciones" especiales.
Como ocune cuando se organizan datos, las técnicas que se utilicen para graficar los datos depen-
del del tipo de vaiable (categórica o numérica) que estos representen.

2.4 Presentación gráficade datos categóricos


l9
La piñca que elija para hacer una presentación gniñca de los datos de una sola variable categórica

A depende de si su objetivo consiste en comparar las categorías entre sí de manera direca (gnífica de
44 barras), en destacar la manera en que las categorías formatr parte de un todo (gnifica circular), o
20 de que los dalos se concenten solamente en algunas de las categorías (gr.áfica de Pareto). Si se desea
98 hacer una presentación grrÁfica de los clatos para dos variables categóricas, se utiliza una gnáfica de
barras agnrpadas.
40 cA?fruLO 2 organización y presentación gláfica de los
datos

Gráfica de barras
Unagráñcadebarrascomparadiferentescategorlasutilizandobanasindiüdualespararepreseu.
la frecuencia o el
t¿r los cooteos ¿.1"ü.Lé¿". La longitud de una barra representa la cantida4
un histogram4 que se estudia
po...ntn¡. o. o"tor-ii. Juá-o.nr.o cte r:ia categoría. A diferencia de
enlasección2.5,unagnificadebanasseparatasbarrasentrelascategorías'EnIafigura2.lse
página 28' la cual
de la tabla 2.1 que se muestra.en la
obsewa la gráfica ¿. u?".;p"" r"r d¿ros
estábasadaenunaencuest¿recienteenlaquesepreguntóaungrrrpo<leadultoscómopagabansug
0.".r.*,*Ñü;;Adil ü uv Todav' 4 deocnbre de 2007' p'1)'
Mooorv nilt"'

Cómo un gnrpo de adultos pata sus tastos


mensual€s
FIGURA 2.1
Géfica de banas
sobre la forma en
que. un gruPO Oe
adultos Paga sus
gastos mensuales

Po|Eant¡la

se observa que los individuos tienen


mayores probabilidules de pagar
Al revisar la ñgura 2.1,
o á finea' modaüdades que van seguidas por la de pago en
."";;q;;; ñ;, a..moitot
tipo de pago o respoodieron que no sabían'
efectivo. Muy pocas penonas meocionaron oto

se busc¿ examina¡ el riesgo de los fondos


yours de

EJEMPLO 2.5 ffi e Is


il;;;úü t;" ttunieron los datosde un",:f:**,]
inversión en bonos. va se defi¡ie; ii
en
de barras para el riesgo de los fondos
Gráfica de barras
de los niveles de
iilA;ilffi#""*-".?rio ..ir*ü una interpretar
fofica
los result¡dos'
riesgo de los
;;;;;i;;;;;" h abta2'2detapÉryina28) e
prome'
que la categoría más grande es un riesgo
londos en bonos SOLUCIóN A1 revisar la figura 2.2, se observa
promedio'
de certificados dio, seguida de cer.u pot *
,r.,gJi-o'-uoitu del pioneclio y un riesgo por debajo
del
2-4 Pr€seatación gráfic¡ & dslos c¿tegóricos 41

ÉrcuRA 2,2 f{lvelc6 de ri€68p de los fondos en bono6

l- Gáfica de banas
de los niveles de
LA riesgo de los
fondos de Invers¡on

¡l en bonos

ut

ct{050
Frlcr¡tñai¡

o
Gráfica circular =
Una gráfica circular üiliza las partes de rm circulo pra rcpreseirtar los valqcs dc c¿d¡ ca¡egoría- El
tamaño de cada parte o porción del clrculo varia de acuerdo coo el porceirtaje en cada categoría-
o
o
Por eje,mplo, en la tabla 2. 1 cle la página 28, 54% de los participant€s dijo que pag¡ sus cu€ntas con o
cheque. Para represent¿r €sta categoría como un¡ parte del círculo, se multiplica 54% por los 360 N
grados que conforman uu clrculo para obteoer una parte que corresponde a 194.4 grados de los
¡
ao
360 que conforman el clrculo. Bn la figura 2.3, la gráfica circular p€moitl visusliza¡ ls Parte del
clrculo completo que conforma cada categorla. En esta figura, el pago de los g¡rfios con cheque
conesponde a la parte más g¡ande, 54% del cl¡culo. La segunda parte más gande conesponde al
pago electónico o en llnea de los gastos, 28% del círculo.

--FIGURA 2.3 cóno pe3e-sus t¡losmensualcsucg¡upode aduhos.


afi
Grafica circular Olrot/llo t b.
de la manera en oue tx
ras personas Pagan
sus gastos

EL.üó¡l.oÉ|| lú|Cr
\ zltl

tl
42 CAPÍTULO 2 Organización y presentación gláfica de los datos

EJEMPTO 2.ó En la pafe I de la seccidn refetente a Choice Is You¡s se busca examinar el riesgo de los fondos de
invers-ión en bonos. Ya se definieron las variables y se reunieron los datos de una muestra de 184
Gráfica circular fondos en bo¡os. Ahora se necesita construir una gfáfica circular para el riesgo de los fondos en
de los niveles de
bonos (con base en latabl^z.z de ia página 28) e interpeta¡ los resultados'
riesgo de los
fondos de
inversión en bonos

FIGURA 2,4 Niveles de riesgo


Gráfica circular
de los niveles de
riesgo de fondos
de inversión en
oonoS

La figura 2.4 muestra


una géfrca circular
creada con Minitab; la
f¡gura 2.3 mues't.a una
gráfica circular creada
con Excel.

P]omedlo
l7.sx

SOLUC¡óN AJ revisar la figura 2.4, se observ"a que aproximadamente ua poco mrás de una tercera
parte <le los fondos rep,resena rm riesgo promedio, que alrededor de una tercera parte implica unriesgo
por arriba del promedio y que menos de üna tsrcera pate tiene un riesgo por debajo del promedio.

Gráfica de Pareto
En una gráñca de P¡reto los valores de cada categoría se grafican como banas verticales en orden
deScendente, de acuerdo Con sus frecuenCias, y se combilan con una llnea porcentual
acuml¡l''la
en la misma gnifica. Una gráfica de Pareto puede revelar situaciones en las que se presenta el ,
cipio de Pareto.

una gráfica de Pareto tiene la capacidad de separar a "los pocos vit¿les" de "los muchos trivia'
les,', conio que permite cenhar la atención en las categorías import¿ntes. En situaciones en las
que

los datos repiesentan artículos defectuosos o que no cumplen con las normas, una gfáfica de Par€to
es una herramienta muy útil para priorizar los esfuezos de mejora.
para esü¡diar una iituación in la que [a gráfica de Pareto demostró ser especialmente ade-
cuad4 considere el problema que enfrenta un banco. El banco definió el problema como las.fan'
su""iónes incompleias de los cajeros automáticos. Se obtuvieron datos sobre las causas de
las

transacciones incompletas de los cajeros automáticos y se alúacenaron e¡ el archivo [fiEEÉ!


@. f
En la tabla 2.1! se presentan las causas de dichas tansacciones, la fiecuencia de cada car¡sa
el porcentaje de tansacciones incompietas de cajeros electónicos debidas a caü causa'
2.4 Pr€sent¿ción gráfica dc dalos categóricos 43

fA1LA 2'15
Causa Frecuencia Porce¡t¡je (%)
Mal fi¡ncionamiento delcajero 32 4.42
fabla-resumen Para
las causas
oe El cajero no tienedinero 28 3.87

transacc¡ones, Cantid¿d solicitada inválida 23 3.18


incomPletas
oe.
Falta de fondos en la cuenta z.oL
cajeros automalcos Tira m¡ g¡.ética ilegible
Ta{eta deformada atorada 36s 50.41
Presión de teclas inconectas 23 3.18
Total n4. I 00.00
Fue¡te: Ddos €xcafdos da A. Bhsll& Totrl Mi$tse úÉ Pa¡€to P¡irciplc", S¿t Sígtru Forum
Magazi¡¿, mayo &2ú9, !p. l5-18.

La tabla 2.16 es r'na tabla-resumen para los datos de las transacciones incompletas de los caje-
ros automáticos, donde las categorías est¡ín ordenad¿s con base en la frecuencia de ha¡sacciones
incompletas presentadas (y no en orden alfabético). También se incluyeú los porcentajes, ¿si como
los porcentajes acumulados, de las categorías ordenadas.

TASLA 2.f ó Caus¡ Frecuencia Porcentaje (%) Porcentrje scrmuledo (%)


, Tabla-resumen
Tarjeta deformada atorada 365 50.41 50.41

ordenada de las Tira magnética ilegible 234 )Z.JL 82.73


causas de Mal fimcionamiento del cajero 32 4.42 87.15
U'
transacc¡one5
El cajero no tiene dinero 28 3:87 9t.02
incomp¡etas de
cajeros automáticos Cantidad solicitada inváüda 23 3.18 94.20 o
Presión de teclas incorrectas 23 3.18 97.38 o
o
Falta de fondos en la cuenta 19 2.62 100.00 N
Total 724 100.00
or
o

En la figura 2.5 se presenta una gráfica de Pareto con base en los resultados mostrados en la
tabla 2.16.

FIGURA 2.5 Gráñca de Pareto de transacclones Incompl€tas en cejeroc automáücG

Gráfica de Pareto
para los datos de
transacciones
incompletas en
cajeros automáticos

de-
atr
las
t da¡ rh¡ Ee¡d ffiád Pl.dó.r r¡lt¡&
dciomadá m¡Fétla ¡ot¡l|l to¡.¡t .b &rda lbrdor .r
.loBd¡ íLgibL dlBr ¡ñáfü rÉnGl¡r l. qrnb
causá
M CAPITULO 2 Organiz¿ciór y preseatación gráñca de los datos

UnagráficadeParetopresentalasbafrasenformaveftical'juntoconunallneaporcentualacu-
de clase de cada categorí4 a una altüa igu¿l al
mulada. La linea acumuhü se grafica en la marca
po.."ot"1" u"u.J"ao. pu. qu"-*u gáfica de pareto incluya todas las categorías, incluso aquellas
denomi¡¿d¿ otos o
con pocos defectos, en algun; situaciones es necesario incluir una categoria
Misceláneos.Enestassituaciones,labafraqüe¡epfesentaesascategoríasdebecoloca¡seala<le¡e.
cha de las otras barr¿s'
estjl[ ordenadas por la ftecuencia de ocu-
Debico a que hJcategorías en una gráfic¿ de_Pareto
esfirerzos para mejorar el proceso. Al analiza¡
nencia, es posibiet Jáf¿. r. ¿"U.n cóncentar los
la grafica ae rareto ."ü ¡g*.i.s, ,i ,e sigue la línea, se ve que las primeras dos categofías repre-
incomlletas de cajeros automáticos. La primera categoría
son
sefiat g:¿..l3%O.l$ f*r-"*¡".r
50.41% de los defectos), seguida por las tira¡
las tarjetas defo¡madas atoradas (que representan
por reducir las uansacciones irrcompietas en
magnéticus itegbles Gon un ¡2.¡zx) ros intentos
atoradas y a tiras magnéticas ilegibles deberían
cajefos autoúft;;;¿iii¿" , tri.t".'o.formadas
producir los ."y"*, i;"fi".s. debería conceuftrse en descubrir por qué ocurrieron
El equipo
esos €rrofes.

de pago de gastos (véase la tabla 2' 1


EJEMPLO 2.7 Construya una gráfica de Pareto para los tipos
página 28).
Gráfica de Pareto
para los tipos
de pago de gastos

FIGUR.A 2.ó Gráfica de Par€to para la forma d€ pago

Gnáfica de Pareto
para el pago de
los gastos

En la frgun 2.ó se o
o
608
ñuestn una graflca
de Parcto cÍeada con Fo
Minitab; en la figura 2.5 I E

se muestra una gráfica


t+o 40t
de Pareto ¡eada con
l f,:. 'i Excel.
!'

0
chgque Elecdn¡co/ Otro/no sabe
Forma de pago
en Inea

hnea representa 8270. del pago de los


En la figura 2.6, el pago con cheque y electrónico/en
representa 97% de los pagos'
gartos, y el iago con cheque, electónico/en línea y con efectivo

Gráfica de barras agruPadas


Unagráficadebarrasagrupadasutilizaconjrmtosdebanasparamostraflasi¡€lzas^conjuntas
de la t¿bla 2.3 de la página 29, donde.se
J" ¿o?uÁublo .ut góricl. La figu¡a 2.7 utiliza los d¿tos
una cuola para los fondos intermedios
ir"r""ol" t".t.tcia de los fonios en bonos que cobran
'gubemamentates
y los fondos corporativos a corto plazo'
- fondos en bonos interme'
Al ,"ni.* lu iigura 2.7, se observa que un número mucho mayor de
en bonos corporativos I
¿io, guU".ou.aotai"s cobra *a cuota en comparación con los fondos
corüo plazo.
2.4 Presentación gnáfica de dstos categóricos 45

FI6URA 2'7
Gráñca de barrss egrüp¡das de cr¡ota y tlpo

Gráfica
de b
,ar,ras
aqruPad-as qel
tióo de tonoo
v del cobro
áe una cuota

rffi|¡ffi

1o¡0lor1050607!¡$
Fr..!.fid.

Problemas para la sección 2.4


APLICAOóN DE CONCEPTOS
vt
2.24 Una encuesta preguntó a 1,264 mujeres c) ¿Curíles serían sus conclusiones con respecto a qué hacen
quiénes eran sus consejeros de compras más con- los esh¡diantes universitarios con su tiempo?
fiables. Los resultados de la encuesta son los siguientes:
o
o
o
Porcentaje (%) Acüvidad Porcentaje (%) N
Consejeroc de compras or
Publicidad 7 Asistir a clases o laboratorio 9
.A
Amigos/faoilia 45 Dofmir
Sitios web de fabricantes l Socializar, recreación, ohos )l
Medios noticiosos 11
Estudiar 7
Resefras de usuarios en llnea IJ
A
Trabajar, alistarse como voluntarios,
Sitios web de mrnoristas
clubes de estudiantes 9
Vendedores 1

Otos 14 Fue¡tq D¿tos extraldor de M. Marllei4 "First Tta,o Yca¡s ofcollsge


Nastdl" USA Todcy, 18 de eñro de 201I p 3A.
'
Fuq¡t€: Dstos ext¡aidos dr "Snapshots", tlil lodzy 19 de
octubrE dc 2006, p. lB.

2.2ó La Energy Ilfo¡6¿1is¡ ddministati6¡ reportó las si-


c) Construya una gnifica de barras, una gráfica circular y
guientes fuentes de energia elffica en Estados Unidos du-
os una gnífica de Pareto.
rante 2010:
á) ¿Cuál método gráfico cree que es mejor para presentar
estos datos?
c) ¿Qué concluye cotr respecto a los consejeros de compras
en los que más confian las mujeres? Fuente de energía eléctrica Porcentaje (o/o)

2.25 ¿Cómo distribuyen C¿rbón 44


su tiempo los estudiantes unive¡-
sitarios? Se realizó una encuesta entre 3,000 estudiantes en Ili&oeléctrica 1

s€
edad universitaria y los resultados se presentan en la si- Gas natural 24
gurente tabla.
os Nuclear 20
c) Construya una gráfica de banas, una gráfica cücular y
Otr¿ 5
Le-
una gáfica de Pareüo.
á) ¿Cuál método gráfico cree que es mejor para presentar fue¡tc: Ercrgy ldormatio¡ Adoitri¡tatio4 2010.
estos datos?
46 CAPÍTULO 2 Organización y presentación gráhca de los datos

2.28 En la siguiente tabla se indican los porcentajes de con'


¿) Construya una gráfica de Parero' Unidos, orga-
sumo doméstióo de energía electica en Estados
ói' ¿Qué párcentaje de la energía se deriva del carbón'
de
año reciente'
nizados de acuerdo con el trpo de aparato en un
ieacciones nuclear o del gas natural?
c) ConstruYa una gr:ifica circular'
datos' Porcentaje (%)
¿l- ,.Oo¿ tipo de gáfica prefiere utilizar para estos
úoa de iareto o una gtáfica circular? Explique su res- Aire acondicionado 18
5
puesta. Secadoras de roPa
24
2,27 Et w artículo se analua la terapia por radiación y Lavadoras de roPa
que se podría I
nuevas cuns a partir de est4 junto con el daño Computadoras
tabla repre- 2
ocasionar si se cometieran elTorcs. La siguiente Para cocinar
de errores cometidos y las 2
senta los resultados de los tipos Lavatastes
de Salud
.*ru, d, lo, errores reportados al Departamento Congeladores
2

del Estado de Nueva York, de 2001 a 2009: Ih¡minación LO

9
Refrigeración
Número Calentadores ambientales 7
Errores de radi¿ción
8
No acertar a toda la zona deteminada Calentadores de agua
284 6
o a parte de ella Televisores Y decodificadores
255 Fuede: D¿tos extr¿idos de J. Moü¿wad y K G¿lb!¿ith' '?luggcd-in
Aplicación de dosis iÍcoÍecta
20 de
50 Age leeds a hu¡ger for ElecElciy', The Nev) York'|1nes'
Paciente incorecto [atado
septi€@bre de 2009, PP. t' 28.
Oho
¿) Construya una gráIica de barras, una glífica cücular
y

¿) Consfuya una grráfrca de barras y una gfáfica


circular u¡a gráfica de Pareto.
á) ¿Cuál método gráfico cree que es meJor paú
presentar
{8 para los tipos de enores de radiación'
para presentar estos datos?
ü) lCuál néto¿o gráfico cree que es mejor
¡ti!
ü:¡ estos datos?
c) l.Qué concluye con respecto al consumo doméstico de

E¡ Énireía eléctica en Estados Unidos?


H, le preguntó a 1,000 personas qué querían
Nrlmero 2.29 Un
# C¡us¡s de errores
355
"stu¿io
asar durante la teúpárada de parrilladas' Los
resultados fue'
Falla en el contol de calidad ron los siguientes:
,t Errores <iel personal en el ingeso cle datos
252
o cálculos Tioo decomid¿ Porcentaje (%)
Enores en la identificación ilel paciente 174
I Came de res 38
o zona de tatamieúto
1 ,.', Uso inconecto de bloqueos, cuñas
IJJ
Pollo 23

y colinadores
Fruta I

Colocación fisica incorrecta del paciente 96 Salchichas 6

77 Puerco 8
Falla en el plan de tratamiento ' Ma¡iscos 19
Mal funciona¡niento de hardware 60
52
Verdur¿s 5
Empleados \üant
Fuente: Datos extaídor de "What Folk
Mal fimcionamiento de programas cle conpúo ^,1
Sizztiag on the Gritl During B¿rb€cue S€asotr"'
USI
o tr¿¡sfercncia de infomación digital TodoY,29 deñar.o &2009'P lA"
Alteración de los datos d€ cálculo por parte l9
y
del penonal c) Construya una gráfica de banas, una gráfica circular
14 una gnifica de Pareto.
Mala comunicación presentar
ó) ¿Cuál método gráfico cree que es mejor para
Inciert¿s/out¡ 8
estos datos?
Fueote: Daios exF¿ldos de W. Bogdanicb,
'A Lifesaving Tool Tumed
a lo que las persooas qurerel
Deaüly",The New Yotk fit¡¿t' 24de eDero d€ 2010' pp l' l5' 16' c)- ¿Qué concluye con respecto
ásar durante la temporada de parrilladas?

una encuesta se preguntó a 1,085 adultos lo


si
de los 2.30 En
c) Construya una gráfica de Pareto para las causas Los resut
suiente: "¡.Le gusta ir a comprar ropa para usted?"
errofes,
tados (dalos extraidos de
' -" ' :cision on clothes shoPPtng
"splrt o(
razo-
d) Analice "las pocas razones vitales" y "las muchas
Uii il¿oy,zs d" *r:roae Zott, p' 18) indicaron que a 51%
nes triviales" para las causas de los enores'
2.5 Presentacióo Bnáfica de datos numéricos 47

gu:o
u.o-..prar ropa para ellas, a dife- c) Constuya una gráfica de barras agrupadas del tumo y del
de lu mujeres l.tT
del.os homlres' No se especifica el tamaño de cump limiento con las no¡mas.
ie¡cia de aa%
y de mujercs' Suponga que los resul¡a- ú) ¿A qué conclusiones podría llegar el director de laborato-
ia,¡u.sra de nomUres
en la siguiente tabla: rio con respecto al patrón de las pruebas que no cumplen
Á. ,on los qu. se muestran
con las normas?
GE¡¡ERO
ÉG$fAIBA 2.32 ¿Enla actualidad le toma más tiempo que antes ser
COMPRAR RÍ)PA Hombre Mujer eliminado de una lista de correo electónico? Un estudio de
sl 238 276 514 los 100 principales minorist¿s en línea reveló lo siguiente:
No 304 zot )/I
Total s42 543 1,085 ]{ECES]ÍA lnn MAS DE TREI CtfCS
PAnA Sn ilililAoo
¡) Construya una gráftca de barras agnrpadas relacionada SI No
AÑO
con el gusto por ir de compras y con el género.
á) ¿Qué concluye a partir de esta gnifica? 2009 39 ol
se realizan varios cientos de pruebas de
2008 7 93
2.31 En un hospital
laboratorio cada día" L¿ t¡sa de pruebas realizadas de forma Fuentq Datos exFaídos de "Drill Down", fie /Ver yort ltn4,29 da

inadecuada (y que, ¡nr lo tanto, necesitan repetine) parece ser 10.6rz0 dc 2010, p. 82.
estable, de aproximadamente 4%. En un esfuerzo por encon-
¡ar el origen del incumplimiento de los requisitos, es dech de c) Constuya una gnifica de barras agrupadas del año y de si
oue se necesite repetir las pruebas, el difector de laboratorio se requieren tres o más clics para ser eliminado de una
áecide llevar registos durante una semana. Las pruebas de la- lista de correo electónico.
bontorio se subdiüdieron de acuerdo con el turno de los em- á) ¿Qué le indican estos resultados acerca de si más mino-
:y pleados que las realiza¡on. Los resultados son los siguientes:
ristas en línea requerían tes o más clics en 2009 que en o
far 2008? =
PRUEBAS OE IA8OFATORIO
rURilO
REAUZADAS Noche Tot¡l o
de
t6 at o
No cumplen con las normas 40 o
Cumplen con las norrnas 654 306 960 N
atr or
le.
Tot¡l 6'70 1,000 N
r

2"5 Presentación gráficade datos numéricos


Entre las glíficas que se utilizan para presentar datos numéricos se encuenta el diagrama de tallo y
hoja, el histograma, el polígono porcentual y el polígono porcentual acumulado (ojiva).

Diagrama de tallo y hoja


Un diagrama de tallo y hoja penrute ver cómo se distibuyen los datos y donde hay concentraciones
de los mismos. El diagrama organiza los datos en Srpos (los allos) y en renglones, de modo que los
valores dentro de cada gnrpo (las hojas) se ramifican hacia la de¡echa de su tallo. En cada hoja
los valores se presentan en orden ascandente. Por ejemplo, suponga que reúne los siguientes costos
del aknuerzo ($) para 15 estudiantes que asistieron a un restaur¿nte de comida nípida: :

5.40 4.30 4.80 5.50 7.30 8.s0 6.10 4.80 4.90 4.90 5.50 3.50 5.90 6.30 6"ó0

Para construir el diagrama de tallo y hoja se utilizan las cantidades de dólares enieras en los
tallos y se redondean los centavos, es decir, las hojas, a un decimal. Para el primer valor, 5i40,
el tallo se¡ía 5 y su hoja sería 4. Para el segundo valor, 4.30, el tallo seria 4 y su hoja sería 3' El
diagrama de tallo y hoja completo para esos datos es:

3 5
4 38899
sl- 4559
5
ol- 6 LJo
7 3
% 8 5
:
7
48 CAPfIULO 2 Orgrnización y presc,ntación gnifica de los clatos

eshldiar el desempeño previo de los


EJEMPLO 2.8 En la parte I de la seccióú refe¡ente a choice Is Yours se busca
¿nterior son los ¡endi-
fondos en bonos corporativos a corüo pl8zo. una medida de su desempeño
Diagrama de tallo *."to, q". pro¿r¡áron en 2009. yaie definieron las variables y se reunieron los datos d€ una
y hoja para los necesita constn¡ir un diagrama
nuestra d; 9i fondos en bonos corporativos a corto plazo. Ahor¡r se
rendim¡ertos de tallo y hoja parz los rendimientos de 2009'
que los fondos
quc los
en bonos SOTUCóN En la figura 2.8 se ilusü:a el diagrama de tallo y hoja para los rendimieirtos
corporativos fondos en bonos corporativos a corto plazo produjeron en 2009'
a corto Plazo
produjeron en 2009

Dirgramr d. tdlo y holr: rrndlm¡.rtot¡ 2oct-Comorf oorto


pltzo
FIGURA 2.8
Dagnma de tallo laug y hoJa <!a rcndloieoio¡ 2009-cor¡'ora! cotto Plazo l¡ '
ttuid¡d dé bols . 1.0
y hoja para los
rendimientos que 1-0 t
los fondos en (5310 1!t¿iu2¡33{11a455555555566666666Ct??t??lE¡8tEt99'9999!t
bonos corPorativos
t3 I m,OAOO7.7'rt1Jx2zz22:l$33:t¡333{11ss55666't9
32 a
a corto Plazo
produjeion en 2009 2

La figun ZB muesta un
diagnna de allo y hoia
aeado con Miniab Y
mcdrífrado Pan que Al aualizar la ñgrua 2.8 se concluye lo siguienrc:
ada allo oatP solo un
renglón. Si * utilíza
. Los r€údimieútos más !¿jss €o !009 ñ¡eron de -8'
PHSat2,las hoias . Los rendimientos más altos en 2009 fueron de 32'
dihrián un Poco & . Los re,ndimi€ntos de 2009 esh¡vieron concenftdos ente 0 y 20'
Ias de la frgun 2.8, Ya .Solounodelosfondostuvorendimientosnegativosen200g,ytesfondosuvieronrendimien.
que PHSEI2 Y M¡n¡tab
¡ilizan úferent* tos de 20 o rnrás en ese año.
métodos.

Histograma
Unhistogrrmaesunagráficadebarrasparadatosnrrméricos¿gfupadosenlaqr.reseutilizaubanas
;;Jr-p.- *pr"r€n;, hs frecuenció o porc€nlajes en cada grupo. En un histograma no
existen

huecos ente las barr¿s aOyacentes. La variabie de interés se


coloca sobre el eje horizontal (f). El eje
de clase'
t"pt**" la iiecuencia o el porcentaje de los datos por cada i¡t€rvalo
t,i ""táin
n"üÁg,fo 2.9 se observan histoqrmas de ficcu€ncia para el costo de
alimentos en rs¡tau*

rc, .l*¿i*i y r.rt",-ot"s suburtanoi. histograma paralos resta_urantes citadinos indica que el
El
costo de los alimentos se conceútra aproxina¿anente átre $zt0 y $50' Muy pocos alimentos en los

FIGURA 2,9
y suburlcanos
Histogramas para el costo de los alimentos en restaurantes citadinos
Hlttogñña dd coato da 16 all|naitoa an l3tru|t t3 d¡bÚti'not
H¡ttogaañr dal co¡to da loa ¡llmlntoa ql ttatrur'nt" dt¡d¡no'
I

z
I t
d

¡15

(t) co.ro d. lo. ¡n|'|úto. (l)


cdt d. h. ¡llnr.nto.
2.5 Besentación grá6ca de datos numédcos 49

restaur¿trtes citadinos cuestan más de $70. E1 histograma pa¡¿ los restaurantes suburbanos indica
)s
que el costo de 1os alimentos se concenha entre $30 y $50. Muy pocos alinentos cuestan más de
i- $60 en los restaurantes suburbanos.

En la parte I de la sección referente a choice Is You¡s se busca comparar el desempeño previo de


EJEMPLO 2.9
los fondos en bonos i¡terrredios gUbemamentales con el de los fondos en bonos corporativos a
los
Histogramas de corto plazo. Un¿ medida de su desempeio anterior son los rendimientos que produjeron en 2009'
que
rendimíentos Ya se deñnieron las variables y se reunieron los datos de una muesfra de 184 fondos en bonos.
los fondos en Ahora necesitamos construir hiStogramas pa¡a los fondos en booos intemtedios gubemamentales
bonos intermedios y corporativos a corto plazo.
gubernamentates
y c€rPoratvos SOLUCIÓN En la figun 2.10 se observan histogramas de frecuencia para los rendimientos que
a corto Plazo los fondos en bonos intermedios gubemamentales y corporativos a corto plazo produjeron en 2009:
produjeron en 20@

FIGURA 2.10
Histoqramas de frecuencia de los rendimientos que los fondos en bonos de certificados
intermedios gubemamentales
y corfontivos a corto plazo produjeron en 2009

Hlltor¿m¡ dr l.ó nndlmhnto3 ql¡. 1o3 ñoñd6 €n b.n6 fikiorr¡m¡ d. lo3 Endlm¡ú.t qu. ltt iúd.t or lo@
ld.rlnr{or ¡ib.m.m.nbl.. predui.M ¿n 20(D onor.üc!. . cofto pl¡¡! ,.od|/hrú 3| 2!09

U'

o
:t !¡' o
o
N
or

'as

en
:Je

¡- La ftgura 2.10 muest|a Al revisar los histogramas de la figura 2.10, se concluye que los rendimientos producidos por
histognmas creados los fondos en bonos corporativgs a cofo plazo fueron mucho máq elwados qu€ los producidos por 1os
con Excel y PHStat2;
h frgura 2.? muestn fondos en bonos intermedios gubemamentales. Los rendimientos de los fondos en botros intelme-
histogramas creados dios gubemamentales se concenaan ente 0 y 10, mientras que los rendimientos de los foudos en
con Minitab. bonos corporativos a corüo plazo se concentrar entre 5 y 15.

to3 Polígono porcentual


Si fratara de construir dos o más histogramas en la misma gnífica, no podría interpretar con facili-
dad cada histogfama debido a que las barras se traslaparían. Cuando existen dos o más grupos,
conüene construi¡ un polígono porcentual, el cual utiliza las marcas de clase de cada intervalo
pata representar los datos de cada clase y luego g$ficar las marcas de clase en porcentaje en su
respectiva clase, como puntos sobre una línea.
En la figura 2.1 I se muestran los poligonos porcentuales para el costo de los alimentos en ¡es-
taurantes cit¿dinos y suburbanos.
Al revisa¡ los dos polígonos de la figura 2.11, se concluye que la concentración más alta del
costo de los alimentos en los restaurantes citadinos se encuenha ente M0 y $50, mientas que el costo
de los alimenios en restaurantes suburbanos se concenka de manera uniforne ente $30 y $50. Asl-
mismo, los restaurantes citadinos tienen un porcentraje mayor de alimentos que cuestan $60 o mrÁs,
en comoaración con los restaurantes suburbanos.
50 cAPfTuLo 2 Orgadzación y presentación g¡áfica de los datos

Poliqonos Dornc€ntualcs del costo de los al¡mentos


FIGURA 2,11 -en restaulante¡ cltad¡nos y suburbanos
Polígonos
porcentuales
del costo de los
alimentos en
restaurantes
citadinos y o
G'
suburbanos
=t^
o

35 45 55 b!
Co¡to d€ lo3 al¡merto. (l)

sobre el eje-Xre-
Los poügonos que se presentan en la figura 2' 11 tienen puntos cuyos valores
pr.r.or_ tu i*."á..hs. d.l int *alo de clase. por ejemplo, observe los puntos localizados
X= OS (SOS). El punto para el costo de los alimentos eD los restaurantes citadinos (el más alto¡
y $70. El
,rpr.."otu .í h""ño de que 12% de los alimentos en esos restaurantes cuestan entre $60
representa el hecho
punto para el costo de los alimentos en los ¡estaurantes suburtanos (el más bajo)
i. qo. AX A. los alimentos en esos restaümntes cuesta ente $60 y $70'
Al consnuü polígonos o histogramas, el eje vertical (i0 debe mostar el cero verdarlero u "origen"
para no distorsionJ el carácter áe los datos. El eje horizontal (X) no necesita mostrar,el
Yalor
parte principal del eje.
cerc para la variable de inteÉs, aunque el raogo de la variable debe incluir la

previo de
EJEMPLO 2.10 En la parte I de la sección referente a choice Is Yours se busca comparar el desempeño
corporativos a
los fondos en bonos intermedios gubemamentales con el de los fondos en bonos
Polígonos q¡e p¡odujeron en 2009.
corto plazo. Una medid¿ de su desimpeño anterior son los rendimis¡fe5
porcentuales de ya seiefinieron las vari¿bles y se reunieron los datos de una muestra de 184 fondos en bonos'
los rendimientos gubema'
Ahora necesita constuir polígonos pofcentuales para los fondos en bonos intermedios
se
producidos por los
mentales y corporativos a corto plazo.
fondos en bonos
produ-
intermed¡os SOLUCÉN En la figr*a 2.12 se muestan los polígooos pofcsnhüles para los rendimientos
y a corto plazo en 2009.
gubernamentales cidos por los fondos dbonos iÍtsrmedios gubernamentales corporativos
y corporativos a
corto plazo en 2009

F'olllono3 porúantt¡alg par¡ loa londos €n bonos Intcrñ'dior


FTGURA 2.'l 2 ¡uüarñ¡nant¿laó Y.ffPor'¡tivo6 ¡ corto pláro

Polígonos
porcentuales de
los rendimientos
producidos por
ios fondos en bonos
¡ntermedios
gubernamentales Y
i corporat¡vos a corto
l¡ plazo en 2009
t.
En Ia figura 2.12 se
muestran los polígonos
Por9entuales creaoos
con Excel; en la figun
2-11 se mueshan los 23 ts
polígonos porcentuales ir.iniúté a !¡9
qeadas con Minitab.
2.5 Presentación gráfica de datos numéricos 51

A1 analizar la figura 2,12, se concluye que los rendinientos en 2009 de los fondos corporativos
a corto plazo son rnucho rxis elevados que los de los fondos intem€dios gubemamentales. El poü-
gono para los fondos corporativos a corto plazo se localiza a la derecha (los rendimientos son más
altos) del polígono para los fondos htemredios gubemament¿les.. Los rendimientos de los fondos
intermedios gubernamentales se concentran entre 0 y 10, mientras que los rendimientos de los fon-
dos comorativos a corto Dlazo se concentran entre 5 y 15.

El polígono porcentual acumulado (ojiva)


El polígono porcentual ¡cumulado u ojiva utiliza la distribución porcentual acumulada que se
an¿lizó en 1a sección 2.3 para presentar la v¿riable de interés sobre el eje.ty los porcentajes actr-
muiados sobre el eje I| |
En la figun 2.13 se observan polígonos porcentuales acumulados para el costo de los alimei-
tos en restaurantes citadinos y suburbanos.

Polfgonor porc.ntu¡l.r lcumülldo. d.l co3to do allll|.rto¡


FIGURA 2.13 .[r r.rt r¡¿nt.a clt¡dlnor y 3üburblno!

Polígonos,
porcentuales
icumulados del
costo de alimentos
en restauranles
o
citadinos Y
subuóanos
o
o
o
N
or
5
3040s060m
Co.to d. lo. ¡llñ.ñto. (l)

Al revisar las cr¡rvas, se observa que la curva del costo de los alimentos en los restaurantes
citadinos se localiza a la derecha de la cuwa de los restaurantes suburbanos. Esto indica que los
restaurantes citadinos cuentan con un menor número de alimentos que cuesten menosque un valor
1
en particular. Por ejemplo, 64% de los alimentos en restaurantes citadinos cuestan menos de $50, a
¡
diferencia de 78% de los alimentos en los restaurantes suburbanos.

f
'1

;
EJEMPLO 2.11 En la parte I de la sección referente a Choice Is Yours, se busca comparar el desempeño previo de
I los fondos en bonos inte¡medios gubernamentales con el de los fondos en bonos corporativos a
Polígonos
corto plazo. Una medida de su desempeño anterior son los rendimientos que produjeron en 2009'
: porcentua les
: Ya se definieron las variables y se reunieron los datos de una muestra de 184 fondos en bonos.
acumulados para
los rendimientos
Ahora se necesita constuir los polígonos porcentuales acumulados para los fondos en bonos inter-
producidos por los medios gubemamentales y corporativos a corto plazo. ,
iondos en bonos SOIUCIóN La frgura 2.14 de la página 52 presenta polígonos porcentuales acumulados para los
intermedios rendimientos producidos por los fondos en bonos intermedios gubemamentales y corporativos a
gubernamentales co¡to olazo en 2009.
y corporativos
a corto plazo en
2009
i¿ CAPÍTLLO 2 Organización y prcsertación griifica de los d¿tos

p¡r¿ k's fondos en lonos


PolfSonoa po,c€ntu¿les acumuledos
FIGURA 2.14 ¡nt€nncdlos Subam¡ment¿les Y Gooor¿tivos a
cono pla¡o

Polígonos
porcentuales I

ácumulados de
los rendimientos
producidos Por I

ios fondos en
bonos intermedios
gubernamentales Y
corporat¡vos a cono
plazo en 2009

La figura 2.1 4 muestra


polígonos Porcenwates
'acumulados creados
con Excel; la figura 2.3 'l!Ol '¡J
túdün¡.nt . u ¡(g
muestra Po,rgonos , ,
porcentuales acumu€dos
creados con Minitab.
de 1a figura 2'14' se obsewa que la curva de
Al reüsar los poligonos porcentuales acumulados loc
..;á;;;;;i"ái.l¿"t i'' r"' i""áo'to booo' totporativos a corto plazo en 2009 se
b,
gubemamentales. Esto indica que los fondos en
a la derecha de la curva de los rooJ* iot.*"¿ios
bonos corporativo, u .otto pl-o gJnittoo
átoo' áodititotos en 2009 que estuvieran por debajo
gsbemamenta'
ái p.¡i.uiar. po, .jttpio' i+'9¿% ¿" tot too¿os en bonos htermedios
les ""
""r,it:."rendimientos o.guuui, .o 2009 (rendimienios por.debajo de cero)' a diferencia de
tuvieron
totto pl-o' A"i¡"isto' 55 17% de los fondos en
solo 1.03% de los fooAo, * Uooo' totp*utiuo' "
rendimientos en 20{9 por debaj-o lt
bonos intermedios guU"."..ooL'-o;ui;ron ^tf ig:::t:::
genem' ros
a corto plazo' Se concluye que' en
á;ffi;tt d. l"t íondos en bonos corporativos
toui"too * -t1or desempeño en 2009 que los fondos
fondos en bonos .orporoouo, u to-io- pi'-o
en bonos intermedios gubemamentales'

Problemas Para la sección 2.5


a) ConstruYa un arreglo ordenado'
APRENDIZAJE DE LOs FUNDAMENTOS ií esos doi diagramas pa¡ece dar más informa-
í"
ic"el
Construya un diagrama de tallo y hoja, a
partir de los ción? Analice el caso.
2.33
más proba'
,iguiaot"t duto. dar:na muestra de las calificaciones
obtenr- c) iQu¿ cantidaA ¿e gasoli¡a^(en galones) tiene
1..'.'l
das en un examen de Imanzas' bilidades de ser comPra@z
de compra
54 69 98 93 53 74 d) ¿Hay alguna concennación de las cantidades
en el cenho de la disnibuciÓn?
2.34Construya un arreglo ordenado, dado el siguiente
JJo"." de taílo y hoja, áe una muestra de n = 7 califtca' m'Gdl 2.3ó El archivo f!!!fi@ incluve información

Jt ti¿"t á un examen de sistemas de infonnación' @ sobte .l costo lotral ($) de cuafio boletos,
dos cerve'

"i"i., L, cuatro bebidas gaseosas. cuaro emparedados y lasalchl¡h4


de
tanla
dos prograrnas de juegos, d:: C:* de
0 béisbol 0€
6 los 30 esu'
7 446 estaiionamiento para un vehícuio en cada uno de
la temporada 20 I 0'
8 l9 ¿io, ¿" f" figu *.ivot de beisbol durante
2 te¡mmrrketing, 1 de abril de 2010'
Fuente: Datos extaidos de

APLICACIóN DE CONCEPTOS pu"¿ tso: qt-o-s,^.


c) Construya un diagrama de tallo y hoj"
se encuenhan concenraoos tuj
2.35 El siguiente es un diagrama de tallo y hoja que repre- "' ;.Alrededo¡ de qué valor
üi
un juego de béisbol, si es que lo están?
..iá ."t:,i¿"¿ ¿e gasolina comprada, en galones
ru
dé- (con :;il;;;ila
de 25 Explique su resPuesta.
;il;¿ galón en-las hojas¡' para una mu^estraen Ia au-
automóviles que utilizan una gasolinera especlllca 2.37 El archivo [!!@@ incluye datos sobre el costo
oscuro:
topista de Nueva JerseY' por onza ($) de uniE-uestra de 14 barras de chocolate
9 14',7 0.68 0.12 0.92 1.14 1.42 0'94 0'11

10 02238 ó;.,; li1 o-si o.5s 0 86 41 1 o c.l


l1 \25s66771 Bars A¡e Best?"
Fuente: Datos extaídos de "Da¡k Chocolate: Which
t2 223489
septiembre de 2007, p 8'
LJ 02 Consumer Reports,
Problemas pal¿ la sección 2.5 53

un arretto otdS*.l, lmpu.*6 toótt


Hbtofr¿n¡ da lo5 la prcp¡aded pet dplta
or Consüuya
ii Co¡sruya un <lasr¿ma ce t¿llo , Ooj a..

'.1icu¿ta¡o¿^ información' el arreglo ordenado o el


^as
rallo y hoja? Amlice ambos diagramas'
' kagrama de
,¡ , nf,ededor
de qué valor está concentrado el costo de las
'' i*rr d. chocolate oscuro, si es que lo esta en alguno?
. . ExPlique su
resPuesta'

Z:3g El archivo @ incluye los siguientes datos acerca


ene¡gía. eléctica durante j ulio de 20 1 para
i-il costo de la
1

50 departamentos con un dormito-


ita muesr¿ aleatoriade
rio efi üna
gfan cluü¡o

96 l7l 202 t78 147 102 153 197 127 82

t51 185 90 |6 t72 111 148 213 130 165

l4l t49 206 t75 123 128 144 168 109 167
o( loJ 150 154 130 t43 187 i66 r39 t49
108 119 183 151 114 135 191 137 129 158

;.", d) CoNtn¡ya un histograma y un pofgono porceDtu¿I.


un polígono porcentual acumulado.
"i ói Consfiuya 2.41 La operación d€ ü¡a cortadora consiste en cortax pe-
i iÍ ¿etededor ¿e qué cantidad parece concentrarse el costo
dazos de acero en partes que después se utilizarán como es-
' '¡rensual de la energía eléctrica?
[uch¡ra para los asientos frontales de un automóvil. El acero
2.39 Puesto que los sala¡ios de los jugadores han aumen- se corta con una sier¡a de diamante y se requiere que las
Bdo, el costo de las enEadas a los juegos de béisbol se ha pafes resultantes estén dentro de + 0.005 pulgadas de la a,
i¡qementado de forma d¡ástica. El siguiente histograma longitud especificada por la empresa automotriz. Se reunie-
presenta el costo total ($) de cuato boletos, dos cervezas, ron datos de una muestra de 100 partes de acero y se alna-
cu¿to bebid¿s gaEeosas, cuato emparedados de salchicha, cenaron en el archivo !!!t
La medición repofada es la o
doa programas de juegos, dos gorras de béisbol y la tarifa de
o
diferencia en pulgadas entre la longitud real de la pafe de o
estacionamiento para un vehículo en cada uno de los 30 es- acero, metlida por medio de un aparato de medición láser, y N
tadios de béisbol de las grandes ligas durante la temporada or
la longitud especiñcada para la misma. Por ejemplo, el pri- or
2009 (datos abnacenados en el archivo !!!!!f!!!$. mer valor, -0.002, representa una parte de acero que es
0.002 pulgadas más corta que la longitud especificada.
a) Constuya un histograma porcentual.
llhl.rÉñ. Fd rl.6t! d. ¡¡l¡ür ¡ un imro d.64¡!0¡
ó) ¿La cortadora de acero cumple con los requisitos estable-
cidos por la empresa automofiz? Explique su respuesta.

2.42 Una empresa fabricante produce carcasas de acero


para equipo eléctico. La p¿rte pri¡cipal de la carcasa es una
bandeja hecha de 1ámina de acero de calibre 14. Se produce
utilüando una prensa noldeadora progresiva de 250 tonela-
das, mediante una operación que coloca dos formas de 90' en
el acao plaio para moldear la bandeja I¿ disancia desde un
lado de la forma hasta la otra es fundameatal, ya que debe

IT t lograr un aislamiento cuando se usa a la intemperie. La em-


presa requiere que el ancho de la bandeja sea de entre 8.31 y
8.61 pulgadas. Se obtienen los atrchos, en pulgadas, de la
siguiente muesta de 49 bandejas; la información está alma-
cenada en el archivo @@.
¿Qué concluye con respecto a[ costo de asistir a un juego de
4) Construya un histograma porcentual y un polígono por-
béisbol en diferentes estadios?
centual.
2.40 El siguiente histograma presenta 1os datos ace¡ca de á) Construya un polígono porcentual acumulado.
ros uDpuestos sobre la propiedad per cápita para los 50 esta- c) ¿Qué concluye acerca del número de bandejas que cum-
oos y el distrito de Coiumbia de Estados Unidos (almace- plirán coo los requisitos que marca la eopresa de que las
nados en el archivo
EE@) bandejas midan enre 8.31 y 8.61 pulgadas de ancho?

#, iQué concluye con respecto a los impuestos sobre la propie- 2.4i1 La empresa fabricmte mencionad¿ en el Foblema 2.42
dad percápita? también produce aislantes eléctricos. Si los ¿isla¡tes se
54 CAPffuLo 2 o4anización y prcsentación gnifica de los
datos

Fabric¡ eA Fabricatrt€ B
podda ocurnr un c-or-
rompen mientras estiín funcioúando'
se lle' 684 720 173 819 836 888 89? 903
i."it"""i Para probar la resistencia de los aislantes' 697 821
".
nuo a ,u¡o pruebas destructivas
en laboratorios de gran
831 0835 848 852 852 901 9t2 918 942 943

io"o.i" pot determinar.cuánt^ fu'*: ?? :::::t::::: 859 860 868 870 816 952 9s9 962 986 992
observando la canhdad de tr-
ioaoatlor. La fuerza se mide 893 899 905 909 911 994 r,004 1,005 1,007 I,OI5
antes de que se rompa-
bras que se deben aplicar al aislante 922 924 926 926 938 1,01ó 1,018 1,020 1,022 I,034
muestra de 30
i. áuii"o.o t* ,igoi*to mediciones de una
uchivo !!@' 939 %) 946 9s4 911 I,018 t,o'12 1,0'71 1,071 1,082
lirmt.., tu, cualJs est'ín al¡¡acenadas en el 1,100 1,113 1,113 1,116
o) Coort oyu uo t'istograma porcentual y un polígono por- 912 97'l 984 1,005 1,014 I,09ó
1,153 1,154 1,174 I,188 1,230
centual. 1,016 1,041 1,052 1,080 1,093

acumulado'
ó) Construya un polígono porcentual c) Constuya histogamas porcentuales en
gráficas separa-

-' ¿qt¿ .á.1"V. acerca
de la resistencia de los aislantes st ' en una gnífica'
das y diúuje los polígonos porcentuales
iu-.tpt.tu exige la medición de una fuerza de al
menos
acumulados en uúa
ó) Construya poliionos porcentuales
i,soo ti¡.^ ¿e que se rompa el aislante?
"ni"t grifica.
incluye información sobre la vida
(en larga' las del Fa'
2,44 El archivo [!!! c)' iCuáles bombillas tienen una vida más
üricante A o las del Fabricante Bl Explique
de 100 watts ploaucl- su res-
horas) de una muestra de 40 bombillas
I 00
rlospár el Fabricante A y una muestra de 40 bombillas de Puesta.
tabla se
. i,"oi p.á¿t l¿* por el Fabricante B' En 1a siguiente [@
::,¡,:'.:
repre'.
2.45 Los datos almacenados en el archivo
p*.u:oo fo, ¿u* como un par de arreglos ordenados' tan la canticlad tle bebida gaseosa en una
muestra de 50 bo
de clase de
Utilice los siguientes anchos para el intervalo tellas de 2 litos.
porcen$al'
cada distribución: 4) Construya un histograma y uú polígono
750 pero menos ii Co**vu * polígono porcentual acumulado'y b)' can'
Fabricante A: 650 pero menos que 750,
,í óoo t^t .o t* resultaÁos de los incisos a) ¿la
que 850, Y así zucesivaúente' concen-
se
pero menos tidad de bebida gaseosa vertida en las botellas
fatricanie S: 750 pero melos que 850' 850 ta al¡ededor de valores específicos?
que 950, Y así sucesrvamente'

2.6 Presentación gráficade dos variables numéricas


Amenudoesnecesarioexplorarposiblesrelacionesentredosvadablesnuméricas.Comoprimer
p";;;ú;""diagramadedispersiónparaobservar.estetipoderelaciones.Enelcasoespe. rle
.r p^o del tiempo, se utiliza una gráfica de serie"
i'i' cial en que una cle las variables repi.'.o,u
':'' tiemDo.

Diagrama de disPersión Un diagrama


numé¡icas del mismo objeto o individuo
Con frecuencia se tienen dos medrciones
ta io'sitl"l"i""i¿n t"u' t"ditioott gruficando los datos de
de dispersión permlte "nt'" numénca
"*pto'"t o x,y los datos tle una sezunda variable
una variable numérica sobre et ,.¡"ioi zoúal,
t" á" noartetinc estudiar la eficacia de la
sobre el eje vertic*, o r' rot e¡eáii"' 11*ia
"""fit* y ingresos de ventas de 50 tiendas Utili'
publicidad comparando tos gastos publicitarios los
zando un cliagrama de dispertlo",
*
prrilo para'cada tienda en la gráfica bidimensio'
'Jt*t"
puUticiü;os y el eje I representa los ingesos
de ventas
nal, donde el eje Xrep.es.nta tos gastos de los 30 equt'
En la tabla 2.1? se pT esenun roilffis
y el valor (ambos en nillones de dotares)

oos profesionales de básquetbol ¿"


fuifge; fot dutos están almacenados en el archivo FEIÍIEE
."o. los ingresos generados por un equipo v el valor de
dicho
h il.".;;i;;l;;;riúi"1"r*0"
equipo, podemoscrear un diagrama de
dispersión'
I
2.6 Presentació¡ sáfica de dos va¡iables ¡uméricas 55

IA1LA 2"17
de los equipos de la NBA
r3
Valor e ingresos
.3

V¡lor
2,
306 103 Milwaukee 91
! AtlsnB
¿}JJ 144 Mi¡nesota 268 96
Bostoú
2 Ch¿rlotte
n8 96 Néw Jersey 269 92

511 168 New Orleans ¿oI 9)


6' Chicago
¡0 Cleveland 476 lJv New York 5!6 202

Dallas 46 t54 Oklahoma City 310 lll


Denver
171 115 Orlando 361 t07

Detoit 4:19 171 Phitadelphia 3M 115 ?

Golden State 315 113 Phoenix 429 148

Ilouston 4.10 160 Portland 338 t2l


r3-
I¡di¿na 281 97 Sacramsnto 305 I09

Los Argeles CliPPen 295 102 San Antonio 398 133


fl- 38ó ll-J
Los Algeles I;akers 607 209 Toronto
r0É

Memphis 257 88 Utah 343 118

Miani 364 126 Washington 110

Fu.nte: D¿tos exü'4ídos dc ww.torbercoDlütM00lt/3zb¡rketb¡ll-v¡lu6-0lr-¡IBA'Teu-Vrlu¡tlo¡c-R8khúL v,


lD-
)n.
=
o
Para cada equipo se gafican el ingreso en el eje Xy el valor eD el eje L En la figura 2.15 se o
presenta un diagrama de dispenión para estas dos variables- o
N
or
ot
FIGURA 2.,I 5 ol.!ññ. d. dl3p.Élóñ d.l v.b y 16 ina't6c d€ 1o3 €qülpo. de la lllA
i Diagrama de
r€¡ ! dispersión del
)e' "l
ingreso y el valor
de 1l

:.oo


de
ica
,la
rli
io-

ul-
tl
f3'
:ho
Al reüsar la figura 2.15 se observa que, al parecer, existe uoa relación creciente (positiva) muy
fuerte ente los ingresos y e[ valor de un equipo. En otras palabras, los equipos que generan meno-
res ingresos valen menos, mientras que los equipos que generan grandes ingresos tienen un valor
m¿is alto. Observe la línea recta que se colocó sobre los datos representados en la figura 2.15. Para
estos datos la línea se acerca mucho a los puntos en el diagama de dispenión. Se tata de una llnea
de predicción de regresión lineal, un tema que se estudiará en el capíhrlo 12. (En la sección 3.5 se
retomar:á este ejemplo cuando se estudie la covarianza y el coeficiente de correlación).
5ó CAPiTULO 2 Organización y presentación gráñca de los datos

Esprobablequeotrosparesdevariablestenganunarelacióndecreciente(negativa),dondeu¡¿
relación haber una
de las variabtes ¿isminuya mientras la oÍa aumenta. En otras situaciones podría
rlébil o incluso ninguna relación ente las variables'

Gráfica de series de tiemPo


Unagráficadeseriesdetienpomarcalosvaloresdeunavariablenuméricaenelejelymarcael de tiempo
periodo ae tiemp-o *1 valor numérico en el eje x. una gráfica de series
"".i"i-" ".¿"
sirveparaexplorutendenciasenlosdatosqueoculTenconelpasodeltiempo.Porejemplo,lata-
películas que se estre-
millones de dólares) de las
bla 2.1g presentJ^ g*un.i^, *rtinadas(en
en el archivo [!@![$'^Para observa¡
naron entre rssi y zñó; r"r datos están almacenados
estos oatos,'se cr"O'n gal"ate- series. de
tiernpo que se müestra en la figura 2-16'
me¡or
Endichafiguraseobservaquehubouninc¡ementoionstankenlasgananciascombinadasde
las películas q." ¿oft tsgo y 2009. Durante esa época, las ganancias combi¡ada¡
";;.;
aumenta¡on de áJos Jt iá,ooo til*ts
en 1996 a más de $ 10'000 millones en 2009'

Gan¡nci¡s combinadas
TABLA 2.18
1996 5,669.20
Ganancias 6393.90
1997
combinadas
de películas 1998 6,523.00

1999 7,317.50

2000 7,659.50
8,077.80
* 2001
tr 2002 9,146.10

2003 9,043.20
$
ta
2004 9,359.40
?l 2005 8,817. i0
2006 9,23r.80
:

2007 9,685.70

2008 9,107.40

2009 10,675.60

Fue¡te: Dstos cxtaldos dr ww''the úumber3'coE/


moúeq I6 dc febrc¡o de 20 10.

h, !¡n¡rcla3 combln¡das de p€lkr¡l¡'


Gráfla¡ da rerl€a do d.rnpo pate
FIGURA 2.1ó
Gráfica de series
de tiempo Para
las gananclas
combinadas Por año d
de las películas que I
se estrenaron qe
1996 a 2009

H
lji i I

!
Problemas Dara la sec{ión 2.6 5t

ñbl.*tt para la sección


E DE LOs FUNDAMENTOS c) ¿Qué podría decir ace¡ca de la relación que existe entre
las ganancias del primer fi¡ de semana y las ganancias en
El sigurente es un conjunto de datos de una muestra Estados Unidos, y las ganancias del primer fin de semana
r= 11 elementos. y las ganancias mundiales?

j5836024958 2.49 El archivo IEEEIEE incluye datos sobre las calo-


y;l5 4 9 8 0 6 2 7 5 4 rías y la grasa total (en gramos por porción) de rma muestra
de 12 hamburguesas vegetarianas.
Consüuya un
diagama de dispersión.
Fuetrte: Datos extaidos de "Healthful Burgers That Taste Good",
;.flay una relación
entre Xy )'? Explique su respuesta. Consumer Reports, junio de 2008, p. E.

La siguiente es una serie de ventas anuales (en millo- a) Coirstruya un diagrama de dispersión con las calorías en
de dólares) durante un periodo de 1 I años (de 2000 a el eje Xy
la grasa total en el eje Y.
0). ó) ¿Qué concluye acerca de la relación que existe entre las
calorías y la gasa total en las hamburguesas vegeta-
2M 2001 2002 2003 2004 2005 2006 200't 2008 2@9 2010
rianas?
13.0 17.0 19.0 20.0 20.5 20.5 20.5 20.0 19.0 17.0 13.0
2.50 El básquetbol universitario es un gÉn negocio, ya
ConstrBya una gfifica de series de tiempo.
que 1os salarios de los enüenadores, los ingresos y los gas-
¿lgún cambio en las ventas anuales con el
¿Parece h¿ber
.
)
paso del tiempo? Explique su respuesta.
tos se miden en millones de dólares. El archivo !![!!f!!
@f, incluye datos sobre el salario de los entenadores y
los ingresos del básquetbol universitario en ó0 de la 65 es-
APLICAOÓN DE CONCEPTOS
cuelas que participaron en el tomeo de básquetbol varonil o
2.48 Las compañías productoras de películas ne- de la NCAA e¡ 2009 (datos exnaldos de "Compensation for =
cesitan pronosticar los ingresos brutos de pelícu- Division 1 Men's Basketball Coaches", USA Today,2 de
individuales una vez que se han estenado. Los siguientes abril de 2010, p. 8C y C. Isadore, 'Nothing but Net: Bas- o
. que se encuentran almacenados en el ar- o
ketball Dollars by School", money.cnn'com/2010/03/18/ o
chivo @@@, corresponden a las ganancias obtenidas news/conpanies/basketballltrofi ts|. N
0r
durante el primer fin de semana en Estados Unidos, así a) ¿Cree que las escuelas con mayores ingresos también tie-
dorno a las ganancias en todo el mundo (en millones de dó- nen entrenadores con salarios más altos?
lues) de las primeras seis películas de Ha¡ry Potter. á) Construya un diagrama de dispenión con los ingresos en
el eje Xy los salarios de los entenadores en el eje f.
Primer G¡n¿nci¿s c) ¿El diagrama de dispenión confirma o contradice su res-
lin de en Est¿dos G¡n¡ncias puesta al inciso c)?
sem¡na Unidos mundiales
2.51 A 1os jugadores de futbol colegial que buscan ingre-
', La piedra flosofal 90.295 3i7.558 976.458
sar a la NFL se lesapüca la.prueba-deinteligencia estandari-
La ctámara secreta 88.357 261.988 878.988 zada Wonderlic. El archivo [@ incluye infomración
El prisíonero de 93.687 249.539 795.539 sobre las puntuaciones promedio obtenidas en la prueba
Azkaban Wonderlic por los jugadores de futbol que buscan ingesar a
.El cáliz fuego 102.335 290.013
de 896.013 la NFL y et índice de graduación de los jugadores en escue-
La otden del Fénb 77.108 292.005 938.469 las seleccionadas (datos extaídos de S. Walker, "The NFL' s
Smartest Team", The Yy'aIl Street Journal,30 de septiembre
:
El mtsterio del 77.836 30r.460 934.601
príncipe de 2005, pp. W1, W10).
c) Construya un diagrama de dispersión con la calificación
Iue¡tq Datos exFaidos de rwÍ.thc-truEben,coE/irtc¡active/coEF promedio en la prueba Wonderlic sobre el eje X y el ín-
H¡ry-Pott€r.php.
dice de graduación en e[ eje I'.
a) Construya un diagrama de dispersión con las ganancias á) ¿Qué concluye acerca de la relación entre la calificación
del primer fin de semana en el promedio en la prueba Wonderlic y el índice de gra-
ejeXy las ganancias en
Estados Unidos en el eje )¡. duación?
á) Construya un diagrama de dispersión con las ganancias
2.52 ¿Cu.il ha sido el desempeño anterior de las acciones?
del primer fin de semana en el ejeXy las ganancias en La siguiente tabla presenta los datos aknacenados en el ar-
t todo el mundo en el eje If chivo @@![@ que indican el desempefio de una
A
¡

t
58 CAPÍTULO 2 Orgaaizacióo y pr€se ación gráltca de los datos

medida general de acciones (por polcentaje) pa¡a cada dé- a) Construya una gráfica de series de tiempo para los prs.

cios de las casas nuevas.


cada. desde 1830 hasta 2000.
á) ¿Qué patrón se presenta en los datos, si es que se pre.
senta alguno?

2.8 2.54 Los siguientes datos (almacenados en el archivo


' 1830
1840 t2.8 [!![!s[!@} representan la asistencia anual al cinr
1850 6.6 len miles de millones) de 2001 a 2010:
l8ó0 tz.5
1870 7.5
Año Asistencia
2001 1.44
1880 6.0
).f 2002 1.60
1890
10.9 2003 |.52
1900
2.2 2004 1.48
1910
t920 I J.J 2005 1.38

1930 2006 1.40

1940 9.6 2007 1.40

1950 18.2 2008 l.Jo


19ó0 8.3 2009 r.42
1970 6.6 2010 l.J)
1980 16.6
Fuente: Datos e(baldos de MofioD Picture Associatioo ofArderic4
1990 I /.O www.mpsa.org y S. Bowles, ''Iicket Salca Slüúp at 2010 Box Office",
2000* -0.5 USA Today,3 & ererc dE 2011, P. 1D.
:

t
Rr
*Hast¿ el 15 de üciemb,re de 2009'

Fuente: Datos cxF¿idos de T. Lauricell4


''l¡vesl,o¡s llope the ' l0s" Beal the '00s", Ifie
¿) Construya una grafica de series de tiempo para Ia asisten-
cia al cine (en miles de millones).
$I Wall Street Jounal,2l de dicienbre de 2ffi9' ó) ¿Qué panón se present¿ en los datos, si acaso se Presenta
I pp. Cl, C2. alguno?

I o) Construya una páfica de series de tiempo del dese]llerlo


de las acciones de la década de 1830 a la década del 2000'
2.55 El archivo ![@ilcluye infomaación sobre el númem
de auditorías de corporaciones con activos de más de $250
á) ¿Parece que existe algún patrón en los datos? miilones realizadas por el lntemal Revenue Service (datos
exraídos de K. McCoy, "IRS Audits Big linrs Less Often"'
2.53 Segun el U.S. Census Bureau, el precio promeüo de
USA Today,15 de abril de 2010, P. 1B).
una casa nueva disminuyó en 2008 y eu 2009' El ar-
.hiuo [Ef!@! incluye inforrnación sobre el precio c) Construya una gráfica de series de tiernpo.
p.o.edio qo" se pagó por una casa nueva de 1990 a 2010 ó) ¿Qué patrón se presenta en los datos, sl ac¿lso se Pre' I

(extraído de www.census.gov, 1 de abril de 2011). alcuno?

2.7 Or ganizaciín de datos multidimensionales


gráficas de 'na sol¿
En este capítulo hemos aprenütlo métodos para organizar y h¡cer presentaciones
variable, y metodos para organizal y hn ., pr.t.otu.ioots graficas conjunas
d:d*
,!]1 yPlf
gráfica úá6 de dos vaña'
..p."rÁ"huy *u oécesidad crcciente por organizar y,presentar de manera
ti"i p*" ¿"as con la finalid¿d di descubrir poiibles patones y relaciones que las exploraciono
-ri*
.^ i*.iU* p"¿"an pasar por alto. Aunque es poiible utilizar cualquier númao de variables, sujehs
de Fes o cuato variabl€s p0'
a los límjtes de los cáiculos-y el a¡nacenamiento, los ejemplos de mris
preseniar los resdtados' Tanto
drían ser dificiies de interpretar cuando se utilizan tablas sencillas para
aplicaciones heno
Excel como Minitab peÁiten organizar datos multidimensionales, pero las dos
i¡teracuvas que lacr
yentajas diferentes: Eicel incluye las tablas dinámicas, que son un tipo de tablas
procedimientos esta'
liUa ia exptoracion de datos multidimensionales, en tanto que Minitab cuenta con
dísticos y'griñcos especializados (cuyo an¿álisis rebasa el alcance de este libro)'

Tablas de contingencia multid¡mens¡onales


Una t¡bh de contingencia multidimension¿l incluye el número de las respuestas.{" Tt:
o.1l
celda de
variables categóricas. En el caso más sencillo de tres variables categóricas, cada
La ta0r0
2.? Organización de datos mu¡tidimcnsiomles 59

indica el conteo de la tercera variable, orgaúiz¿do de acuerdo con los subgrupos r€presentados por
las variables de renglón y de columla.
Considere la tabla di contingencia que se presenta en la tabla 2.3, que muesüa el tipo de fondo
y el cobro de una cuota para la muesta de 184 fondos de inve¡sión eu bonos. La figura 2.17 pre-
ienta esta info¡mación como una tabla dinámica de Excel. Al añadir una tercera variable categórica
a la tabla dinámica, el riesgo, se form¿ la nueva tabla dinímica multidimensionai que se presenta
en la figura 2.18. La nuevalabh revela los siguientes pahooes que no se observan en la tabla origi-
nal de contingencia de la tabla 2.3.
. Aunque la proporción de fondos en bonos que cobran cuota con respecto a los que no-la
cobran parala iategoría de htermedios gubemamentales parece ser de aproximadame¡rte 2 a
3 Q4; $),la proporción para los fondos en bonos intemedios gubernamenlales con. m
rlesgo po, ,oita OJt prome¿io es de al¡ededor de 1 a I (15 a l4), mientras que lalroporción
para los fondos con uu riesgo por debajo del promedio es menor que I a 3 (6 a 20)'
que se . ivfientras que el gn¡po "fondos corporativos a corto plazo que cobran una cuota" tiene casi el:
este mismo número áe iondos con un riesgo por aniba del promedio, cotr un riesgo promedio y
..fondos en bonos intermedios
con un riesgo por debajo del promedio (7,7 y 6), el grupo
s¡ estas
gUlemamdtais que cóbra¡ una cuot¿" incluye menos fondos con un riesgo por debajo del
¡nPrcstones
fromedio (6) que fondos con un riesgo promedio (13) o fondos con un riesgo por arriba
del promedio (15).
. El p-atrón de valores de riesgo difiere entre los fondos que cobran una cuota y los que no la
cobran en cada una de las categorías de los fondos en bonos.

RA 2.f 7
a,

2.3
de o
dinámica o
o
N
or
o
RA 2,1 8
contingencia multidimensional de Excel y M¡nitab para tipo, riesgo y cuota

l¡br¡h.d í¡díi.s: IIPé, Ri¡& F..a


¡¡r.: trDé / i1!t co¡¡ü5: tet
l¡ !€r ¡1¡
llt¿ü.rllrtc GolE@!!
¡Do?t ¿Eñq! ta 15 29
. tiE.@ 1' 1! l2
h¡ü. ¡É¡6{c 206¿6
!o!! tlr co.Dont!
¡lbG eql 2t7ú
¡ll¡t.E !0?!t
¡c¡t 2t6At
¡lt 'É.lc
¡¡.1 rao 5t tra

Agregar variables numéricas


Las tablas de contingencia multidimensionales pueden contener variables numéricas. Cuando se
¿ñade una variable numérica a un análisis multidimensional, se utilizsn variables categóricas o va-
riables que representan unidades de tiempo para lós renglones y las columnas que formarán los
subgrupos mediante los cuales se analizaú la variable numérica.
-poi
ejemplo, en la figura 2.19 de la página 60 se presenta una tabla qu€ hace una clasificación
cruzada dilas cootas y eitipo, en la que iaJcantidades de las celd¿s corresponde¡ ¿ las sumas de la
variable Activos para cada subgrupo;la figura 2.20 de la página 60 presenta la misma t¿bla forma-
t€ad¿ para most¡ar los activos en porcentaje. Al comparar la frgxt 2.21 0a tabl¿ que se muesft en
la figura 2.17, pero formateada para presentaf el porcentaje del total genefal) con la figura 2.20' se
obsJva que el porcentaje de activoJpara los fondos intermedios gubernamentales en la categoría
de cuota no da el mismo resultado que los porcentajes de la cat€goría de cuot¿
ó0 CAPhWO 2 O¡ganización y presentación gáfica de los datos

FIGURA 2.19
para tiPo' cuotas y sumas de activos
fabla de contingencia multidimens¡onal de Excel Minitab
y

I¡ü¡# r¡ülticri tlF FLc


¡dlr ltta Col¡D!3 laig
lo ica

Iltatld!¡lt Go+!4úl 55€92 26¿53 429{5


$oEt lcd collEÉtt 6n72 16da2 at67l
rr1 12{t65 l30lr5 16?559

ell C6tast!: llleis rS!

FIGURA 2.20
Tabla de
contingenc¡a
multidimensional
para tipo de fondo,
categoría de cuota
y porcentales
de activos

FIGURA 2.21
Tabla de
u contingencia Par¿
F tipo y Porcentales
f
u
¡
de cuotas

'

Cuandoseincluyeun¿variablenumérica,porlogeneral,secalculaalgunodelosestadísticcls
y 3'2' Por ejemplo' la frgn2'22 ¡re'
lVéssq ls sccció¡ 3.1 P¿ra
descriptivos numéricos que se estudian en las secciooes 3'1
se calculó 1¿ media o tasa de rendi'
¿prc[dcr Eás acelca d€ l8
,..r"i". ,"ur" de contingencia multidimensional en la que
infomacioú,
.-:,:r. ;;;;;;;d;á;2009iara cadauuo de los subg'upos.r-Estarabla-revela, enre otra
mcdis.
de 2009' dependiendo de si ¡.
o* uunque prácticamente no hubo diferencia en el reldimiento
por aniba del promedio' el rendimienh
#;;"J;;;eicaso de bs ron¿os coo rm ¡iesgo
cuota fue mucho más alto (4 89) Ee
de los fondos intermedios gubemamentales que cobraron una
el de los fondos que no la cobraron (1'41)'

FIGURA 2.22
y t¡po, r¡esgo, cuotas y media de las tasas de
Tabla de contingencia mulüdimensional de Excel Minitab Par¿
rendimiento en 2009
¡¡Ér¡l¡bl ffi;lt?q Rfdq F.t
v,.tr a\té / a!!r colú!: ¡ét
'¡o Ié, ¡¡¡
I¡rcdt¡tc €6v€!E!l tJ0?. ,."r, ,.r,'
¡¡.n! ¡t'll(F
¡vltaql l.t!? 3,üz ¡,:t
L¡d í!t ll 1.L70 5'9i3 6'89'
s¡d¡r Idr có4¿!ac:
lbt! ¡rr¡4r 12,1lt ¡9,9!6 rl ¿tl
9'611 g 7o¡
Itéq. 9.61i!
Élld ¡ElaG 5.6¡9 6.5¡{ 5'610
1¡1
A¡¡ 6.9!? t 16¡
c.l¡ cqrte¡€. ¡¿l¡a 2tÍ19 : tl.t
2.8 Uso indebido y errores comunes en la presentación gráfica de datos

blemas para la sección 2.7


DE CONCEPTOS 2.58 Para este problema utilice los datos del archivo [!
Para este problema utilice los datos del
!E@.
2.56 a) Construya una tabla que incluya categoría, cuotas y
archivoE!E@@. riesgo.
una tabla que incluya tipo, cuotas y riesgo. á) ¿Qué concluye con respecto a las diferencias ent¡e las ca-
Construya
concluye con respecto a las diferencias eno".l?t t1: tegorías de los fondos en bonos (capitalización bursátil
¿Qué
iordr foodot en bonos (intermedios gubeman:entales y alta, media y baja) con base en cuotas (sí y no) y el factor
plazo) con base en las cuotas (sí o de riesgo ftajo, promedio y alto)?
comontivos a cono
(bajo, promedio y alto)?
¡6¡ y al factor de riesgo 2.59 Para este problema utilice los datos del archivo @
Compare los resultados
mn en la figula 2.18.
del inciso ó) con los que se mues-
@
a) Constuya una tabla que incluya categoría, objetivo, cuo-r
tas y riesgo.
para este problema utilice los datos del archivo @ á) ¿Qué concluye con respecto a las diferencias entre l¿s ca-
tegorías de los fondos en bonos (capitalización bu¡sátil
una tabla que incluya categoría, objetivo y
alta, media y baja) con base en el objetivo (crecimiento y
ca-
valor), el factor de riesgo (bajo, promedio y alto) y las
¡ ¿Qué concluye con respecto a las diferencias entre las cuotas (sí y no)?
teeorias de los fondos en bonos (capitalización bursátil
c) ¿Cuál tabla cree que fácil de interpretar, la de
sea más
ala, media y baja) con base en el objetivo (üecimiento y este problema o las de los problemas 2.5ó y 2.57? Expli-
valor) y las cuotas (sí Y no)? que su respuesta

U'

p.8 Uso indebido y errores comunes en la presentación


'. gráfica de datos o
o
Las presentaciones gníficas adecuadas revelan de forma clara y sin ambiguedades lo que comuni-
o
N
can los datos. Por desgacia, muchas gnificas que se presentan en los medios de comunicación (ra- (rl
dio y televisión, medios impresos y en línea) son incorrectas, confusas o tan innecesariamente
complicadas que nunca deberían utilizarse. Pa¡a ilustra¡ el uso indebido de las gníficas, en la figura
2.23 se presenta una similar a la que se incluyó en un adículo de la revista 7Im¿ sobre el aumento
de la exportación de vino de Australia a Estados Unidos.

FIGURA 2.23 Estamos bebiendo más...


ExDortacion€s de vino austral¡ano
Presentación a Estados Unidos en millones de galones
"inadecuada " de
las exportaciones
de vino australiano
a Estados Unidos
en millones de
galones

Fuente: Easado en 5. i:,


-1..,..,i .';,'
,.'.-.- '"--.,",.i ' --,.-l
Wafrerson, "Liquid Gold 1989 1992 1995 1997
Austal¡áns Arc Changing
frte World of Wine. En la figwa 2.23 el símbolo de la copa de vino que representa los 6.77 millones de galones de
Eren the French Seem
Gnteful",Tme,22 de 1997 no parece ser del doble del tamaño del símbolo de ia copa de vino que representa los 3.67
noviemb¡e de 1999, p. ó8. millones de galones de 1995; ni ampoco el símbolo de la copa de vino que representa \os2.25 mi'
llones de galones de 1992 puece ser del doble del tamaño del símbolo de la copa de vino que re-
presenta los 1.04 millones de galones de 1989. Pade de la razón de esto es que se utiliz¿ un símbolo
6,¡9¡
tridimensional de la copa de vino para represent¿r las dos dimensiones de exportaciones y tiempo.
5.¡l Auuque la presentación con las copas de vino resulta atractiva, en vez de presentar los d¿tos de esta
1.1C1
t.lt manera se deberían presentar en una tabla-resumen o en una gráfica de series de tiempo.
l.ltl Adernrás del tipo de distonión creada por los símbolos de l¿ copa de vino en la gnáfica de la revista
?ime que se observa ".li-la figxa2.23, el uso inadecuado de los ejes vertical y horizontal produce distor-
siones. En la figura 2.24 se presenta oha gnáfica que se utilizó en el mismo artícüo de la reüsta fime.
62 cAPfruLo 2 organiuciótr y presentación gnáfica de los datos

FIGURA 2.24 ... están creciendo más...


Cantidad de tierra plantada con uvas para la ¡ndustria vinícola
Presentación
"inadecuada" de la
cantidad de t¡ena
plantada con uvas
p€ra la industria
vrntcola

Fuente; Bas¿do en S' 1949r


Watterson, "Liquid 135,326
Gold-Ausvalians Are
Changing the Wortd of
Wíne. Even the French
Seem Gr¿teful", Time,
22 de noviembre de
1999, p. ó849.

Seobservanvariospfoblemasenestagáfica.Primero,noexist€unceloenelejeveftic¿l.s^
graficada por arriba-dr
guoJo, L" sup".ficle de i35,326 acres para;l periodo de 1949 a 1950 estri
Tércsro, no es evidente qu€ la difere¡-
Juperficie di 150,300 acres para el periodo di 1969 a 1970'
rqls yl9g0 y 1997 y 199¡ (71,569 acres) sea aproxima¿t¿mente 3.5 veces la
diferencia
.iJ."* horizont¿l carece de valores escala-
."o.lSzS v lSgo y téOS y ólO et,ilS acres). Cuarto, el eje
horizontal. Quinto, Ios
,.r. r., u¡á. .r,¿" graficados junto a las superficies totales y no sobre el €je
adecurda a lo largo del eje
t! valores para la rhJensión dei tiempo no eitrí,n espaciados dt-manem
más cerca del periodo
;r
F norirootl. no. .¡".plo, el valor pára el periodo di 1979 a 1980 esüi mucho
que se suelen obsewa¡
¿" isas 1gg0 que de lg6g a 1g70. oto tipo de presentaciones.atractivas
"
en las revistas y en los periódicos a menudo incluyen información
que no es necesaria y que solo

añade mayor confiuión.Lafrgxa2.Z5 es un ejemplo de esto'

FIGURA 2.25 Coca-Cola sigue siendo la más burbuieante ..


coca-cola clás¡ca lás bebidas ca-rbonatadas con la mayor participación €n €l
Gráfica "inadecuada" l2OV.l mercado que ascendió a $58,000 m¡llon6s €l año antsr¡or:
de la participación
en el mercado de las Pepsi-Cola
(14%) Coca-Cola
bebidas gaseosas
de d¡et8 Mountain
Fuente: Basádo en Anne {e%) Dew Sprite Dr PePPer
B. Carey y 9am Ward, 1% jyo 67o

"Coke Still Has Most ¿*


Fiz" , USATodaY, 10 de
mayo de 20N, P. 18.
,'J
iw
R;

La gráfica de la figam2.25 presenta los productos con la mayor paficipación-en el mercado


de las bibidas gaseor^. Lu gtlfi.u trtá demasiado desordenada'
aunq'e está diseñada-para m^oúa
gaseosas. La imagen de la eferves'
las diferenciasin la particifación det mercado de las bebidas
gráfica en relación con los datos'
cencia tle cada bebida abaria un espacio demasiado grande de- la
iii i" p"¿¡" iti. la misma información con una gnifica de banas o una gráfica circula¡'
i "-t
Algunos lineamientos para elaborar buenas gráficas son los siguientes:

r
. Una gníñca no debería distorsiooar los datos'

!
. Una -gáfica no debería contener basura, es decir, adomos innecesarios que no transmitsl

información útil.
. Cualquier gniúca bidimensional debe contener una escala para cada eje'
. La escala en el eje vertical debe empez¿r en cero'
)
Problemas oara la sección 2.E o5

. Los ejes deben estar corectamente rotulados.


. La gÉfica debe inclui¡ un título.
. Se debe utilizar la g¡áfica más sencilla posible para un conjunto de datos.
A menudo los individuos que no saben cómo constuif gáficas ¿decuadas violan esos linea-
mieotos. Algünas aplicaciones, incluyendo Excel, nos tientan a crear gníñcas "bonitas" que quizá
tengan diseños elegantes, pero qu€ fepresentan decisiones poco inteügentes. Por ejemplo, es inade-
cuaáo hacer que una gtáfica circular sencilla luzca más elegaote añadiendo porciones sepaladas
en tres dimensiones, ya que esto podría complicar la interpretación de los datos. Es probable
que los diseños de gráficas poco comunes, como en forma de rosquilla, radar, superficie, burbuja,
cono y pinámide sean visualnente impresionantes, pero en muchos casos generan conñrsión en
los datos.

lemas para la sección 2.8


6¡¡to tltn dL d. L. q3.i¿ri ¿r¡r¡ a Ob a.ln V.¡.nd¡
DE CONCEPTOS

par¡ los estudiantes) Lleve a la clase una


un sitio web, un periódico o una revista que se
blic¿do este mes y que usted considere que repre-
úanera inad€cuada una variable numérica. Prepá-
r

enviar la gráfica al profesor con comentarios sobre


::
ls por las que cree que es inadecuad¡. ¿Cree que el
de la gráfica es el de confimdi¡ intencionalmente al
o
o
'"bien par¿ presentar y comentar esto en o
N
ot
ioyecto para los estudiantes) Lleve a la clase una
un sitio web, un periódico o una revista que se a) Describa al menos una característica adecuada de esta
este mes y que usted considere que repre- presentación gnífica.
manera inadecuada una variable categórica. Prepá- ó) Describa al menos una característica inadecuada de esta
enviar la gnifica al profesor con comentarios sobre presentación gÍifica.
es por las que oee que es inadecuada. ¿Cree que el c) Reconstuya la gnifica utilizando los lineamie¡tos ante-
de la gráfica es el de confi¡ndir intencionahnente al riores y los de la página 62.
también para presentar y comentar esto en
2.64 La siguiente presentación incluye una gráfica con
adomos excesivos, similar una que ap areció ea USA Today
a
pora los estüdiantes) Data and Story Li- en relación con el núme¡o estimado de horas que el estadou-
ASL) es una biblioteca en línea de archivos de da- nidense coniún dedica a utiliza¡ üversos medios de comuni-
que ilustan €l uso de los métodos estadísticos cación ('USA Today Snapshots: Minding Their Media",
Visite lib.stat.cmu.edu/index.php, haga clic en USA Today , 2 de marzo de 2007, P. I B).
iy explore algunas de las representaciones gr:áficas.
t ro d. los medioa
eccione una gráfica que considere que presenta de úttuo.klv'6 .,'jt'r,th qu. d .'aadoqtue$e

oer¿ adecuada la información que transmiten los da- 6ún.dM a odlnt úe.¡t6 n¿'lot.d. otu

por qué piensa que es una buena gráfica.


una gáfica que considere que necesita mejo-
)ho, Comente por qué piensa que se trata de una
mai construida.

La siguiente presentación incluye una gráfica con ¿dor-


excestvos, similar a una que apareció en USA Today en
'n con el gas¡o promedio de los consumidores durante
de San Valentín ("USA Today Snapshors: The Price of
, USA Today,l4 de febrero de 2007, p. lB).
64 CA¡ÍTIJLO 2 Organización y presentación gráfica de los datos

a) Describa al menos una característica adecuada de esta informes anuales de 1as corporaciones (véase D. Rosato,
presentación gráfica. "Wor¡ied About the Numbers? How About the Charts? 71¿
á) Describa al menos una característica inadecuada de esta New York Tlmes,15 de septiembre de 2002, p. 87) y encon
presentación gráfica. tró que incluso ligeras distorsiones en rrna gráfica cambia.
c) Reconstruya la gráfica utilizando los lineamientos de las ban la percepción de los lectores sobre la información.
págnu 62 y 63. Utilice Intemet o recursos de una biblioteca para elegir u¡¡
corporación y estudiar su inforrne anual ¡riís reciente. f¡.
2.65 Lt siguiente presentación incluye una gráfica con
cuentre al menos r¡na gnífica en el informe que considel¡
adomos excesivos, simila¡ ¿ ¡¡¡
q¡s apa¡€ci6 en USA Today en
que necesita mejorar, y elabore una versión mejorada de ¡
relación con la tarjeta de uso más seguro ("USA Today misma. Explique por qué cree que la gnífica mejorada e3
Snapshots: Credit Card vs. Debit Card", UM Today' 14 de más adecuada que la que está incluida en el informe anual.
marzo de 2007, p. 1B).
2.ó7 Las figuras 2.1 y 2.3 presentan una gráfica de barras y
Túje¡s de ct€di¡o €n coúP¿¡acii¡ cú t¡¡jct¡ dc d¿Iito: uná grafica circular sobre la forrna en que los adultos paga¡
u
¿Cuil ticoc uro m,is següo?
,u, !"tto, ..or*les (véase las páginas 40 y 41).
c) Elabore una grafica circular con las porciones separada¡,
una gráfica de rosquilla, una gráñca de cono y una grá-
fica piramidal que muesten la fomra en que los adultos
pagan sus gastos mensuales.
á) ¿Que gníficas prefiere, la gnifica de banas, la gnífica ci
lar, la gnífica circular con porciones separadas, la grátrca
de rosquilla, la gráfrca de cono o la gráfica piramidal?
Explique su respuesta.

2.ó8 Las figuns 2.2 y 2.4 presentan una gráfica de barras y


una grrífica circular para el nivel de riesgo de Ios datos sob¡E
$ los fondos de inversión en bonos (véase las páginas 4l y 42).
c) Describa al menos una característica adecuada de esta a) Constuya una Eáfica cücular con las porciones separa-
presentación grafica. das, una gnáfica de rosquilla, una gráfica de cono y una
ü
I á) Desc¡iba al menos una característica inadecuada de esta gráfica piramidal que muestren el nivel de riesgo para loc
I
presentación gúñca. fondos dejnve$ión en bonos.
i
c) Reconsfuya la gr.áfica utilizando los lineamientos de las á) ¿Qué gáficas prefiere, la gráfica de barras, la gnifica cit'
a
pignas 62 y 63. cular, la gr.ifica circular con porciones separadas, la gná'
2.óó La profesora Dea¡na Oxender Burgess, de Florida frca de rosquill4 la gmfica de cono o la gráfica piramidal?
Gulf Coast University, realizó una investigación sobre Explique su respuesta.

En Choice is Yours, parte I, Revisión


n la sección Uso de la estadística, supusimos que usted fue

contratado por la empresa de inversiones Choice Is Yours para

ayudar a los clientes que buscan invertir en fondos en bonos'


Se seleccionó una muestra de 184 fondos de inversión en
bonos y se registró la información sobre los fondos y el historial de su
desempeño anierior. Se reunieron datos de ocho variables para cada uno
de

los l8i fondos. Con tanta información, la presentación gáfica de todos


estos números requería elegir adecuadamente el tipo de gníficas que se utilizarían'
A partir de gñificas de banas y gráficas cüculares usted pudo ilustrar que aproximaümente
ua tercera parte-de los fondos se óhsificaban con un riesgo por debajo del promedio, que alrede'
dor de una tercera parte tenía un riesgo promedio y que aproximadamente una telcera pafte
tenla

un riesgo por aniba del promedio. Laiabulación cruzada de los fondos respecto a si cobraban una

gubemamentales o en bonos corporativos ¡


cootu fu iu iouersión del fondo en bonos intermedios
gubemamentales c0-
corto ilazo reveló que es más probable que los fondos en bonos intermedios
bren úna cuota. Después de construir hisiogramas sobre los rendimientos durante 2009, usted con-
cluyó que los fondoi en bonos corporativos a corto plazo ofrecían rendimientos mucho más attos
quó los fondos en bonos intermedios gubernamentales. Los rendimientos de los fotrdos en bonos
intermedios gubemamentales se conceintran enfe 0 y 10, mientras que los rendimientos de los fon'
dos en bonos corporativos a corto plazo se concentran entre 5 y 15.
Ecuaciones clave ó5

Con estos datos, usted está en condiciones de i¡forma a sus clientes ¿rcerca del desempeño de
los distintos tipos de fondos. Desde luego, el historial de desempeño preüo no garantiza el desem-
peño futuro. De hecho, si observa los rendimientos de 2008 ¿lmacenados en el archivo f!@
[@!!!@ ¡descubrirá que los rendimientos de los fondos en bonos corporativos a corto plazo
fueron mucho r¿¿js áa7os que los de los fondos en bonos intermedios gubernamentales!
El uso de mótodos gáficos como estos constituye un primer paso importante para resu¡ni¡ e
interpretar los datos. Aunque la presentación adecuada de los datos (como se analizó en la sección
2.8) ayuü a eviiar ambigüedades, los métodos gnáficos siempre impücan cierto grado de subjetivi-
dacl. Ahora necesitará estadísticos descriptivos para analizar más a fondo el desempeño anterio¡ de
los fondos en bonos. En el capítulo 3 se presetrtan estadísticos descriptivos (por ejenplo, media,
mediana y moda).

organizacióa y presenüación de los datos implica el uso de La elección de las tablas y las gnáficas depeirde del tipo
tablas y gráficas para sacar conclusiones acerca de datos con los que se cuenta. L¿ t¿bla 2.19 resume las de-
los mismos. En diferentes ejemplos del capíhrlo, las ta- cisiones adecuadas para el tipo de datos, tablas y gríficas
y las gráficas nos aludaron a obtener conclusiones que se esürdiaron en este capítulo. En el capítulo 3 se estu-
de la manera en que las personas prefieren pagar sus dia¡án diversos estadísticos descriptivos que son útiles para
y acerca de los costos de los alimentos en los ¡estau- el análisis v la intemretación de datos.
de una ciudad y sus suburbios; también b¡indaron
información acuca de la muest¡a de fondos de inver-
en bonos en 1a sección Uso de la estadistica. u,

=
BLA 2.19
o
de tablas y gráficas o
o
N
Tioo de datos
' Tipo de análisis Nunéricos Categóricos

O¡ganización de los Aneglo ordenado, distribución de ftecuenci4 Tabla-resumeq ubla de contingencia (2.2)
d¿tos distribución de frecuencia relativa.
distribución porcentual, dishibución
porcentual acumulada (sección 2.3)

Presentación gráfica ,.Diagama de tallo y hoja,iistogr¿¡na


de una variable porcentual, polígono porcentual acumulado gnáfica de Pareto (sección 2.4)
(ojiva) (sección 2.5)

Presentación gnífica Gnifica de barr¿s de agrupadas


I de dos variables (sección 2.4)

Organzación de datos Tablas multidimensionales (sección 2.7) Tablas multidimensionales (sección 2.7)
o
multidimensionales

Determinación del ancho del intervalo de clase


os
; c0- a.^L^ oel
.ructro r_, . , = -----------------
nteñalo
valor más alto valor más bajo
(2.r)
'.
numero oe cnses
Cálculo de la proporción de frecuencia relativ¡

¡-ur¡.'tro oel mtervalo = fecuencra relaüva = número de datos en cada clase


número total de datos
(2.r)
datos
CAPÍTULO 2 Orgasización y presetrtación gráfica de los

polígono porcenrual 49
formato no agruPado 32
analiz¿¡ 26 polígono porcentual acumulaco
clase 33 frecuencia relativa 35
ancho del intervalo de (ojiva) 5l
fiiente primaria de datos 26
arreglo ordenado 32 presentargnificamente 26
fuente secundaria de datos ¿o
basura en una gráfica 32
gráficacircular 4l principio de Pareto 42
celdas 29 proporción 35
gáfica de banas 40
clases 33 44 recolectar datos 26
gráfica de banas agruPadas
definir 26
reunir 26
disPenión 54 gnifica de Pareto 42
diagrama de tabla de contingencia 28
gnifica de series de nemPo )t)
diagrama de tallo Y hoja 47 tabla de contingencia multidimen-
distribución de tecuencia 33 histograma 48
i¡tervalo de clase 33 sional 58
distribución de tecuencia ¡elativa 35 tabla dinriL¡nica 58
límites de clase 33
distribución de porcentaje acumulado tabla-resumen 28
JO
marca de clase 34

distribuciónPorcentual 35 ojiva (polígono Porcentual


acumulado) 51
DROPA 26
formato agnrPado 32 orgmizar 26

I
PJ
FI
!I VERIFIOUE SU COMPRENSIÓN Categoria del ingreso Porcentaje (%)
¡f
y los polígonos en
t'
2.ó9 ¿En qué difieren los histogamas
cuanto a su constn¡cción Y uso? Costos de fabricación
!-

2.70 ¿Por qué construiría


una trabla-resumen? Marketing Y Promoción
15.4

2.71 ventajas y las desventajas de utilizar Costos adminisüativos e impuestos


10.0
¿Cuáles son las
g.áfr.u d. barras, una gráfica circular y una gráfica
de
*u Utilidad después de impuestos
'7 .l
Pareto?
22.4
Librería
2.72 Compare la gráfica de banas para datos categóricos 11.3
Salarios y Prestaciones de los
con el histograma para datos numéricos'
empleados
una gráfica de series de
2.73 ¿Qué diferencia hay entre Operaciones
6.6
tiempo y un diagrama de disPersión? 4.1
Uülidad antes de impuestos
2.74 que la principal característica de una
li ¿Por qtié se dice 11.6
"los pocos Autor
i¡ eráfici de Pareto es su capacidad para separar
1.2
iitales" de "los muchos triviales"? Transportación
Br€ak lhe Baúk" f¡¿
tres formas de sepalar los porcentaJes Fuent€: D¿tos extr¿ídos de T Lewi4 "Wlen Boola
2.75 ¿Cuáles son las yorkTr e5,16 de septiernbr€ de 2003, pp Bl'94'
New
en una tabla de contingencia?

2.76 ¿En qué difrere una tabla multidimensional de una


tabla de contingencia con dos variables? autor y
c) Utilice las cuatro categorías de editorial, librerías'
iri una un¿
tipo de información se puede obtener transportación para construir una gráfica de barras'
de-
2.77 ¿Qué
li tabla di tres entradas, que no estí disponible en
una tabla de gráfica circular y ''na gnífica de Pareto'
y
á¡ Útilice las cuatro subcategorías de editor las subcatego'
.i dos entradas?
y traúv
i: rías de librería, juúto con las categorías de autor
AFLICACIÓN DE CONCEPTOS portación, para construir una gnfica de Pa¡eto'
'Con y á)' ¿qué cor'
del -' base en los resultados de los ilcisos a)
2.78 Lasiguiente tabla-lesumen presenta el desglose "1 a quién obtiene los ingresos por
las
p¡ecio de un nuevo libro de texto universitario'
.tuy. .oo r".pecto
Problenas de rcpaso del capínfo 67

libros de t€xlo uiversita¡ios? ¿Algrm.o


de los nuevos Verific¡ción de hechos comparrdr
¡esulados le sorprcnde? Explique zu respuesta' con el contenido imprcso Porcentaje
tabla representa la.participación de mer- Igual 7t
¡¿ siguiente
millon¡s de d!-
de películas, gaaancias en riguroso
á oúr.to Menos 27
número de boletos
vendidos en mrllones) de cada
Sin verificación de hechos en líne¿ 8
oelloula en 2009'
Sin verificacién de hechos en línea ni

G¡nancias Boleto¡
en impreso .8

Nrúrero de Fuc,rb: D¡tos €xt¡ídoe dc S. Clifor4 "Colunbi¡ Survqy Fi[ds a Slack


Editing Proccr ofMagaziac IVó Sietr, ltu j{er lor} ?larcr, I dc
r¡nlibro 66
oarzo dc 2010, p. 86.
cofta
eo |¡n cónic 6 376.2
r novela
gnáfca c) Cdnsüuya una gráfica de banas, una g¡áfica ci¡cular %
una gnífica de Pareto para la verificación de hechos.
bnun[bro 5 280.7 37.4
d) ¿Qué método gráfico cree que es mejor para presentar
un juego 9.2 L.Z esos datos?

en uú¿ obra 1.8 a) ¿Qué coacluye con respecto al proceso de edición y al


o d€ óP€ra cotejo con las revistas impresas y en llnea para consumi-
en una obra 172.0 dores?

2.81 El dueño de un restaurante que siwe platillos estilo


€u gucesos 334.9 44.7
continental tiene el objetivo de negocios de conoco más so-
¡eal
bre los patrones de demanda de los clientes durante el fin
un Jugusle I r50.2 20.0
de semana del viemes al domingo. Se reunieron datos de a,
htslevisión 7 267.5 35.7 630 clientes sobre el tipo de platillo ordenado, los cu¿les
I 0.6 0.1 se organizron en la siguiente tabla:
ci¡em'fogláüco 203 ¿??(7 579.1 o
o
Número de o
IE 422.6 56.3 N
Tipo de pletillo phdlloc rervidos
20 2,064.2 275.2 o)
N
Res 187
ads | 179.9 24.0
Pollo 103
cxt¡ldos d¡ rwv.thc-númber&corD/D¡rkev
Combinado 30
Pato 25
una gráfica de barras, una gráfica circular y Pescado LZa
gráfica de Pareto para el número de peüculas, las ga-
Pasta bJ
(an millones de dólares) y el número de boletos
(en millones). M¿riscos
concluye acerca de la participación de me¡cado de Temera ¿n
diferentes tipos de películas en 2009? Tot¿l 630
Se llevó a cabo u:ra encuesta sobre las pnicticas de los
web de 665 r€ristas para consnmidores. Los resulta- c) Construya una tabla-resumen con porcentajes para los
resumen en rma tabla sobre el proceso de edición v en tipos de platillos ordenados.
bbla sobre la verilicación de hechos. ó) Construya una gráfica de barras, una gráfica circular y
una gráfica de Pareto para los tipos de platillos orde-
:eEo de edlclón comp¡rado nados.
el contenido imnreso c) ¿hefiere utilizar una gnáfica de Pareto o una gnifica cir-
el mismo rigor 41
cular para estos datos? Explique su réspuesta.
d) ¿A qué conclusiones podría llegar el dueño del restau-
nguros0 48
rante con respecto a la dema¡da de los diferentes tipos de
Proceso de edición II platillos?
Lonltruya una gráfica de barras, una gráfica circular y 2.82 Supong que el ó¡eño del restar¡rantedel probleoa 2.81
rr una
8náfica de Pareto para el proceso de edición. también quiere estudiar la demanda de posEes durante el
'.! óQué método gni'fico cree qu. nl.1o, para presentar mismo periodo. El empresario decide que, además de estu-
' ' esos ",
datos? diar si se ordenó un postre, también ex¡r¡ina¡á el géneto
t
ó8 cAPiTULo 2 organización y presentación gñífca de los datos

res Se
del indrviduo y si este ordenó un platillo fuerte con PAfS
en las
obtuvieron daios de 600 clientes y se organizaron Estados
siguientes tablas de contingencia: AIIMEI{TOS EMPACADOS Unidos Japón Rusia

Productos de Panadería 108 144

Productos lácteos 298 r21

Pasta 12 t6
GÉI{ERO
70
Hombre Mujer Tot¡l Alimentos procesados, 183
POSTRE (¡RDEI¡ADO
lJo congelados'
Sí 40 96
d$hidratados Y
2N 224 464
No refrigerados, así
280 600 como alimentos listos
Total
' part comer
S¡ls¡s, ¡derezos 63 75
Y
condimentos
Bocadillos y dulces 41 l9 24

PI.ATO R'EHTE COI{ RES Sopa y alimentos 77 T7 25

Sí Tot¡l enlatados
POSTRE ORDENADO

sl 71 o) lJo FuetteDatos extraidos de H. Fairúel4 'Tacior Foot'' The New York

No 116 348 4& 7¡ñe¡, 4 de ¿b¡il de 2010, P. BU5.

187 413 600


Tot¡l
á) Coostruya una grrífica de banas, una gráfica circular I
alimen-
una grádca de Pareto para los diferentes tipos de
I
tos empacados que se consumen en Estados Unidos,
1 Ja-
! cons-
a) Para cada una de las dos tablas de conti¡gencia' oón v Rusia.
i truya tablas de contingencia con porcentales por renglon' que existen
c)- iQuá conctuye con respecto a las diferencias
poicentajes por columna y porcentajes totales'
intre el consumo de alimentos ftescos y el de alimentos
f;' (por renglón, por columna o to-
¿que tipo de porcentaje empacados en Estados Unidos, Japón y Rusia?
áil . qot b.iodu t*
ioformación sobre cada género?
"t el plato fuerte con res? Explique zu respuesta' 2.84 Etel año 2000, el cada vez mayor número de recla'
¿Sobre
mos de garantía en los neunáticos Firestone i¡cluidos
en
c)- ¿A qué conclusiones podría llegar el dueño del restau-
al patrón de órdenes de postres? vehículos utilitarios Ford obligó a que ambas empresas
[l'
i-té.oo r.rp..to
cieran un retiro importaúte del producto' Un análisis de los

2.83 Los siguientes datos representan las libras per cápita


datos sobre los reciamos de garanüa ayudó a identificar
qué

.. de alimentos frescos y alimentos empacados


que se consu-
modelos debían retirarse. En la siguiente tabla se
presl
''r' men en Estados Unidos, Japón y Rusia en 2009' eú el
'r' un desglose de 2,504 reclamos de garantía con base
t¿maño del neumático.

garanth
PAfS Tamaño del neumático Número de reclamos de
23575R15 2,030
Estados
Unidos Rusia 3l1050R15 137
AUMEilTOS FRESCÍ¡S
Huevos, nueces 88 88 30950R15 82

y frijoles 23570R16 81

Fruta 124 88
331250R15 fó
Carne y mariscos 197 146 r25
25570R16
Verdur¡s 194 278 JJf,
Otros 62

Steps Up Recall
Fue¡te: Datos extraídos de Robert L. Simison, 'To¡d
77¡e WalI Sfteet Journal,14 de agosto de 2000' p A3'
Without Fi¡estone",

y
a)' Construya una gráfica de banas, una gráfica circular
una gráirca de Pareto para los diferentes tipos de
ali- Los 2,030 reclamos de garantía para los neumáticos
23575R15 se pueden clasiltcar en los modelos AIX
y en l0r
Unidos' Japón y
menás frescos consumidos en Estados resr¡me el trfl
Rusia.
iodelos WildLess. En la siguiente tabla se

)
Problem¿s de repaso del capíulo OY

j¡cidenre que llevó al reclamo de


garantía de acuerdo con c) Construya una distribución porcentual acumulada y un
,1e
mootto' polígono porcentual acumulado (ojiva).
JitiPo dt c) Con base en los resultados de los ilcisos a) a c), ¿qué le
Reclamos de Reclamos de di¡ía al director de la empresa si tuviera que informarle
garantía para garantía para el cuánto tiempo debe esperar un cliente para resolver una
i,tPo ¿' el modelo ATX modelo Wilderness queja? Explique su respuesta.
!.,rUatnt'
TssParxiónde
1,365 2.8ó El archivo !!l@@ incluye datos sobre el porcen-
. la banoa taje de alcohol, el núnero de calorías en 12 onzas y el número
de carbohidratos (en gramos) en 12 onzas para 145 de las cer-
77 4l vezas artesanales de mayor venta en Estados Unidos.
Fuente: Datos ext'aídos de www.Beerl00.com, I de abril de 20 II.
422 66
a) Construya un histograma porcentual para cada una de las
1,864 r66 trei variables.
ó) Construya tres diagramas de dispersión: porcentaje de al-
cohol en comparación con calorías, porcentaje de alcohol
Fir$to¡e", Tlt¿ tr¿ ll Street Jou|nal, 14 de aSosto dc 2000, p. A3.
Jvitlor.¡t
etr comparación con carbohidratos y calorlas en compa-
ración con carbohidratos.
I ¿) gáfica de Pareto para el número de recla-
Construya una
c) Analice 1o que aprendió al estudiar las gráficas de los i¡-
'F nos de garantía de acue¡do con el tamaño del neumático.
r::+r cisos a) y ó).
del neumátíco se relaciona con el mayor
¿qué tamaño
2.87 El archivo ![![@@ lista los impuestos estatales
h) Construya una gráfica circular que muestre el porcentaje para los cigardllos ($) para cada entidad de Estados Unidos
' del número total de reclamos de garantía para los neumá- vigentes el 31 de diciembre de 2010.
. ticos 23575R15 en el modelo ATX y en el modelo Wil-
';.
c) Constuya un aneglo ordenado. v,
d'emess.InterPreie la gráfica. ó) Construya un histograma porcetrtr¡al.
e). Co¡stuya una gnifica de Pareto para el tipo de incidente c) ¿Qué concluye acerca de las diferencias en los impuestos
, que causó el reclamo de la garantía para el modelo ATX. para los cigarrillos que se cobran en los estados? o
¡ ¿Algun tipo de i¡cidenie se relaciona con la mayoría de o
¡, los reclamos?
2,88 El archivo !$@incluye información sobre el ren-
o
dimiento que produce un certi.ficado de depósito (CD) a uu N
l):Constuya una gnfica de Pareto para el tipo de incidente año y un certifióado de depósito (CD) a cinco años en 25 ot
! que causó al reclamo de la garantía para el modelo Wil-
bancos de Est¿dos Unidos el 4 de abril de 2011.
(¡t
demess. ¿Algún tipo de incidente se relaciona con la ma-
l"Voría de los reclamos? Fuente: Daros extaídos d€ wlvv.Brnlirat€'coq 4 d€ abril de 20 I I.

c) Constuya un diagrama de tallo y hoja pa¡a cada variable.


... 2.85 Una de las principales medidas de la calidad del serr¡icio
'que otece una organización es la rapidez con la que responde
á) Construya un diagrama de dispersión para el CD a un año
y el CD a cinco años.
a las quejas de los clientes. Una gran tienda departamental,
c) ¿Qué relación existe entre la tasa del CD a un año y la
''.,ptopiedad de una familia, que se especializa en la venta de
tasa del CD a cinco años?
muebles-¡recubnmientos para pisos; incluyendoalfombras,
ha.teflido un gran desanollo en los últimos años. En particular, 2.89 El archivo EEEEIE@E incluye infon:ración so-
el departamento de recubrimiento para pisos se arnplió de dos bre la remuneración total (en millones de $) de los directo-
gupos de instaladores a un supérvisor de instalaciones, un res de 161 empresas públicas gmndes y el rendimiento de la
nedidor y 15 gmpos de instaladores. Uno de los objetivos de inversión en 2010.
negocios de la empresa era reducir el tiernpo tanscr¡rrido en- Fuent€: Datos exfaídos de M. Kftntz y B. Hausen, "CEO Pay Soun
tre la recepción de la queja y su solución. Durante un año re- While Workers' Pay Stalls", "Bargains in the Boardroom", USI Io-
clente, la empres¿ recibió 50 quejas relacionadas con la day, I de añl de2011, pp. 18, 2B y money.us¡today.com
l¡shlación de alfombr¿s. Los d¿tos de las 50 quejas, que estan Para la remunerac ión total:
a'lmacenados en el archivo
[@,
representan el número de o) Conshuya una distribución de tecuencia y una distribu-
úas Fanscurridos ente la recepción de la queja y zu solución: ción porcentual.
54 535 137 3t 27 152 2 123 1A a1 ó) Construya un histograma y un polígono porcentual.
81
ll 19 126 110 ll0 29 61 35 94 c) Construya una distribución porcentual acumulada y un
JI 265 polígono porcentual acumulado (ojiva).
12 4 t65 32 29 28 29 26 2s 1 14 13
13 10 5 21 452 30 22 36 d) Con base en los incisos a) a c), ¿qué concluye con res-
26 20 23 pecto a la remuneración de los di¡ectores en 2010?
33 68
e) Constuya un diagrama de dispersión de la remuneración
4) Construya una distribución de frecuencia y una distribu-
total y el rendimiento de la inversión en 2010.
ción porcentual.
á) Construya un histograma y un polígono porcentual.
fl y
¿Qué relación existe entre la remuneración total el ren-
dimiento de la inversión en 2010?
7

70 CAPíTwo 2 organizaciótr y presentación gláfica de


los datos

-ai"-s;*
2.g0Estudiosrealizadosporeltabricantedelastejasdeas.ó)Construyaunhisto$amaporcentualparalacantidaddq
y
ll
v..o'"", y*:o.5l,HXXiLtJ|*'i:: .) :ü::::lt;r*. partir de su anárisis en ros incisos a) v ó)2

es un factor imPortante en ta Per "


bcluye información sobre
,.pr.r*á"ü
crientes. Además, et prro !!@S
de mut"rius 2.93 E1 archivo
y
el
"Jidud
i, * tu"to..uy relevante parala pt"i" pt"..ai" ñññ-l ¿.1 g-as-natural doméstico en
ffiij;ü;, p"t l" qo.ttt" etapa mil pies cúbicos) en Estados u¡'
#;;' Ñ; Ñ¿ d" ¿tlát tas
tottot' La ultim'a
tejas antes de coloc^t los
tolu á"'poto loorares por
;;;;i iá;;t" ¿e z'oos at i de enero de 2011' Realice lo
de ensamule empaca
de ia linea
ffit* ffi*-^ de de inteés es
madera'ia1;able tióit"t pá a precio en boca de pozo v doméstico'
en mayoria de ^el
las .EDergy l¡fomration A.tminis'atioD", wwwei¡.doe.gov' 4 dr
i]o ." fit* ¿" f" tarima ya cargad4 que
es
la
Fuetrte:
".ur.^ .ooo.n. 1,600 pies cuadrados de Ejas' La emPresa ¿" zor r.
"ü¡i
p..^q::^rT,*1:"j:l:":fi1fl0:i::i:::ff"#,il; c) consruya una gnánca de series de.tiemPo'
oe Jj presente en los datos' si es que hav
nos 3,050 libras, Pero menos
marca Ver¡nont las turio,* ¿"u* ít"'iil:ffi1¡.9"$+:
íóJpi'* a "ttá
der preci' en b'ba
5jfl'ff1j;:l"1i{jii*"*jffit -ffitffj:Tffi: ' :+:xlllrr-r,":*i::':.- precio
.o'o.ruv" it*t1 d: ]1::]Tión enne el
en
y
una distribución de frecuencia un1
distriiu; ¿l ióli
o¡ conr,*yu üiu dt pozoy el precio doméstico?
ción porcennral paru tu, tt¡^ bl"on
ton ócho intervalo-s
de clise utilizand" ¡,ors; :ñi"o'ij'óii;
á-'izq ¡'rss;
2'94 Lossiguientesdatos(almacenadosenelarchivo@ll¡
y 3 ,295 iíáitts de clase' ü cantidad de bebida gaseosa en una muestl
3 .190:3 ,225 3 ,260
' 'oáo
¿t'oluuiioo at't't"uÁtiu y u¡a distribu- lóiotetlas de 2 litros
"p'"'á*
llenadas de forma consecutrva ros
¿l Ü"ír*v"
"it
ción porcenrual p*^ tas te¡as ve'moJ
con siete interva- r*u" de forma horizontal de acuerdo con el
3,550;3,600;3,650; 3'700; 3'750; "'ur"*¿ot
orden de llenado: "
i"r'¿5.i*r
'iirá*¿o
3,800, 3,850 y 3,900 como los límites
de clase 109 2.086 2.066 2.0'75 2.065 2 05'7
2'052 2'044 2'036 2'038
para las tejas Boston 2'013 2'014
c) Construya hrstogramas porcentuales l,orr r.orn 2.025 2.029 2.023 2 020 2.015 2'014

I Y pa¡a las t€jas Vermont' z'oos 2'oo3 1-999 1996 | 99'7 1992
-Cómente
sobre 1a distribución de los pesos
tarimas z'ó1zio'12'0172'010
de las l'e6óle6?
¡'
d) t.liit.taur.e84 1'e81 ts13r's7st'e'tl te6e l'908 1894
contastejaseouooyv.,-oli."eii;;;;"1;;ifi..
peso. tlal t.sy i.951 1.951 |g41 r'941 1941 l'938
de tanmas ."o ,;G..-o y.on bajo
el porcentaje

2.91¿Cr.r.ílenelprectopro.mediotleunahabitaciónenhote-c)Construyaunag"fi:it::l:'d"Ottnonaralacanti'
Jad de bebicla gaseosa en el eje
f v el número de botell¡
les de dos, nes y cuoto
il'.liüL-¿" toao .t -*to en el ejex'
"rt "uu, lista,los iilt;" Áliti:9 o" t-TÍi-t:*lcutiva)
durante el verano de 2010? Ei archivo @ ., en esos datos' si acaso hay
precios en libras brian_rcas {qu" eo eoefoTT0l
l equivalían t) )óué p-atrón está presente
Resuelva . alguno?
i"t"-jl.¿""t."t a 1.56 dóIares estadormidenses)' esüe[as. c¡' Si"tuuie'u q'-'" hacer un Pronóstico
acerca de la cantidad
ló siguiente para los hoteles de ;;, ;-y cua;; en la siguiente botell'
press/hotet- ;;;";id^ ü*""ta^que si verterá
Fuetrte: Datos extraídos de httpli/wlyw.hotek.cotr
price-index-summef-20t0.btn|.'/wwwl||U¡E¡!.!uu!P
una-cristribu- ::1"'i:
a) construya una distribución de ftecuencia v
ción Porcentuat.
";;lm:.:lt¡::t*:::ff1'ffil'Ífi'J¿
á) Construva un histograma y un polígono
porcentual' üfrñ. Zlqi de Ia págira 54'
'lü'il:TJii:l"lilT1::if :#{"!titffi ¡p¿
rí d) ¿Qué.concluye_acerca oet ct F,'ri-.'.,..-:"*i,:if.:'#:,"ffi
iliéiol zolq ¿.nde el dólar canadiense, el
yen japonesy

, ¿:11ff.'[']#las de dispersió-n independientes


para el r."^riur* uti¡"i"^ se Listan por su equivalente
en unidado

costo de los hoteles de dos estrellas eniomparación


con por dólar estadounidense'
tiempo para los valorr
ros de tres estreras, para rJs-;;;.ñ; G estrellas en ;;'' c;sürütr""ld:.:t"::-9
canadiense' el yen japonés
yI

comparación con lo, ¿.


p*" fo, not¿t' I" ti-tiJ JtT na" del dólar
"*[o"""ri.ii:^]l
de hes estrellas en cotp*tióo too los de iuatro estellas' libra briulqrica'
^É*ptq". en las gÉficas
u".r.u ¿. .i-tuiiá,'int . .t prrrio a. to, ¡l raton q;^e¡lé nraente
fl ¿Qué concluye
ru
estrellas?
"t"rq*er
nti""ltt u&e risumen de sus resultados'
hoteles de dos, tres y cuaüo "í ""
ó
incluve información sobre las calo- *ttr¡.ffi#$ en:::i'üT:HT#:iifri1tifi
ii 2.e2 Er archivo
lu, u J .ot"rt"roi[
[@[
ut'r-entós que contienen proteína (car- comparación con la iibra
el <lólar canadiense
inglesl

;;; iür l;;, de conal y pescado). v .i vá ¡"p"r¿, r" comparición


con la libra británica'

Agricultrra de Estados unidos.


"res ,on respecto,al valor del dóla¡ canadie¡s'
Fuenk: Departamento d€ ieoé aooiuy,
c) Constnrya un hlstogfama porcentual
para el número de "l" iffii.i"íet V ia tiUra Untri'nica en términos del
dóll

estadounidense?
caloúas.
Problanas clc repaso del capítulo 71

a cada estudiapte de la c) ¿Qué concluye acerca del índice de gastos con base en
--a l¡ cl¡se) Pida los resultados de los incisos a) y á)?
lí li pt"e*tu que el profesorgaseosa
"¿Qué.bebida car-
pueda in-
i,i-. d" 2.101 Para este problema con¡idere el rendimiento anuali-
. ag una
^*r*
tabla+esumen. zado a fres aflos, de 2007 a200l9.
iltor u pot.*t.¡.s
y constuya una gnífica
c) Constuya un histograma porcentual.
ó) En una misma gráfica dibuje polígonos porcentuales de
fuúlazgos' rendimiento anualizado a hes años, de 2007 a2009,pra

parr la cl¡se)
Clasifique:*j,Y*.: los fondos intermedios gubemanentales y los fondos

lir. *.¡ gen1ro,(h13bre. nn11) rilf_ corporativos a corto plazo.


c) ¿Qué coucluye acerc¡ del reirdimiento anualizado a tes
/¡Bbaja, no nabaja) para que el profesor
con los resultados' aios, de 2007 a 2009, con base en los resultados de los
oñoo,.o incisos a) y ó)?
üatartu con Porcentajes P". :.:clóT,ryl
considere usted que brinda
de cuál
2.10) Para este problema considere el rendimiento anuali-
zado a cinco años, de 2005 a 2009.
de este estudio?
f,¡¡¿ a padir c) Constuya un histograma porceotual.
le gustaría conocer con rcspecto al ó) En una misna gnáfica díbuje poügonos porcentuales del
il¡auies
sus hallazgos? rendimiento anualiz¡do a cinco años, de 2005 a 2009,
iejorar
para los fondos intermedios guknmo€ntales y los fon-
ESCRÍTO
DE TNFORME dos corporativos a corto plazo.
a los resultados del
problema 2.90 que se c) ¿Qué concluye acerca del rendimiento anualizadoa cinco
;oa 70 acoca del peso de las tejas Boston y años, de 2005 a 2009, con base en los resultados de los
u¡ informe p¿ra evaluar si el peso de las incisos a) y á)?
4ps ripos de tejas es el Tte la empresa espe-
y gráficas informe. BASE DE DATOS DE EñKUESÍA CON EsruDhNTEs o
áe i¡corporar tablas en su

problema 2.84 en las 2.103 El problema 1.27 de la p6gna 13 describe una en- =
Le a los resultados del
garantia de cuesta apücada a 62 estudiantes de liccnciatura (la informa- o
en relación con los reclamos de
Fir€stone, y r€dacte un informe
que evalúe los ción esti alnacenada en el archivo @@. Para o
de los neumáticos Fircstone vendi- estos datos construya todas las tablas y gníficas p€rtin€ntes o
N
y redacte un informe en el que resuma sus conclusiones.
utilitarios Fo¡d. Asegúrese de incorpo- ot
en el informe. 5
2.104 El problen¿ 2.103 describe una encuesta aplicada a
62 estudiantes de licenciatura (la información está aL¡ace-
DE EOUIPO n¿da en elarchivoEE@@!@.
incluye información acerca de nuevas a) Seleccione una muestra de est¡diantes de ücenciatura de
ffi¿ ¿e I 84 fondos de inversión en bonos: su escuela y apüque una encuesta similar.
ü) Para los datos reunidos en el inciso a), construya todas
de fondo: número de identificación para cada las tablas y gníficas pertinentes, y redacte un informe en
de bono el que resuma susco¡clusiones.
de fo¡do del certificado (intermedio gubema- c) Conpate los resultados del inciso D) con los del pro-
o corDoñltivo a corto Plazo) blena 2.103.
en m'illones de dólares
Gastos de ventas (no o sí) 2.105 El problema 1.28 de la págim 14 desc¡ibe una en-
d€ gastos: proporción de gastos con respecto a los cuesta realizada a z[4 estudiantes de posgrado (véase el ar-
netos en porcentaje chivo @E!$. Para €stos datos, construya todas las
2009: rendimientos de 12 meses en 2009 tablas y gníficas pertinentes, y redacte un informe en el que
en fes años: rendimiento anualizado, de resuma sus conclusiones.
a2009 2.10ó El problema 2.105 describe una encuesta aplicada a
en cinco años: rendimiento anualizado, de 44 estudiantes de maestría en administracióri (almacenada
s2009
f¿ctor de riesgo de pérdida de los fondos en
e'iG6¡ de €studiantes de la maestría en
c) Seleccione una müestra
(por debajo del promedio, promedio, por arriba
administración de su programa de posgrado y aplique
promedio).
una encuesta similar.
Para este pnoblema considere e[ índice de gastos. á) Para los datos reunidos en el inciso 4), construya todas
un histogama Porcentual. las tablas y gráficas pertinentes, y redacte un informe en
misma gráfica dibuje polígonos porcentuales del el que resuma sus conclusiones.
de gastos para los fondos en bonos que cobran c) Compare los resultados del inciso á) con los del pro-
Y Para 1os fondos en bonos que no lo hacen. blema 2.105.
72 CAPiTL,'Lo 2 Organización y preseotación gr'ífica de los datos

.ADMI'N I 5T R AC.FGN..'I
. U.ETtC OF,
; .- .-.'.'i.;*,i.,

Recientenente, Ashland Multicomm Sewices ha recibido


crí' fipo y costo de los elrores
y
ticas por su mal servicio al cliente al responder pregunt¿s por factur¡ción incorrect¡
por
oroblernas acerca de sus servicios de telefonía' televisión Tipo de errores
cable e Internet. La dirección estableció una fuerza de tabajo
por factur¡ción incorrecta
al
a la que se 1e encargó el objetivo de mejorar el servicio Tr¿nsaccio¡es rechazadas
/.o
trabajo reunió
cüenti. En respuesta a este encargo, la fuerza de
datos acerca de los tipos de enores del servicio
al cliente, del
104.3
al cliente y del costo de los Número de cuenta incorecto
costo cle los errores del servicio
9.8
errores de facturación inconecta. Los datos son los siguientes:
Verificación inváüda
121.7
Total
Tipo de errores del servicio al cliente
Frecuencia
Tipo de errores
27 1. Revise esos datos (alnacenados en el archivo $l!!$
Accesorio hcorrecto para des'
Identi-fique las variables que son imponantes
42
Dkección inconecta bir los pioblemas del servicio al cliente' Para cada van*
Teléfono de contacto inconecto 3l
ble que identifrque, construya la representación gfáfica
9
Cableado inconecto que considere mas adecuada y explique por qué la eligro
Error en la programación solicitada 14 los dite'
a
Ásimismo, sugiera qué otra información sobre
Solicin:d de suscripción no realizada rentes tipos de errores sería útil examinar' Comente los

Error de suspensión t) cursos de acción de la fueza de trabajo o la di'


oosibles
22
Error de ñnalización iección que podría seguir para apoyar la meta de nejora
Er¡or en el acceso al sitio web 30
el servicio al cüente.
Fach¡ración inconecta r31 2. Como actividad cle seguimiento, la fuerza de frabajo de'
11
cide reuni¡ datos para estudiar el patrón de llamadas
al
Fecha de finalización incor€cta
l9 el
servicio de ayuda (información almacenada en
at'
Número incorrecto de conexrones
Precio cotizado inconecto 20 chivo [ltFl!D. A¡alice esos datos y presente sus conclü'
Fecha de inicio inconecta 24 siones en un i¡fo¡me.
Tipo de suscriPción incorecta JJ

Total 44S

Costo de los errores del serricio al cliente dur¿nte


el año anterior

Accesorio incorrecto 11.3

\f Dirección inconecta 62.4


¿L.J
ll Teléfono de contacto incorrecto
Í¡ 40.8
Cableado incorrecto
Errores en la programación solicitada 38.8
I 20.3
!
Solicirud de suscripción no realizad¿
Enor de suspenstón 46.8
I
Enor de finaliz¿ción 50.9
I
lil Er¡or en el acceso al sitio web 60.7

Facturación incorrecta t2t.7


l''il 40.9
Fecha de finalización inconecta
!! Númerc incor¡ecto de conexiones 28.1

Precio cotizado incorecto 50.3


I
Fecha de i¡icio incorrecta 40.8
'i Tipo de suscnPción incoÍecta 60.1

Tot¿l 10t.2

)
Referencias 73

Uso de Ia estadístic,a se le pidió que reuaiera 2. ¿La aseveración de EndRun de que cuent¿ con más gana-
En la sección
dores que perdedores es un reflejo justo y preciso de la
i)rn mar¡ó, Para ayudar a los clientes a tomar decisiones
'oiruo¿^ de.inversiones. Las fuentes de información in- calidad de su servicio de inversiones? Si cree que la ase-
de inversión y otras veración no es justa y precisa, rcalice una presentación
lluuen coneduios, asesores empresas

1)'rnntcios fnancteros. Aplique sus conocimientos sobre el altemativa que considere justa y precisa.
"wo y gráfcas a este Caso digital sobre 3. Revise el an¡ilisis sobre "La diferencia del Gran ocho" de
odurrodo de tablas
de previsíón y excelencia que asegura ofrecer EndRun y luego abra y examine el archivo Mutual
)i s"rutc¡o
de servicios fnancieros del área de Ashland- Funds que incluye una muestra de fondos de inversión
;tno empresa
en bonos. ¿Hay algunos otos datos relevantes en ese ar-
que incluye la "Guía para invertir" chivo que podrían h¿berse incluido en la tabla del Gran
Abra EndRunGuide.pdf,
Financial Services. Revise el documento, ponga ocho? ¿De qué manera los nuevos datos habrían alterado'
<le EndRun
atención a las propuestas de inversión de la onpresa su percepción de las afi¡naciones hechas por EndRun?
especial
y después responda lo siguiente:
de apoyo, 4. EndRun estií orgulloso de que los fondos Gran ocho han
v a los clatos
1. ,tDe qué manera la
presentación de la información gene- incrementado su valor dumnte los últimos cinco años.
ial sobre EndRun en esta guía afecta su percepción del ¿Coincide en que EndRun debe sentirse orgullosa de sus
nesocio? elecciones? Explique su respuesta.

U'

l. Htf D. How to L¡e w¡dl Sr¿t¡¡lics (Nueva York: Norton, t. Tufte, E. R. Beautiful Evüence (Cheshire, CT: Graphics
1954). Press,2006). o
2. Levine, D. y D. Stephan, "Teaching htroductory Busi Tufte, E. R Ezvrsro ning Informatbn (Cheshüe, CT: Gra- o
ness Statistics Using the DCOVA Fr¿mework", Decision phics Press, 1990). o
N
Scíences Jountal of innovative Educaüon, 9 de septiem- 7. Tufte, E. R. The hsual Display oJ Quanütative Informa'
(rl
bre de 2011, pp. 393 a398. tion,2r ed. (Cheshire, CT: Graphics Press,2002).
3. Microsoft Excel2010 (Redmond, WA: Microsoft Corpo- 8. Tufte, E. R' Tnual Explanations (Cheshire, CT: Graphics
ration,2010). Press. 1997).
4. Minitab Release I6 (State College, PA: Minitab, Inc., 9. Waine¡ H. frsual Revelations: Graphical Tales of Fate
20r0). and Deceptíon from Napoleon Bonaparte to Ross Perot
(Nueva York CopemicuVSpringer-Yerlag, 1997 ).
l

de los datos
74 CAPÍTULO 2 Organización y presentación gráfica

GE2.2 DE DAros
3ÁRrG#8ÉtXgN
Tabla-resumen
Charts para oear una
PHStat2 Utüce OneWay Tabtes &
t¿bla-resumen s¡
t"bl"-."sum.o. Po. ejemplo, para crear una
iif"t z'z áe ú página 28, abra la hoja de cálculo
iilrl ü"j" "¡f"
[t.. o" trabaj'o Bonrl Funds Seleccione PIIST¡I
"-
S"tistics -) OneWay Tables & Chars'
En
l*.J""* (que se muesta aba¡or:
eicuadro áe diálogo del procedimiento

l. Haea clic en R.aw Categorical Data'


y marque
2. In;ese Il:I185 como Raw Data Cell Range
Fiist cell contains label'
¡. i"gt"* * rnlo, marque Percentage Column y haga En el cuadro de habajo Pivot Table Field
List (que se m'
clic en OK.
tra abajo):
to add
3. Marque Risk en el recuadro Choose lields
to

rePort.
en el re'
4. Anastre la etiqueta marcada Risk y colóquela
copia de esta
cuadro Row L¡bels. Arrast¡e una segunda
.-*¿" n"ky colóquela en el recuadro Va-
-)Risk
i "oqt*
lues. Esta segunda etiqueta cambia a
Count of
un conteo de las ocurren'
'
oara i¡dicar que se moskará
ii". a. .ua^ á.goría de riesgo en la Tabla dinámica'

que no están resu-


La hoja de cálculo DATA contiene datos
ái¿or. go.l caso de datos que ya estén separados
en cate-

gorías, haga clic en Table of Frequencies

que necesitan con-


Excel en profundidad Para los datos
una ta-
tarse. utiliie la aplicación Tabla dinámica para crear
ya esten
¡tu-r"rut"o 6n el caso de que los datos
ir"riit."J"t, *il.e la hoja de cálculo SUMMARY-SIM- para
PiE Jel capitulo 2 clel libro de tr¿bajo como modelo
crear una tabla-resumen.¡'
similar a la
Por ejemplo, para crear una tabla-resumen
28' abra la hoja de cálculo DAIA del
Sond Funils y seleccione Insert ) Pivot
"ut^i'z-'i"tiiái¡a
It." ¿.
inli". sn"t¡"i"
.r
"uu¿.o
de diá1ogo Create Pivot Table (que se
ao.rn*n fup^tt" superior de la siguiente columna):
I1:I185
1. Hasa clic en Select ¿ table o range e ingrese
paá el rango de celdas Table/Range' ,
z. ilaea cüc á New Worksheet y luego en OK'
Guía del capihrlo 2 para Excel 7 5

dtnitmi"a que se creó: Charts. En el cuadro de diálogo del procedimiento (que se


E¡nfabla
muestra abajo):
c. tTaga clic con el botón derecho y luego clic en Pivot
T¡ble Options en el menú rápido que aparece. 1. Ingrese B1:B185 en Row Variable CelI Range.
2. Ingrese D1:D185 en Column Variable Cell Range.
g¡ el cuadro de diálogo
Pivot Table Options (que se muestra
3. Marque First cell in each range contains label.
sbsJo)i 4. Ingrese un Tíhrlo y haga clic en OK.
en la pestaña Layout & Format.
6, Haga clic
empty cells show e ingrese un valor de 0.
7. M¿rque For
Deje el resto de la configuración sin cambios.

E. Haga clic
en OK para completar la tabla dinámica.

Una vez que el procedimiento cree la tabla diniimica, reor-


dene las columnas
¡'Ilo" y ¡'Yes":

5. Haga clic en la lista desplegable Fees en la celda B3 y o


seleccione Sort Z to A.

Excel en profundidad Para los datos que necesiten ser cla-


o
o
sificados utiüce la aplicación Tabla dhámica para crear una o
tabla de conthgencia. (En el caso de que los datos ya estén N
clasificados, utilice la hoja de cálculo CONTINGENCY-
SIMPLE del capítulo 2 del libro de trabaio como modelo
para crear una tabla de contingencia). Por ejemplo, para
crear una tabla de contingencia similar a la tabla 2.3 de Ia
Para agregar una columna para la frecuencia porcentual: página 29, abra la hoja de cálculo DATA del libro de tra-
9. Ingrese Percentage en la celda C4. Ingrese la fórmula bajo Bond Funds y seleccione Insert )
Pivot Table. En el
=B5/B$8 en la celda C5 y cópiela hacia abajo hasta el cuadro de diálogo Create Pivot Table:
,.:;
renglón 7.
1. Haga clic en Select a trble or r¡nge e ingrese B1:D185
10, Seleccione el rango de celdas C5:E5, haga clic con el Tlpe esÉ en
en el rango de celdas Table/Range. (Aunque
botón derecho y seleccione Format Cells en el menú
la columna B y Fees está en la columna D, Excel no Ie
nipido. permite ingresar un rango compuesto de columnas que
11, En la pestaña Nunber del cuadro de diálogo Format no son adyacantes).
Cells, seleccione Percentage en C¡tegoría y haga clic OK,
2. Haga clic en New Worksheet y luego en
en OK.
12, Ajuste los límites de Ia celda, si asi [o desea (véase el En el cuad¡o de trabajo Pivot Table Field List (que se mues-
apéndice F). ha en l¿ parte superior de la página 76):

Tabla de contingencia
3. Marque Type y Fees en el recuadro Choose fields to
add to report.
PHStat2 Utilice Two-Way Tables & Charts para crear 4. Arrastre la etiqueta rrarcada Type y colóquela en el
una tabla de contingencia cuando necesite clasificar datos. recuadro Row L¡bels.
Por ejemplo, para crear la tabla de contingencia de la tabla 5. Arrastre una segunda copia de la eüqueta marcada Type y
2.3, que se muesfa en la págna 29, abra la hoja de cálculo )
colóquela en el recuadro de Values. @sta etiqueta cam-
DATA del libro de trabajo Bond Funds. Seleccione PIIS- bia a Count of Type). Luego anastre la etiqueta mar-
tat .) Descriptive Statistics ) Two-Way Tables & cada Fees v colóquela en el área Column L¡bels.
76 CAPÍTULO 2 Orgadzación y present¿ción gláfica de los datos

Distribución de frecuencia, parte I

I Para crear una distribución de ftecuencia, primero debe co6


vertir sus intervalos en lo que Excel denomina grapos. Lq
grupos aproúman los intervalos de u¡a distribución de fie.
cuencia. A diferencia de los intervalos, los grupos no henq
valores de límites superior e hferior. Los grupos se estable.
cen al ingresar, en orden ascendente, una lista de "valor d¡1
gmpo" en las beldas de un rango de una cohrmna. Cada v¿.
lor del grupo, a la vez, defrne un grupo, el cual está inte.
grado por todos los valores menores o iguales que su valct
de grupo y mayores que el valor del grupo anterior.
Como el primer valor de grupo no tiene un valor de grupa
"anterior", el pnmer grupo nunca podrá tener un valor de li.
mite inferior preciso. como ocurre siempre con el primer in.
tervalo de clase. Una solución común a este problerna, que ¡
utiliza en los ejemplos que se describen en este libro, consisb
en definir un gn:po adicional utiiizando un valor de grupo
que sea un poco mrís bajo que el valor de límite inferior de
la primera clase. Este valor de grupo adicional, que apar'
En la Tabla din¡ímica creada:
primero, permite que el ahora segundo valor de gnrpo se
aproxime mejor aI primer intervalo, aunque con el costo de
6. Haga clic en la lista desplegable Fees en la celda B3 y añadir un gnrpo no deseado a los ¡esultados.
seleccione Sort Z to A para reordenar las columnas En este capíhfo las ttblas2.8 a2.11 de las páginas 34 a 36
,.No,, y .,yes,,.
utilizan gnrpos con \a forma"valorA pr'*lo menor que valorB",
7. Haga clic con el botón derecho y luego haga clic en Pi- Es posible convertir los grupos con este formato en clases ca¡i
vot T¡bl€ Options en el menú r.ípido qu€ aparece. equivalentes creando una lista de valores de gn¡po que sean u¡
En el cuad¡o de diálogo Pivot Table Options: poco más pequeños que cada valorB que aparece en los intin'
valos. Por ejemplo, los intewalos de la tabla 2.9' de la págiu
8. Haga clic en la pestaia Layout & Format. 34, podrían convertine en gupos casi equivalentes uülizando
9, Marque For empty cells show e ingrese un valor de 0. la siguiente lista de valores: -10.01 (el valor del gnrpo adi'
Deje el resto de la configuración sin cambios. cional), -5.01 ('hn poco menor" que -5), -0.01' 4.99 (un
10. Haga clic en la pestañá Total & Filters' poco menor que 5) ,9.99, 14.99, 19.99,24.99,79.99 y 34.99
11. Marque Show grand totals for columns y Show grand Para en los grupos con el formato "todos los valores
totals for rows. desde valorA hasta valorB", como el conjunto 0.0 a 4.9, 5 0
12. Haga clic en OK para completar 1a tabla-
a 9.9, 10.0 a 14.9 y 15.0 a 19.9, podemos aproxlmar cad¡
intervalo eligiendo un valor de grupo un poco mayor ^"e
GE2.3 ORGANIZACIÓN DE DATOS crda valorB, como en la siguiente lista de valores de gn.
NUMERICOS -0. 01 (el valor del gnrpo adicional), 4.99 (un poco mayor
que 4.9), 9.99, 14.99 y 19.99.
Datos agrupados y no agruPados Utillce una columna vacía en la hoja de cálculo que
PHStat2 Utilice St¡ck D¿ta o Unstack Data para reorde- contenga los datos para ingresar sus valores de grupo (o
nar los datos. Por ejemplo, para desagrupar 1a va¡iable ren- orden ascendente). Escriba el encabezado Clases en la celd¡
dimientos 2009 @eturn 2009) en la columna F de la hoja 1 del renglón de esa columna. lngrese sus valores de gnrpos
de cálculo DATA del libro de trabajo Bond Funds, abra antes de utilizar las instrucciones de la parte II para creat
esa hoja de cálculo. Seleccione Data Preparatis¡ )
Uns' distribuciones de fr ecuencia.
tack Data. En ese cuad¡o de diálogo del procedimiento, in- Cuando construya sus propias distribuciones de fre'
grese Bl:8185 (el rango de celdas de la variable Type) cuencia podrá incluir frecuencia, porceDtaje y/o porcenujes
como Grouping Variable Cell Range e ingrese FI:FIES acumulados como columnas de una distribución, a difereú'
en Stacked Dat¡ Cell Range. Marque First cells in Both cia de lo que se observa en las tablas 2.8 a 2.1l. Asimismc
ranges contain label y haga clic en OK. Los datos desagru- con Excel se crean disfibuciones de frecuencia para catego
pados aparecerán en una nueva hoja de cálculo. rías individuales de forma separada (por ejemplo, una distn'
bución de frecuencia para los fondos en bonos intermedios
Arreglo ordenado gubemamentales seguida por una para los fondos en bonos
Excel en profundidad Para crear un aneglo ordenado pri- corporativos a cono plazo). Para formar hojas de cálct'¡t0
mero seleccione los datos que desea ordenar' luego selec- que tengan la apariencia de las tablas 2.8 a2.I1con dos cÍ'

cione Home )
Sort & filter (en el Editing group) + Sort tego¡asl recorte y pegue las partes de las distribuciones de
Smauest to Largest. fricuencia creadas de maoera separada. @xamine las hojas
Guía del capitulo 2 para Excel 77

fondos en bonos según el tipo de fondo y que las dos hojas


, nD IG y FD-STC del capítulo 2 del übro de
la boja de cálculo F?-C,-OMPI- de cálculo co¡tienen listas idénticas con valores de grupos
iu.go
"**io.
,'J.i.¿ro se pueden cortar y pegar las distribu- en la coh¡mna J. Con el libro de F¿bajo abierto en la hoja de
'ftecue¡cia hdividual)' cri'lculo IGDATA:
de una categoría

l Haga clic con el botón derecho en la pestaña de la hoja


de frecuencia, Parte ll IGDATA y luego haga clic en Insert en el menú rá-
¡dlice Frequency Distribution para creÍu una pido. En el cuadro de diálogo Insert, haga clic en el
i de tecuencia. Por ejemplo, para crear la distri- icono de hoja de cálculo y luego en OK para insertar
delatabla2.9, que se muestra en la una nueva hoja de cálculo.
lrco"nciu
abra la hoia de cálculo DATA del libro
de tra' 2, En la nueva hoja de cálculo escriba un título en la celda
Funds. Seleccione PHStat )DescriPtive Sta- Al, Bins en la celda A3 y Frequency en la celd¿ 83.
Frequency Distribution. En el cuadro de diálogo 3. Copie la lista de valores de grupo que se ubica en el
tifliento (que se muestra abajo): rango de celdas J2:J1l de la hoja de cálculo IGDATA y-
peg:ue esta lista en la columna A de la nueva hoja de"
F1:F185 en Variable Cell Range, ingrese cálculo empezando en la celda A4.
como Bins Cell Range y marque First cell in 4. Seleccione el rango de celdas 84:813 que contendrá la
rlnge contains label. función frequency.
clic en Multiple Groups - Stacked e ingrese 5. Sin presionar las teclas Enter o Tab, escriba la fórmuia
85 en Grouping Variable Cell Range. @n la hoja
=IREQUENCY(IGDATA!$F$1:$FI$88' $A$4: $A$13).
cálculo DATA, los rendimientos de 2009 para arnbos Luego, mientras presiona las teclas Ctrl y Shift (o la
rs'de fondos en bonos están agrupados o colocados en tecla Apple en una Mac), presione la tecla Enter. (Esta
sola columna. Los valores de la colum¡a B permiten combinación de teclas ingresa una "fórmula de orden"
desagrupe los rendimientos para los fondos
que se explica en el apéndice F, en el rango de celdas
gubemamenkles de los rendimianlos para los
84:Bl3). u,
corporativos a corto plazo).
un Título y luego haga clic en OI( Para crear la disfribución de frecuencia de los bonos corpo- =
r¿tivos a corto plazo, repita los pasos 1 a 5 pero ingrese la o
fórrrula =FREQ{IENCY(STCDATA!$F$1:$EI9E $A$4: o
$A$13) en el paso 5. Luego corte y pegue los resultados d€ o
N
las dos distribuciones de ftecuencia para crear una tabla si-
milar a la tabla 2.9. {
Observe que en el paso 5 ingresó el rango de celdas
como IGDATA!$F$1:$F$88 (o STCDATA!$F$l:$F$98)
y no como F1:F88 (o Fl:F98) porque los datos que se resu-
minln estan localizados en otra hoja de cálculo, y usted que-
ría utiiizar referencias de celdas absolutas para facilitar el
copiado de la columna de frecuencias con la finalidad de
c¡ear una tabla similar a la tabla 2.9.

Herramientas para análisis (Analysis ToolPak) Utilice


Ilistogram con una lista de valores de gnrpo (véase "Distri-
bución de frecuencia, parte I", que aparece en la página 76)
para crear una distribución de frecuencia. Por ejemplo, para

tcrear otras distribuciones de f¡ecuencia, si utiliza una


crear la distribución de frecuencia de la tabla 2.9, que se
cálculo que contenga datos de un solo grupo, como muestra en la págha 34, abra la hoja de cálculo IGDAIA
oj¡s de cálculo IGDATA o SCTDATA, haga clic en del libro de trabajo Bond Funds yseleccione Data t
Group Variable en el paso 2. Observe que el proce- Data Analysis. En el cuad¡o de diálogo Data Analysis, se-
Ilistogram & Polygons, analizado eu la sección leccione Histograma de la lista de Herramientas de análi-
también crea distribuciones de ftecuencra. sis y luego haga clic en OK. En el cuadro de diálogo
Histogram (véase la parte superior de la página 78):
en profundidad Utiiice la tunción FREQUENCY
hoja de cáiculo y una lista de números de clase (véase l. Ingrese F1:F88 en Input Range e ingrese J1:J11 en Bin
de frecuanci4 pade I', que aparece en la página Range. (Si deja Bin Range en blanco, el procedimiento
Para crear una distribución de frecuencia. Por ejemplo, crea un conjunto de clases que no esenán tan bien confi-
c¡ear la distribución de frecuencia de la tabla 2.9. que guradas como las que usted podría especificar).
uesM en la página 34, abra y revise las hojas de cálculo 2. Marque Labels y haga clic en New Worksheet Ply.
.lTA y SCTDATA del libro de trabajo Bond Funds. 3. Haga clic en OK para crear la distribución de frecuen-
que las hojas de cálculo dividen la muestra de los cia en una nueva hoja de cálculo.
datos
78 CA.P Í I u-LO 2 Organizaciór y p¡esentación gráfica de los

gubernamentales' Pa¡u
de inversión en bonos intermedios
porce¡-
modifi.ar esta ho¡a"de cálculo e i¡clufu distribuciones
tuales y Po¡centuales acumuladas:

l. Escriba Total en la celda A14 e ingrese =SUM(84:814)


e¡ la celda 814.
Escriba Percentage en la celda C3 y Cumulative
Per'
2.
centaqe en la celda D3.
¡. iogr.t". =¡¿mn$14 en la celda C4 y copie esu fórmu1¿
--
i'icia abaio de Ia distribución de
en todos los renglones
frecuenciá.
+
4. toer"r" =C4 en la cetda D4' Ingrese D4 C5. la
en
esta fórmula hacia abajo en todos los
..iau nS y
'renglones de"opie
la distribución de frecuencta'
clic con d
En la nueva hoja de cálculo: 5. iellccione el rango de celdas C4:Dl3' haga
-' en el menú
Seleccione el renglón l. Haga clic con
el bcitón derecho botón dtt..ho y lirego clic en Format Ceüs
"
4.
io .ittogfOn I y iuego en efmenú nípido Insert' Repita rápido.
de diálogo Format
el proced-imienü. (Eito crea dos renglones
en blanco en -' Eá la pestana Number del cuadro
6.
la oarte superior de la hoja de cálculo)
ó.it, ..t...iooe Percentage en Category y haga clic
en la en OK.
s. ñi¡to uo tituro para Ia áistribución de frecuencia
en lugar ttr
celda Al. Si desea una colunna de frecue¡cias relativas
C4 a Rel
Las herramientas para análisis crean una
distribución de fre' oora.o,uiat, cambie el encabezado de la columna
que se denomrna '¡'*o"eJ.i.t. Luego seleccione el rango de celdas C4:Cl3'
cuencia que incluye una clase inadecuada
iu*^'.fi. .oo A bolón derecho y luego clic en Format
Cells
manera:
More. Corrija este enor de la sigurente
sume el valor de la frecuencia del
*? .*ti ¿pi¿o. En la pestaña Number del cuadro dey haga
diá-

"' De forma manual,


6.
al valor de la clase anterior' (Esto es rn-
i"g" ¡"""* ó.nt, seleccione Nunber en Category
taogf"o lf*a clic en OK.
se observa
oec'"s"rio si el conteo More es cero, como Utilrce
en este ejemPlo de la tabla 2'9)' Herramientas para análisis (Analysis TootPak),
hoja de calcuto las i¡strucciones anteriores de Excel en
pro¡undúad pal:
7. Haea clii en el número de renglón de la
oaá el renglón More (y asi seleccionar
todo el renglon .o¿i¡"a. u"u ¿ist ltución de ftecuencia creada utilizando
derecho en parte I1"'
á. fu rto¡" í" .¿f.olo); taga clic con el botón iuJ ios-t .i..loo", ¿" "Distribución de frecuencia'
menú rá-
*.gi¿" y luego haga itic en Delet€ en el
"i que aParece.
pido GE2.4 PRESENTAqÓN GRÁFICA DE DATOS
Abra la hoja de cálculo STCDATA y repita
los pasos I al CATEGORICOS
y pegue los resulta-
con los renglones 1 al 98. Luego corte Gráfica de barras y gráfica circular
para crcal una GF^ "
dos de las clos distribuciones de frecuencra PHStat2 Modifrque las instrucciones de la sección
tabla similar a la tabla 2.9' PHitat2 pata elaborat una tabla-resumen
(página 74) co'-

¡"Jt:á¿'¿. cr.". *" gni'fica de barras o circular' En ei


paso
Distribución de frecuencia relativa, porcentual
o
y/o Pie Cha4
porcentual acumulada 3 de esas rnstruccrones, marque Bar Chart
Jemás de ingresar un Titulo y hacer cüc en OK'
PHStat2 Para c¡ear estas otras distibuciones, primero utilice
gráfica de barras¡
i^ io.t o".ioo". an PHStat2 en"Distribución de ftecuen-
p Excel en profundidad Construya una
para
H1 U'', pao crear una distribución de ftecuencia
que o puttit de una tabla-resumen' Por ejemplo'
:i "i",pu.t" acumula- "ii.ufu.
crear Ia pri8ca de banas de la ñgura 2'2'
que se mu:sira e.r
.oióneo *n.otutoa de porcentajes y porcent¿jes
I
,ll relanvas camble la oáeiná 41, o la gráfica circular de la figura
2 4' de la pa'
dos. Pia crear una columna de frecuencias
Jiioáuto o" tu .otrunna de porcentajes' Seleccione
las cel- *fir*b;; iu-nJ¡" a" celcuto sUlvfMARY-PÑoT
del

il das que contienen los porcentajes, haga


clic con el boton oe- capítulo 2 del libro de tnbajo Y:
xi
,-JJl y lu"go ,el"ccione Format cells en el menú nipido
En su selec'
,fii selec-
l. Seleccione el rango de celdas A4:87 (empiece lo hace
ü p"rtun" Ñu¡nu.. del cuadro de diálogo Format ce-lls' ción en 1a celda 87 y no en la celda A4' como
i;li Jáo. No.¡.t * Category y luego haga clic en oK'
normalmente).
hti gráfica de ban^as'
t, z. ffagu .fic en insert. Par¿ obrener una
Excel en pro{undidad Para crear est¿s otas
distribuciones'
selecclone t,
iÉ utili- hagi clic en Bar en Chart Group y luego
;;;tf*¿ una distribución de frecuencia consruida
Excel en profund¡dad en "Distibu-
oritera opción 2-D Bar (Clustered bar) Para obt'ener
r*¿o ii, tt*..io nes de Ht:"-tt-9!T Gilll
,f
'l ción de frecuencia, parte II", anadiendo una
columna par¿ Ios irna grrí'fica circular. haga clic en
y lue-go seleccione la primera opción 2-D Pi: f q:TÍ
o".*i., *".tfados. Por ejemplo' abra boja de cálculo
Ia rtnrr
l. ireubique la gráfica en una boja gráfica.y a¡ustela
hO tC ¿.t capítulo 2 del libro de tr¡baio' t'sta
no1aoe
f" dismbución de frecuencia para los fondos
zando i; l¡strucciones de la sección F4 de los
apenocvr'

"¿f."f" -o,i*.
Guía del capítulo 2 para Excel 79

-rr¿¡er üIlá
gráfica crcular, seleccione Layout ) 9, Seleccione Format (en Chart Tools). En goup Selec-
tion Cunent elija el comando para las series de porcen-
li"J More O¿ta fabel Options. En el cuadro de
taje acumulado de la lista desplegable y luego haga clic
Daia Labels, haga cüc en Label Options en
en Form¡t Selection.
lll" rzqüerd¿. En el cuadro de la derecha de Label
10. En e1 cuadro de diálogo Series para formato de datos,
l"".nur C"t"go.y Name y Percentage y deje los
marcar. Haga cüc en Outside End y luego haga clic en Scries Opüons en el cuadro de la izquierda
i¡ y en Series Options en el cuadro de la derecha, haga
una gnífic¿ cle barr¿s, si la escala del eje ho- cüc en A¡is Secondary. Haga cüc en Close.
el botón derecho en el {e 11, Cuando aún estén seleccionadas las series de porcentaje
fr"iu.- O, nugu
"licco_n acumulado en el grupo Selection Cunent, elija Desigl
rogat en matl_4'f1
lvaror) ¡_!ueeo.a {ls ;l Aris Op t Change Chart Qpe, y en la galería Change Chart
de dirálogo Axis Format, haga cüc en
cuartro izqüerdo. E¡ el cuadro de la derecha de
T!¡re seleccione la cuarta opción Litre (Line with Mar-
clic en el primer boton con la o,pció,n Fired kers). Haga clic en OI(
¡5. haga

); ingres€ 0 en ese cuatro. Ilaga clic en Clma


A continuación establezca 10ff/o como el valor máximo do
1as escalas de los ejes f primario y secundario (izquierdo y
de Pareto I:
derecho). Para cada eje
Modifique las instrucciones de 1a sección
ftal para crear una tabla-resume4 como la que se 12. Haga clic con el botón derecho el el eje y haga clic en
lapigtna 7 4, conla finalidad de constuir una grá- Format A¡is en el menú níPido.
En el paso 3 de esas instrucciones, marque Pa- 13. En el cuadro de dialogo Format Axis haga clic en Axis
de escribir un Títr¡lo y hacer clic en OIi Options en el cuadro de la izquierda y enAxis Options
en el cuadro de la derech¿ haga clic en el botón de la
Pa"a crear una gnifica de Pareto, mo-
orofundidad segunda opción Fixed (para el oáximo) y escriba 1 en
'abl"-r"ruteo qrr" ." creó originalmente utilizando
su cuatlro. Haga ciic en Close.
cle la secciór GE2.3. himero organice la tabla

n orden decreciente de Aecuencias y luego añada una Reubique la gr.i'fica en una hoja gniñca y ajuste su formato o
ipara elporcentaje Ultiü9e la tabla orde- utilizando las inshr¡cciones de la secciór F.4 de los apéndices. =
lunfado,
para crear la gr:ífica de Parcto. Cua¡do utilice nnz Tabla dinárnica como tabla-resunen,
para crear la gnáfica de Pareto de la figura le será más sencillo ordenarla: hag¡ cüc con el bo6n derecho o
AIMTabIe en el libro de trs- en la celda que contiene la prinera ftecuencia (celda 85 en la
o
la hoje de crilculo o
vf Transactions. Primero organice la tabla Eodifi- hoja <te oálculo del ejerylo) y seleccione Sort )
Sort Largest N
decreciente de ftecuencias: to Sm¡llest Sin embargo, es mucho más dificil crear una ot
gifica de Pareto a partir de una Tabla dinámica con colum- 6
el renglón 11 (el renglón del Total), haga
nas adicionales para el porcentaje y el porcentaje acumuiado
con el botén derecho y luego haga clic en Hide en
que crear una gnífica a partir de una tabla-resumen sencilla.
rápido. (Esto evita que el total por renglón se
La mejor solución consisG en convertir la Tabla dinámica en
en el ordenamiento).
una t¿bla-rest¡men sencilla copiando los nombres de las cate-
la celda 84 (la primera frecuencia), haga
gorías y las ftecuencias en la Tabla dinámic4 juuto con las
con el botón derecho y seleccione Sort Sort ) columnas adicio¡ales, a un á¡ea vacía de la hoja de cálculo.
to Smallest.
los renglones 10 y 12 (no hay renglón 1l),
Gráfica de barras agrupadas
clic con el botón derecho y luego haga clic en Un-
del menú rápido. PHstat2 Modifique las instrucciones para crear una tabla
una qolumna para el porcentaje acumulado:
de contingencia que se dieron en la página 75 en la sección
GE2.2 PHStat2, con la finalidad de crear una gráfica de ba-
Cumulative Petage en la celda D3. Ingrese nas agrupadas. En el paso 4 de esas i¡stucciones, malque
en la celda D4. Ingrese =IX + C5 en la celda D5 y
Sideby-Side Bar Chart adem:ás de escrfui¡ un Tftulo y hacer
esta formula hacia abaio hasta el renelón 10.
clic en OK.
el rango de celdas C4:D10, haga clic con el
derecho y luego haga clic en Fornat Cells en Excel en profundidad Construya una gráfica con base
nenú nipido. en una tabla de contingencia para crear una gráfica de ba-
la pesda Number del cuad¡o de diálogo Fo¡mar Cells nas agrupadas. Por ejemplo, para elaborar la gráfica de
ione Percentage en Category y haga clic en OK banas agnrpadas de la frgura 2.7 de la página 45, abra la
construya la
8táfica de Pareto: hoja de cálculo CONTINGENCY-PIVOT del capltulo 2
ü€leccione el rango de celdas A3:A10 y, mientas pre- del libro de trabajo y:
slona la tecla Ctrl, también seleccione el rango de celdas 1. Seleccione la celda A4 (o cualquier otr¿ celda dento de
10. la Tabla dinámica).
ione Insert t Column (en Charts group) y se- 2. Seleccione Insert t Bar y elüa la primera opción 2'I)
la primera opción 2-D Column (Clustered Bar (Ctustered Bar). Reubique la grrifica en una hoja
). gráfica y ajuste su forrato utilizando las instucciones
datos
80 CAPÍTULO 2 Organización y presetrtación gráfica de los

y PHSta¿
pero con Ia sigutetlte Como Minitab utiliza un método de tnrncamiento
de la sección F.4 de los apéndices,
.*..p"iOo' cuando haga clic en Legend, seleccione
o* * .¿to¿o ¿. .edondeo, 1as hojas del diagrama de PHg'
áá difi"."o * poco de las de 1a hgura 2'8 (que fue crea¿¿
Show LeYend at Right'
con Minitab).
óu*¿o t. .oot*ye Lrna gráfica a partir de una tabla
de
selecclona el Cuandá construya otros diagramas, utilice la opción
contilaencia que no es una Tabla dinámica, se Autocalcula¡
Set stem unit as de manera racional y solo si
.ü* l. l"fait de Ia tabla de contingencia, incluyendo los stem unit crea un diagrama con muy pocos 0 cem¿srados
el
enábezados de renglón y de colum¡a, pero excluyendo *ldid de tallo que especifique debe tener
seleccionar taitos. lCoutqule.
io-tut p. t"ngtoo y ei toá por columna
antes de
una potencia de l0).
----Eo ) Bar'
Insert
Excel en profundidad Construya de lor¡na manual
se consruye una gráfrca de banas los ta-
o.urionrr. .uando
mler- llos v las üoias en una nueua hoja de cálculo para crear q1
asupadas, las variables de renglón y de colurnna-de9.el
STEM-
Si la fuente de la gráfica es una-labla dmamlca' áiasrama de-t¿llo y hoja. Utilice la hoja de cálculo
"á.üitt..
t.",Ji""1" ***endo Ia variable de renglón en la
variable iiir a"l capítuto i
aet ntro de trabaio como guía para
y viceversa. Si la gráfica no se basa en una laota dar formato a su diagrama.
de columna,
iL-¿toi"a, ttuÁucon el botón derecho en la gráfica y luego
"t¡.
en el menú rápido' En el cuadro de diá-
Histograma
i. *i.i*i u",a
y
1Á Select Data Source, haga clic en Switch RodColumnse- PHStat2 Utilice el procedimiento Ilistogram &
Polygons

hJeo.o Of. (En Excel 2010 umbién puede utihz¿r.este para crear un histograma a partir de datos no agrupados' Por
cu;do mérodo para las gníficas basadas en t¿blas únamrcas'' li.rnpto, pu. o..il par de histogamas de la frgura 2J 0 o'-
"* r" oioUuuri q* talibien necesite reordenar las categorías r'" ti.tÉu * tu p¿gini +1, aUra U no¡a de cá'lcul¡ DATA
ou" ,.áortt á
Ia gr:í6ca. Si desea cambiar sus posiciones iit.o A. ttaf"¡o ñond Funds. Seleccione PHStat Des )
"o
lu.u u* *m.u U*adá en u¡a Tabla di¡árnica" haga clic en la cripáve Statisdcs > rristogram & Polygons' En
el cuadro de
'tirá [rpí"guut" p* Ia variable categórica que necesita.reor- cliáiogo del procedimiento (que se muesta
abajo):

denane y sélec¡ione SortAto Z En este eJemplo,


despues oel
1, Inprese F1:F185 en Variable Cell Range' J1'J11
en
para Ia vanaote
oaso 2. haga clic en Fees de la lista desplegable R¡nge y
Sort A to ¿' Biis CeU R¡nge, K1:K10 en Midpoints CeU
cateeóricique necesita reordenarse y seleccion€ marque First c-e in each range contains label'
gnifica que no esl¿ bas¿ul¡l
Para-reordenar las categorías de una - Stacked e tngrese
en una Tabla dinárnica. reordene fisicamente
las columnas 0e -' ttuei cti. en Multiple GroupsCellRange
Z.
U no¡ de cetun pan que incluyan los datos
de la gr¿frca' iiilmti * c.oupingvariabli (Enlahoja
para ambos
áe cálculo DATA,loslendimientos de 2009
tipos de fondos en bonos esuin agnrpados o colocados
en

GE2.5 PRESENTACIÓN GRÁFICA DE DATOS r.rna sola colun¡a. Los valores de la


column¿ B pefmlte¡
NUMERICOS los fondos tn-
oue PHStat2 separe los rendimientos para
Diagrama de tallo Y hoja ü"o.¿¡t guU"irtu.*tales de los rendimientos para los
fondos corporativos a corto plazo)'
PHStat2 Utilice el procedimiento Stem-and-Leaf
Display y
3. Escriba uo títolo, haga clic en Eistogram
luego
y hoja Por ejem¡lo' para crear
oara crear un diagrama de tallo haea clic en OK.
r¡n diaprama de tallo y hoja similar al
que se observa en u-n-

e*u ii, ¿. fu p¿giou +8, ub.u h no¡" at cálculo S'TC-DATA +


áJ ."pitor" z'¿ú noro de trabaio' Seleccione PJIStat
Desciptive Statistics ) Stem-and-Leaf Display
F'n el cua-
abajo):
dro de diálogo clel procedimiento (que se muesh'a
y
1. Ingrese Fl:F98 en Variable Cell Range marque
First cell contains label.
2. Deie Autocalculate stem unit seleccionada'
iti 3. Inerese un Título y haga clic en OK'

il
rti

a¡are
tsin Cell Range y Midpoints Cell Range deben
cer en la misma hoja de cálculo que los ütos no
agrupaou:'
lo iftrm fu úoja de cáiculo DATA de1 libro de trabalo
"o.o
Guía det capinrlo 2 para Excel 81

clase no puede tener r¡namarc-a de dichas instrucciones, marque Chart Output y después
Como la primera
haga clic en OK.
o"i.*,;¡1¡**:i'::i:*-t:#"""i1 Por ejemplo, para crear el par de histogramas de la fi-
n*'ai-1* 1"t*,, nf
coqo etiqueta T:
"i .lrr" y o,ili- "--" i]11"--. para 1:
la gura 2.10 que se muestra en la página 49, utilice el paso 5
in- modificado con las hojas de oálculo IGDATA y STCDATA
ü tanto, el ilfidpoints Cell Range que.
mrís pequeño que el de del Capítulo 2 del llbro de trabajo (como se expuso en la
un tamano de celda
página 77) para crear un par de hoju de cálculo que conten-
iea "segurmiento del histograma" en Ia
ajustes adi- gan uoa disfibución de frecuencia y un histograma. Cada
de esta página para conocer los
aolicar a los histogramas que consfruya. histograma tendrá (los mismos) dos errores de formato que
usted puede corregir:
Construya una gnfrca a Partir de Par¿ eliminar los intervalos ente las barras:
de ftecuencia. Por ejemplo, para crear el
as de la figura 2.10, que se muesta
en la 1. Haga clic con el botón de¡echo en una de las barr¿s del
iero utilice las instucciones de Excel en pro' histograma y haga clic eú Form¡t Drta Series en el
lorre..o tn la se" cí6n' GE 2.4 "Distribución .enú Épido que aptt".".
parten", de laPlg;na 7l ' 2. En el cuadro Series Options del cuadro de diálogo For-
un par de distribucio- mat Data Series, mueva el deslizador de Gap Width a
ió.r, ürru..ioo.t para crear
para los fondos en bonos i¡termedios No Gap y haga clic en Close.
]iretrcia. uoa
ales y la otra para los fondos en bonos corpofil-
Para cambiar los rótuios de clase del histograma:
plazo en hojas de cálcr¡lo separadas. En cada
1. Úrgrese el encabezado de cohrma Midpoinb en la cekla
añada una colum¡a de marcas de clase escri-
de columna MidPoints en la celda C3 e ingrese '-- en la cekla C4 (a primera clase no tiene
e inicie en la celda C5 las m¿¡cas de
marca de clase). Inicie en la celda C5 e ingese las mar-
ita cekla C4
2.5, 7.5, l2'5, 17.5, 22.5' 21.5 v 32.5. Et
cas de clase -7.5, -2.5,2.5,7.5,12'5,175,22,5'27.5 y
-2.5,
32.5 en la columna C. (Las narcas de clase servi¡iín
crilculo:
como etiquetas para las nuwas clases en el puo 3).
o
el rango de celdas B3:B13 (el rango de cel- 2. Haga clic con el botó¡ derecho en el fondo de la gnifica
úecuencias). y luego haga clic en Select Dat¿.
Insert )
Column y elija la prirnera opción 3. En el cuadro de diálogo Select Data Source, haga clic
o
(Clustered Column). o
en Edit bajo el encabezado de Eorizontal (Cetegories) o
con el botón derecho en el fondo de la gráfica Aris L¡bel. En el cuadro de diálogo Axis Label' in- N
en Select Dat¿. grese la fórmula del rango de celdas en la forma
de diálogo Select Data: =SheetNam¿!C4:C13 en el Aris L¡bel r¡¡ge y des-
pués haga cüc en OK pua completar la tarea.
en Edit en el encabezado Éorizontal (cate-
A¡is Labels. En el paso 3, sustifirya el nombre de la hoja de cálculo que
de diri,logo Axis Labels ngese lafórmula contiene la distribución de ftecuencia y el histograma para
de celdas en la fotma --SheetNamet C4tCl3 SheelName; observe que el rango cle celdas C4:C13 no in-
SheetName es el nombre de la hoja de cálculo cluye la celda con el encabezado de colum¡a. Lea la si-
y después haga clic en OK para regres¿r al cua- guiente sección para conocer los ajustes adicionales que
dirílogo Select Data Source. puede aplicar a los histogramas creados.
cüc en OK.
Histograma: Seguimiento
clic con el botón de¡echo dentro de una barra y Como el ejemplo utilizado a 1o largo de la sección "Histo-
en Format Data Series en el menú nipido. grama" utiliza una técnica que incluye una clase adicional
(véase"Distibución de frecuenci4 pade I" en la sección
de diáloeo Formbt Data Se¡ies:
G82.4), el histograma creado incluiÉ la clase adicional sin
clic en Series Options en el cuadro izquierdo. En sentido. Si quiere eliminar la clase adicional, como se hizo en
t Options del cuadro derecho, mueva el deslizador los histogramas de la figu¡a 2.10, haga clic con el botón dere-
Width a No Gap. Haga clic en Close. cho en el fondo del histograma y eüja Select Dat¡. En el cua-
la gáfica a una hoj a gráfica y ajuste su formato dro de diflogo Select Data, primero haga clic en Edit bajo el
las instrucciones de la sección F.4 de los apéndi- encabezado Legend Entries (Series). En el cuadro de diá-
Seguimiento" en esta página para co- logo Edit Series modifique la fórmula del rango de celdas
aJustes adicionales que puede aplicar a los para Series Values. Luego haga cüc en Edit bajo el encabe-
creados. zado Horizontal (Categories) Axis Label. En el cuadro de
diálogo Axis Label modifique el Rango de Lebcls del eje.
rlentas para análisis (Analysis ToolPak) Modifi- Para el ejerylo que se utilizó etr la sección anterior, caurbie la
¡n$rucciooes de la sección GE2.3 Herramientas para celda inicial por la formula del rango de celdas para los Se'
para "Distibución
de frecuencia. parte II" de la pá- ries v¡lues de 84 a 85 y cambie la celda inicial por la fór-
con la fmalidad de
crear un histograma. En el paso 5 mula del rango de celdas del A¡is label Range de C4 a C5.
r
82 CA!ÍTULO 2 O€atrüación y presentación gnifica de los datos

La frgura 2.2 E de la págila 50 también presenta el pol¡.


Polígono Porcentual
gono porcentual para los fondos en bonos corporativos ¡
PH5tat2 Modiñque ias i¡shucciones de PHStat2 peaa ctear w iorto pl-o. Para agregar este polígono a la gráfica reci6¡
histograma que se dieron en la página 80, con la finalidad de cread4 abra la hoja de cálculo CPD-SCT. Repita los paso3
crear u polígono porcentual. En el paso 3 de esas instucciones, 1 a 5 para modificar esta distribución, luego abra la hoj¡
haga cüC en Percentage Polygon antes de hacer clic en OK gráfrci que contiene el poligono de los fondos intermedios
gubernamentales. Seleccione Layout )
Legend Sholt
Excel en profundidad Cons[uya una grafica basada en una iegend at Right. Haga clic con el botón derecho en la 96-
distibución porcenhral nodificada para crear un polígono por- fica y haga clic en Select Data en el menú rápido. En e1
centual. Por ejemplo, para crear los polígonos porcentuales de cuadro de diálogo Select Data Sou¡ce haga clic en Add. E¡
la figura 2.12 de la página 50, abra la hoja de crilculo CPD-IG el cuadro de diriüogo Edit Series, ingrese la fórmula ="Sho¡
del libro de trabajo Bond Funds. (Esta hoja de cálculo con- Term Corporate" en Series name e ingtese la fórmula del
tiene una distibución de ftecuencia para los fondos de i¡ver- rango de celdas =CPD-STC|C4:C15 como Series values,
sión en bonos inten¡edios gubemamentales e incluye coiumnas Ha[a clic en OK. Vuelva al cuadro de diálogo Select Dat¡,
co-
oara los porcentajes y los porcentajes acumulados en las Source y haga clic en OK.
i
ir¡n¡as y D). Primero modifique la disribución:
Polígono porcentual acumulado (oj¡va)
1. Ingrese el encabezado de columna Midpoints en la
celda E3 e iagrese '-- en la celda E4 (la primera clase PHStat2 Modifique las instrucciones d'e PHStat2 pan
no tiene marca de clase) Inicie en la celda C5 e ingrese crear el histograma que se muestra en la página 80 con '
las marcas de clase -:7.5, -2.5,2.5,7,5,12.5,17.5' 22'5' finalidad de construir uo polígono porcentual acumuladr,
27 .5 y 32.5 enla colum¡a E. En el oaso 3 de esas insrucciones, haga clic en Cumulative
2, Seleccione el renglón 4 (el primer renglón de las cla- Percentage Polygon (Ogive) y después haga clic en OK.
ses), haga clic con el botón derecho y seleccione Insert
en el menú níPido. Excel en profundidad Construya un polígono porcentual
3. Selecciooe el renglón 15 (el total por renglón), haga clic acumulado modificando las instrucciones de Excel en pro'
con el botón derecho y seleccione Insert en el menú fundittad pata crear un polígono porcentual. Por
elemplo,
nioido. para crear los polígonos porcentuales acumulados de la fi'
4. lngrese 0 en las celdas C4, D4 y C15. gura 2.14, en la página 52, utilice las instrucciones para
5. Seleccione el ¡ango de celdas C3:C15. constuir polígonos porcentuales reemplazando los pasos 4
y 8 por lo siguiente:
Ahora construya la gfáfica:
6. Seleccione Insert t
Line y elija la cuarta opción 2-D 4. Seleccione el rango de celdas D3:D14.
Line (Line with Markers). 8. Haga clic en Edit bajo el encabezado de Horizontal (Cr
?. Haga clic con el botón derecho en la gnifica y luego en tegories) Axis Label. En el cuadro de di:ílogo Axis Labe\
Select Data en el meoú nfPido. ingrese la formrfa del rango de celdas {PD-IG!A4:AI4
para el Axis Label Range y haga clic en OIL
En el cuad¡o de dirilogo Select Dat¿ Source:
Después, cuando agregue el segundo polígono para los . f
8. Haga clic enEdit bajo el encabezado Legend Entries
dos in bonos corporativos a corto plazo, ingrese la fórmula
(Series). En el cuadro de diálogo Edit Series, ingrese la
del rango de celdas {PD-STC!IX:D14 como Series value
fórmula = "Intermediate Government' para el nom-
en el cu¿dro de diálogo Edit Series'
bre de la serie Y haga clic en OK.
9. Haga cüc en Edit bajo el encabezado Eorizontal (Cate-
{1I
gories) Axis Labels. En el cuadro de ditáLlogo Axis Labels'
GE2.ó PRESENTACIÓN GRAFICA DE DOS
-
il ingrese la formula clel rango de celdas {PD-IGID4:EI5 VARIABLES NUMERICAS
tl
para el Axis Labels Range y haga cüc en OI(
il¡l 10. De nuevo en el cuadro de diálogo Select Data Source, Diagrama de dispersión
tl haga clic en OK PHStatz Utilice el procedimiento Sc¡tter Plot para crear
Vuelva a la hoja gráfica: un diagrama de dispersión. Por ejemplo, para crear u¡l
diagrama de dispersión similar al que se muestra en la n'
11, Haga clic con el botón derecho en el eje vertical y luego DAT{ 1
Form¡t A¡is en el menú níPido.
en
#tzL.15 de la página 55, abra la hoia de cálculo ¿
Jt übro de traialo NBAValues. Seleccione PHStat2
12. En el cuadro de diálogo Format Axis, haga clic en ) Scatter Plot. En el cuadro de diá'
Descriptive Statistics
Number en el cuadro izquierdo y luego seleccione Per-
!,j
il
logo del procedimiento (que se muestra a conthuación):
t centage de la lista Categories que aparece en el cuadro
I izquierdo Number' Ingrese 0 como Decinal places y 1. Ingrese C1:C31 en Y Variable Cell Range'
I haga clic en OK. 2. lngrese 81:831 en X Variable Cell Range'
Reubique la grafica en una hoja gráfica y ajuste su fo¡mato 3. Marque First cells in each range contains label'
uúüzando las i¡shucciones de la sección F.4 de los apéndices' 4. Escriba un Título y haga clic en OK.
Guía del caoltulo 2 oar¿ Excel 83

GE2.7 ORGANIZAqÓN DE DATOS


MULTIDIMENSIONALES
Tablas de contingencia multidimensionales
Excel en profundidad Utilice las Tablas dinámicas para
crear tablas de contingencia multidimensionales. Por ejem-
plo, para crear la labla de la figura 2.18, que se muesha en la
página 59, sobre el tipo de fondo, el riesgo y las cuotas, abra
la hoja de cálculo DATA del libro de trabajo Bond Funds
y seleccioue Insert .) Pivot T¡ble. En el cuadro de diálogo
Create Pivot Table:

1. Haga clic en Select a table or rsnge e ingrese Al:I185


en Table/Range.
utilizar ta opción de salida Scatter Plot del
2. Haga cüc en New Worksheet y luego en OK
Simple Linear Regression para creal un
¿iro.oióo. Los diagramas de dispersión crea-
,. En el cuadro de tabajo Pivot Table Field (que se muestra
i altirnativa contendrán una línea sobrepuesta abajo)
se observa en la figura 2.15-
(Véase la Guía de
3, Anastre 1}pe en el recuad¡o Choose fields to add to
il capítulo 12 si desea revisar las instrucciones report y llévelo al recuadro Row Labels.
del procedimiento de Regresión lineal simple)'
r.
4. Arrastre Risk en el recuad¡o Choose frelds to add to
report y l1évelo al recuadro Row Labels.
Para crear un diag¡ama de disPer-
5, Arrashe Fees en el recuadro Choose lields to add to
i una hoja de cálculo en la que la columna para
report y llévelo al ¡ecuadm Column L¡bels.
la variable Xesté a la izquierda de la columna
6. A¡raste Fees en el recuadro Choo¡e fields to rdd to U'
de la variable /. (Si el orden de la hoja de
report por segunda ocasióa y llevelo al ¡€cu¿dro > Va-
I después X, corte y pegue la columna de la
y
lores. @sta etiqueta cambia a Count of Fees).
la derecha de la columna de la variable X).
o
nplo, para crear un diagrama de dispersión simi- o
obserrra en la ñgura 2.15 delapípa 55, ¿br¿ la o
DATA del libro de trabajo MAValues y; N
{
el rango de celdas B1:C31.
o
Imert t Scatter y elija la primera opción
Scatter (Scatter with only Markers).
Lavout ) Trendline ) Linear Tren¡lllne.

,la gráfica en una hoja gráfica y ajuste su for-


iándo l¿s instrucciones de la sección F.4 de los

series de tiempo
profundidad Constrüya una gráfica a partir de
cálculo en la oue la coh¡mna con los datos de la
aparezca inñediatamente a la izquíerda de
que contiene los datos de la variable numérica.
funciones cortar y pegar para reordenar las co-
uecesario).
para crear la gráfica de series de tiempo que
en la figura 2.16 de la página 56, abra la hoja de
en el libro de trabajo MovieGross y:

al rango de celdas Al:815.

En la Tabla dinrímica creada:

la gráfica en una hoja gr1fica y ajuste su for- ?. Haga clic en la lista desplegable Fees en la celda B3 y
las instrucciones de la sección F.4 de los seleccione Sort Z to A para reordenar las colum¡as
gráfica de los datos
84 CA¡ÍTI'LO 2 Organización y lresetrtaciól

8. Hasa clic duecho y luego haga


clic en Pivot Table Op- j'r) j,[X'fr"":]iJ[-t:n.*m'.',"::'.ml
l.Xffi '"'
tiois en el menú rápido que aparece' vdridble \afiasljardo la etiqueta Y
;:;;;;;;;ir."uadro ) ú¡lores) Para mostrar.ona i¡for-
Table Options:
En el cuadro de diálogo Pivot numérica' hag¿
& Format' rljo", ^i.*¿, de la suma de la variable
9. Haga clic en la pestaña Layout 0' Deje .il;ilÑ;t eríc loego hagclic en Vahre
variabley
l;.
--' ffiil;;;;;itv c'tt''
'no'"
v anote el valor
fl.ra S.niogt e ingrese los datos pertinentes
en et cuadr¡

in toong*".ion resmnte süc¿mbios' de diálogo Value Fb'd


tlaga cñ. en la pestaña Total
& Filters' llT?l'".u610 dinámica de la figur¿
ff. columns y Show grand
Por ejemPlo, Para crear la Ii
for qut tu:Tu
ii, i"rio". snt" grand totals
z.zi,otit¡o oe tonao, riesgo y cuotas' ll:
totals for rows rot .endimientos en 2009 (véase la págtna 60¡
iro."¿io, ¿É
f:. .li. OK para completar la tabla' J" r" f"¡f" di¡iímica de la figura
2 18' pnmero cons'
tf.gu
"o i o*f los pa'
Si construye una tabla dinámrca
a partü de un archivo i,.'li^il r"urt ¿t""-ca de Ia Írgura 2 18 utilizando con
JJ; ; i;; I*ección anterior' Luego continúe
de lus
postenor' el formato por defecto
.xlsx de Excel 2007 o
que presertan las
;i;ü di"át"i.. teni diferente del formato siguientes Pasos:
iJü' a'¿Jl ". q: j: :".vera el recuadro Choose fields to
|1;ilffi 3"1;,ii." 13. Arastre Return 2009 en
:^Y"¿
más, en el Paso 7 stemPre- "11
-' ffi;;;;;l [évelo alrecuadro ) Valores'
(Esta eti-
aparecerá en
¿. L Iista desplegable' la cual siempre 2009)'
""ttr. oo"o .u^tiu n Som of Return
la celda
- 93. r¿. irt*tt" Coo"t ofFees al recuadro
)
Values y c'
^*
ptu *ort u. tos valores de la celda como polcenta3es' '-' lugar fuera de ese recuadro'
de la página60' haga 0".f" ." *tfq"ier
."t"1" ftir" ." r"s figuras 2 20 y 2'21ta¡eas rs. il.g. .ri. tt's"t oi Rttuto 2009 y luego en value
Pivot Table Field
ó".ta r""J"n el p'nti de Fie-ld Settings del menú ráPido'
"li"^." "r
ffi ;,;"*ü1:\:{*:::."*11ftfi ",';.,;!fil:;
\ En el cuadro de diálogo
Value Field Setdngs (que se
mues
oido. En el cuadro de dlalogo
I muestra abajo): üa abajo):
Values by y selec'
Values' ló. Haga clic en la pestaña.summarize
I.Haga clic en la pestaña Show Sun of Retun
% of Grand Total de la üsta desplegable cione Average en esa trsra' La etiqueta
,. l"ñ."i"^. 20(D'
2-0-09 cambia'a 'tverage of Return
Show Values'
17. Haga clib en OK'
3. Haga clic en OK'

Suma de variables numéricas y la Presentacón de los dect


a Aiuste el formato de la celda
Excel en profundidad Agregue una variable numérica r" *q"iera (véase el apendice l)'
ra etiqueta de una variable
.'"r.. *g"i
una Tabla dinámica arastranoo
Guía del caDítulo 2 Dara Militab 85

IÓN DE DATOS Para crear los otros tipos de tablas de contingencia que se
muestran en las tablas 2.4 a2.6, modifique el paso 3 utili-
óÁreaónlcos zando otros elementos de Display adicionales.

Variables para oear una tabla-resumen. GM2.3 ORGANIZACIÓN DE DATOS


. iara crear
una a¡la-resumen similar a laabla22 NUMÉRICOs
, it, .U. tu to¡"
de cálculo Bond Funds. Selec-
Datos agrupados y no agrupados
Table + Tally Indiüdual Variables. En el cua-
Utilice Stack o bien, Unstack Columns para reordenar los da-,
del procedimie¡rto (que se muesta abajo):
tos. Por ejemplo, para desagru.par la variable Return 2fi)9 en
clic en C9 Risk de la lista de variables para la columna C6 de la hoja de qilculo Bond Funds, abra esa
Risk al cuadro de Variables. hoja de cálculo, seleccione Data i
Unstack Columns. En el
y Percents. cuadro de diálogo del procedimiento (que se muestra abajo):
en OK.
l. Haga doble clic en C6 Return 2009 en la lista de varia-
bles para agregar 'Return 2009' al cuadro Unstack the
Data in y presione Tab.
2. Haga doble clic en C2 llpe en la lista de variables para
agregar Type al cuadro Using subscripts in.
3. Haga clic en After last Column in use.
4. Marque Name the Columns containing Unstacked o
Data. =
5, Haea clic en OK.
o
o
o
N

contingencia
Tabulation and Chi-Square para crear una
ia. Por ejemplo, para construir una tabla
similar a la tabl¿ 2.3 de la página 29, abra la
Bond Funds, seleccione Stat t Tables )
and Cbi-Square. En el cuadro de diálogo del
(que se nuestra abajo):

Tlpe en el cuadro For rows.


Fees en el cuadro For columns.
Counts. Minit¿b inserta dos colum¡as nuevas, Return 2009 l¡ter-
clic en OK. mediate Government y Return 2009_Short Term Corpo-
rate, nombres que puede modificar.
Para agrupar columnas, seleccione Data i Stack t Co-
lumns. En el cuad¡o de diálogo Stack Colurnns, agregue los
nombres de las columnas que contienen los datos que desea
agrupÍu en el cuadro Stack the following Columns; luego,
haga clic en New worksheet o Column of current work-
sheet y elija ei lugar para almacenar los datos agnrpados.

Arreglo ordenado
Utiüce Sort para crear un arreglo ordenado. Seleccione Data
t Sort y en el c.radro de dirí{ogo Sort (que no se muesta) haga
doble clic en el nombre de una colunma en la lista de variables
para agregarla al cuadro Sort Column(s) y luego presione
7
8ó CA-P1TULo 2 organizacióo y presentaciótr griflca de los datos

en la
Tab. Haga doble clic en el nombre de la misma columna
lista de iariables para agregarla al primer cuadro By Column'
Haga clic en Niw worksheet, Original Column(s) o
Coiumn(s) of current worksheet. (Si elige la tercera opción,
colo-
también ügrese el nombre de la columna en la que desea
car los datos ordenados en el cuadro). Haga cüc en OK'

Distribución de frecuencia
Minitab no cuenta con comaúdos que utilicen clases que us-
ted especifique para crear distibuciones de frecuencia como
las qui se oüservan en las tablas 2.8 a 2'11' (Véase
t¿nbién
el apartado "Histograma" en la sección GM2'5)'

Si sus datos est¿n en el fornato de una labla de frecuencias,


GM2.4 PRESENTACIÓN GBÁFICA
-"'-'' seleccione Values fron a table en la lista desplegable Ban
be-bÁros cArEcÓRlcos represent en el paso 1. Con esta selección' al hacer clic en
Gráfica de barras y la gráfica circular Ok en el paso 3 aparecerá el cuadro de diálogo "Bar Chart
- Values from a table, One column of values, Simple"
Utilice Bar Chart pará crear una gnifica de banas a parhr
para crear ma grá- este cuadro de diálogo, ingese las columnas que se rnclu]
de una tabla-resumen y utilice Pie Chart
fica ctcular a partt de una tabla-resumen Por ejemplo,
para rán en el cuadro Graph variables y, de manera opcional,
crear la gnifica de barras de la figura 2.2 que se muesüa
en Ia ilgrese la columna en la hoja de crálculo que contrene lar
oisúa it,abra la hoja de cálculo Bond Fnnds, seleccione categorías para la tabla en el cuadro Categorical variable'
'Cñart + Útiüce Pie Chart para crear una gráfica circular a padir
Bar Chart. En el cuad¡o de diálogo del procedi-
gnáúca cinu
miento (que se muestra abajo): ds ,,na tabla-r€sumen. Por ejenrplo, para crear la
lar de la figura 2.4 óe la págiu 42, abra la hoja de cálculo
1. Seleccione Counts of unique values de la lista desple' )
Chart Fie' En el cu¿d¡¡
Bond Funás. Seleccione Graph
gable Bars rePresent. (que muestra abajo):
de diálogo del procedimiento se
2. En la galería de opciones, haga clic eu Simple'
3. Haga clic en OK' l. Haga clic en Ch¡rt counts 0f unique values y presione
Tab.
2. Haga doble clic en C9 Risk en la lista de variables pan
agegar Risk a Categorical variables'
3. Haga clic en Labels.

iii
rli
il

.
iiii
i[
li'
,il En el cuadro de diálogo Pie Chan - Labels (que se muestr¿

values, en la parte superior de la página 87):


En el cuadro de díáiogo Bar Chart - Counts of unique
Simple (véase la parte superior de la siguiente columna): 4. Haga clic en la pestaña Slice Labels'
en C9 Risk en la lista de variables para 5. Marque Category name Y P€rcent.
4, Haga dobie clic
6. Haga clic .obK pu.o t.gt.sar al cuadro de diá1090
agegar Risk a Categorical variables'
orieinal.
5. Haea clic en OK.
Guía del capítulo 2 para Minitab 87

En el cuadro de diálogo "Bar Chart - Counts of unique


values, Cluster" (que se muestra abajo):

4. Haga doble clic en C2 Tlpe y C4 Fees en la lista de


variables para agregar Type y Fees al cuadro Categori-
cal variables (2-4, outermost first).
5. Hasa cLic en OK.

cuadro de diálogo Pie Chart original:

cüc en OK'

de Pareto
Chart paÉ crear una gráfica de Pareto. Por
construir la gráfica de Pareto de la figura 2.5,
en la página 43, abra Ia hoja de cálculo
Seleccione Stat t
Quality Tools t o
En el cuadro de diálogo del procedimiento GM2.5 PRESENTAqÓN GRAFICA DE =
abajo): DATOS NUMÉRICOS
o
doble clic en Cl Cause en la iista de variables Diagrama de tallo y hoja o
Cau¡e al cuadro Defects o attribute data. o
Utilice Stem-and-Letf para crear un diagrama de tallo y N
doble clic en C2 Frequency en la lista de va¡ia-
hoja. Por ejemplo, para crear el diagrama de tallo y hoja de N
agregar Frequency al cuadro Frequencies in.
la figura 2.8, qúe se muestra en la página 48, abra la hoja
clic en Do not combine.
clic en OK.
de cálculo Bond Funds, seleccione Graph t
Stem-and-
Leaf. En e1 cuadro de diálogo del procedimiento (que se
muestra abajo):

1. Haga doble clic en C6 Return 2009 en la lista de varia-


bles para agregar 'Return 2009' en el cuadro Graph
Variables.
2. Haga clic en OK.

de barras agrupadas
Bar Chart para crear una gráfica de barras agrupa-
ejemplo, p¿ra crear la gráfica de barras agrupadas
2.7. que se muestra en la página 45, abra la
e cálculo Bond Funds. Seleccione Graph )
Bar
En el cuadro de diálogo del procedimiento:

Counts of unique values en la lista desple-


úe Bars represent.
la galería de opciones, haga clic en Cluster.
clic en OK.
de los datos
88 CAPÍTULO 2 organúación y preserrtación $áfica

Histograma
Por ejemplo'
Utilice Histogram para crear un histograma'
la figura 2 10' qre se
;;;;;t.t. .l ia, d. histog'amasladehoja de-cálculo Bond
i"""r"l" ii ou*ina 4qlabra
Funds. seleccione Graph
) Histogram- bn el cuaoro uc
abajoJ:
diálogo Histograms (que se muestra
clic en OK'
1. Haga clic en Simple y luego haga

- Simple:
Vuelva al cuad¡o de diálogo llistogram

7. Haga clic en OK.


que difieren de las
Los histogramas creados utilizan clases
2 9 de la
t" i--" en la figura 2 10 (y en la tabla
"'r. ",if
;il; tt) v no utilizan las marcas de clase que se observa¡
que
tO. Para ajustar mejor los hlstogamas
se
.niu ngu. Z.
histogn¡aa:
- Simple (que se muestra presenán en la figura 2 10 para cada
En el cuadro de diálogo Histogram
en el eje Xy luego hagl
abajo): E. Haga clic con el botón derecho
Return 2009 en la lista de vana- clic en Edit X Scale en el menü rápido'
en C6
-' Haga doble clic
2.
Graph
;;: ;;;".gar 'Return 2009' en el cuadro En el cuadro de diálogo Edit X Scale
(que se muesma abalo):

variables. müestra.aba¡ol
en la pestaña Binning {que se
3. Haga clic en MultiPle GraPhs' '' Haga clic
9.
* Cttpoint (como Interval Tlpe) y Midp^o'
fi"g"
"ii.
inltutpoint poiition' y escnba -10 -5 0 5 10 15 2{
^"'l¡
entre
zS ¡O:i ¿"n io del cuadro (con un espacio
valor).

lfl
,ri l
ti\
[]
¡t
1i

- Nlultiple Graphs:
En el cuadro de diálogo Histogram
'!ili
1;r
no se muesrre)
{. En la pesraña Multiple variables (que haga
- clic en la
ii ;u^gJil .o ,"p","it graphs y luego
oestaña Bv Variables'
pane
ri -' É" i"
s. p.t*. ny Variables (que se muesra en la
Type en eL
*p"rio, de la siguiente columna) ingrese grapns'
.u'u¿ro sy V"ri"bles in groups
0n separate
6. Haga clic en OK'
cuía del capítulo 2 para Minitab 89

en la pestaña Scale
(que se muestra abajo). En el cuadro de diálogo Histogram - Scale:
en
position of ticks y escriba -7.5 -2.5 2.5
5. Haga clic en la pestaña Y-Scale Type. Haga clic en
fl.5 22.5 21.5 32.5 dentro del cuadro (con un
Percent, quite la ma¡ca de Accumulate values across
valor)'
e!üe cad¿ bins y después haga cüc en OK.
en OK'
Vuelva al cuadro de diálogo Histogram - Simple:

6. Haga clic en Data üew.


En el cuadro de diálogo Histogram - Daia view:

7. Haga clic en la pestaña Data display y luego marque


Synbols.
8. Haga clic en la pqst¿ña Smoother y luego haga clic en
Lbwness y escriba 0 er el Degree of Smoothing y I ,
en Number of steps.
9. Haga clic en OK
Vuelva al cuadro de diálogo Histogram - Simple:

10. Haga clic en OK para crear los polígonos.

Los poligonos porcentuales creados utilizan clases que di-


ñeren de las que se usaron en la figura 2.12 (y enlatabla2.9
de la página 34) y no utilizan las marcas de clase que se
muestran en la figura 2.12. Para ajustar mejor los polígonos
que se muesran en la figura 2.12:
v,
11. Haga cüc con el botón derecho en el eje X y luego haga
el histograma de los rendimientos en 2009
cüc en Edit X Scale en el menú úpido.
fondos en bonos, rqrita los pasos I a 11, pero o
'5 elimine Type del cuadro By Variables in En el cu¿dro de diálogo de Edit Scale: o
graphs- En general, si no creó hísto-
o
12. Haga clic en la pest¿ña Binnirg. Haga clic en Cutpoint N
(como se hizo en el ejemplo), enton-
en Interval Type y Midpoint/Cutpoint postions y es-
{
(¡t
pasos I a 4 modificando el paso 4 por "Haga
criba -10.-5 0 5 10 15 20 25 30 35 dento del recuadro
para crear un solo histograma que contenga to-
(con un espacio enüe cada valor).
de una variable.
13. Haga clic en la pestaña Scale. Haga clic en Position of
las bar¡as del histograma, haga doble
ticls y escriba -7.5 -2.5 2,5 7 .5 12.5 17 .5 22.5 27 ,S 32.5
barras y realice las anotaciones y selecciones
'el dentro del recuadro (con un espacio ente cada valor).
cuadro de diáloso Edit Ban. Para modificar
14, Haga clic en OK
doble clic en el eje y realice las anotaciones y
adecuad¿s en el cuadro de diáloeo Edit Scale.
Polígono porcentual acumulado (ojiva)
porcentual Si tiene acceso a software para edición de imágenes o foto-
para crear un polígono porcentual. Por grafias, utilice las instrucciones en la sección "Polígono
crear el par de polígonos porcentuales que se porcentual" para crear un polígono porcentual ¿cumulado.
la frgxa 2.\2 de la página 50, abra la hoja de /
En el paso 5 haga clic en Percetrt marque Accumulate
2009 Unstacked, seleccione Graph t values across bi¡s y después haga clic en OK. En este mo-
En el cuadro de diálogo Histograms: mento, los puntos de los datos se graficarán (de manera in-
conecta) hacia las marcas de clase y no hacia el ñnal de las
en Simple y luego en OK. clases (los puntos de cofe). Con la gráfica ¿bierta, selec-
de diálogo Histogram - Simple: cione File ) Save Graph As y guarde la gráfica en un for-
mato S¡ve ¡s type que sea compatible con su software para
clic en Cl Intermediate
Government en edición de imágenes o fotografias. Abra el software y reem-
de variables para añ¿dir .Intermediate Govern-
place las etiquetas del eje X (las marcas de clase) con los
a cuadro Graph variables.
datos adecuados del punto de corte.
doble clic en C2 Short Term Corporate en Ia
De otra forma, utilice Scatterplot con columnas de
variables para añadir ,Short-Term Corporate'
datos que representen una distribución porcentual acumu-
o¡o Craph Variables.
lada para crear un polígono porcentual acumulado. Por
cllc en Scale.
ejemplo, para creu los polígonos porcentr:ales acumulados de
:-=:'
90 cAPiTULo 2 érganización y presentación gráfica de los
datos

l3 sobre el costo de los alimentos en ¡estaurantes


la fieu¡a 2.
.iüáioot t subu¡banos, abra la hoja de cálculo Rest¿urant
óu.u1",i". p..."ntages y seleccione Grapb ) Scanerplot'
En el cuad¡o de diálogo Scatterplots:
y en OK'
1. Haga clic en With Connect Line luego
Connect Line
En el cuadro de diálogo Scatterplot- With
(que se muestra abajo):
en la lista de
2.
-' Haga doble clic en C2 City Restaurants
en la celda Y
uJÁi.t o.u .olocar 'City Restaurants'
variableJrow 1.
clic en Cl Cost of Meal en la lista de va-
'f. Uaia dotle
;ffii.; para colocar 'Cost of Meal' en la celda X Gráfica de series de tiemPo
variables row l.
en ta
4. Haga doble clic en C3 Suburban Restaurants Utilice Time Series Plot para üear una gnífica
de series ¿¡

i"r"" ¿. variables para colocar 'suburban Restau- tiemDo. Por eiemplo, para crear la gáfica
de la figura 2 16'
rants' en la celda Y v¡riables row 1' qu. ," tu.rhu I a p6gna 56, abra la hoj a de cálculo Mo

S. nala dotle clic en Cl Cost of Meal en


"'
la lista de va- y seleccione Graph t Time Series Plot E[ el
"o
Juti", put" ingresar 'Cost of Meal' en la celda X "i.G"ott
cuadro de diálogo Time Series Plots:
variables row 2.
1. Haga cüc en SimPle Y luego en OK'
6. Haga clic en OK.
en la etiqueta -
En el cuadro de diálogo Time Series Plot Simple
(que st
En la práfica, haga clic con el botón derecho
Label del menú
il;ít;il"dhaga clic en Edit Y Axis muestra abajo):
r¿-oiá". e" el iuadró de diálogo Edit Axis Label' ingrese
'fít.üt"g" 2. Haga doble clic en C2 Combined Gross en Ia list¡
.o .r .uadro de teito y luego haga clic en OK: Gross' al cuadm
de iariables para agregar 'Combined
Series.
3. Haga cüc en Time/Scale.

GM2.ó PRESENTACIÓN qRAFICA DE DOS


Í'i VARIABLES NUMERICAS
{i Diagrama de disPersión
dispersión'
Utilice Scatterplot para crear un diagrama de
roi.¡..pto, p"tu "t ". un diagrama de dispersión similar al (que
j. En el cuadro de diálogo Time Series Plot - Time/Scale
il r" tu.ti.u en la ftgura t s dt tu página 55' abra la página 91):
"""
üoia de cálculo NBAValues, seleccione Graph
t Scatter- se muestra en Ia parte superior de la

plot. En el cuadro de dirílogo Scatterplots: 4. Haga clic en Starnp y luego presione Tab'
u 1. Haga clic en With regression y luego en OK' -' Haia doble clic eril Year en la listacolumns
5. de variables pari
(1-3' ir'
;;';;;t;"..n el recuadro stamp
regression (que
En el cuadro de diálogo Scatterplot With
- nermost first).
I se muestra en la parte superior de la
siguienie columna): 6. Haga clic en OK.

2. Ingrese Y-alue en la celda row I Y variables'


I
Vuelva al cu¿dro de diá1ogo Tine Series Plot- Simple:
3, inlese Revenue en la celda row I X vrriables' OK
7. Haea clic en
4. Haga clic en OI(
t
Güa del capítulo 2 para Minirab 91

l. Haga doble clic en C2 Tlpe en la lista de variables para


agregar Type al recuadro For rows.
Haga dobie clic en C9 Risk en la lista de variables para
agregar Risk al recuad¡o For rows y luego presione
Tab.
Haga doble clic en C4 Fees en la lista de variables para
agregar Fees al recuadro For Columns.
Hasa clic en Associ¡ted Yariables.

'oRGANtzActóru oe DATos
MIJLTIDIMENSIONALES
contingencia multidimensionales
Tabulation and Chi-Square para crear una
multidimensional. Por ejemplo, para
i abla similar a la de la figura 2.18 de la página 59,
,tipo de fondo, el riesgo y los costos, abra la hoja de
Funds y seleccione St¡t t Tables ) Cross
ond Chi-Square. En el cuadro de diáiogo del o

doble clic en C2 Type en la lisa de variables para En el cuadro de diálogo Descriptive Statistics - Summaries o
I}pe al recuadro For rows. Associated Variables (que se muestra abajo): o
doble clic en C9 Risk en la lista de variables para
o
5. Haga doble clic en C6 Return 2009 en la lista de varia- N
Risk al recuadro For rows y luego presione \¡
bles para agregar 'Return 2009' al cuadro Associated 5
Vari¿bles.
doble clic en C4 Fees en la lista de variables oara
ó. Marque Means.
Fees al recuadro For Columns.
7. Haga clic en OK.
Counts.
clic en OK. Vuelva al cuadro de diálogo Table ofDescriptive Statistics:

Ios valores de las celdas como porcentajes, 8. Haea clic en OK.


hizo-en-lasfiguras 2-20 y 2.2Lde la-página 60,
Total percents en lugar de Counts en el paso 4.

variables numéricas
Statistics para crear una labla de con-
multidimensional oue contensa una variable nu-
ejemplo, para crear la tabla de Ia fr,glna2.2z qlre
en la página 60. sobre el tipo de fondo, el riesgo y
la cual muestra los oromedios de los ¡endimien-
, abra la hoja de cálculo Bond Funds y selec-
t Tables )Descriptive Statistics. En el cuadro
Table of Descriptive Statistics (que se muestra
Medidas numéricas
descriptivas

DE LA EsrADlSTlcA en
Exploración de datos 3.ó EstadísticadescriPüva.
uso Desventaias y asPectos
ll numéricos
Choice ls Yours, Parte éticos
Cuartiles
Rango intercuartil
3.'l Medidas de tendencia
Resumen de los cinco Revisión del USO DE LA
central ESTADISTICA en Choice ls Your.
números
Media parte ll
Diagrama de caja
Mediana
Moda GUíA DEL CAPíTULO 3 PARA
Medidas numéricas
descriptivas Para una EXCEL
3.2 Medidas de variación población
y de forma GUíA DEL CAPÍTULO 3 PARA
Media poblacional
Rango MINITAB
Varianza Y desviación
Varianza Y desviación estándar de una Población
estándar
Regla emPírica
Coeficiente de variación
Regla de ChebYshev
Yalor Z
Forma
Covarianza Y coeficiente
de correlación
EXPLORACIONES Covarianza
VISUALES: Coeficiente de correlación
ExPloración de estadísticos
descriPtivo:

¡1

ril
il

1l

jfi
,i.:
:i:

En Choice Is Yours, parte II

as tablas y las gníñcas que preparó para la muesta de 184 fondos de inve¡sión en bonos
han sido útiles para los clientes del servicio Choice Is Yours. Sin embugo, se sienten
frustrados al tatar de evaluar el desempeño de los fondos en bonos. Aunque saben cómo
se distribuyeron los rendimientos de 2009, no tienen idea de cuál fue la tasa de rendi-
miento en ese año para una categoía especlfica de los fondos en bonos, como los inter-
gubernamentales y los corporativos a corto plazo. Tampoco conocen la magrrinrd de la
idad en la tasa de rendiniento de 2009. ¿Todos los valores son miás o noenos iguales, o inclu- a,
muy bajos y valores muy altos? ¿Hay muchos valores bajos y pocos altos, o sucede lo
? ¿Acaso la cantidad de valores bajos es simila¡ a la de valores altos?
podrían las respuestas a estas pr€gunt¿s ayudar a los clientes a evaluar mejor los fondos o
o
en bonos? o
N
{
or

Do! F.E¡¡VCúty ¡E¡96 93


r
94 CAPÍTULO 3 Medidas nu:nericas descriptivas

plantea1¡o
os clientes de la segunda parte de
la sección referente a Choice Is Yours estan
p..g** ti1¡
""*."
¿e-variables numéricas, luando.sre ryt::H:^::t:*":T:ltT
*
.1#;,ñ;;; *op"p* lastabtasv grár:cas que T:t11:1,:1:],1"1]tt:?'
hs medidas de tendencia cenüal, la variación
y la fonm ¡6
t¿mbién es necesano ,o.* .n .o"ju
cada variable numérica.

MEDIDAS DE TENDENCIA CENTRAL


Las meclidas de tendencia.central indican
el grado en que los valores de los datos se
agnrpan alrededor de un valor típico o central'

VARIACION
a partir de un
La v¡riacién es Ia oantidad de dispersión o tlisemiración de los valores
valor cental,

FORMA
valores' descle el m'ís bajo hasta el más alto'
La forma es el patón de Ia distribución de

Enestecapítuloseestudiaránfofmasparamedirlatendenciacentral,lavariaciónylaforrra los cuale


to .ouarianza y el coeficiente de correlacióq
de una variable. También se .rtudi*ío
aw<lan a médir la fuerza ¿t tu árc dos variables numéricas' El uso de estas medidas dani
"futi-
Is Yours las respuestas que buscan'
.ii*,., ¿"t tervicio Choice
"'ro.

3.L Medidas de tendencia central


Lamayoríadelosconjuntosdedatospresentanunatendenciadistintivaa¿g'upafs€alrededo¡de
.,valor promedio", sobre el "valor interme'
sobre un
un valor central. cu-ao m p.ooi"r'hablan mediana y la
dio" o sobre el "valor más ftecu.o|""' t;;;f;t
de manera informal a la media" la

mocla, tres medidas de tendencia central'

Media
media) es 1a medida de tendencia central
má¡
La media aritmética (generalmente denominada
'*-,¡"lL ei mrsmo pa'
."Ji" .s l"'inic" medida común en la que todos los valoresdedesempeñan
(como el punto 0e
t.L L" á.¿i" tf*. .oto "p*to .e equilibrió" en un conjunto datos
* de datos y
sumando todos loi vaiores en un conjunto
aoovo en un sube y U"¡a¡. L" meAia se calcuia
,i#il¿ilJr ,"1ít ¿" ,u-u entre el número de valores en dicho conjunto.
-"t;ilH;;;?"ii^l^¿i "¿o i "r" uru p.u representar la. media de una muestra.
tá*i,'r. Pafa ur8
se escribe como:
.u"rü qu. .ontiá. n valores' la ecuación para calcular la meüa

suma de los valores


número de valores
€l
¿ valores y z para represenur
Al utilizar seieX, Xr,...' X,para r€presentar el conjunto de
la
se conüerte en
número de valores ao lu auttt4 la ecuación

x= xr+xz+'+x,
n

A)'
con det¿lle en el apéndice
A continuación se utiliza la notación de sumatoria (que se analiza
para reemplazar el numerador X, + X2+'- + Xnconel término
iX" que significa sumar todos 106
3.1 Medid8s de tcDd€ncia cental 95

valores x, desde el primer valorx,4, hasta


el último valor,{, x", para formar la ecuación (3.1)'
que es una deñnición fon¡al de la
media muestal'

MEDIA MUESTRAL
La media muestr¡l es la suma de los valores en una muesta, diüdid¿ entre el número
de valores eú la muesÍa.


(3.1)
n'

donde j:'
:
.i media.muestial
z: número de valores o tamaño de ia muesta
X, = j-ésimo valor de la vaiiable ,Y

\r.
,Z¿"r = sumatoria de todos los
valores .& en la mueshr

por
Puesto que todos los valores desempeñan el mismo papel, la media se ve muy afectada
cualquio valor que sea muy diferente de los demás. Cu¿ndo existen este tipo de valores tan exte- o
mos.ie debe evitar el uso de la media como medid¿ de tendeucia cental'
La media sugiere un valor típico o cental para un coojunto de datos. Por ejemplo, si usted sabe
=
clrioto tiempo, por lo general, le toma prepararse para salir en la mañan4 podría planear mrcjor su o
rutina y reclucir al mínimo cualquier retraso (o anticipación) para salir a zu destino. Siguiendo el o
o
nétodó <h Oefini¡, Reunir, Organizar, Presentar gníficamente y Analizar, lo primero que hay que N
hacer es definir el tiempo qrr nos toma preparamos para salir como el tiempo (redondeado al mi-
ot
nuto más cercano) que transcurre a partir de que nos levaltamos de la cama hasta que salimos de
casa. Luego, los siguientes tiempos para
t"uoi-or l0 dlas l¿borales consecutivos (los cuales se
encuentran alnacenados en el archivo @$:
Día: 34 678910
Ttempo (minutos): 39 29 43 52 39 4 4 31 4 35

El primer estadlstico que se calcula para analizar esos datos es la media. Para esos datos, la
media del tiemoo es de 39.6 minutos, calculada como sigue:

suma de los valores


x= nrlmero de valores

i=l
x= n

39 + 29 + 43 + 52 + 39 + 44 + 40 + 31 + ¿14 + 35

10

=38
10
= 3e.6

Aunque ningún día en la muestra realnente tuvo el valor de 39.6 minutos, dedicar alrededor de
40 minutos a prepararse para salir sería una buena regla para planear las mañanas. La media es una
buena medida de tendencia cental en este caso, ya que el conjunto de dato, oo .o¡1¡sne ningún
valor excepcionalmente pequeño o gande.
:--- I
96 cA¡rIfJLO 3 Medidas numéricas descriptivas

Considereutrcasoenelqueelvalordeldía4es102mi¡utos,enlugarde52.Estevalo¡
a 44'6 minutos' como stgue:
extemo causa que la media aumente
suma de los valores
número de valores

2x,
,
-Y
'^ =Y9
l0
= M.6
con la media
la media de 39'6 a'14'6 min¡tos' En contraste
Ese único valor extremo incfementó tiempos que loma prepa'
..en
il"#i;r; ,;;;"*ba el cenro" ies decir, era mayor que 5 de los
mavor que e de los'10 tiempos
#;il J;;;;;;i q,,. ro' ono-'JtiJ'po'¡' L ootuu
"&aes
ta media dejó de ser una meüda de te¡'
;ffi;;;ó;;;"'l *ri'' o'úiÁ "i-vitor
ext'eno'
denciacenral adecuada.

(almacenado
ffi mues[a de siete cereales para el desayuno
EJEMPLO 3.1 incluve el número de calorías por porción:
;i;.hi;; @
La media de las
C¡lorí¡s
calorías en los Cere¡l
cerealeS 80
All Bran de Kellogg's
100
Com Flakes de Kellogg's
100
Wheaties
Path 110
Organic Multigrane Flakes de Na¡¡re's
130
Rice Krispies de Kellogg's
Post 190
Shredded Wheat Vanilla Almond de
200
Mini Wheats de Kellogg's
en esos cereales para el desayuno'
Calcr¡le la media del número de caloias
que se calcula como sigue:
soLucóN El número metlio de calorías es 130,
suma de los valores
número de valores

(.')
X:
910
=_=IJU
7
\{f
ilt
ril
Mediana
il
lt, Lamedianaeselvalori¡temredioenunconjuntodedatosofdenadodemenoramayor'Lamitad
son mayores o iguald
'il de los valores sdn menores tg;t ;ü"-;;;.t* ; ü-titu¿ ¿t tot uotores útil cuando exrso
t."ü"rt'"[" p"i""l"tit'é*tr"mos' po' lo r€sulta
,
que
rr[1 ;;;#i;;;;
lrü
r.tii'
l, ll
""$HH*Ti"di-" dr-.*junto dedatos, primrcro se ordenanlos varores.el
ji"i'it-JJt
nenor al.m¡-
que se ubica la mediar
en el
,
.""r"iot iuiroGioo a"r
yor, y luego se utiliza r" t: "ur*
'x
MEDIANA
I i',
t:t n1-!""1o, *6*¿¿6 (3:)
Mediana =
3.1 Medid¿s de tendcncia cental 97

La meüana se calcula siguiendo una de las siguientes dos reglas:


. Regta I Si el conjunto de datos contiene un oúmero impar de valores, la mediana es el
valor asociado con el dato ubicado a la mitad.
. Regla 2 Si el conjunto de datos contiene un número par de valores, la mediala es el valor
asociado con el prorn edlo de los dos datos ubicados a la mitad.

Para analizar con mayór detalle la muesta de los 1 0 tiempos que toma prepararse para salir en
l¿ m¡ñena, podemos calcula¡ la mediana. Para ello se ordenan los tiempos diarios de la siguiente
manera:

Yalores ordenados: 29 31 35 39 39 40 43 44 44 52
Posición12345678910
T

Mediana : 39.5

Como el ¡esultado de dividir n + 1 ente 2 es (10 + 1/2 = 5.5 para esta muesüa de 10, debernos
utilizar la regla 2 y promediar las mediciones asociadas con el quinto y el sexto valores ordenados,
39 y 40. Por loluto, la mediana es 39.5. La mediana de 39.5 significa que, la mitad de los dlas, el
tiempo que toma prqrarane para salir es menor que o igual a 39.5 minutos y que, para la ota mitad
de los días, ese tiempo es mayor o igual que 39.5 minutos. En este caso, el ti€mpo medio de 39.5
minuios que toma prepararse para salir estri muy cerca de la media de tiempo que üon¿ esa activi-
da4 que €s 39.6 minutos.
o
=
3.2 Los datos nutricio¡ales acerca de una muestra de siete cereales para el desayuno (almacenados en o
incluyen el númoo de calorías por porción (véase el ejemplo 3 . I de la página
o
de la
el archivo !@$ o
96). Calcule la mediana del número de calorías en los c€reales para el d€saymo. N
de una
con SOIUC|ÓN Como el resultado de dividir z + I ente 2 para est¿ muestra de siete es, utilizando la
regla 1, (7 + l/2 = 4, la mediana es el valor asociado con el cuarto dato ordenado. Los datos del
número cle calorías por porción están ordenados del menor al mayor:

Talores ordenados: 80 100 100 ll0 130 190 200


Posicíón:1,234567
t
Mediana = 110

La mediana del número de calorías es 110, La mit¿d de los cereales para el desayuno tiene una
cantidad de calorías igual o menor que 1 I 0 por porción, y la mitad de los cereales para el desayuno
tiene una cantidad de calorías igual o nayor que 110.

Moda
La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. A difereucia de la
media y al igual que la median4 los valores extsmos no afectan a la moda. En ocasiones no existe
una moda en rm conjunto de datos, o bien, se encuentan varias de ellas. Por ejemplo, considoe los
sigurentes datos sobre el tiempo que toma prepararse para saiir:

29 31 35 39 39 40 43 44 44 52

Se observan dos modas, 39 minutos y ¿l4 minutos, ya que cada uno de esos valores se Pr€seúta dos
veces.
v
98 CAIiTULO 3 M€didas numédcas descnptlvas

de la recl de una empresa.lleva un registro del


nírmero ¡s
EJEMPI-O 3.3 U" *t."" d**"-.*"e está adia.cargo
ñetermine la moda para los siguientes datos, los cuales repre.
u..á qo" rdlu * sewidor en un
Cálculo de la r"r*I t".oo ¿. veces que falló el servidor cada dia de las dos últimas semanas'
mooa
130326274023363
SOLUC¡óN El aneglo ordenado para estos datos es

001223333346726
que cualquier otro valor' la moda es 3' Por consi"
Puesto que el 3 se presenta cinco veces, más
falle tres veces en u!
;;;;"];it.;; le sist"m"s afrma quq 1o más.común es que el ser'idor
día. Para este conjunto de ütos' r" ttal^ou
tut¡le" es igual a 3 y la media es igual a 4'5' El nir'
p"tu .tto, datos, la mediana y la moda son mejores medidas de ten'
mero 26 es un valot €xtemo.
dencia central que la media.

de los valores es el "más común"' En el ejero


Un conjunto d€ datos no üene moda si ninguno
üene mooa-
3.4 se present¿ un conjunto de datos que no

de l0 bancos son:
f^ *.¡iooo ($) por emitir cheques sin fondos para una muestra
EJEMPTO 3.4
Datos sin moda 26 28 20 2t 22 25 i8 23 15 30
Caicule la moda.

Estos dalos no tie¡en moda- Ninguno de los


valores es el más común, ya que cada
sotucÉN
número aparece solo una vez.

3.2 Medidas de variación Y de forma


conjunto'de datos'se puede-describir de acueúo
Ademas de las medidas de-tendencia=centai;.cada
de los valores en un con'
;;;;;";ló" y forma. La variación micte la ¡tistribución o dispersión
el rango' es decir' la diferencia enhe el
lalot
iunto de datos. Una medida sencil" ¿" "J"liOt "t desviación *'
en estadística, es mrtu común utilizu la
lt" ñ¿" .flÁv p.qrrn" Sin embugo,
La forma de u
',i¿", más adelante en esta sección'
tandar y la varianza, dos medidas que sJ explican
conjunto de datos represenra un p.'ii" á"
il valores, desde el más pequeño hasta el
nás

muchos conjuntos de tlatos tienen unp&


grande. Como vercúos posrcnormente en esta sección'
se ubican a t¡
hón que se ve más o taoo, aorno *"
campana' en el cual la mayoría de los valores
mitad

Rango
Elraneoeslameditlanuméricadescriptivadevariaciónmrissencillaenunconjuntodedatos.

RANGO
miás pequeño'
El rango es igual al valor más grande menos el valor

(33)
Rango = .X.* o*u" - 4* n**""

)
3.2 Mcdidas de va¡i¡ción v de forma 99

Para analizar con mayor detalle la muestra de los 10 tiempos que toma prepararse para salir en
la mañan4 podemos calcular el rango. Para hacerlo, ordenamos los datos del más pequeño al mas
grarúe,

29 3t 35 39 39 40 43 44 44 52
Utilizando la ecuación (3 .3), el rango es 52 - 29 = 23 minutos. El rango de 23 ninutos indica que
la diferencia mris grande ente dos días cualesquiera en el tiempo que üoma pr€pararse para salir
en la mañana es de 23 minutos.

3.5 Los datos nutricionales acerca de una muesta de siete cereales para el desayuno (almacenados en
el archivo @@ incluyen el número de calorías por porción (véase el ejemplo 3 . I de la página
96.¡. Calcule el raogo del nrhnero de calorias en los cereales.

SOLUC|ÓN Ordenadas de menor a mayor, las calorias pa¡a los siet€ cer€ales son:

80 100 100 110 130 190 200


Por lo tanto, utilizando la ecuación (3.3), el rango : 200 - 80 = 120. La diferenci¿ rnáq grande en el
número de calorías entre cualesquiera cereales es 120.

El rango mide la di.qp e'.rsíón totat q)ehnyen el conjunto de datos. Aunque el rango es una me-
dida sencilla de la variación tot¿l de los d¿tos, no üoma en cuenta cónto estos se distibuyen ente el
valor más pequeño y el mrás grande. En otas palabras, el rango no indica si los valores están distri-
o
buidos de manera unifomle a lo largo del conjunto de datos, si se agrupan cerca de la mitad o si se =
agrupan cerca de un exhemo o de ambos. Por esa razón, cuando al menos uno de los d¿tos es un
valor exüemo, es errgañoso utilizar el rango como uoa medid¿ de variación.
o
o
o
N
Varianza y desviación estándar {
o
Como el rango es una medida sencilla de variación, no toma en cuenta cómo se distribuyen o se
agrupan los valores etrtre los exEemos. Dos medidas de variación comlnmente utilizadas, y que sí
toman en cuenta cómo se distribuyen todos los valores de los datos, son la varirnza y la desvia-
ción estándar. Estos estadisticos miden la dispersión 'lromedio" alrededor de la medi4 es decir,
la manera en que los valores más grandes fluctuan por arriba de ella y la m¡nera en que los más
pequeños fluctúan por debajo de ella.
Una medida sencilla de la variación al¡ededor de la media podría toma¡ en cuenh la diferencia
entre cada valor y la media, y luego sumar esas diferencias. Sin emba¡gq si lo hiciáranos, encontra-
rlamos que como ia media es el punto de equiübrio en un conjunto de daÍos, para coda conjunúo esas
diferencias suman cero. Se requiere una medida de variación que r€st€ un conjmto de datos de oto,.
eleve al' andrado la diferencia ente cada valor y la media, y luego sr:me esas diferencias cusdradas.
En estadística esta cantidad se conoce como suüri de cu¡dr¡dor (,SC). Luego, para obtener la
varianza muesFal (,!'), esta suma se divide ente el núm€ro de valores menos I (!ara datos nu€stra-
les). La rriz cuadrada de la varianza muestal es la dewiacióu estáada¡ muesFal (S).
Como, de acuerdo con las reglas del álgebra, esta suma de cuadrados siempre será no negativao
ni la varianza ní la desviación estándar pueden ser negativas. Para pnicticamente todos los con-
juntos de datos, la varianza y la desviación estíndar serán un valor positivo. Ambos estadlsticos
serán cero solo si no hay variacióú en un conjunúo de datos, lo que ocurre únicamente cuando todos
los valores de la muesta son iguales.
Para una muestra que contiene ¡¡ valores , Xp X2, X3,. ,., Xn,la varia¡za muestal (dada por e1
símbolo J,) es:

(J;-x)z + (x2-x)2 + ... + (x,-x)2


n- 1

La eouación (3.4) expresa la varianza muestal utilizando notacióu de sumatori4 mietrtas que la
ecuación (3.5) expresá la desviación estándar muestral.
?
1OO CA?ÍTULO 3 Mertidas nu¡¡é¡icas descriptivas

VARIANZA MUESTRAL
La varianza muestral es la suma cle las rliferencias alrededor de la media elevadas al
cuadrado' dividida ente el tamaño de Ia muestra menos 1'

S/v - ?\2
(3'4)
J- = ---------;-
n- L
donde:
i :j metlia ¡h¡estat
n númem de valo¡es o ta'n¿fro cle l¿ muestra
X= j-ésimo valor de la variable X
'n
i'/i\rLi*. - )t\2
" t = sumatoda
de'todas las diferencias aL cqadrado ente
¡=l .n
los xi valores y á

DESVIACIÓN ESTANDAR M UESTRAL


de las diferencias
La rlesviación estándar muestral es la raiz cuadrad¿ de la suma
e1 tamaño de la muestra
alrededor de la media elevadas al cu¿drado y dividida entre

2(;¡',-x)'
s= \F= (35)

(3 4) [y el termino interno en la ecu¿'


Si el denorninador fuera z en lugar de n - l, la ecuación
p.li ."frrfria el promedio Je ias diferencias alrededor de ia media elevadas al cuad¡ado.
matemáticar
ii"1i"tág", se utiliza;- i debido a que el estadístico S, tiene ciertas propiedades
"iO"
la página 236)' A me'
7'4 en
G ñ;;;j;;"bt- para ta infeÁcia estadística (véase la sección
y entre n - 1 se vuelve
dida que el tamaño ¿. tu .o.rt ui-.otu, la difer;cia ¿e dividi¡
ent¡e n
"
--- vez más Pequeña-
cada
muestral como la medii'
E, h;rá"iió lo mris probable es que se utilirce la.desvración estándar
ae variacién ¡definida en É ecuación (3.5). A diferencia de
la variaoza muestal' que es una cann'
que está en las mism¿s unidads
elevada al cuadrado,l¿ tlesviaciOlesüníar siempre es un número
para observar la manera en que un
oue los datos muestrales originales. La dewiación esüínda¡ sirve
de datcr'
l;"¡i". ili":r", L .gr"p. 3 alrededor de zu med.ia..para casi cualquiu conjunto
a*t"v. ec
l-Jmil;ñ;I";;¡oi.r'o¡r.*n¿o. dento de un intervaio de más v menos una desviación
iaen
media y la desüación estánd¡l
tándar por arriba y por debajo de ümedia' Por lo tanto, conocer la
de los datos'
;.1. Jrrlir pt" d;ñ"it en dónde se agnrpa ai menos la mayoría .de los valores
lo sl'
para calcular a nano tu uafi"-u-.ii.rt oi, S", y la desüación estiindar muestral, S, haga
guente:
1. Calcule las diferencias de cada valor y la media'
2. Eleve al cuadrado caü diferencia.
3. Sume las diferencias elevadas al cuadrado'
¡. Dividida este tot¿l enhe n I para obtener la varianza
- muestral *r
la desviación estifurdar muestrar'
5. Calcule la raíz cuaclrada de la varianza muestral para obtener
Para ¿nalizar con mayor detalle la muestra de los 10 tiempos
que toma
PttP**tt
pti.tl[':
presentan los primeros cuatro paso's para calcular
la mañana, en la tabla 3.1 se li
el catcxlo
"TY?^yj'i;l.
viación es¡índar con una media Qf) igual a 39'6 (véase la pá-gina 95 lara ": li -t^''.'l;
columna de la tabla 3 1 presenta el pas,o 1 La tercera columna Dresena el pítsu ¿' '-
l" La segunda 3l
(paso 3) se observa en la parte.inferior de la tabla
: suma de las diferencias elevadas al cuadrado
Lu"!o, .rt. totut ,e divicle entre l0 1 = 9 para calcular la varianza (paso 4)'
-

)
3.2 Medidas de variación y de forma 1 01

X :39.6
8tA 3'1 Paso I Paso 2
de la Tienpo (X) (x'--E (x, - 7)'
de los
que toma 39 -0.60 0.36
para salir 29 - 10.60 t12.36
43 3.40 I t-)o
52 12.40 l)J. /o
39 -0.60 0.3ó
M 4.40 19.36
40 0.40 0.16
J1 -8.60 I t-vo
44 4.40 19.36
35 -4.60 21.16

Paso 3 Paso 4
Sumar: Dividir entre (z - l):
412.40 45.82

La varianza tarnbién se puede calcular sustituyendo los valores de los términos de la ecua-
ción (3.4):

v,
2(ur, -h' =
n'l o
o
(39 - 39.q2 + Q9 - 3e.q2 + ... + (3s - 39.6)'? o
N
l0-l
ID
4t2.4
=9
= 45.82

Puesto que la varianza está en unidades al cuadrado (específicamente en minutos al cuadrado


para estos datos), si se desea calcular la desviación estánda¡ se debe sac¿r la raíz cuadrada de la
vari¡nza. Utilizando la ecuación (3.5) de la página 100, la desviación esütndar muestral, 'f, es:

S¿r. - 7tz
s=vF= = t/+tn = e.n

Esto indica que, en est¿ muestra, los tiempos que toma prepa¡arse para salir se agnrpan dento de
6.77 mi¡utos alrededor de la media de 39.6 minutos, es decir, se agrupan enhe X l,S = 32.83 y -
i + S = qASl . De hecho, siete de los l0 tiempos que toma prepararse para salir se localizan den-
ho de este intervalo.
Utilizando la segunda columna de la tabla 3.1, también es posible calcular que la suma de las
diferencias entre cada valor y la media es igual a cero. Para cualquier conjunto de datos esta suma
siempre será cero:

>
j=l
(X' - t) = 0 para todos los conjr:ntos de datos

Esta propiedad explica por qué la media es la medída de tendencia central mís utilizada.
V"

102 CAPÍTULO 3 Medidas nunéricas descriptívas

(almacenados q
de siete cereales para el desayuno
3 r de ra página
ffi-ilil;;; "'i'*" " L",'^-* ::?'"'.*:1"'*:"
Cá|cu|ode'. ";:il:[:ffi#;;;ilñ¡nesuá,ndardelascaloríasenlosce¡eales.
""n'uo
:"i:-ll'^T:

Illil1lut"'t"*r"0.. táüü* Enlatabla3.2seilusraelcálcuiodelavaÁarzavladesüaciónestándardela


J"i i'¡t"to ¿" calorías en los cereales'
calorías en los
cereales

TABLA 3.2 Í= 130


I Paso2
Paso
-r.,r\ r'r\t^
Cálculo de la calorias ixi :-xt rr';;-:1"
varianza de
80 -50
las calorías
1óó -30 eoo
en los cereales
ioo -30 eoo

iro -20 4oo

1300u
iéó 60 3'600

;6ó 7o 4'eoo

Paso 3 Paso 4

Sumar: Dividir entre (z - 1):


13200 2,200

de la página 100:
Si utilizamos la ecuación (3 4)
n _^
Srr
,L) \'-' - X)'
c2 i=l
-

(so-130F+(1oo -130)2+"+(2oo-l3o)2
l- L

13,200
o

-- 2,200
estrindar muestal, ü es:
Si utilizamos la ecuación
(3.5) de la página 100, la desviación

t(x
Ft''
-t)'?
S=VF= =t/r4p=46.eM2
n- |
&nÍo
en 10s cereares se agrupan
est átndar de 46.g042indica que las ca10rías
La desviación Í- 1'S = 83'0958 y X + tr
de 130' es dicir' que se'agrupan'entre
de 46.9042 al¡ededor de la media de es(
(;;;;'d;*¿"liiO tle-las calorias se localiza dentro
= r16.9042.De hecho, 5i'1%
intervalo.

se resumen como sigue:


la varianza y la desviación estáudar
Las caracteristicas del rango'
el rango' la varianza
y la des'
de los dalos' mayores serán
' Cuanto mayor sea la dispersión
viación esüíndar. ,
menores seral L el rango, la
varianza ¡,ln de9

*oot tea la dispersión de los datos'


' Cu*to
viación estándar'
3.2 Medidas de va¡i¿ción y de forma 103

Si todos los valores. son iguales (de manera que no hay variación en los datos), el rango, la
varianza y la desüación estándar se¡an iguales a cero.
Ninguna de las medidas de variación (el rango, la varianza y la desviación esLíndar) puede
ser üesativa.

Coeficiente de variación
A diferencia de las medidas de variación que se presentaron antes, el coeficiente de variación es
vna medida relativa de variación que siempre se expresa como porcent¿je y no en términos de las
unidades de los datos en particular. El coeficiente de variación, que se denota con el símbolo C(
mide la dispersión de los datos con respecto a la media.

cr, = (!)non
, donde:
,S : desviación estánda¡ muestal
Í = media muestal a,

=
c)
Para la muestra de 10 tiempos que toma prepararse para salir, dado que X = 39.6 y S = 6.77 , el c)
c)
coeñciente de va¡i¿ción es: N
o
CV=
o

Para los tiempos que toma prepara$e para salir, la desviación estrlndar es 7.1% del tamaño de la
media.
El coeficiente de variación es especialmente útil para comparar dos o más conjuntos de datos
que estrín medidos en unidades diferentes, corno se ilustra en el ejemplo 3.7.

EJEMPTO 3.7 ¿Qué aspecto varía ruás de un cereal a oto, el número de calorías o la cantidad de azúcar (en gamos)?

Comparación de SOLUCIóN Como las calorías y la cantidad de azúcar tienen diferentes unidades de medición,
dos coeficientes es necesario comparar la variabilidad relativa en las dos mediciones.
. de variación cuando Para las calorías, a partir del ejemplo 3.6 de la página 102, el coeficiente de variación es:
las dos variables
tienen diferentes cvca*u= (,46191?)loo % : 36.08%
unidades de \ 130 /
medición
Para la cantidad de azúcar en g¡amos, los valores para los siete ceteal€s son

6244411 10

faraestos dabs- x = ).6)/l vJ=J.Jó//.


Por lo t¿nto, el coeficiente de variación es:

/? 1R?7\
C/-,i"* = l:\ ).ó) /1,/ltoo% = 57.84%
Así, con respecto a la media, la cantidad de azúcar es mucho mrís variable que las calorías.
I

"=- r
104 cAPÍTuLo3 Medidas numéricas descripuvas

Valor Z que es la diferenc¡¡


un dato que se locatiza muy
lejos <1e. flmed!.'-et valor Z'
Un valor extreno es
Jt*iutión estándar' siwe para identiÍc^ar:3:::::T
entre el valor y la me¿iu, ¿iuia¿""toitl" muv pequercs (negati'
;; ;r;J; ;"t iuy lejos de la media tienen valores z
sa localizan

vos) o muY grandes (P'ositivos)'

VALOR Z
x-x (3.7)
J

prepararse para salu


e[
10 tiempos que toma
pu,a analiza¡ con mayor detalle la muesta de los la desviación
la mañana, podemo, turcou'
to" ulü"'?' i"J" q"t r"-tint t'ide 39'6 minutos'

uei'po qu9.tol" o'*er día es de 39 0 mt'


estandar es de 6.77 minutos v lltpT:: !T:,10 (3 7)'
"r zpol" ei día t utiliza¡do Ia ecuación "
l'ffi;"d;; ;;ro'rt a "uro'
x-i
-s
7=-

39.0 - 39.6
b.//

= -0.09
Z para los l0 üas'
Lattbla3,3 Eesenta los valores
tiúor Z
TABLA 3.3 39 -{.09
Valores Z de los 10 29 -t.f /
0.50
tiemPos que toma,. {J
sallr 52 i.83
PrePararse Para
39 -{.09
44 0.6s
40 0.06
JI
44 0.65
J) -{.68

Medi¿ 39.6
o.tI
Desvi¡ción estándar
¡]tr
R
Jll
¡li Erryvorv{vrz¡:1.1?:T.l'-iii',HiiHi'j,'fi:"T'.i"trJ#1ilii{ü;'j'l:
li I
It i

;'"1m*::lfff 1""1':¿í;:*';ilñ;;i';r''T11'"'-",T'd;Jil:::[illJ:[:*;1
lll
l¡r #r"t qt :¡¡ " si es mayor que +3'0' Ninguno de
los tiempos er
li
para consi<terarlo un valor extremo'
i
ll r

¡¡;
ti (almacenados d
ñmuestra de siete cereales para el desayuno
iill €JEMFLO 3.8 Los datos nutricionales acerca
de
(véase el ejemplo 3'l de la págm
!!!@ io.tuvtn tt o'i#?Jll-t;ol* fo' pottión
'it
Cálculo de los
el archivo
siii;n#ñ-"""res Z de las calorias en los cereales'
t:
f,
I
t:*
valores Z Para el
número dé calorías ;ü;'" ?9':"';it'*li;it,ili
?
"T#ü:r#
;*:f ,?,ü:t:
;iffiíi:ifr que ninguno de
^^r^-.-. -- r^c cc

los

'.:15 3"1t,:il*Í'rl;?.3rl;" * v;res extremos eo .rto, duto.,


en los cereales yu

+3'o'
;;l;;;, ;; ."""r que -3'o ni maYor que
3.2 Medidas de variación y de forna 105

C¡lorías Yrlores Z
LA 3'4
80 -1.0'l
Z del
100 -0.64
de calorías
100 -0.64
110 -0.43
130 0.00
190 1.28
200 't.49

Media 130
DesYiaciónestándar 46.9M2

Forma
La forma es el patrón de la distribución de los datos a lo largo del rango completo de todos los va-
lores. Una distribución es simétrica o sesgada. Ea una distribución simétric¡, los valores que están
por debajo de la media se distribuyen exactametrte de la misma forna que los valores que están por
arriba de esta. Así, los valores altos y bajos se neutralizan. En una distribución sesgrilr, los valores
no se distribuyen de forma siméfica al¡ededor de la media. Este sesgo produce un desequilibrio
ente los valo¡es altos y los bajos.
La forma también puede afectar la relación de la media con la meüana. En la mayoría de los
casos: o
. Media < m.ediana: negativa o sesgada hacia la izquierda
. Media = mediana: siménca o sin sesgo o
. Media > median¡: positiva o sesgada hacia la derecha o
o
En la fizura 3. I se describen tres coniuntos de datos. cada uno con una forma diferente. N
o
U RA 3..I
de
conjuntos
datos con
forma Gráfca
Gráfica A Gráfica B C
Negativa o sesgada hacia la izqu¡erda S¡mét¡ica Positiva o sesgada hacia la derecira

Los datos en la gmfica A son negativos o sesgados hacia l¡ izquierda. En esta gnific4 la maye
ría de los valores se encuenrari en la parte superior de la distribución. El largo extemo y la distonión
hacia la izquierda son causadas por algunos valores exhernadamente pequeños. Estos valores hacen
que la media se deslice hacia abajo, provocando que esta sea menor que la mediana.
Los datos en la gnifica B son simétricos. Cada mitad de la curva es una imagen en espejo de la
otra mitad. Los valores altos y bajos en la escala estín equiübrados, y la media es igual a la mediana.
Los datos en la gnáfica C son positivos o sesgados hacia la izquierde. En esta gr:ífica, la ma-
yoría de los valores se eúcuenFan en la parte inferior de la distribución. El largo extemo y la dis-
torsión hacia la derecha son causadas por algunos valores exhemad¿mente grandes. Estos valores
hacen que la media se deslice hacia arrib4 provocando que esta sea mayor que la mediana.
Dos estadísticos relacionados con la fo¡ma son la simetría y la curtosis. La simetría mide el
grado en que un conjunto de datos no es simétrico. La curtosis mide la concentación relativa de
los valores en el cenho de la distribución de un conjunto de datos, comparada con los extemos.
Una distribución simétrica tiene un valor de cero. Una disnibución sesgada hacia la derecha
ls dene un valor de simetría positivo, y una distribución sesgada hacia la izquierda tiene un valor de
úa simetría negativo.
Una distribución en forma de campana tiene una cu¡tosis con un valor de cero. La distribución
que es rnás plana que una distrbución en forrna de carnpana tiene un valor de curtosis negativo. Una
1 0ó cAPÍTwo 3 Medidas trunéricas desc¡iltrvas
r
clistribuciónconunapuntamasmarcada(aquellaconunamayorconcenhacióndevaloresenelcq.
un valor de cudosis positivo,
no de ta distibución que wra distibución en forma de campana) tiene

se busca comparar el desempeño ¿6


EJEMPLO 3.9 En la segunda parte de la sección ¡eferente a Choice Is Yours
los fondos en bonos corp¡¡.
terior dJlos fondos en bonos intermedios gubernamentales con el de
constituyen los rendimientos 4
Estad ísticos tivos a corto plazo. Una de las medidas dél desempeño previo la
descriptivos de los de u¡a muestra de 184 fondos en ¡n
2009. Ya se definieron las variables y se reunieron los datos
fondos en bonos oor. C¿.ot .rtu¿i.ti.osdescriptivoi para los fondos en bonos intermedios gubemamentales y 1¡t
intermedios
fondos sn bonos corpomtivos a corto plazo'
gubernamentales
.2 se presenta una tabla con un resumen de medidas descriptivas
para ¡¡¡
y los fondos en SOTUC¡óN En la figrua 3
izquierda) y Miniu¡
bonos corPorat¡vos Ao, a" fooaos enionos calóuladas por medio de Excel (resultados de la
tip*
estándar, Ia mediarq
a corto Plazo (resitados de la derecha). Los resultados de Excel incluyen la media, el enor
el rnáximo'¡
ü.o¿r, lu ¿"*i*ión esüfurdar, la vananz4 la curiosis, la simetí4 el rango' el mínimo'
y (el tamañ. o de la muestra)' El enor esuÁnda,
suma (que no tiene sentido en este ejemplo) el conteo
*
q* * á,*a'' la sección ?.4, esla <tewiación estáLndar dividida ente la r¿iz cuadrada del "'n¡¡n
variación, el primer c!a¡'
üe la nuesr¿ fos ¡esutta¿os de Minitab ambien incluyen el coeficiente de
priginas 109 a 111)'
til, el tercer cuartil y el rango intactartil (véase la sección 3'3 de las

FIGURA 3.2
obtenidos en 2009 por los tondos en bonos
Estadísticos descriptivos de Excel y Minitab para los rendimientos
;ür;.;;, ¿;#;t;"i;; y lo's fondos dn bonos corporativos a corto plazo'

Des.riúive st¡t¡stfts fur neürn 2Og

cdEa r¡ !ó.w \¡L.l¡é c6fv. .


rÁbdl¡t c4rt r .-¡!3 !.3a1 ra ?!¡ !?0.J9
9t t,516 5.i¡t t2.339 !,26

bt !-.Irát Goctút

trE r¡¡F Ic8


ti¿.r¡dr¡!. coGú¿ a3 .00 3

$ort L- c¿4.ót. ao. too 3

I¡i.rdl¡t! G.c!üi 1.50 1.90

st€!¡ftre5s I

tu l¡tr 6i¡l¡ .t ldi ¡lÉ .ó E¡Út. (b¡t s {ll_!


l'i
1I Alexaminarlosresultados,seobservaqueexistengrandesdiferenciasenlos¡endimie[t00
lll gubemamentales y b' f""*,t,:i
ott""-iü It ZOOS por los fondos en bonos intermedios 1111i
ll,l
ll,, comorativos a coft; plazo. Los fondos intermedios gubemamentales tuvieroD una utrlldac mcu'
f { r
#ffiil;.;ü'v í* "iiliüi L.¿i ana de 4.4,a d'iferencia de los fondos en bonos corporat-voo
y una mediana 9'1' Las medianas indic¡r
li l a corto plazo, los cuales tuvreron una media de 9'S959
'le rendinientos de 4'4Ú
oue la mitad de 1os fondos en bonos iotermeüo. gubáamentales
tuvieron
ll" ffi;il;ñ^ü.üJá"irl""a"s en bonos óorporativos a corto plazo tuvreron,r:liru::'.X
u de 9.1 o misilevados. Se concluye que los fondos en bonos
corporativos a corto pnzo ruvtv'""
.*di-i*to, .o"ho loi fondos en bonos intermedios gubernamenlal"t', ,,--*
más altos que
Losfondosenbonosintermediosgubemamentalestuvie¡onunadesvracronestanorng'"
il' ,o.rt. -a, t"¡u que los fondos el bonJs corporativos a corto plazo (5 3606 * :"-qi:.tó" ll
5.6867). Aunque ambos tipos de fondos en bonos plesentaron
un sesgo t *t",*
il fondos en bonos i¡termedios gubemamentales resultaron más sesgados
lo "jp^o,tl:::'(;
La curtosls oe los uuo "
oos de fondos en bonos fue muy po,itiu", ro que indica una
distribución con un pico mas pronuf
ciado aue una distribución en forma de campana'

I
Problemas para las secciones 3.1 y 3,2 107

procedirniento de Exploraciones visuales de es-


Utilice el
p1a ver.:l efecto que tiene el
údírrirot descriptivos
valores en las medidas de tendencia cen-
.lr¡io ¿. los
' fl, de vanación de forma. Abra el libro de trabajo
y
visuales (Visual
¡6¡ el complemento Exploraciones
.. Éfplorations'da) Y:
1. Seleccione Add-ins
'- Visu¡l Explorations "- De'
scriPtive Statistics.
2.Lea las instrucciones en el cuad¡o de diálogo De-
scriptive Statisücs y luego haga clic en OK (véase la
ilustación a la derecha).

3. Experimenre ingresando un valor extemo, por ejem-


plo 5, en una de las celdas resaltadas de la columna A.

,.Qué medidas se ven afectadas por este cambio? ¿Cuáles


no? Puede alternar entre los diagramas "antes" y "des-
pués" presionando de manera repetida Ctrl+Z (deshacer)
y luego Ctrl+Y (rehacer) para observar mejor los cam-
bios que ha causado el valor extremo en el diagrama
(Para conocer más acerca de Exploraciones visuales
véase la sección D.4 de los apendices). o

o
o
Problemas para las secc¡ones 3.1 y 3.2 o
N
3.4 El siguiente conjunto de datos proüene de una muestra 6
APRENDIZAJE DE LOs FUNDAMENTOS N
3.1 El siguiente conjunto de datos proviene de una muestra
den=5.
7-5-879
7 4982 c) Calcule la media, la mediana y la moda.
á) Calcule el rango, la varianza, la desviación estándar y el
c) Calcule la media, la mediana y 1a moda.
coeficiente de variación.
ü) Calcule el rango, la varianza, la desviación est:iadar y el
c) Calcule los valores Z. ¿Hay algún valor exherro?
coeficiente de variación.
d) Describa la forma del conjunto de datos.
c) Calcule los valores Z. ¿Hay algún valor extemo?

tt d) Describa la forma del conjunto de datos.

3.2 El siguiente conjunto de datos proviene de una muestra


de¿=6.
APLICACIÓN DE CONCEPTOS
3.5 Un¿ encuesta realizada por la Anerican Statistical Asso-
ciation reportó los siguientes resultados para los salarios de
F 7 497 312 profesores, con una antigiiedad de ente cuatro y cinco años
)nto$
E en el puesto de profesor adjunto o profesor titulr, que ensb-
} c) Calcule la medi4 la mediana y la moda.
ono{ ñan estadística en univenidades dedicadas a la investigación.
redl ó) Calcule el rango, la varianza, la desviación esüíndar y el
¡
lvos f coefi ciente de variación. Título Mediana
f c) Calcule los valores Z. ¿Hay algún valor exhemo?
licar
d) Describa la forma del conjunto de datos.
Profesor adjunto 81,600
!.4 ol,,
Profesortih¡lar 120,000
ntos : 3.3 El siguiente conjunto cle datos proviene de una muesta
eron I FueDte: Datos extr¿ídos de m¡g¡zine.amstslor gblogl20lU 12 | 0l I
den=i.
rcademic-salary-survey.
12749073
,era'
a) Calcule la media. ta media¡a v la moda. Interprete la mediana del salario para los profesores adjun-
I c00
ó) Calcule el rango, la varianza, la desviación estrindar y el tos y los profesores titulares.
r, los :
)s tl' coeficiente de variación. 3.ó El gerente de operaciones de una planta que fabrica
c) Calcule los valores Z.;.Hay algún valor exfemo? neumáticos desea comparar los diámet¡os i¡ternos reales
tru¡'
d) Descnba la forma del óon¡*to- d" dutos. de dos tipos de íeumáticos; él espeta que cada uno mida
a
I
.t_-
108 CAPÍTULO 3 Medidas numé¡icas descriptivas
r
575 milímetros. Seleccionó una muestra de cinco neumáti- c) Calcule la media, la mediana y la moda.
cos de cada tipo, y los resultados que representan los diáme' ó) Calcule la vaianza,la desviación estiindar, el rango,,1
tros intemos de los neumáticos, ordenados del más pequeño coeficiente de variación y los valores Z'
al más grande, son los siguientes: c) ¿Los datos estrín sesgados? Si es así, ¿de qué forma?
d) Compare los resultados de los rncisos a) a c) con los re.
sultados cle los incisos a) a c) del problema 3.9, los cr¡.
les se refieren a las millas por galón que rinden Io5
automóüles sedán familiares.
¿) Calcule la media, la mediana y la desviación estándar 3.11 El rchivo !@l@1fi incluye datos sobre el cosh
para cada tipo de neumáticos. (en centavos) por porción de una onza de una muestra de 13
á) ¿Qué tipo de neumáticos ofrece mejor calidad? Explique galletas con trozos de chocolate. Los datos son los siguientg'
su respuesta.
c)- ifecto tendría en sus respuestas a los incisos c) y á)
54 22 25 23 36 43 7 43 25 4'1 24 45 44
¿Qué
Fuerite: Datos extraidos de "Chip, Chip, Ho oray" , Consumer Repo6, .
étiecno de que el último valor para el tipo f fuera 588 junio de 2009. p. 7.
en lugar de 578? Explique su respuesta.
¿) Calcule la media, la mediana y la moda.
3.7 Segun el U.S. Census Bureau, en 2010, la medionl del
á) Calcule la varianza, la desviación est índar' el rango,4
precio de venia para las viviendas nuevas fue de $22 I ,000 y
coeficiente de variación y los valores Z' ¿Hay algun valor
ia media del précio de venta fue de $272,400 (extraído de
extremo? Explique su respuest¿.
www.census.gov, 4 de abril de 20il).
c) ¿Los datos esüin sesgados? Si es así, ¿de qué forrna?
¿) Interprete la mediana del precio de venta-
d) Con base en los resultados de los incisos a) a c)' ¿qué
á) Interprete la media del precio de venta.
concluye con respecto al costo de las galletas con trozos
ci A-nalice la forrna de la distribución del precio para las vi- de chocolate?
viendas nuevas.

incluye datos sobre la


3.12 El archivo [1ft@@ incluye datos sobre el costo
3.8 El archivo @$!@ por porción de una onza (en dólares) de una muestra de 14
cantidad que una muestra de nueve clientes gastó barr¿s de chocolate oscuro.
para el aLrnuerzo ($) en un ¡estaurante de comida épida'
0.68 0.72 0.92 1.14 LA 0.94 0-',17

4.20 5.03 5.86 6.45 7.38 7.54 8.46 8.47 9.87 0.57 1.51 0.57 0.55 0.86 1.41 0.90

a) Calcule la media Y la mediana. Fuetrte; Datos extlaidos de "Dark Chocolate: Wtich Bars A¡e Besfl
Consumer Reports, septiembre de 200?, p. 8.
ái Calcule la varianza, la desviación estandar, el rango y el
coefi ciente de variación. a) Calcule la media, la mediana y la moda.
c) ¿Los datos están sesgados? Si
así es, ¿de qué forma? ái Calcule la varianza, la desviación estándar, el rango, el
l) Óoo b"s. en los resultados de los incisos c) a c), ¿qué coeficiente de variación y los valores Z. ¿Hay algun valo
concluye con respecto a la cantidad que gastaron los extemo? Explique su lesPuestra.
clientes para el almuerzo? c) ¿Los datos estín sesgados? Si es asi, ¿de qué forma?
lista las millas tot¿les por galón á Óon base en los resultados de los incisos a) a c), ¿qué cot
3.9 El archivo $@ cluye con respecto a[ costo de las barras de chocolare os€r
2011'
fMPG) que rinden los automóviles sed,ín familiares
3.13 ¿Hay alguna diferencia en la
variació¡ del rendimi:nh
24 21 2s 22 23 34 34
it
20 20 22 44 32 20 20 p"tn aif.tát"i tipos cle inversiones? El archivo ![@
cluye d^tot sobr" los rendimientos para un certificado de de'
Fuente: Datos extraídos de "Ratitrgs" ' Consumer ReportJ, abril de
pOsito 1Cl¡ a un aAo y para un certificado de depósito (CD),r
2011, pp. 30J l.
cinco años'en 23 banios de Estados Unidos vigentes el 4
de

¿) Calcule la media, la mediana y la moda. abril de 20 1 1 .


ái Calcule la'ta1rar.za,la desviación estándar, el rango, el 20ll
Fuente: Datos extraídos d€ rvwlY.Balkr¡te.com, 4 de abril de
coeficiente de variación y los valores Z'
c) ¿Los datos están sesgados? Si es así, ¿de qué forma? a) Calcule, por sepaTado. la vaianza.la desviación est'á¡'
' dar, el rango y el coeficiente cle variación para los CD a
d) Óompare los resultados de los incisos c) a c) con los re-
sultados de los incisos a) a c) del problema 3.10, que se un año y a cinco años.
á) Con base en el resultado del inciso a), ¿cuál de los
CD
refieren a las millas por galón que rinden automóviles
üene un rendimiento más variable, el que es a un año o €t
utilitarios pequeños.
que es a cinco años? Explique su respuesta.
3.10 Et archivo f@ lista las millas totales por galón
(MPG) que rinden los ¿utomóviles utilitarios pequeños' 3.14 El archivo llotelllK lista el precio promedio porna'
bitación (en libras británicas ) que se pagó en seis ciudad6
20 24 22 23 20 22 21 22 22
del Reino Unido en 2010.
1.9 22 22 26 19 t9 23 24 2r
21 19 21 22 22 16 16 110 98 78 10 76 62

Fuent€: Datos extraídos de "Ratings", Consumer Reports, abrll de Fuente: Datos exÍaídos de www.hotels.com/pre3s/hotel-priceü
2011, pp. 30-31. dcx-summer-2010.htm1.
F'
3.3 ExPloración de d¿tos quméricos 109

mediana Y]t d) Un cliente llegaa la sucursal bancaria durante la hora del


úedi4 la Podl' ..
1^oo.lavairatza y la desviación esuíndar. abnuerzo y pregunta al gerente cuínto tiempo debera es-
'il-iát r"tult"¿ot de los incisos a) v á), ¿qué perar para ser atendido. El gerente responde: "Casi le
por habitación (en libras puedo asegurar que menos de cinco minutos". Con base
iá respecto al precio
en los result¡dos de los incisos a) a c), evalúe la exactitud
2010?
de 160 ea lugar de ll0. de esta afi¡mación.
ir a pt¡ott $ot_P.
inciso ¿) al c) utilizando este valor. Comente 3.1ó Suponga qu€ a otra sucursal bancaria, localizada en
i¿ diferencia
en los r€sultados. una zona residencial, tanbién le preocupa que el horario del
alnuerzo, enfie el mediodía y la l:00 p.m., provoque retra-
de un banco localizada en un distito co-
sos en la atención a los clientes. Los siguientes tiempos d€
ciudad tiene el objetivo de negocio de mejo- esper4 en minutos, reunidos de una muestra de 15 clientes
$ para atender a los clientes durante la hora del
Itre el mediodía y la l:00 p.m. El üempo de es-
duranrc esa hora, están almacerados en el archivo f@
se define como el tiempo que traoscr¡ne
9.66 5.90 8.02 5.79 8.73 3.82 8.01 8.35
10.49 6.68 5.ó4 4.08 6.17 g.gt 5.47
en que el cliente se forma en la fila y el
oue llega a la ventanilla- Se reunieron datos de c) Calcule la media y la mediana.
;de 15 clientes durante esta hora. El ar- ú) Calcule la varianza, la desviación estrindar, el rango, el
iene los siguientes resultados. coeficiente de variación y los valores Z. ¿Hay algun valor
extemo? Explique su respuest¿.
3.02 5.13 4.77 2.34 3.54 3.20
c) ¿Los daos estrán sesgados? Si es así' ¿de qué forma?
0.38 5.12 6.46 6.19 3.79 d) Un cüente llega ¿ la sucursal bancaria duranúe la hora del
media y la mediana. alnuer¿o y pregunta al gereflt¡ cuinto tiempo deberá es-
b.vaianza,la desüación esüindar, el rango, el per¿r para ser atendido. El gerente responde: "Casi le
ie devariación y los valores Z. ¿Hay algún valor puedo asegurar que menos de cinco minutos". Con base
Explique su resPuesta. en los resultados de los incisos a) a c), evalúe la exactitud o
esuín sesgados? Si es así, ¿de qué forma? de esta afi¡mación. =
o
loración de datos numencos o
o
En las secciones 3.1 y 3.2 se estudia¡on las medidas de tendencia cental, la variación y la forma. N
Ot¡a manera de describi¡ datos numéricos consiste en realiz¿r un análisis exploratorio de datos que
o
(¡¡
calcula los cuartiles y el resumen de los cinco números, y que también permite constuir una gní-
fica de caja" Ademris, es posible complementar esto¡ métodos mostrando estadísticos desoiptivos
y Q tanbien de üversas variables categóricas mediante la técnica que permite construir la abla multidimensio-
vigésimo
y scp- nal descrita en la sección 2.7.
¡rsp.cti .
(3.2), Cuartiles
dr n¡úcf¿ gc!c-
alptesar eD Los cu¡rtiles dividen un conjunto-de-datos-en cuatro partes igr¡'les-Elprimer cuartil 0,, separa al
parrcD- 25.0% de los valores rnrás pequeños del oto 75.0%, que son máq grancles' El segundo cuartil, Q, es
pcrcctrtil la median4 50.0/o de tos valores son miás pequeños o iguales que la mediana y 50.0/o son mayores o
v¡lor o¡dñ6do,
iguales que la meüana. El tercer cu¡rtil, Q, sepua a175.0% de los valores nás pequeños del oto
proporcióD,
2s.0%, que son nrás grandes. Las ecuacio¡ei(¡.4) y (¡.9) ¿efi¡en el primer cuartil y el tercero.l

PRIMER CUARTIL, 01
El 25.0% de los valores son más pequeños que o iguales a p,, el primo cuartil, y 75.09/o
de ellos son mrás grandés que ó iguales al primer cuartil, pt.

A, = +fvalor
+
ordenado (3.s)

TERCER CUARTIL, q
El 75.0% de los valores son pequeños que o iguales al tercer cuartil, Q3,! 25.0o/o de
miás
ellos son más grandes o iguales que el tercer cuartil, Q.

3{¡ + l)
ar = valor ordenado (3.e)
7
110 CAPÍTULO3
._l:

Medidas numéricas descriptivas


I
Utilice las siguientes reglas para calcular los cuartiles a paÍir de un conjunto de valorcs oldenadosl

. Regla I Si el valor ordenado es un número entero, el cuartil es igUal al valor que conespo¡¿,
a ele dato ordenado. por ejemplo, si el tamaño de la muestra es n = 7, el
primer cuartil, p,.
valor asociado con el (7 + 1/4 = segundo dato ordenado'
es igual al
En Excel la función
CUARTIL utiliza
. Regla 2 Si el valor ordenado es una mitad fraccionaria (2.5, 4.5, etcétera), elcuartil es ig!¡l
diferentes reglas para al v;alor que conesponde al promedio de los valores de los dos datos ordenados implicados
calcular cuartil es. lJti lice Por ejen:plo, si el iamaño de la muesÍa es n = 9, el primer cuartil, Q,, es igual al dato o¡¿r.
/a hoja de oálculo nado (9 + ly4 = 2.5, que está ente el segundo y el tercer dato ordenado'
COMPUTE, del libro de . Regla 3 Si el valor ordenado no es un número entero ni una mitad fraccionaria, seredon¿q
trabajo Ouartiles, gue se
estudió en la sección el risultado al entero m¡is cercano y se selecciona el valor conespoodiente a ese dato or¿o
6E3.3 para calcular nado. Por ejemplo, si el tamaño d€ la muesta es n = 10, el primer cuartil' Qt, es igual al ¡¡
cuaftiles uülízando las + l)14 = Zjs dáto o¡denado. Redondeamos 2.75 a 3 y utilizamos el tercer dato ordenado.
reglas que se presentan
para analizar con mayor detalle la riuestra de 10 tiempos que toma prepararse para salir en ¡¡
en esta secdon.
mañana. Oodenos calcula¡ los cuartiles. Para ello, ordenamos los datos del menor al mayor.
Yalores ordenados: 2931 3539394043M4452
Posición: r2345678910
El primer cuartil es el (z + 1)/4 = (10 + 114 = 2.7 5 dato ordenado. utilizando la regla 3, se r¡.
dondeá al tercer dato ordenado. El tercer dato ordenado para 1os valores del tienpo que '
prepararse para sali¡ es 35, lo cual sipifica que 25% de los.días' el tiempo que toma preptu*"d
pr€'pa¡ase pan
para salir es menor que o igual a 35 minutos, y que 75% de los días, el tiempo que toma
salir es mayor que o igual a 35 minutos.
El terce¡ cuartil eJ eB @ + ll4 =3 (10 + 1)/ 4 = 8.25 ¿ato ordenado. Utilizando la regla 3 pan
¿[4 minutos. Asi' 75% de los días, d
los cuartiles, se redoodea al octavo dato ordenado, el cual es
tiempo que toma prepafafs€ para salir es menor que o igual a zl4 minutos, y 25% de los días, el tienp
zl4 minutos'
que toma prep¿¡ri¡rse para salir es mayor que o igual a

EJEMPLO 3.10 Los datos nutricionales ace¡ca de una muestra de siete cereales para el desayuno (alnacenados en
el archivo (!!!$incluyen el número de caloias por porción (véase el ejemplo 3'1 en la págiu
Cálculo de 96). CatcutLl pri-er cuartil (pr) y el tercer cuartil (Q) del núme¡o de calorías para los cereales.
cuartiles
SOLUCÉN Ordenados de menor a mayol los núme¡os de calorías de los siete cereales sonlc
sieuientes:
Valores ordenados: 80 100 100 110 130 190 200
fostcon: I 234567
Para estos datos,
ln + l)
e, = # valor ordenado

= 4 valor ordenado = 2o. valor ordenado


¡r
t:
i
Así, utilizando la regla 1, se sabe que es el segundo valor ordenado. como el segundo
I, valot

lr: ordenado es 100, el primer cuartil Q' es 100.


Para calcular el tercer cuartil, Q,
lii
t,. i/z + 1)
i¡r Ar=_-7-"valorordenado
l{'' 3(7 + 1)
li
ti¡
tj; - +
valo¡ ordenado = 6o. valor ordenado

Por lo tanto, utilizando la regla 1, se sabe que g, es el seito valor ordenado Como
el sexlo
ü
$ valor ordenado es 190, Q, es 190.
,
- qu€ 0
i.l Ei prh.r .r.rtil áe-1b0 indica que 25% de los cereales tienen calorias_ que son menores
iguales a 100, y que 75% tiene calorías que son mayores que o iguales a 100. El tercer cuaftlr'¡
-r-go
:- de los cereales tienen calorías que son menores que o iguales a 190, y que
25Í'
I
rái." qrlisy.
tiene calorías que son mayores que o iguales a 190.

)
3.3 Exploración de datos numé¡icos 111

Rango intercuartil
El ralgo intercuartil es la diferencia enüe el tercer cuartil y el primero en un conjunto de tlatos.

El rango intercuartil mide la dispersión en el 50% intermedio de los datos. Por lo tanto, no sq
que
ve afectado por los valores extemos. Para analizar con mayor detalle la muesba de I 0 tiempos
tori¿ preparaNe para sali¡ en la mañana, podemos calcular el rango intercuartil. Primero se orde-
nan los datos como sigue:

29 31 35 39 39 40 43 44 44 52

de la página 110, pt = 3 5
utilizarnos la ecuación (3.10) y los resultados anteriores del ejemplo 3.10
Y Qt= 44.
Rango intercuartil = tA - 35 = 9 mi¡utos

Por lo tanto, el rango intercuartil del tiempo que toma prepararse es de 9 minutos. El intervalo 35
a o
44 a menudo se conoce cotclo cincuenta intermedio-

o
o
o
EJEMPTO 3.11 Los datos nuficionales acerca de una muestra de sieG cereales para el deSayuno (atnacenados en N
el archivo !S!$ incluyen el número de calorías poi porción (véase el ejemplo 3' l en la página o
Cálculo del rango 96). Calcule el rango intercuartil del número de calorías para los cereales'
5
para el
de calorías SOLUCIóN Ordenados del menor al mayor, Ios números de calorías de los siete cereales son los
los cereales siguientes:
80 100 100 110 130 190 200
Si utilizarnos la ecuación (3.10) y los ruultados anleriores del ejemplo 3.10 en la página 110, 9r =
100

v O,=190.
Rango intercuartil = 190 - 100 : 90

Por lo tanto, el rango intercuartil para el número de calorías en los cereales es de 90 calorías'

Como el rango intercuartil no toma en cuentra cualquier valor menor que Q, o mayor que-93'
no se ve afectaclo por valores extremos. Los estadísticos descriptivos, como lamediana, Qt, Qry
el rango intercuartil, que no se ven afectados por valores extremos, se denominan medidas re-
sistentes.

Resumen de los cinco números


Un resunen <te los cinco núneros, que consta de lo sigUiente, ofrece una maner¿ de determina¡ la '
forma de una distibucióu.

x'e. p.qo.no 0r Mediana Q x* o-*


En la t¿bia 3.5 se expüca la manera en que la relación entre estos cinco números permite rcco-
nocer la forma de u¡ cotrjunto de datos.
r
112 cAPÍTuLo3 Medidas nunéricas descriptivas

TABLA 3.5
Relaciónentreelresumende|oscinconúmerosyeltipodedistribución
TiPo de distribución
Simétrica Con sesgo a Ia derecha
Comparación Con sesgo a la izquierda
Las dos distancias La distancia desde
La distancia desde La distancia desde
'(* hasta la
-
r -
_úri6 p€qucno hasta la Y. - hasta Ia
'-m¡s p.$erc
son iguales. o**o
medíaia es menor que Ia
meüana, en comParacton mediana es maYor que ta
distancia desde la mediana
con la distancia desde la dist¿ncia desde la mediana
hasb,f,Á!
mediana hasta X,oÁ! hasta X,á"
Las dos distancias La dist¿¡cia desde
La distancia desde La distancia desde
X'*n*,";, es son iguales. X* **o hasta P, es
x**"a, lasta {r
en hasta Pt
menorqr¡e or$ancla
la '
compamclon con la mayor que la drstancra
d€sde 03 hasta Xr¡ s-d..
distancia desde 93 hasta desde Q, hastaX* o-*.
XrÁ"
Las dos distancias L¿ distancia desde gi
La distancia desde Qt La distancia desde Pt
son iguales. hasta la mediana es menor
hasta la mediana, en hasta la meüana es maYor
que la distancia desde la
comparación con la que la distancia desde la
mediana hasta Pr.
distancia desde la mediana mediana hasta Qr.
hasta Qr.

Pa¡a analüar con más detalle la muesta


l0 tiempos que toma prepararse para salir en l¡
de los
los cinco números' Pata estos datos' el valor miís
pe'
mañana, podemos calcular el resumen de
queñoesde29mi¡utosyelvalornásgrandeesdes2minutos(v"¡selapágina97).Loscálculos:
39 5' Q t = 3 5 v Qt 44 Por lo tanto'
;;"#;-l*; e-Á st v t t 0 ieveian que ta mediana =
el resumen de los cinco números es el siguiente:
29 35 39.5 44 52

hdb la mediana (39 5 - 29 = 10'5) es ligeramente menor que l¡


La distancia desde X.¿" p"qu¿o
i-- X-*
distancia clesde la m.¿i*u ¡*tu --, -(52
- 3g"5 = 12 5)'La clistancia r
desde
(52
nr""u"]*i
,.ffifl{s i" airtancia desde Qrha*" ' - 44 = 8\'lÁ
o, g5 _ 29= 6) es ligeramenr.
iguur iut ladiffiffif desde la median¡
Á'stancia desde p, hasta la t.ai*ulió's -
35 = 4'5)
"
prepararse para saür están ligera
i^"á'ü (u -z1l = ¿.sl' Por lo tanto, los tiempos que toma
mente sósgados hacia la derecha'

de siete cereales para el desayuno Q$*T"djll


EJEMPLO 3.12 Los datos nutricionales ace¡ca de una muesta 1 en la págur
;il;; E@ incluven el número cle calorías por polion,{vealel^eie^ry-t^o,3
Cálculo del ft;üñr::ñ"sum;n-á" tor.irr"o o,ir"ros del número de calorías en los cereales.
rf:: resumen de los
A partir de los cálculos previos nara 1f nri91o
a; calorías en los cereales (véase las
iir
ll l
cinco números Para
las calorías en los
SOLUCIÓN
p¿gt"^liy r roi sabemos que la mediana = 110' Qt 100 y 0t =
: 190'
ts 80'y el valor nás g¡ande es 200' Por
[1rr cereales Adem¡is, el valor m^ p.q";;;;';oo¡*toa1'auto'
f lt' lo tanto, el resumen de cinco números queda como
stgue:

xl; 80 100 110 190 200


liqt r- dtr
-
utiliza¡ Dar¿ evaluar el sesgo La
{{'.
i4 rr
tes comparaciones que se present¿n en la tabla 3'5 se
Las
(200 - 110 = 90)
(110 - 80 = 30) es m*ot quei" distancia
ii tancia desde.{* *u*o hasta la mediana (100
;i; desde la medianahastu x.*.*d". ; disüncia
desde x'*.**".hasta O' - 80 = 20) es mayor
ii,. r;:t;lgüf'fl
i]., ili'"''':rültf *h?fr #r+ch:1:;ii"1f#ii:üi'ffi
ili.orn que la otra indica-una
!'l ::tff"#jo=,';";:",jj"fiJffiffi; pors..gada nuci" ta d.r..h.,
al tamaño d€ la muestra tao pequeño
y
\r i
:.'
;r-#;;i¿;;6;; hacia la izquierAa. Io tanto, ladebido
forma con claridad'
ios ,"suttudos-.onflictivos, no se logró determina¡
"
3.3 ExDloración dc datos numéricos 113

Diagrama de caja
Un diagrama de c¡ja es una representación grifica de los datos con base en el resumen de los cinco
números. Para analiza¡ con mayor detalle la muestr¿ de los l0 tiempos que tom¿ prepararse par¿ salir
qn l¿ 6añana, pedemss consüut tm diagr¿ma de caja como 9l que se muesba en la figura 3.3.

A 3,3
de caja
tiempos que

rtllllll
20 25 30 tl ot 50 55
n".oo1l''nr,or)
La línea vertical que se encuenta denao de la caja representa la mediana. La línea vertical que estií
al lado izquierdo de la caja representa la ubicación de p,, y la línea vertical que eslá al lado dere-
cho de la caja represent¿ la ubicación de 93. Asi, la caja contiene 50% cle los valores inrcrmedios'
El 25% inferior de los datos estri representado por una linea que conecta la parte izqüerda de la
caja con la ubicación del valor más pequeño, ,Y,* o"o*o. De maner¿ similu, el 25% superior de los
daúos es!á represeutado por una línea que conecta la'parte derecha de la caja con.(r. .n**'
La gráfica de caja con 1os tiempos que toma prepararse para salir de la figura 3'3 hdica un li-
gero sesgo hacia la derecha, ya que la distancia entre la mediana y el valor más alto es un poco
mayor que la distancia ente el valor más bajo y la mediana. Asimismo, el extremo derecho es un
poco más largo que el extremo izquierdo. at,

2.13 En la segunda parte de la sección referente a Choice Is Yours se busca comparar el desempeño an- o
terior de los fondos en bonos inGrmedios gubemamentales y el de los fondos en bonos corporati- o
de caja vos a corto plazo. Una de las medidas del desenpeño previo son los ¡endimientos de 2009. Ya se
o
N
los rendimientos definieron las va¡iables y se reunieron los datos de un:i muestra de 184 fondos en bonos. Construya o
por los el diagrama de caja de los rendimientos producidos por los fondos en bo¡os intermedios gubema- or
en Donos mentales y corporativos a corto plazo durante 2009:
y diagrarnas de caja de Ex-
v SOTUCÉN La ñgura 3.4 presentr los resr!¡enes de los cinco n{meros
a cono cel para los rendimientos producidos por los fondos en bonos intomedios gubenamentales y corpoftI-
durante 2009 tivos a corto plazo durante 2009. En la figura 3.5 se observan los diagramas de caja de Minitab para los
misrnos d¿tos. Observe que en la figura 3.5 aparecen varios asteriscos (t) eo los diagramas, los cuales
indican valo¡es extremos que se alejan mas de L5 veces el rango intercuartil a partir de los cuartiles.

FIGURA 3.4
Resúmenes obtenidos con Excel de los cinco números y diagramas de caja de los rendimientos
generados en 2009 por los fondos en bonos intermedios gubemamentales y corporativos a corto Plazo

ohí.ü ¡¡ cl. ¡ h. f.&. - lqG


¡rÉr!d6 ¡¡dr-t* t dr...tlrd ¡ óno te

MinÍmum
F¡r5t Quartile

La mediana de los rendimientos, los cuartiles y los rendimientos máximos y mínimos 5sa ¡x¡q¡t
mayores para los fondos en bonos corporaüvos a corto plazo que para los intermedios gubema¡neata-
les. La mediana de los rendimientos para los fondos en bonos corporativos a corto plazo es mayor
que los rendimientos del tercer cuartil para los fondos en bonos inte¡medios gt¡b€rnamentales.
F
114 CAP|IIJLO3 Medidas auméricas descriptivas

Ol¡l.rnas d. caia p|t lo3 foftalo€ .n bonot


FIGURA 3.5 htcmradloa gubGmam.nt lat Y corpo.ltlvc a cotto pLzo

Diagramas de caja
de Minitab para los
rendimientos
producidos por los
fondos en bonos
intermedios
gubernamentales Y
corporat¡vos a corto
plazo durante 2009 _n_ j( +*

tt||d¡mldrto..¡ 2mt

El rendimie¡to del primer cuartil (5.70) para los fondos en bonos corporativos a corto plazo q
mayor que la mediana del rendimiento (4.,()) para los fondos en bonos htemedios gubemamenh.
les. Tan-to los fondos en bonos inte¡medios gUbemamentales como los corporativ$ a corto
plaa
están sesgados hacia la derecha, con un extremo muy largo en la parte superior del rango' E
result¿doi sol consistentes con los estadísticos calculados en la figrua 3.2 de la página 106.

En la figura 3.6 se muestra la relación entre el diagrama de caja y la cuwa de densidad pan
cuatro tipos diferentes de distibuciones. El área debajo de cada curva de densidad esüi dividida en
los cua¡tiles conespondientes al resumen de los cinco números para el diagrama de caja.

FIGURA 3,ó
Diagramas de ca.ia
para cuatro.distri-
buciones y las
curvas de densidad
correspondientes
F---m-----l t-------il}-i
Gráfica A Gráfica B
Distribución en forma de camPana Distribuc¡ón sesgads hacia la ¡zquierda

l---ú------l F---rr-l---r
Gráfica D
Gráfica C
OistÍbución s$gada hac¡a la deredra Distribución redangular
I

ú
Las distribuciones de las gráficas A y D en la figura 3.6 son siméticas. En esas distibucio¡s
a la longtud
la media y la mediana son igr.riles. Ademas, U tongtua del extemo izquier<lo es igual
J
del extremo derecho, y la línea de la mediana divide la caja a la mitad'
.:, La distribución de la gráfica B en la figwa 3.6 está sesgada hacia la izquierda. Los escasgs
bacü
( valores bajos distorsionan la media hacia el extremo izquierdo. En esta dishibución sesgada
(es decif' e[ €l
la izquierd! hay una gran aglomeración de los valores en el extemo alto de la escala
y e] e1
latlo ierecho); 7SX áe los-valores se encuentran entre el borde izquierdo de la caja(Qt)
tremo derecho (X* ooo*). Se observa un largo extremo izquierdo que contiene 25% de los valord
mris bajos, lo que cleñuéitra la falta de simetría en este conjunto de datos.
fa ¿istriUuciOn ¿e la gráfrca C en la figura 3 6 estrí sesgada hacia la derecha. Los valores sl
.

de ca.¡a
conceotr¿n en el extemo inicial de la escal4 es decir, en el lado izqüerdo del diagrarna
dgrecno-ofl
Aquí, 75% de los valores se encuentan entre el inicio del extremo izeuiadg y el lorde
diagáma de caja (e). Se observa un largo exkemo derecho que contiene 25% de los valores
ns
altos. lo que demuesta la falt¿ de simetría en este conjunto de datos.

)
Problemas para la sección 3.3 'l 15

l.mtt Para la sección

siguiente es
DE LOS FUNDAMENTOS
un conjunto de datos de una muestra ffi :iá',#,sn::,ffi ;:"#T"*"ffi;
14 ban-¿s de chocolate oscuro.

12749073 0.68 0.72 0.92 1.r4 1.42 0.94 0.77 0.57 l.sr
(0) 0.57 0.55 0.86 1.41 0.90
el primer cuanil (Q'), el tercet cuartil
Fuente: Datos ext¿ídos de "Da¡k C\ocolalÉ: Which Bars Are Best?',
ro intercuaru' Corcuner Rqo*, sepienbre dc 2007, p. 8.
il resumen de los cinco números.
6L diagrama de caja y describa su forma. a) Calcule el primer cuartil (0,), el tercer cuartil (Q) y el
su respuesta €n el inciso c) con la del inciso d) rango intercuartil.
3.3 de la página 107. Come,nte al respecto. ó) Ddscriba el resumen de los cinco nrlmeros. ,
c) Constuya un diagrana tle caja y describa su forma-
El giguient€ es un coojuuto de datos de una muestra
3.23 El archivo l@ lista el precio promedio por habi-
tación (en libras briüánicas) que se pagó en seis ciudades del
74973t2 Reino Unido en 2010.
el primer cuartil (01), el tercer cuartil (Q) y el
110 98 78 70 76 62
intercuartil.
Fue¡tc: Datos extraldos de vww.botclr¡onlpr€.sAotel-prfue-itr-
el rcsume¡ dalos cinco números.
de¡<ummer2010.hhl
un diagrama de caja y describa su forma.
su rcspuesta en el inciso c) con la del inciso d) a) Calcule el primer cuartil (01), el tercer cuartil (Q) y el
broblema 3.2 de la página 107. Comente al respecto. rango intercuartil.
ó) Escriba el resumen de los cinco números. a,
El siguiente es un conjunto de datos de una muestra c) Constuya un diagrama de caja y describa zu forma.

74982 3.24 El archivo @iacluye información sobre las millas


o
totales por galón (MPG) que en 2011 rendian automóviles o
ef primer cuartil (0,), el tercer cuartil (Qr) y el utilitarios pequeños. o
int€rcuartil. N
20 24 22 23 20 22 21 22 22 o
el resumen de los cinco números.
19 22 22 26 19 19 23 24 2r o)
un diagrama de caja y describa zu forma.
su respuesta en el inciso c) con la del inciso d)
2t 19 2t 22 22 t6 t6
Fuente: Datos extraídos de "Ratings", Consumer Reports, abil de
3.1 de la página 107. Come,nte al respecto.
2011, pp. 35-36.
El siguiente es un conjunto de datos de una muesba a) Calcule el primer cuartil (p,), el tercer cuartil (Q) y el
r¿ngo int€rcuartil.
7-5-87g ó) Desc¡iba el resumen de los cinco números.
c) Constuya un diagrama cle caja y describ¿ su forma.
el priner cuartil (01), el tercer cuanil
te (Q) y el
mercrvrfirl- 3.25 El archivo @ incluye información sobre los ren-
el resumen de los cinco números. dimientos de un certificado de depósito (CD) a un año y de
un diagrama de caja y describa su forma. un certificado de depósito (CD) a cinco años en 23 bancos
su respuesta en el inciso c) con la del inciso d) de Estados Unidos vigentes el 4 de abril de 20 I I .
problema 3.4 de la página 107. Comente al respecto. Fuede: Datos exh'¿ídos de rvv.B¡nkr¡t€,com,4 de abril de 2011.

DE CONCEPTOS c) Calcule el primer cuartil (0¡), el tercer cuartil (Q) y el


El archivo rango int€rcuartil.
E@EEE contiene infornación sobre
ó) Describa el resr¡men de los ci¡co números.
(en centavos) por porción de una onza de una mues-
13 galletas con trozos de chocolate. Los d¿tos son los
c) Constuya un diagrama de caja y describa su forma.
3.2ó Una sucursal ba¡caria localizada en un dishito comer-
cial de u¡a ciudad tiene el objetivo de negocio de mejorar un
22 25 23 36 43 7 43 25 47 24 45 44 proceso para atender a los clientes durante la hora del al-
U" "Chip. Chip, Hooray" , Consumer Reports, muerzo, ente el mediodia y la l:00 p.m. El tiempo de esper4
[?ffi*ft*r eu minutos, se define como el tiempo que transcufre ente el
te el primer cuartil (Q,), el tercer cuartil (pr) y el momento en que el cliente se forma en la fila y el momento
mtercuadil. en que llega a la ventanilla. Se reunieron datos de una mues-
Describa el resumen
cle los cinco núme¡os.
Conshuya un diag¡ama de
[a de 15 clientes durante est¿ hora. El archivo l@ lista los
y
caja describa su fonna. resultados, los cuales se presantan al inicio de la página 1 1 6.
"=. ?
116 CAPÍTULO3 Medidasnurnéricasdescriptivas

4.2t 5.55 3.02 5.13 4.77 2.34 3.54 3.20 c) ¿Qué concluye con respecto a las diferencias enhe el ü!0
4.50 6.10 0.38 5.12 6.46 6.19 3.79 de fondo de bono (intermedio gubernamental y corpora.
tivo a corto plazo) con base en el factor de riesgo (baj0,
La gerencia de otra sucursal bancaria' localizad¿ en una promedio y alto)?
zoni residencial, también está preocupada por el horario del
d) Compare los resultados en los incisos c) a c) con los ¡6¡.
almuerzo, entre el mediodía y la l:00 p.m. Los siguientes
dimientos de tes años, de 2007 a2009 (almacenados er
tiempos de espera, en minutos, reunidos de una muesha de
15 ciientes durante esa hora están almacenados en el ar-
el archivo !![l@$.
chivolS!. 3.2? Para este problema utilice los datos del archivo @
9.66 5.90 8.02 s.79 8;73 3.82 8.01 8.35 EC@
10.49 6.68 5.64 4.08 6.17 9.91 5.4'l c) Construya una tabla multidimensional para la media ¿a
los rendimientos de cinco años según el tipo y el riesg¡.
a) Calcule los resúmenes de los cinco números para los
t) Construya un¿ tabla multidimensional para la desüación
tiempos de espera en las dos sucursales bancarias.
bsli¡dar de los rendimientos de cinco años segun el tip
,) Construya diagramas de caja y describa las formas de las y el riesgo.
distribuciones para las dos sucursales bancarias.
c) ¿Qué concluye cotr respecto a las diferencias ente el tip¡
c) ¿Qué similitudes y diferencias hay en las distibuciones de
de fondo en bonos (intermedio gubemamental y corpor¡-
ios tiempos de espera para las dos sucursales bancarias?
tivo a corto plazo) con base en el factor de riesgo ftajo,
3.27 Para este problema utilice los datos del archivo l@ promedio y alto)?
@ yu oo" tabla multidimensional para la media de
d) Compare los resultados en los incisos a) a c) con los
ffiirt dimientos de cinco años, de 2005 a 2009 (almacenads
los rendimientos de 2008 segun el tipo y el riesgo.
ó) Constuya una tabla multidimensional para la dewiación es-
en el archivo l![f@$.
üíndar de los rendimientos de 2008 segnn el tipo y el riesgo' 3.30 Para este problema utilice los datos del archivo @
c) ¿Qué concluye con respecto a las diferencias ente el tipo @
¿) CoDstuya una tabla multidimensional para la media lc
de fondos en bonos (intermedio gubemamental y corpo-
cle

rativo a corto plazo) con base en el factor de riesgo (bajo, rendimientos de 2008 segun el tipo, las cuotas y el riesgo,
promedio y alto)? á) Constuya una tabla multidimensional para la desviaciól
-Compare
d) los remltados ur los incisos a) a c) con los rendi- está¡da¡ de los rendimientos de 2008 segun el tipo' lu
rnientos de 2009 (almacenados en el archivo !![@' cuotas y el riesgo.
c) ¿Qué concluye con respecto a las diferencias entre el tipo
3.28 Para este problema utilice los datos del archivo !!@
de fondo en bonos (intermedio gubemamental y corpoo
@
Ij-diist oy" una tabla multidimensional para la media de
tivo a corto plazo) con base en el cobro de cuotas (si o
no) y el factor de riesgo (bajo, promedio y alto)?
los rendimientos de nes años según el tipo y el riesgo'
d) Compare los resultados en los mcisos a) a c) con los rer
á) Constmya una tabla multidimensional para la desviación
estáüdar de los rendimientos de 6es años según el hpo y
dimientos de 2009 (almacenados en el archivo l@
el riesso. @.

3.4 Medidas numéricas descriptivas para una población


En las secciones 3.1 y 3.2 se presentaron varios estadísticos que describen las medidas
de tende¡'
numeric¡
cia cenhal y la variaóión de una muestra. Si el conjunto de datos representa mediciones
de una pobiación completa, se tienen que calcular e interpretar f9s ngi':ro¡
poblacionales En
la vananza po0ta
esta sección se estudianín tres parámetros de la población: la rredia poblacional,
cional y [a desüación esüíndar poblacional.
páa entender estos pariirnetos revise la tabla 3.6, que indica los rendimientos de un año ptf¡
los cinco fondos de invenión en bonos mas grandes (en iérnilos de bienes totales) vigentes el4 de

aonr qe zuI I 1auto".uo.rr" .,r 1fi!!@7.

TABLA 3.ó Fondo en bonos Rendimientos a un año

Rendimientos a PIMCO: Total Rh;Inst 6.9


PIMCO: Tot RtqAdmin o.o
un año para la
población que . Vanguard Tot Bd; Admn 5.0
consta de los clnco PIMCO: Tot RtniA 6.4
fondos de inversión American Funds Bond;A l.t
en bonos més Fue ei Dato¡ extsaidos de The Wall Stnet Journa¡,4 de abrii de 2011, p' Rl4'
grandes

)
3.4 Medidas aumericas desc¡iotivas oar¿ una ooblación 117

Media poblacional
La media poblacional se representa con el símbolo p, la leta griega minuscula mq y la ecuación
que la deñne es la (3.11).

MEDIAPOBLACIONAL
La. media poblacional es la suma de los valores en la población dividida ente el tamaño
poblaclonal, .ry.

(3.1r)
M

= media poblacional
¡¿
X = i-ésimo valor de la va¡iable f
=, su,m4 de todos los valores X¡ en la población

= nrlmero de valores en la población

Para calcular la media de los rendimie¡tos a un año para la población de fondos en bonos pre-
sentados en la tabla 3.6. se utiliza la ecu¿ción (3.11).
u,
\r.
+ + + +
lL= - =
6.9 6.6 5.0 6.4 5.6
=T=o' o
o
Por consiguiente, el porcentaje promdio de los rendimientos pam estos fondos en bonos es ó.1.
o
N
o
Varianza y desviación estándar de una población {
La varianza poblacional y la desviación estándar poblacional son parámehos que miden la va-
riación en una población. De manera análoga a los estadísticos muesfales, la desviación estandar
poblacional es la raiz cuadrada de la varianza de la población. El símbolo la letra griega mi- l,
ntiscula sipa elevada al cuadrado, represent¿ la vaxianza poblacional, y el símbolo r, la letra
griega minuscula sip4 representa la desviación estánd¿r poblacional. Las ecuaciones (3.12) y
(3-13) definen-esos parámetros.- Los denominadores,para los.términos del lado derecho de estas
ecuaciones utilizan N en lugar del ténnino (l - 1 ), que se utiliza en las ecuaciones para la va¡ianza
y la desviación estándar muestales [véase las ecuaciones (3.4) y (3.5) de la pág"a 100].

. .. .' ,,.
VARIAN¡ZAPOBLACIONAL
La varianza poblacional es la suma de las diferencias al cuadrado al¡ededor de h media
poblacional diüdi¿. .¡¡s sl r¡maño poblacional, jV

Srr. - ,, \2
t (3.L2)
¡l
donde:

It : media poblacional
xi : i-ésimo valor de la variable X
N
2(x' - t")t = suma de todas las diferencias al cuadrado eirte
los valores,{ y ¡r.
'F
118 cAPfrulo 3 Medidas auméricas deso'iptivas

DESVIACIÓN ESTANDAR POBLACIONAL

(3.n)

Para calcular la variaoza poblacional de los datos que se presentan en la tabla 3.6, se utiliza ¡
ecuación (3.12):

>vt - pr
o-=

o.il + 0.25 + 1.21 + 0.09 + 0.25


5

)M
=-"=0.488
5

De esta manera, la varianza de los rendimientos a un año corresponde a un ¡endimjento de un


porcentaje cuadrado de 0.488. Las unidades al cuad¡ado dificultan la interpreiación d€ Ia varianza
(porcfi'
bebemoi utiliza¡ la desviación esüfurdar expresada en las unidades originales de los datos
taje de rendim'iento). A partir de la ecuación (3.13)'

l, ¿Á
= 0.6e86
"=17= !i?
pof lo tanto, el porcentaje de rendimiento típico difiere aproximadamente 0.6986 de la medi¿
producen resultadm
de 6.1. Esta pequeña cantidad de variación sugiere que estos fondos en bonos
sin muchas diferencias.

Regla empírica
cerca &
En la mayoría cle los conjuntos de datos, una gran parte de los valores tiende a agruparse
l.' l";dñ". En los conjr:ntos de datos sesgadoi haiia la derecha, este agupamiento ocure. a'

quierda de la-media, ei decir, en un-valor que es menor que la media. En los conjuntos de daro
es dec4 r¡
sesgados hacia Ia izquierda, ios valores tienden agnrparse ¿ [a derecha de la medi4

valór mayor que la media. En los conjuntos de datos simétricos, donde la mediana y la media
so
y
iguales, a menudo los valores tienden a agnrpane alrededor de la mediana la media
producioú
para examinar la vant
$
ria ¿istribuciOn en forma de campana. Pódem¡s utilizar la regla emplrica
.f bilidad en las distribuciones que tienen forma de campana:
; :l:
. Aproximadamen te 68Vo de los valores se encuenÍan denho de +l desviación estrándar
¡
1

partir de la media.
. iproximadament e 95Vo de los v¿lores se encuentran dento de +2 desviaciones esüindaf¡
partir de la nedia.
. iproximadamente 99.7% de los valores se encuentran detrtro de +3 desviaciones estánd¡f
¿

l3 partir de la media.
y.porlt
La regla empírica ayuda a medi¡ la forma en que los valores se dishibuyen por aniba
,
U"¡o ae f"LAa f tamúien sirve para identificar valores extremos. La regla empfit" rypl11$to:%
t
'¡ para las distibuciones en forma de carnpan4 solo alrededor de 1 de cada 20 valores.e,staTn
rt ios rrás allá de dos desviaciones estandar a partir de la media, en cualquier dirección. Como rets"

general, podemos considerar valores que no se encuentran dentro del urteya]o-4^+ 2l como
p¡sl0re
valores v
i"lo.es rmo.. La regla también implica que solo alrededor de 3 de cada 1,000 esta¡aú_
"it
calüados más allá de ties dewiaciones esüindar a partir de la media Por lo tanto, los valores
qur "

se encuentan dento del intervalo p + 3o casi siempre se considera¡r valores exhemos.


3.4 Medidas u¡néricas descriptivas para una población 119

3.14 Se sabe que ula población de botellas de 2 litros con bebida de cola tiene un peso de llenado de
2.06 ütos y una desviación estándar de 0.02 litros. Se sabe que la población tiene una distribución
de Ia regla en forma de campana. Describa la distribución de pesos de llenado. ¿Es muy probable que la bote-
lla contenga menos de 2 litros de bebida de cola?

sorucóN
tL x o = 2.06 x 0.02 = (2.04,2'08)
F x 2o = 2.06 i 2(0.02) = (2.02'2.10)

F t 3a = 2.06 * 3(0.02) : (2.00,2.12)

Por medio de la regla empírica, observamos que aproximadamente 68% de las botellas contendrán
entre 2.04 y 2.08 lihos, que alrededor de 95% contendran enf.e 2.02 y 2.10 liüos, y qüe más o me-
nos 99.7% contendní errre 2.00 y 2.lzlibos. Por lo tanto, es muy poco probable que una botella'
contenga menos de 2 litos.

Para conjrmtos de datos muy sesgados, y que no parezcan tener fonna de campana' en lugar de
la regla empírica se debe utilizar la regla de Chebyshev que se estudia a continuación.

Regla de Chebyshev
La regla de Chebyshev (Véase la referencia 1) establece que para cualquier conjunto de datos, sin
importar su forma, el porcentaje de los valores que se encuentan a distancias que estiín denho de & U'
desviaciones estándar a oarti¡ de la media deben se¡ al menos:

(' -;) x 100% o


o
o
N
Esta regla se puede utilizar para cualquier valor de ,t mayor que 1. Por ejemplo, considere o
k = 2. La regla de Chebyshev establece que al menos 11 - (112)21x l00o/o = 7 5%o de los valores @
deben encontrarse dentro de É2 desviaciones estánda¡ de la media'
La regla de Chebyshev es muy general y se aplica a cualqüer distribución. Esta regla indica a/
men os qué porcentaje de los valores cae denho de una distancia dada a partir de la media. Sin em-
bargo, si el conjunto de datos se aproxima a una forma de c¿rmpana, la regla empírica refleja con
mayor exactitud la mayor concentación de datos cerca de la media. En la trbla 3.7 se comparan la
regla de Chebyshev y la regla empírica.

en
iat
BLA 3.7 7o de valores que se encüentrrn en interv¡log
alrededor de la media
Cómo varían los
i datos alrededor Reglr empírlce
:'de.la, media Chebyshev ldistibución con
Intervalo (cualquier distribución) forma de cempana)
o,¡t + o) Al menos 07o Aproximadamente 68%
2a, p, + 2o) Al menos 75% Aproximadamente 95%
3a, p, + 3o) Al menos 88.89% Aoroximadamente 99.7%

EJEMPLO 3.15 Como se planteó en el ejemplo 3.14, se sabe que una población de botellas de 2 lihos de bebiü de
cola tiene un peso de llenado de 2.06 litos y una desviación esuíndar de 0.02 linos' Sin ernbargo,
Uso de la regla
se desconoce la forma de la población y no podemos suponer que tiene forma de campana. Des-
de Chebyshev
c¡iba la distribución de los pesos de llenado. ¿Es muy probable que la botella contenga úenos de 2
liros de bebida de cola?
120 CAPÍTULO3 Medidas numéricas descriPtivas

50rucóN
u t c = 2.06 + 0.02 = (2.04,2.08)
P' t 2a = 2'06 r 2(0'02)
: (2'02'2't0)
p' t3o = 2'06 i 3(0'02) -- (200'2'12)
puesto que la distribución podría estar sesgada, no podemos utilizar la regla empírica'
Si uüliz¡.

;".;:üui] A;ñ";:io obt.nemosfiformación acerca del porcentaje de botellas_que ¡¡n


po¿emos afirmar que al menosJ5T-o de las botellas contendrán e¡¡
ii"., ,rü" zl+ v z.óg titros.
iJiv Z.1O litros, v que al menos 88'89% contend¡a entre 2'0 y 2'12 litros Por lo tanto' entre 0!
t t . t t % de las botellas contend¡án menos
de 2 litros'

Lasdosreglassepuedenutiiizarpaiaentendercómosedistribuyenlosdatosalrededorde¡
media cuando se tienen d¿tos Con cada regla se utilüa el valor calculado para ie¡
'u"'o"1.,.
para '9 en lugar de o' Los resultados que se obtienen utilizand¡
lu
üi*¿i;, ;;i;d"t scacuudo
son apronmacion", J.bido qo" t. utilizaron estadísticos muestales (-{. s1
esta¿ísticos muesaale "
y no pan{metos poblacionales (¡, o)'

Problemas para la sección 3.4


c)- Compare lo que encuentre con lo que se esperaría dt
APRENDIZAJE DE LOs FUNDAMENTOS acuerdo con la regla empírica. ¿Le sorprende el resultadl
3.31 El siguiente es un conjunto de datos para una pobla- obtenido en el inciso á)?
ción con l{ = I 0.
3.34 Considere una población de 1,024 fondos de inv*'
? 5 l1 8 3 6 2 t 9 8
sión que invierten principalmente en empresas
gtandes Us
de rendinientc
¿) Calcule la media Poblacional' ted deierminó que p, la media del porcentaje
y que a
¡i Calcule la desviación esuíndar poblacional' anual total obtenido por todos los fondos, es 8'20,
la desviación esüíndar, es 2.75.
3.32 El siguiente es un conjunto de datos para una pobla-
a) Según la regla enpírica, ¿qué porcentaje de esgs f.on$
ción con N= 10. ' +1 desviactft
de-i¡versión se esfera que estén dento de
7 566648693 estandar a Partir de la media?
á) Segun la regla empírica, ¿qué porcentaje de -esos
fondoc
c) Calcule la media Poblacional. ' +2
de-inversiói se .rp.tu qu. estén dentro de desviacto'
á) Calcule la desviación estrindar poblacional'
nes estándar a Partir de la media?
c) Segun la regla de Chebyshev. ¿qué porcenaje
de '
APLICAOóN DE CONCEPTOS +'' -
foidos de invenión se espera que estén dentro de
3.33 El uchivo @ listalos inpsos5scales himestrales.por
que termmo en o *3 desviaciones estríndar a partir de la media?
ventas (en miles de dótares), para el periodo
de d) Segun la regla de Chebyshev, ¿ente qué dos cantidades*
marzo ie 2011, que los 50 establecimientos comerciales ' anuales total6
de Fair Lake: .tp.-"au qua t" *.uentren los rendimientos
esa localidad enüaron al contralor de la ciudad
d;al m;s el 93.75% de estos fondos de inversión?
10.3 l1.l 9.6 9.0 14.5
incluye información sobre e
13.0 6.7 11.0 8.4 10.3 3.35 El archivo !!@@ e¡t
13.0 I 1.2 11 51 12.5 l-po.sto ..t"td ($F los .igttrillos en cada uno de las 50
de 2010'
8.0 11.8 8.7 10.6 v.f dJes cte BstacbsÚnidos hasta el 31 de diciembre
a) Calcule la media poblacional y la desviación estríndat P
11.1 10.2 1 1.1 9.9 9.8
11.6 15.1 p.5 6.5 1.5 blacional para el impuesto estatal a los cigarrillos'
10.0 12.9 ot 10.0 12.8 á) Interprete los parámefos an el inciso a)'
12.5 9.3 10.4 12.7 10.5
3.3ó El archivo [@! incluye datos sobre el consuÍ]od
01 ll5 11.6 7.8 estados y et u"
10.7 energia per cripit4 en kilowatt-hora' en los 50
10.5 7.6 10.1 8.9 8.6
oi oi. óo¡-tiu¿e Estados Unidos durante r¡n año recie¡e
Ú
estándar ¿) Calcule la media, la varianza y la desviación estfuldar
c) Calcule la media, la vartanzz y la desviación
para esta Población.
lapoblación. )!
^F
fisca- ó) ¿Qué proporción de esos estados tiene un consumu
-'
A¡' ¿que porcenta,¡e de estas empresas tienen ingresos
ies trimestrales por ventas que están dentro
de +1' +2 o tEiu p". t¿pita denuo de +1 desviación estríndaraPÑ
a Pd

ttu d;h;di; denko de +2 desviaciones estindar


+3 desviaciones estlíndar a parti de la media?
3.5 Covrrianza y coeñcic,Et€ de corelación 121

y d€nto de +3 desviaciones estándar a partir de mero de acciones por su pt€cio en el mercado. El 8 de ab¡il
de 2011 la capitalización en el mercado de esas empresas

lo que eücuenüe con lo que se esperaría encon- iba de $19,200 millones para Alcoa, hasta $426,400 nillo-
regla emplrica' ¿Le sorprenden los re- nes pa¡a ExxonMobil. La población completa de los valores
acuerdo la
ebtenidos en el inciso á)?
de capitalización de mercado está ahnacenada en @[
desde el i¡rciso
a) hasta el c) sin tomar en cuenta @
¡ro de Columbia' ¿Cómo variaron los resultados?
Fuente: Datos exFaídos de money cnn.com, 8 de abril cle 20 I I .

DJIA está compuesta por 30 empres¿rs. ¿Qué tan


on esas empresa!¡? Un método común para medir o) Calcule la media y la dewiación estrindar de la capitali-
d€ uúa empresa consiste eE utilizar su ctpitalíza' zación de qercado para esta población de 30 empresas.
nercado, la cual se calcula multiplicando el nú- á) Interprete los parámebos obtenidos en el inciso a).

v aríanza y coeficiente de correlación


En la sección 2.6 utilizamos diagramas de dispenión para examin¡r visu¿lnente la relación entre
dos va¡iables numéricas. En esta sección se presentan dos medidas de la relación ente dos varia-
bles numéricas: la covarianza y el coeficiente de cor¡elación.

Covarianza
La covarianza mide la fuerza de la relación lineal ente dos variables numéricas (Xy ,f). La ecua-
ción (3.14) defi:re la cov¡rianza muestrrl y en el ejemplo 3.16 se ilusta su uso. o
<
o
o
o
N
>6r-ngr-i) (3.14)
6

3.16 En la figura 2.15 de la página 55, usted constuyó un diagrama de dispenión que mosf¿ba la rela-
ción entre el valor y los ingresos anuales de los 30 equipos que conforman la National Basketball
Association (NBA) (extraído de ww*forbes.com/lists/2009/32lbrsketb¡ll-values-09-NBA-
Te¡m-Valu¡tions-Rankhtml; aLnacenados en el archivo S!!@'
Ahora usted dese¿ medi¡ la
relación, entre el valor de una franquicia y los ingresos anuales por medio del crilculo de la cova-
ria¡za muestral.

SOLUCÉN La tabla 3.8 de la página 122 indica el valor y los ingresos anuales de los 30 equipos.
En la figura 3.7 se presenta una hoja donde se calcula la covarianza par"a estos datos. La sec-
ción área de cálculos de la figura 3.7 divide la ecuación (3.14) enrm conjunto de cálculos más pe-
queños. A partir de la celda F9, o utilizando di¡ectamente la ecuación (3.14), encuentra que la
covarianza es 3,1 1 5.7241.

90.356
cov(¡, r) = *
.]U-I
= 3.115.7241

La covarianza tiene una importante desventaja comrc medida de la relación lineal ente dos
variables numéricas. Como la covarianza puede tomar cualquier valor, no es posible ut'rlizarla para
deternri¡ar la fuer¿a relativa de la relación. En otras palabras, no es posible saber si el valor
3 ,ll5 .7241 indica una relación fuerte o débil. Para determinar mejor la fuerza de la ¡elación, es

necesario calcular el coeficiente de corelación.


122 cAPÍTWo 3 ' Mdidas nl¡mericas descriptivas

TABLA 3.8 Ingresos Equipo Valor


a<¡ gl
Valores e ingresos Atlant¿ 306 103 Milwaukee
anuales de los 30 Boston 433 t44 Mi¡nesota 268 96
equipos de la NBA 278 96 New Jersey 269 92
Charlotte
(en millones de
dólares)
Chicago 5il 168 New Orleans 267 95

Clwel¡m¡l q6 159 New York 586 202


Dal]as 4t6 154 Oklahoma City 310 lll
Eenve,r 321 ll5 Orlando 361 l0?
Detoit 4:19 t'll Philadelphia 344. 115

Golden State 315 113 Phoenix 429 148

Houston 470 160 Portl¿nd 338 121

Indiana t9l 97 Sacramento 305 109

Los Angeles elippers 295 102 San Antonio 398


Los Angeles Lakers 607 2W Toronto 386 133

Memphis 257 88 Utah 343 118

Mi¿mi t64 126 Washington JIJ 110

FIGURA 3.7
Hoia de cálculo de
Exéel para calcular
la covarianza entre
el valor y los
ingresos anuales de
los 30 equipos de la
NBA

4i
a!
i '.q
i \'r

i'rj
' .:l

I r,,

I 'dt
lli

i!

)
3.5 Covarianza y coeficiece de conelación 123

Coeficiente de correlación
El coefciente de correl¡ción mide la fuerza relativa de una relación lineal enae dos variables nu-
méricas. Los valores del coefrciente de correlación van de -1 para rma conelación negativa per-
fecta hasta +l para una conelación positiva perfecta. En este caso, perfecta significa que si los
puntos se graficaran en un diagrama de dispersión, todos se podrían conectar con una línea ¡ecta.
Cua¡do se tienen d¿tos poblacionales para dos va¡iables numéricas, la letra griega p (rho) se
utiiiza para simbolizar el coeficiente de correlación. En la figura 3.8 se ilustan t€s tipos de asocia-
ciones diferentes entre dos va¡iables.

Gráfica A Gráf¡ca B Gráfica C


Correlación n€gativa S¡n con6lación Corelación positiva
perfecta (p = -1) (p= o) p€rfecta lp= +1)

Eu la gnífica A de la figura 3.8 se observa una relación lineal negativa p€rfecta enfie Xy F.
Así, el coeficiente de conelación p es igual a -1, y cuando Xaument4 f disminuye de una forma a,
perfectamente predecible. En ta gráfica B se observa una situ¿ción en la qr¡e no hay una relación
ente Xy L En este caso, el coeficiente de conelación p es igual a 0, y a medida que aumeÚa,! no
existe una tetrdencia de I a aumentar o disminui¡. La grífica C ilustra un¿ relación positiva per- o
fecta en la que p es igual a +1. En este c¿so, F aumenta de una manera pedectamente predecible
o
o
cu¿ndo aumenta X N
to
Una correlación, por sí misma, no demuestra que uisu un efecto de causalidad' es decir que
o
el cambio en el valor de una variable causó el cambio en la otra variable.U¡a fuerte correlación
puede ser simplemente producto del azar, o el efecto de una tercera variable que no se tomó en
cuent¿ en el cálculo de la conelación, o bieD, el resultado de "n¡ relación de causa y efecto. Es ne-
cesario realizar un anáüsis mlís profrmdo para determinar cual de esas tes situ¿ciones p¡odujo en
realidad la correlación. Por lo tanto, podemos decir que /c causalidad implica correlación, peto la
correlación, por sí misma, no implíca causalidad.
La ecuación-(3. I 5)-define.el.coeñcienle de corrd¡ción muestral (r).
124 cAPfruLo 3 Medidas numéricas descriplvas

Cuando se tie¡en d¿tos muestrales, es posible calcular


el coeficiente de correlación muesq
r.Cuandoseutiliza¡datosmuestales,espocoprobablequeseobtenganncoefctented€cor¡eh
se presentan di"{*
cióu muesüal de exactamente *1, 0 o -1. En la figura 3'9 9" g'p"ttiq
para conjuntos de datos, qad¡
junto con ; coeficientes de co¡relación muéstal respectivos, r, seis

uno con 100 valores de X Y Y'


para todos
.i cug.." ¡,, el coeficiente de correlación, r, es -0.9. como se observ4
no fu
de f sean gandes. De ia mis6¡
oao.., p.qoá* JrÍhay una fuerte tendencia a que los valores
FIGURA 3.9
de conelación muestral' r
Seis diagramas de dispersión y sus coeficientes
gh¡r¡m. d. dl.9-.1ón F n tr_o'ó
Dl.gr¡h¡ ó dt¡Ff!¡ón P.n f. -0.9

* ... .,.
' ...l'¡

Oi8grama B

t. -03 O.i¡ruÍ. d. d?..iór F ¡ t= 03


Dbsffl¡ d. d!'.tión Pü¡

't

.:
Diagrama D
D¡agrama C
q Dt¡gm. d. d.P.dón P.ñ .: 0.9
{t Dhgr.m. d. (ftFrdó¡ 9¡r. t' 0.4
.ri
L¡:
j\
i,rj ' .. i:'
, ;li
i"l '..t ¡
r,{ t'.
: .'.
:¡f . .; i
l:16
rr¡ i' .
t! ...:. .:.. :
.q1Y ' :;..
t
.,, ( . .::-.'

!
3.5 Covarianza y coe{iciente de corelación 125

forma, los valores grandes de .{ tienden a apareane con valores pequeños de y. No todos los datos
caen sobre una línea recta, por lo que la asociación entre Xy Ino se puede describir como perfecta.
Los datos en el diagrama B tienen un coeficiente de correlación igual a -{.6 y los valores pequeños
de Xtienden a aparearse con valores grandes de fLa relación linealentre.f,y Idel diagrama B no
es tan fuerte como la del diagrama A. Así, el coeficiente de cor¡elación en el diagrama B no es tan
negativo como en A. En el diagrama C la relación lineal ente Xy I es muy débil, r = -{.3, y solo
existe una ligera tendencia a que valores pequeños de X se acoplen con valores grandes de L Los
diagamas D a F describen conjuntos de datos que tienen coeficientes de conelación positivos, ya
que los valores pequeños de Xtienden a acoplarse con valores pequeños de I, y los valores gra:rdes
de Xtienden a asociarse con valores grandes de f. El diagrama D presenta una correlación po-
sitiva débil, con r = 0.3. El diagana E muestra una conelación positiva más fuerte con ,'= 0.6. El
diagrama F muesha una conelación positiva muy fuede, con r = 0.9

En el ejemplo 3.16 de la página 121, calculamos la covarianza de los valores e ingesos de 30


'LO 3.17 equipos de btisquetbol de la NBA. Utilice la figun 3.10 y la ecuación (3.15) de lapigirn 123 pua
del
c¿lcular el coeficiente de correlación muestal.
de
muestral

IGURA 3'IO
de cálculo de
para calcular
coeficiente de
muesüat, a,
los valores
ingresos de 30
de Ia NBA. o
o
o
N
to

sorucróN
cov(X, I
SxSv

3,115.7241
(32.4s73)(e6.9te9)
= 0.9905

El valor y los ingesos de los equipos de la NBA estrin muy conelacionados. Los equipos con me-
nores ingresos tienen los valores mrás bajos. Los equipos con los ingresos mrás elevados tienen 1os valo
¡es más altos. Esta relación es muy fuerte, tal como lo indica el coeficiente de conelación r = 0'9901
En general, no podemos suponer que solo porque dos variables estén conelacionadas, los cam-
bios en una variable causaron los cambios en la otra. Sin embargo, en este ejemplo, tiene sentido
concluir que los cambios en los ingresos podrían causar modificaciones en el valor de un equipo.
126 cAPÍruLo3 Medidas numfi cas descriPttvas
r
enhe dos variabls
indica la relaciónLineal o asociación
En resumeq el coeüciente de conelación lineal entre las dos
coefici#it t"tlüt¡" " acerca a +1 o -1' la relación
numéricas. Cuando el una relación [nq¡
de conelaciónse acerca a 0' no existe
va¡iables es m¡ís fuerte Co^¿o
'ito"¡ti*t"
gl ,rpo i.i."".lJ"rt Je fonelación indica si los datos están
conelaciona.
o, si acaso, es muy un¡". los valoq
* d;#";;;;-tÁ g-ao at xsuelen estar apareados con
dos de manera posi i",' granda
los valores mas 4
de manera negativa' es decir'
mas grandes de f, o si está'n conelacionados tuerte
x sueren estar apareu¿o, .oo ro, ilñIlili' ntffi a" r' r" tilencia de una 9onei11on no

inAca ü ünd*cias que están presentes en los d¿tos'


implica un efecto de causati¿aq 'ofo

Problemas Para la sección y b)' concluye acerca ¿s


d) Cpn base en los incisos a)
-' ¿qué
ú?u.ioo *o" las calorías y el azúcar?
una muesÍa
3.38 El siguiente es un conjunto de datos de necesita predecir lo,sin'
3.41 La industria cinematográfica
con n = 11 elementos' ¿. cada película, ¡na
610 12 4 9ls18 ü.t.t U.., f"*":,:'::::rt::*
x'i 15 83 18 í' i.ü"'"."ti.f ryfg*entes
resultados'aLnff:i*:-T
zi $ zq s 30 36 12 27 45 s4 li';;ñ;;iffil son 1os ingresos
1tT, ;t^'"'.*:i:
¿) Calcule la covana¡za' i.i'l'**ñr"r,-l*t"s.*1:"E:?11'.y19f :1,::'":
¡l Cul.ot. el coeftciente de correlación' ;J#;,;;;undo ien nittones ¿e
19lT:l* iT^T
nott"i qut se estrenaron entre 2001v
.í iq*,- fuerte es la relación entre Xy I? Explique su
ídr.#;;il"y
respuesta. 2009.

APLICACIóN DE CONCEPÍOS Primer Ingesos


State University frnde en Estados Ingreros
3.39 Un estudio de 218 alumnos de Ohio
;;ót;;"" relación ent¡e el tieúpo dedicado a-navegí¡r semana Unidos mundials

y .t promedio de las caüficaciones' Los estu- La piedra 90.295 317:558 976.458


flosofal
"i"rac.boor utilizaron Facebook h¡vie-
diantes que pocas veces o nunca 88.357 261.988 878 98E
que sí La cámara secreta
i"l * ol-*i"¿¡ de calificaciones mas alto que los
EI prisionero de Azkaban 93.687 249.539 195 539
lo utilizan'
Marklein' "Facebook Use -L^inkcd to 102.335 290.013 896'013
Fuente: Datos exfiaídos de M' B' El cáliz fuego
de

ilt. i""ü""t it-"", www'rsatoday'com' 14 de abril de 2009'


La orden del fénix 7?.i08 292'005 938 469
¿) ¡.El estudio sugiere que el tiempo
dedicado a navega¡ en
EI misteio del PrínciPe 17.836 30i.460 934 601
" i;;;;k t .t"p'ot"aio de calificaciones están correla-
Füente: Datos extraídos de wft?'the'!üDberi'com/interacüve/c0mF
cionados de manera positiva o negativa? E¡rry-Potter.Php '
de causa y etecro
á) ¿Cree que podría baber una rel¿ción
Facebooky el pro-
. entre el ttempo dedlcaoo a navegar
en
respuesta'
c)Calculelacovari'--:t'i:,'"fff-uo'¿1,1,:ff;rlr,,,
t'su
medio de calificaciones?'Explique'su semana Y los ingresos en

ftifid;l 3.40 El archivo incluve datos-sobre las


!![!! i.ffill il;.";..*o mundiales' v
v lo' ingresos
Unidos y los ingresos mundrales
los

E@ calorías y el azúcar, en gramos' conte


dos en una in-gr;s en Estados --"
de correlación entrelos ingresos
oorción de siete cereales para el desayuno' "' éaicule el coeficiente
á)
irn ¿e semana y los ingresos en Estados l-l¡r'
i.itl."t
Cere¿l
Calorías Azúcar ;:::iffiñ;;;i p'i-íenn"Estados
aJ'"'ana v los
Unidos y los tnge
ingresoe

80 6 rr*¿int"riy los ingresos


Al1 Bran de Kellogg's
100 2 sos mundiales.
Com Flakes de Kellogg's cree que es.más valioso
para expresar la
4 c) ¿Qué est¿dístico
Wheatles
100
' iüción del primer frn de sem1la'
entre los ingresos
lT
de 110 ü
Organic Multigane Flakes
i"t.t". .t g""¿"'ioido' y üs ingresos mundiales
.o?;áiJaJá *tf itot' át conelación?
Na¡re's Path Expliquesu
130 4
Rice KrisPies de Kellogg's
190 l1
Skectded-ffi eat V¿nilla Almond
de Post
,,'i.ll"",ik;:H.t;ljJlJ"Íi".,';il"":iffi ."",:,il:
Vtini Wheas de Kellogg's 200 I 0
y los tngtesos munurc'*
los ingresos en Estados Unidos
r.s
¿) Calcule la covananza' un eran negocio' va qu€
á) Calcule el coeficiente de conelacron' l;11"i'rlTJJi,P"""t"'"1",?les
valioso para expresar Ia
c) ;.Cuál estadisbco cree que es más
" :;;;;;" ius caloúas v el azúcar' la covarianza
coeñciente de conelación? Explique
su respuesta'
o el
i:::T,*-,1T5:tri:lffi ,,":Ilili{ffi
3.6 Estadística descriptiva. DesveBtajas y aspectos éticos 127

las 65
- r0 deuásquetuot
escuelas que participaron en Wonderlic. El archivo [![@ lista las puntuaciones pro-
de Ia NCAA de 2009' medio obtenidas en la prueba Wonderlic por los jugadores
l"'ñ
-Compensation for Division I Me¡'s Bas- de fi:tbol que buscan ingresar a la NFL y el índice de gra-
l. ,,^. ¡"
duación de los jugado¡es en las escuelas seleccionadas.
i;,*, ZjX3:l51ol9r*9,
T"i''drtt"i¡utl l^': l:l*'i'
D_ollars,by,schoo-l"' ltotrey'cnn' Fuente: Datos extaídos de S. Walker, "The NFL'g SEartest Tcam"'
The Wall Street Jounal, 30 de sepüembre de 2005, pp. W1, Wl0).

c) Calcule la covari¡nz¿.
de correlación. á) Calcule el coeñciente de correlación.
incisos ¿) y b), ¿qué concluye acerca
de
c) Con base en los incisos a) y b), ¿qué concluye acerca de
y
los salarios de los entrenadores los
in-
la relación entre la puntuación promedio en la prueba
Wondoüc y el índice de graduación?
de futbol colegial que quieren ingresar
la prueba de inteügencia estandarizada

ica descriptiva. Desventaias y aspectos éticos


En este capítulo se explica la forma en que un conjunto de datos numé¡icos puede describine por
medio de los estadísticos que proporcionan las medidas de tendencia cental, de variación y de
forma. En las empresas a menudo se incluyen estadísticos descripüvos, como los que hemos estu-
diado, en los informes ejecutivos que se preparan de forma periódica.
El volumen de información üsponible en loternet, en los periódicos y en las revistas ha provo-
cado gran escepticismo acerca de la objetiüdad de los datos. Cuando lea inforrración que incluya
est¿díiticos desc¡iptivos, debe tener en mente el sarcasmo que zuele afibuine a Benjanin Disraeli' a,
el famoso estadista britrínico del siglo nc "Existen tes clases de mentiras: las mentiras, las malditas
mortiras y la estadística".
Por ejemplo, cuando examine estadísticos, debe comparar la media y la mediana. ¿Son simila- o
res o son muy üferentes? O bie4 ¿solo se proporciona la media? Las respuestas a estas Feguntas o
ayudanin a d*erminar si los {atos están sesgados o son siméticos, y si la mediaaa podría ser-una
o
N
mejor medida de tendencia central que la media" Además, debení determinal si también se incluyo to
la áesviación estándar o el rango intercuartil para un conjunto de datos muy sesgado. Sin esta in- N
formación, es imposible determina¡ la cantidad de variación que existe en los datos.
Al decidir qué resultados debe incluir en un informe, surgen consideraciones éticas. Es necesa-
rio documentar taúto los resultados buenos como los malos. Además, al hacer presentaciones ora-
les y al presentar informes escritos, se deben reportar los resultados de una formajusta, objetiva y
neutal. Cuando de forma intencional no se reportan los hallazgos que afectan de manera negativa
a una postura en particular, se incu¡re en una conducta poco ética.

En Choice is Yours, parte II, Revisión

n la segunda parte de la sección referente a Choice Is Yours, la


empresa de inversiones Choice Is Yours lo contató para ase-
sorar a inversionistas interesados en fondos de invenión en
bonos. Una muesta de 184 fondos de inversión en bo¡os in-
cluyó 87 fondos en bonos intermedios gubemamantales y 97 fondos en
bonos corporativos a corto plazo. Mediante la comparación de esas dos
categorías, usted obtuvo información valiosa para los inversionistas.
Los rendimientos de 2009 para los fondos en bonos intennedios gubenramentales y cotporatlvos a
corto plazo tuvisron un sesgo hacia la daecha, tal como lo indican los diagramas de caja (véase las.fi-
guras 3.4 y 3.5 de las páginas 113 y I l4). Los esadlsticos descriptivos (véase la figura 3.2 de lapágina
i06) pemritieron comparar la tendencia central y la variabilidad de los ¡endimientos producidos p9r
los fondos en bonos intermedios gUbernamentales y los fondos e,n bonos corporativos a corto plazn.Ia
media indicó que los fondos en bonos intermedios gubemamentales produjeron reodimientos prome-
dio de 4.4529, y la mediana indicó que la mitad de los fondos en bonos ofu¡iercn rendimientos de 4.4
o más. Las medidas de tendencia cenfial de los fondos en bonos corporaüvos a corto plazo fuaon
F
128 cArÍTuLo3 Medidas uuméricas descriPtivas

mucho más altas que los fondos en bonos intermedios gubernamentales' ya que tuvielo[ uil
las, de

froln.Ao O. 9.5SjS, y la mitad de los fondos en


bonos tuvieron rendimientos superiores a 9.1. ¡,
iondos en bonos intermedios gub€mamentales mostraron una variabilidad
ligeramente,
T19t gk
los fondos en bonos corporativos a corto plazo, con una desüación estandar de 5.JÓ } ).Ó9, ¡¡,.
de
los fondos en bonos in1¡,.
pectivamente. una inforrnación interesante es que, mientras que 25% de
L.dio, gub.-u..ntales tuvieron rendimientos de 6 5 o mayores (p, = 6 5)'.75% de-los fondos q
bonos córporativos a corto plazo tuvieron rendimientos de 5 7 o mayores
(gr =-) /) Aunque el
durante 2009 los fondos en bonos corpo¡ati.
desempeñó previo no garantiza el desempeño futuro,
gubernamentales (Pan
vos a corto plazo superarctr por mucho a los fondos en bonos rntenrcdios
conocer una situación donde ocunió lo contrario, abra el archivo f!!!f![p!!$'

dad y forma. Además, construimos diagramas de caja par¡


En este capítu1o y en el antenor estudiamos estadística des-
criptiva: la manera de visualizar datos por medio de tablas y visualizar la distribución de los datos. Tambien aprendirns$
gráficas, y la forma de utilizar diferentes estadísticos para a utilizar el coeficiente de conelación para describir la rela'

analiza¡ los datos y obtener conclusiones. En el capitulo 2 ción entre dos variables numéricas. En la tabla 3 9 se pre'
seota una üsta de los estadísticos descriptivos estudiados
aorendimos a visualizar datos mediante la construccióo de
graficas cle banas y gráficas circulares' histogramas y otos este capítulo.

tipos de gráiicas. En este capítulo aprendimos la forma en En el siguiente capítulo se presentan los principios basi-
que estadísticos descriptivos como la media, la mediana, los cos de la probabilidad con la finalidad de cenar la brecha
cuartiles, el rango y la desviación estándar se utilizan para ente el tema de la estadística descnptiva y el tema de laes
clescribir las características de tendencia central, variabili- tadística inferencial.

Datos nunéricos
TASLA 3,9 de análisis
Descripción de la tendencia central, Medi4 medi'n4 moda cuartiles, rango, rango intercuartil,
Resumen de
la variación y la forma de una varianz4 clesüación estándar, coeficiente de variación, valor
estadística
variable numérica Z, diagrama de caja 3.1I a 3.4)
(secclones J
ca.¡a (secciones J.
descriptiva
Describir la relación ent¡e dos Covananz4 coeficiente de conelación (sección 3 5)
variables numéricas

Desvi¿ción estánd¿r muestr¿l

\r.
X (3.1) S=VF= (3.5)
,q
'!Í
t:;
.'ii
rli.:
Mediana Coeficiente de v¿riación
-

..¡:
n+1 (3.2) (3.ó)
;
Mediana = 1i¿ valor ordenado cv = lz..lloo%
, ;lt V/
r;!
3 iungo Y orZ
r*
z= X-X
Ra[go=X."ro.-X."oo, (3.3)
¡l! (3.0
j¡i
t
Yarianza muestral
{
Primer cuartil,
I
.-É
ii.-
Srv - ?r2 Q1

(3.4) nll (3.8)


.t2 =
n-I ul - valor ordenado
. ^

i
Problemas de repaso para el capituio 129

Desviación estándar poblacional

valor ordenado
(3.e) )lx, - tD2
(3.13)

Covarl¡nza muestr¡l
(3.10)
=Q-Qr
\{x'-hv'-h
cov(X, t) = (3.14)
n-l
(3.11) Coeñciente de correlación muestr¡l
cov (,{, I) (3.1s)
SxSv

(3.r2)

a,

t23 media 94 sesgado 105


muestral media arimética 94 sesgo 105 o
media muestal 95 sesgo hacia la derecha 105 o
poblacional l17 sesgo hacia la izquierda 105
o
iariación 103 media N
mediana 96 siméaico 105 to
(D
medida de resistencia lll suma de cuadrados (SC) 99
moda 97 tendencia central 94
Q,: primer cuartil 109 valorexbemo 104
99 Qr: segundo cuartil 109 valotZ 104
muestral 100 Qr: tercer cuartil 109 variación 94
poblacional 117 rango 98 vaia¡za 99
113 rango intercuartil 111 muestal
varianza 100
regla de Chebyshev 119 varia¡"apoblacional 117

111 regia empírica 118


resumen de los cinco números 1l I

3.49 ¿Qué mide eI valor Zl


tn las propiedades de un conjunto de datos nu- 3.50 ¿Qué diferencias hay entre las diversas medidas de
variación, como el rango, el rango intercuartil,Ia vaúnza,
la desviación estrlndar y el coeficiente de variación, y cuáles
se refiere la orooiedad de tendencia central?
son las ventajas y desventajas de cada una?
hay entre la media, la mediana y la
y desventajas de cada una?
3.51 ¿De qué manera la regla empírica explica la
fonna en
son las ventajas
que los valores de un conjunto de datos numéricos se agru-
manera se interpretan el primer cuartil, la pan y distribuyen?
tucer cuartil?
3.52 ¿Qué difaencia hay enhe la regla empírica y la regla
se refiere la propiedad de variación? de Chebyshev?
I

1 30 cAPÍTWo 3 Medidas numéricas descriptivas

d) ¿Qué dkía a un cliente


que llega al banco_ a comPra¡ est
3.53 ¿A qué se refiere en la
propiedad de la for¡na?
tipo de póliza de seguro y le pregunta cuánto tlempo h.
3.54 ¿Qué diferencia hay entre
la covarianza y el coefi- daní el proceso de aProbación?
ciente de conelación? 3.57 Una de las principales medidas de la cali<lad delsq.
vicio que ofrece una organización es la rapidez con la q4
APTICACIóN DE tOS CONCEPTOS
responde a las quejas de los clientes. Una gran tienü depe.
3.55 La American Society for Quaüty (ASQ) aplicó una
tamental, propiedad de una famili4 que se especializa gn¡,
eucuesta sala¡ial a todos sus miembros. Los miembros de
la
venta de muebles y recubrimientos para pisos, incluyendo
ASQ trabajan en todas las áreas de instituciones de manu-
alfombras, ha tenido una gran expansión en los últi¡.¡
factura y servicios, con un interés común por la calidad' años. En particular, el departaúento de recubrimiento p¡¡¡
Pa¡a reaiizar la encuesta, se enviaron coneos elechónicos
a
pisos se amplió de dos gnrpos de instaladores a un supe¡i.
y recibie¡on 5,743 respuestas válidas'
56,052 miembros se
ior de instalaciones, un meüdor y 15 gnrpos de instalads
Los dos puestos más comunes fueron el de gerente e hge- res. El objetivo de negocio de la empresa era reducir gl
niero de control de calidad. Otro puesto es el de maestro tiempo tanscurrido entre la recepción de Ia queja y su res¡.'
Cinta negra, que es una persona que adopta un papel de lide' lución. Durante un año reciente, la empresa recibió 50 q1¡.
razgo como guardián del proceso Seis Sigma (véase la sec- jas respecto a la instalación de alfombras. Los datos de la¡
ción 14.6). Un título más es el de Cinta verde, que se otorga sO qu.¡*,
que estan organizados en el archivo E@ rc'
a los individuos que trabajan medio tiempo en proyectos de Dresentan el núnero de días que ranscurren desde que 3s

Seis Sigma. En la siguiente tabla se ptesentan estadísticos iecibe la queja hasta que se resuelve.
descriptivos sobre los salarios para esos cuato puestos' <^ 5 1{ 1l )7 l|52 2 123
f17 81 74 2'I ll
T¡d¡no Dervliclór t9 126 rr0 110 29 61 35 94 31 ¿o 5t2 4
d. mueltn Mlnlúo Má¡iDo €.t¡¡drr M.dt¡ M'dlrtrr 165 32 29 28 29 26 2s 114 13 13 10 5

Cbt vcrd€ 15 24,000 13?,000 29,000 ?5917 70'0m 27 4 52 302236 26 z0 23 33 68

c.f.nt 1,438 10,400 212,000 26,455 88'93 86'000 ¿) Caicule la media, la mediana, el primer cuartil y el tenc
Ing.d.m de 831 25,000 175,000 19,878 16239 15'0fo
cortol de
cuartil.
c¡llüd á) Calcule el rango, el rango htercuartil, la varianza' la d*
M.dfro s6 60,000 l85,OO0 26,46 113276 112,650 viación esuándar y el coeficiente de variación'
Cln¡ Égr¡ c) Construya un diagrama de caja. ¿Los datos esüín sesp-

Fücntc: Ddo6 eúaidos de ¡ S€áde c I A[.¡''Rcvcaling lÑ11ct3", Qttli, dos? Si es asi, ¿de qué forma?
P/o8zúr, dicicDbrÉ de 2010, P. I l.
d) Con base en los resultados de los incisos c) a c)' si tu'
viera que informar al presidente de la empresa cuádo
Compare los salarios de los Cinta verde, los gerentes, los
tiempo debe esperar un cliente para resotver una que¡a'
ingenieros de control de calidad y los maestos Cinta negra'
¿qué le diría? Explique su
respuesta.
3.5ó En el estado de Nueva York est i permitido que los ban- 3.58 Un fabricante produce carcasas de acero para eqüpo
cos Dara el ahoro vendan un tipo de seguro de vida, llamado eléctico. La parte principal del componente de la carcasa 6
seguro de üda de banco para el ahorro (SBLI, por las siglas una bandeja úecha de lámha de acero de calibre 14 Se
'

de Savings Banklife Insurance). La aprobación consta de un duce utilizando una prensa moldeadora progresiva de
z'"
oroceso inicial, el cual incluye una reüsión de la solicihrd' Ia toneladas con una opiración que coloca dos formas de 9ff
verificación de la información médic4 la posible solicitud de en el acero plano para moldiar la bandeja' La distancil
información médica y exámenes médicos adicionales, y una desde un lado de la fo¡ma hasta 1a ofia es fi¡ndame¡tal'
ya

etapa de recopilación de pólizas, durante la cual se generan que debe lognr un aislamiento cuando se usa a la intenp'
las páginas de la póliza y se envían al banco para zu enbega' rie. Lu requiere que el ancho de 1a bandeja sea dc
La óapacidad para entregar las póüzas aprobadas a los clien- "mpiesu
.l¡ entre 8.31 y 8.61 pulgadas. Se obtienen los datos derl!¡
tes de manera opoltuna es firndamental para que este servlclo muestra de 49 band;jas y se alnacenan en el archivo E@
sea rentable pam el banco. Dur¿nte un mes se seleccionó
una
el cual lista el ancho de las bandejas en pulgadas como
,lL 5t

muesta aleatoria de 27 polizas aprobadas y se obtuvieron los muestra en seguida:


siguientes tiempos totales de procesamiolto en días (almace- 8.312 8.343 8.317 8.383 8.348 8.410 8.351 8.373 8481 8'4n
núos en el a¡chivo@@} 8.476 8.382 8.484 8.403 8.414 8.419 E.385 8.465 8.498
84ü

73 19 16 64 28 28 31 90 60 5ó 31 56 22 8.436 8.413 8.489 8.414 8.481 8.415 8.4'lg 8.a9 8.458


8 4ó2
18

45 48 17 17 t7 91 92 63 50 51 69 16 17
8420
ii 8.460 8.444 8.429 8.4& 8.412 8.420 8.410 8.'105 8 321
8.396 8A47 8.405 8.439 8.411 8.4n 8.420 8.498 8.409
¿) Calcule la media, la mediana, el primer cuartil y el tercer
,,1., a) Calcule la media, la mediana, el rango y la desviacto¡r
cuartil. te!
estándar para el ancho. lnterprete esas medidas de
ó) Calcule el rango, el rango intercuartil, la varianz4 la des-
dencia central Y variabilidad.
viación esüfurdar y el coeficiente de variación'
á) Describa el resumen de los cinco números.
c) Conskuya un diagrama de caja. ¿Los datos están sesga-
dos? Si es así, ¿de qué fonna?
c) Constuya un diagama de caja y describa su fo¡rna'
Problqras de repaso para el capíhllo 131

del número de bandejas que cubri- gnmos, de una muestra de 50 bolsas de té producidas en
acerca
y
?, lu .npr.su d. tener enüe 8.3 I 8.61 una hora por una mriquina.
'! 5.65 5.44 s.42 5.40 5.53 5.34 5.54 5.45 5.52 5.41
m.e¡ci9nad1.e3 el problema 5.57 5.40 5.53 5.54 5.55 5.62 5.56 5.46 5.44 5.51
fabricante
ee aislantes eléctncos. Sl los
alslantes se 5.47 5.40 5.47 5.61 5.53 5.32 5.67 5.29 5.49 5.55
iJ"ra fu¡cionando, podría ocurrir un cor- 5.77 5.57 5.42 5.58 5.58 5.50 5.32 5.50 5.53 5.58
la resistencia de los aislantes, se lle- 5.61 5.45 5.44 5.25 5.56 5.63 5.50 5.57 s.67 s.36
d€structivas en laboratorios de gran c) Calcule la medi4 la median4 el primer cuartil y el tercer
cuánta fuerza se necesita para
cuartil.
se mide observando la cantidad de li-
á) Calcule el rango, el rango intercuartil, la varianza, la des-
ic¿r al aislante antes de que se rompa. viación estíndar y el coeficiente de variación.
:--;"ntes mediciones de una muesÚa de 30
c) lnterprete las medidas de tendencia cenFal y de variación
se üstan en el archivo @. deirto del contexto de este problema" ¿Por qué la compa-
t.6to 1,634 l,'1u 1,522 1,696 1,592 1,662
ñía que produce las bolsas de te debería preocuparse por
r,6ó2 1,734 t,774 t,5s0 1,756 1,762 r,866 las medidas de tendencia cenfal y de variación?
r,688 1,810 t,752 1,680 1,810 1.652 1,736 d) Constuya un diagrama de caja. ¿Los datos están sesga-
la mediana, el rango y la desviación dos? Si es así, ¿de qué forna?
fi¡alidad de determinar cuiint¿ fuerza se e) ¿La empresa está cumpliendo con el rcquisito indicado en
romper los aislantes. la etiqueta de que cada bolsa tiene, en promedio, 5.5 gra-
áedidas de tendencia central y de variabili- mos de té? Si usted estuüera a cargo de este proceso, ¿qué
a). cambios trataría de hacer con relación a la distibución de
diagrama de caja y describa su forma. los pesos en las bolsas indiüdu¿les si fuer¿ necesa¡io?
acetca de la resistencia de los aislantes si 3.ó2 El fabrica¡rc de las tejas de asfalto Boston y Vermont
que soporten al menos una fuerza de ofrece a sus clientes 20 años de garantía en la mayoria de o
del rompimiento? sus productos. Para determinar si una teja ó¡rará tanto como =
Ei.r.@E incluye datos sobre las calo- el periodo de garantí4 se realizan pruebas de aceler¿ción de
(€¡ gamos por porción) para una mues- vida en la fábrica" Las pruebas de aceleración de vida expo-
o
o
veget¿riarus. nen a una teja a las presiones a las que estaría som€tida en o
un uso normal de por vida, por medio de un experimento N
de "Healthful Burgers That Taste Good", to
de 2008, p. 8. en un ambiente de laboratorio que solo toma unos cuaotos 5
minutos. En est¿ prueba se raspa una teja de manera repe-
calcule la media, la nediana, el pri-
¿l tercer cuartil.
üü con un cepillo duranrc un üempo y se pesan los gni¡ulos
desprendidos por el cepillado (en gramos). Se espera que las
calcule el rango, el raúgo intercuartil,
tejas que experimentan una mefor pérdida de gnánulos du-
desviación estándar y el coeficiente de
ren más tiempo con rm uso normal que las tejas que experi-
mentan grandes pérdidas de gnínulos. En esta situación, una
construya un diagrama de caja. ¿Los
gi_es.esí teja no debe experimentar una pérdida de gránulos mayor
¿dequé_forma?
que 0.8 gramos, si se espera que dure €l tiempo que ofrece
de correlación entre las calorías y
la garantía. El archivo !@ presenta una muestra de 170

mn rcspecto a las calorías y a la grasa total?


mediciones realizadas con las tejas Boston de la empresa y
140 mediciones hechas con las tejas Vermont.
ica de calidad que es de interes para un
c) Anote los resúmetres de los cinco números para las tejas
de bolsas de té es el peso de este en las
Boston y para las tejas Vermont.
Si las bolsas no se llenan por completo, ó) Consfruya diagramas de cqja uno al lado de otro para las dos
Primero, los clientes no podrían pre- marcas de tejas y describa las fon¡as de l¡s distiliuciones.
an concentrado como lo deseen. Segundo, la
c) Comente sobre la capacidad de cada tipo de teja para lograr
violar las leyes sobre la veracidad de la in-
una @ida de gninulos igual o menor que 0.8 gramos.
sus etiquetas. Para este producto, el peso
el empaque indica que una bolsa contiene, en 3.ó3 El archivo [@ lista los costos por comida y
gramos de te. Si la cantidad media de te en una las califcaciones obtenidas por 50 rutaurantes citadinos y 50
el peso de la etiqueta, la empresa está rega- ¡estaurantes suburbanos por la calidad de sus alimentos, de-
Lograr la cantidad exacta de té en una bolsa coración y servicio (y su calificación total). Responda lo si-
debido a las variaciones en la temperatura y guiente para los restauradtes ur¡anos y suburbanos.
de la fábrica, a las diferencias en la densi- Fuente: Daios extraídos de Zagat Suney 2009 New York City Restdu-
la operación de llenado extremadamente rá- rarls z:r.d, Zagst Survey 2009-2010 Long Island Restrurarts. '
de la máquina (alrededor de 170 bolsas por 4) Constuya el resumeo de los ci¡co números para el costo
archivo
@@! lista los siguientes p€sos, etr de una comida.
132 cAPlTULo3 Medidasnrunéricasdescriptivas
f
á) Construya un diagrama de caja para el costo de una las propiedades, en miles de dólares, para cada estado I
comida. ¿Cuál es la forma de la distribución? el Distrito de Columbia?
c) Calcule e interp¡ete el coeficiente de correlación para la 3.ó7 El archivo indica el salario to1¿¡

calificación total y el costo de una comida. (en millones de dólares) de los di¡ectores de 1ól empres¿¡
3.ó4 El archivo f,fi@ lista l¿s calorías, las proteínas y el públicas grandes y el retorno sobre la inversión eu 201¡,
colesterol de alimentos proteinicos populares (carnes rojas Responda lo siguiente en relación con el salario total 1q
frescas, came de aves Y Pescado). millones de dóla¡es).

Fuente: Departamelto de Agricultura de Estados Unidos. Fuente: Datos ext¡aídos de M. Krantz y B. Hansen, "CEO Pay Sqan
While Worken' pay Stalls", USI Today, I de abil de 2011' pp. I!,
a) Calcule el coeficiente de cor¡elación entre las calorías y 2B y money,usatod¿y.com.
las proteínas.
¿) Calcule la media, la media¡a, el primer cuartil y el tercq
ó) Calcule el coeficiente de conelación entre las calorias y
cuartil.
el colesterol.
ó) Qalcule el rango, el rango intercua¡til, la varianz4 la da
c) Calcule el coeficiente de correlación enfe las proteínas y
viación estíndar y el coeficiente de variación.
el colesterol.
c) Construya un diagrama de caja. ¿Los datos están sesg¿'
d) Con base an los resultados de los incisos a) a c), ¿qué con-
dos? Si es así, ¿de qué forma?
cluye con respecto a las calorias, las proteínas y el co-
d) Con base en los resultados de los incisos a) a c), ¿que
lesterol?
concluye con respecto al salario total (en millones de dü
3.ó5 El archivo f,@@ indica el precio promedio de uoa lares) de los directores?
habitación en hoteles de dos, Fes y cuato estellas en ciuda- ¿) Calcule el coeficiente de correlación ente el sala¡io
des de todo el mundo durante 2010, en libras brit¡ínicas retorno sobre la inversión en 2010.
(aproximadamente 1.56 dólares en enero de 2011). Responda /) ¿Qué concluye a partir de los resultados
del inciso e)?
lo siguiente pan los hoteles de dos, tres y cuato estellas.
3.ó8 Usted planea estudiar par¿ su examen de estadística co
Fuetrte: Datos extraídos de www.hotels.com/press/hotel-price-itr- un gn:po de compañeros de clase y desea impresiona¡ a uo o
der-summer-20l0.btml.
oarticr¡iar. El individuo se ofrece voluntariaúente a utiliur Er'
¿) Calcule la media, la mediana, el primer cuartil y el tercer iel o Minitab para obtener la información, las tablas y las gni$
cuartil. cas necesarias para un conjunto de datos que incluye divasa
ó) Calcule el rango, el rango intercuadil, la varianza, la des- va¡iables numficas y categóricas asignadas por el profesor cm

viación esüíndar y ei coeficiente de variación. f¡es de estudio. El compañero se le acoca coo una hoja in
c) Interprete las medidas de tendencia cenfal y de variación presa y exclama: "Tengo toda la infonnación: las mediaq
dentro del contexto de este problema. las medianas. las desviaciones es!índar, los diagramas de ca¡
d) Construya un diagrama de caja. ¿Los datos están sesga- y las gnificas circulares para todas nuestras variables. El pto
dos? Si es así, ¿de qué forma? blenn es que algunos de los resultados parecen exh'años, com
e) Calcule la covarianza enhe el precio promedio en hoteles los diagramas de caja para el génao y la caner4 y las gráficr
de dos y de tres estellas, entre hoteles de dos y de cuaüo circularts para la calificación promedio y la estatura" Admi4
estrellas, y entre hoteles de tres y de cuaho estrellas. tampoco entiendo por qué el profesor dijo que no podríaoc
/) Calcule el coeficiente de conelación entre el precio pro- obtener estadísticos descriptivos para algunas de las varial''-
medio ente hoteles de dos y tres estrellas, entre hoteles ¡los obtuve para todas! Vean, la media de
la estatura es óL
de dos y cuatro estrellas, y entre hoteles de tres y cuatro la media de la c¿lificación promedio es 2.76, la media <lel genel
estrellas. es 1.50, la media de la canera es 4.33". ¿QrÉ le respondería?
g) ¿CuáI estadístico cree que es más valioso para expresar Ia
relación entre el precio promedio de una habitación en EJERCICIOS DE INFORME ESCRITO
q hoteles de dos, hes y cuatro estrellas: la covarianza o el 3.ó9 El archivo [!ftS!!! contiene rntbrmacion sto¡
:,''jj coeftciente de conelación? Explique su respuesta. el porcentaje de alcoho!-l número de calorías y el núneÍ
liiir ú) Con base en el inciso/), ¿qué concluye acerca de la rela- de carbohidratos (en gramos) para 145 de las cervezas ¿re
,ni ción enfe el precio promedio de una habilación en hote- sanales de 12 onzas más vendidas en Estados Unidos'
ü les de dos, tres y cuatro esüellas? Su tarea consiste en redactar un informe con base en
t¡¡l

irri 3.óó El archivo ![!!@ lista los impuestos per cápita evaluación descriptiva completa de cada uoa de las valt¿'
para las propiedades en los 50 estados y el Distrito de Co- bles numéncas [plrcentaje ie alcohol, número de caloríd
x
ts. lumbia de Estados Unidos. en 12 onzas y número de carbohidratos (en gramos) e¡
nr'
¿) Calcule la media, la mediana, el primer cuartil y el tercer
y
.;3 onzas]. Anexe a sus informes todas las tablas, gráñcas
it cuartil. didas descriptivas numéricas pertinentes.
:¡! ú) Calcule el rango, el rango intercuartil, la varianza, la des- 20ll
-rf Fuente: Datos €xtnídos de www.Beer100.com, I de abril de
viación estánda¡ y el coeficiente de variación.
t1-;
c) Construya un diagrama de caja. ¿Los datos están sesga- PROYECTOS DE EOUIPO
dos? Si es así, ¿de qué forma? El archivo Bond Funds contiene info¡mación acerca.*
d) Con base en los resultados de los incisos a) a c)' ¿que nueve variables de una muestra de 184 fondos de inversl0'
concluye con tespecto a los impuestos per cápita sobre en bonos.

I
Problemas de repaso para el capítulo 1 33

de fondo: número de identificación para cada las variables porcentaje de costo, rendimientos en 2009,
bonos rendimiento a tres años y rendimiento a cinco años, y res-
?ondo en
oo, dpo d. bonot que confonnan el fondo de inversión ponda lo siguiente:
gubernamental o corporativo a c) Calcule la media, la median4 el primer cuartil y el tercer
i'r Uono. (inttnoe¿io
cuartil.
corto Plazo) ,
: en millones de dólares D) Calcule el rango, el rango intercuartil, la varianz4 la des-
cargos por venta (no o sí) viación estándar y el coeficiente de variación
de costo: relación de los gastos con los acdvos netos c) Construya un diagrama de caja. ¿Los datos están sesga-
en 2009: ¡endimiento de 12 meses en 2009 dos? Si es así, ¿de qué forma?
a tres años: ¡endimiento anualizado, de d) Con base en los resultados de los incisos a) a c), ¿ryé
ZAO'1 IZOO9 concluye con respecto a las diferencias entre los fondos
" a cinco años: reudimiento anualizado, de en bonos con base en el riesgo?
,2005 a2009
factor de riesgo de pérdida de los fondos de in-
:
BASE DE DATOS DE LA ENCUESTA
v.nión 1ba¡o, Promedio o alto) CON ESTUDIANTES
3.74 El problema 1.27 de la página 13 describe una en-
Responda 1o siguiente para el porcentaje de gasto, el
cuesta aplicada a 62 estudiantes de licenciatura (los datos
a tes años y el rendimiento a cinco años.
la medi4 la mediana, el primer cuartil y el tercer
están aknacenados en el archivo @[@[. Para es-
tos datos y para cada variable numérica, responda 1o si-
guiente:
el ¡ango, el rango intercuartil, la varianz4 la des-
c) Calcule la media, la median4 el primer cuartil y el tercer
estrindar y el coeficiente de variación
un diagrama de caja. ¿Los daros están sesga-
cuartil.
ó) Calcule el rango, el rango intercuartil, la varianz4 la des-
Si es así, ¿de qué fonna?
üación estrindar y el coeficiente de variación
n base en los resultados de los incisos a) a c), ¿qué
c) Construya un diagrama de caja. ¿Los datos están sesga- a,
concluye con respecto a esas variables?
dos? Si es así, ¿de qué forma?
Desea comparar fondos de inversión en bonos que d) Escriba un infor¡ne donde resr¡ma sus conclusiones.
cuotas con aquellos que no las cobran. Par¿ cada uno
3.75 El problema 1.27 de la página 13 describe una en-
o
dos grupos, utilice las variables porcentaje de costo, o
en 2009, rendimientos a tres años y rendi cuesta aplicada a 62 estudiantes de ücencian¡r¿ (los datos o
a cinco años, y responda lo siguiente: están almacenados en el ¿rchivo GEEñIID. N
la medi4 la mediana, el primer cuartil y el tercer c) Seleccione una muesta de estudiantes de licenciatura de to
or
su escuela y realice una encuesta similar con ellos.
el rango, el rango intercuartil, la varianza, la des- ó) Con los datos recolect¿dos en el inciso c), repita desde el
estitndar y el coeficiente de variación.
inciso a) hasta el c) del problema 3.74.
un diagrama de caja. ¿Los datos estiín sesga- c) Compare los resultados que obhrvo en el inciso ó) con los
Si es así, ¿de qué forma? del problerna 3.74.
base en los resultados de los incisos a) a c), ¿q,té 3,7ó El problerna 1.28 de la página 14 describe una encuesta
concluye coo respecto a las diferencias entre los fondos aplicada a 44 estudiantes de la maestría enadministración
de bono que cobran cuotas y los que no las cobran? (los datos estrin ahnacenados en el archivo GEE@. pura
cada variable numéricq responda lo siguiente:
Desea comparar los fondos en bonos intermedios gu-
b€mamentales con los fondos en bonos comorativos a corto c) Calcule la media, la mediana, el primer cuartil y el tercer
plazo. Para cada uno de los dos grupos, utiiice las variables cuartil.
porcentaje de costo, rendimiento a fies años y rendimiento a ó) Calcule el rango, el rango intercuafil, la varianza, la des-
cr:nco años, y responda lo siguiente: viación estándar y el coeficiente de variación.
'ol c) Construya un diagrama de caja. ¿Los datos están sesga-
c¿.ur.'rá
cuartil.
-eá¡,;;;i;;;;i p"-er cuarril y el tercer
dos? Si es así, ¿de qué forma?
ü) Calcule el rango, el rango intercuartil, la varianza, la des- d) Escriba un informe donde ¡esuma sus conclusiones.
vtación estiándar y el coeficiente de variación, 3.77 El problema 1.28 de la página 14 describe una encuesta
c) Construya un diagrama de caja. aplicada a 44 estudiantes de la maestría en administración
en
¿Los datos esrán sesga-
dos? Si es así, ¡.de qué forma?
yr r') Con base en lós reiultados
(los datosestrfur alrnacenados en el archiuo E!!!@$.
de los incisos a) a c), ¿qué a) Seleccione una muestra de estudiantes de la maestría de
concluye con respecto a las diferencias entre los fondos administración de su escuela y realice una encuesta simi-
)11, en bonos intermedios gubemamentales y los fondos en
lar con ellos.
oonos c¡rpomtivos a corto plazo? ó) Con los datos recolectados en el inciso a), repita desde el
caü 3.73 Desea comparar fond.os en bonos con base en el inciso a) hasta el c) del problema 3.76.
nesgo. Pam cada uno de los
:niór ftes niveles de riesgo (por debajo c) Compare los resultados que obtuvo eu el inciso b) con los
del promedio. promedio, por
arriba del promedio¡, utiliie del problema 3.76.
:

134 cAPfrIJLo
:r¡e

3 Mediclas numéricas descriptivas


T:
II
variable q'
de Ashland 2. Elabore una presentación gráfica para la
;.Para qué variable en el caso "Adminishación
identificó. ¿A qué conclusiones podría lleg¿r a
parti¡ dt
página 72) se
i,rJ,i.á.rn Services" del capítulo 2 (véase la esta otra Eiáfica, a las cuales no podría llegar con el
necesit¿n medidas numéricas descriptivas?
üagama de caja?
adecuadas y que pueda i¡'
1. Calcule las medidas numéricas descriptivas
- 3. Resuma lo que encuentre en un informe
que iden- rabajo'
coirt oyu uo aiagrama de caja para la variable cluir en el estudio de la fuerza de
tificó.

qué r"'
del uso adecuado de las de resumen las afirmaciones de EndRun? ¿De
',i"ii¿^ sus conoctmrcntos acerca en
Aolique
este Caso di8it41 se' nera afectarían esos estadisticos de resumen su per
numéricas descriptivas
ción del historial de EndRun?
anencial del caPínlo 2 '
2. Evalúe los métodos que EndRun utilizó
para resumir los

Abra EndRunGuide'pdf, la "Guía para


i¡vertü" de En-
resultados presentados en la página "Resultados
de eil

Revise nuevamente los datos oe cuesta a clientes". ¿Se le ocurre otra manera
en que pc
dRun Fi¡anciat Services'
que perdedo.res"
aoovo de EndRun para "Más ganadores dría resumir esos resultados?
.',"'ia diferencia del Gran ocho" y después responda lo 3. Observe que la última pregunta de la
encuesta ttent

slgulente: ..oo,,.rpu.rt^ qu. las o$as preguntas ¿Qué facton


podrían haber limitado el número de respuestas
a €s¡
calcular medidas descriptivas para cuatquter
-
1. ¿Es posible preguúta?
i*i*f.l ¿De qué manera respaldarían
esos estadísticos

Minitab' Inc'
! K' Ord, Kentlall's Advon' 3. Minitab Release l6 (State College, PA:
-l. Kendall, M. G', A. Shmrt y
2010).
ced Theory of Statistics , Volume I : Distribution
Theory
'
6a e<1. (Nueva York Oxford Univenity
Pres' 1994)'
Corpo-
2. Miuoioft Excel20l0 (Redmond, WA: Microsoft
ration,2010).

.ix

s
t:
.i1
t,il
'l-.i.

i,i.:
t¡:.

: :¡l
rs:
rl|{
1j
:::"
'lt¡
i{i

)
Guía del capítulo 3 para Excel 1 35

porativos a cofo plazo (véase la página 106), abra la hoja


MEDIDAS DE TENDENCIA CENTRAL
de cálculo RETURN2009 del libro Bond Funds y:
mediana Y moda l. Seleccione D¡ta ) Dat¡ Atralysis.
añ Drofundidad Utilice las funciones AVERAGE 2. En el cuad¡o de diálogo Data Alalysis, seleccione Des-
o MODE en las fórmulas de las criptive Statistics de la lista Analysis Tools y luego
n á.¿iul, VmOt¡'l
haga clic en OK.
cálculo para calcular medidas de tendencia central.
sstÁs fi¡nciones con el for¡nato F{.4fCTION(rango En el cuadro de diálogo Descriptive Statistics (que se mues-
de la vafiable).Yins'e la sección GE3.2 para revi- tra abajo):
ejemPlo de su uso'
3, Escriba AI:B9E cono Input Range. Haga clic en Co'
para análisis (Analysis ToolPak) Utilice
lumns y marque Labels in First Row.
Statistics para crear una lista que incluya me- 4. Haga clic en New Worksheet Ply, marque Summary
! Endencia central. @n la sección GE3.2 se explica Statistics y luego haga clic en OK.
en forma detallada).

MEDIDAS DE VARIACIÓN
Y DE FORMA
varianza, desviación estándar
de vaflaoon a,
prorfundidad Utilice [a hoja de crilculo COMPUTE
Descriptive como modelo pan calcular medidas de
centr¿l, de variación y de foma. Esta hoja de cáicu-
o
o
se presenta en la figura 3 .2 de la pígina I 06, calcula o
icos descriptivos para la variable Rendimientos
N
to
en 2009 por los fondos de ilversión en bonos in- o)
gubernamentales y corporativos a codo plazo, uti-
los datos que se encuenban en las columnas A y B de
En la nueva hoja de cálculo:
DATA. La hoia de cáüculo utiliza las frm-
de cálculo
5. Seleccione la columna C, haga clic con el botón.dere-
VrlR (varianza muestral), STDEV (desüación eslin-
cho y luego haga clic en Delete en el menú rápido (para
MIN (valor mí¡imo) y MAX (valor rniximo)
eliminar las etiquetas de renglón dupücadas).
medidas de variación de una variable de inüerés.
6. Ajuste los encabezados de columna y el fornnato de las
1l. la hoia.de cálculo toma la--diferencia.ente
celdas utilizando la figtra 3.2 como guía. (Véase el
y MIN para obtener el rango. En el renglón 4, la hoja
apéndice B para realizar estos ajustes).
usa la ft¡nción COUNT oara determinar el ta-
de la muestra y luego divide la desviación estándar Para agregar el coeficiente de variación a esta hoja de
€nte la r¿íz cuadrada (SQRT) del tamaño de la mues- cálculo, primero ingrese Coefficient of variation en la celda
calcula¡ el error estándar. (Véase la sección 7.4 para A16. Luego escriba la fonnula =B7lB3 en la celda B16 y có-
mris sobre el enor estrindar). piela a la celda C16. Por ultimo, asigne formato a las celdas
a$egar el coeficiente de variación a la hoja de
'Para B 16 y C 16 para pesentat los datos en porceritajes.
üo COMPUTE, primero ingrese Coeflicient of varia-
en la celda A16. Después ingrese la fórmula =B7l83 en Valor Z
816 y luego cópiela a la celda C16. Por último, dé
Excel en profundidad Utilice la función STANDAR-
a las celdas B16 y C16 para presenar el porcentaje.
DIZE para calcular el wlor Z.Esci,ba la función con el for-
para análisis (Analysis ToolPak) Utilice mato STANDARDIZE(v alor, media, desviació n esiindar),
,.ue¡criptive Statistics para crear una lista que contenga me- donde valor es un valor de X. Utilice la hoja de trabajo
0l0as de variación.
forma v tendencia cental. TABLE-3.4 del libro Descriptive como modelo para calcu-
', Por ejemplo, para crear una hoja de cálculo simila¡ a la lar los valores Z. La hoja de cálculo utiliza las funciones
'0e .h
fi8ura 3.2 de la página 106. la cual presenta esradísti- AVERAGE y STDEV pará cálcular los valores dela media'
gos desc¡iptivos
para los rendimientos dL 2009 generados y la desviación estándar utilizados en la función STAN-
'po¡ los fondos enionos intermedios gubemamentales y cor- DARDZE.
13ó CA-PÍTULO 3 Medidas numéricas descriptivas

Forma 3. Escriba un Título, marque Five-Number Summarr,


haga clic en OK.
Excel en profundidad Utilice las fimciones SKEW y KIIRT
oara calcular la asimetría y la cufosis, respectivamente. Es-
..ibu .rt^ fuociones con el formato FIlNCTION(rango de
celdas de b vañable). Utilice Ia hoja de cálculo COMPUTE
del libro Descriptive (que se analizó anteriormente en esta
sección) como modelo para calcular esos estadísticos.

Herramientas para análisis (Analysis ToolPak) Utilice


Descriptive Statistics para calcular la asimetria y la curto-
sis. Las i¡strucciones del Analysis loolPaft que se presenta-
ron a¡t€s en esta sección también calculan estos estadísticos.

GE3.3 EXPLORACóN DE DATOS NUMÉRICOs


Cuartiles
Excel en profundidad Como se señaló en la página 110,
la función QUARTILE de Excel, que se ingresa como
I
QUARTILE(razgo de celdas de los datos que se resumi-
rón, número de cutrtil), utlliza teglas diferentes a las que E1 diagrama de caja aparece en su propia hoja gálcx

se presentaron en 1a sección 3.3 para calcular los cuartiles. separado de la hoja de cálculo que contiene el resumen de
Para obtener los cuartiles utilizando las reglas de la sección los cinco números.
3.3, abra la hoja de cálculo COMPUTE del libro QUAR- Excel en profundidad Utilice las hojas de calculo del übn
TILES. La hoja contiene los valores del ejemplo 3.10. Para Boxplot como plantillas para crear un resumen de los cino
calcula¡ los cuartiles en otro probleúa, sobrescriba esos va- números y un üagrama de caja. Utilice la hoja de cálml
lores (que aparecen en la columnaA). PLOT-DATA como plantilla para crea¡ un resumen de lo
Los cuartiles que rezuitan al utiliza¡ las reglas de la sección cinco números y un diagrarra de caja en una hoja de crílcuh
3.3 se muestran en la columoa D, la columna Book Rules. Los con datos que no se han agnrpado. Utilice la hoja de cálcr
resultados de la colurma D se basan en una serie de formulas lo PLOT como plantilla para construir un diagrama de cajal
avanzadas que están ubicadas desde la columna G hasta la co- partir de un resumen de cinco números conocido.
lumna I para aplicar 1as reglas de la sección 3.3. Abra la hoja Como Excel no incluye el diagrama de caja en sus gn'
de cálculo COMPUTE-FORMULAS para examinar esas ficas, la creación de un diagrama de este tipo requlefe d
fórmulas. (La explicación detallada de las fónnulas utilizadas "mal uso" avanzado y creativo de 1as aplicaciones de gnfi'
en esa hoja de calculo ¡ebasa el alcance de este libro). cación de Excel. Abra la hoja de cálculo PLOT-FORMII
LAS para examinar este "mal uso". (Una explica"''
Rango intercuartil
detallada rebasa el alcance de este übro).
Excel en profundidad Para obtener el rango intercuartil,
utilice una fórmula de la hoja de cálculo que reste el primer
cuartil del tercero. Por ejemplo, para calcular este estadís- ---
GE3.4 MEDIDAS NUMÉR|CA5 DESCR|PT|VAS
penn UNA POBLACIÓN
tico en el ejemplo 3.11 de la página 111, abra la hoja de
trabajo COMPUTE del libro Quartiles y escriba la fór- Media poblacional, varianza poblacional
'ür mula =D5 - D3 en una celda vacía. y desviáción estándar poblacional
i1e pafi
Excel en profundidad Utilice l¿ funcióü AVERAGE
Resumen de los cinco números y diagrama de caja
calcular la media poblacional. Utilice las funciones VARPI
# PHStat2 Utilice Boxplot para crear un resumen de los STDEVP para caicular la varianza y Ia desviación estfudr
:i
cinco números y un diagrama de caja. Por ejemplo, para de la población. resPectivamente. lngrese esas funcion6
: ;r¡r crear el resumen de los cinco números de la figura 3.4 y el p0!!:
::j, coo .i forrnuto AVERAGE(rang o de celdas de la
ti. diagrama de caja de la página I13, abra la hoja de cálculo cün),YLRP(rango de cetda's de It población) y STDEII
':i' DATA del libro Bond Funds. Seleccione PI{Stat Des' .) (rango de celdas de la Población).
;r.
:$
criptive Statistics t
Boxplot. En el cuad¡o de diálogo del
procedimiento (que se muestra a continuación): Regla empírica y regla de Chebyshev
,,tl 1. Ingrese Fl:F185 como el Raw Dats Cell Range y Excel en profundidad Utilice la hoja rle cálculo CoM'
marque First Cell Contains Lab€l. PUTE del übro Variability como plantilla que usa fórÚr
en u'
2. Haga clic en Multiple Groups-Stacked y escriba las aritméticas para examinar la variabilidad
81:8185 como el Grouping Variable Cell Range' distribución.
cuía del capítulo 3 para Midtab 137

Y.COEFICIENTE Coeficiente de correlación


3.5 COVARIANZA
DE CORRELACION Excel en profundidad Utilice la función CORRIL para
c¿lcular el coeficiente de correl¿ción. lngese esta función
con el formato CONREL(rango de celdas de los valores X,
en profundidad Utilice la hoja de cálculo COM- rango de celdas de los valores f).
del libro Covariance
como plantilla para el análisis
Utilice Ia hoja de cálculo COMPUTE del libro Co'
,,^;mza. Lahoja de cálculo contiene el conjunto de 30
(véase la página
rrelation como plantilla para el análisis de conelación que
e ingresos anuales de la tabla 3.8
se obserya en la figura 3.10 de la página 125. En esta hoja
para otros problemas, sobrescriba esos valores y siga
de cálculo la fórmula de la celda F15 =CORREL(A4:A33'
en la hoja de cálculo para modificarla en
lstrucciones 84:833). calcuia el coeficiente de correlación.
, d, qu, ,tngu
t.nos o más de 30 valores. (La hoja de
COMPUTE-FORIIIULAS incluye las fórmulas
en la hoja de cálcuto COMPUTE).

.1 MEDIDAS DE TENDENCIA CENTRAL En el cuad¡o de diálogo Display Descriptive Statistics - Sta-


tistics (que se muesta abajo):
mediana y moda
4. Marque Mean, Standard deviation, Variance, Coeffi-
Descriptive Statistics para calcular la media, la me- cient of variation, First quartile, Median, Third
la moda y medidas seleccionadas de variación y de quartile, Interquartile range, M0de, Minimum, o
a.Por ejemplo, para crear resultados similares a los que
[,[¡ximr¡rn, Range, Skewness, Kurtosis y N total.
gbservan en la figura 3.2 de la página 10ó, gue presentan
5. Haea clic en OIi
ádísticos descriptivos para los rendimientos generados en o
por los fondos de inversión en bonos intermedios gu- o
o
y corporativos a corto plazo, abra la hoja de N
Bond Funds. Seleccione Stat ) Basic Statistics

Descriptive Statistics. En El cuadro de diálogo
Descnptive Statistics (que se muesha abajo):

Haga doble clic en C6 Return 2009 en la lista de varia-


bles para agregar Return 2009 al cuadro de Variables
y luego presione Tab.
Haga doble clic en C2 1}pe en la lista de variables para
' agregar Tlpe al cuadro'Byvariables (optional).
3; Haga clic en Statistics.

De regreso en el cuadro de diálogo Display Descriptive


Statistics, haga clic en OK.

GM3.2 MEDIDAS DE VARIAOóN


Y DE FORMA

Rango., varianza, desviación estándar


y coe¡rcrente oe vaflaclon
Utilice Desiriptive Statistics para calcular esas medidas de
variación y de forma. Las instrucciones de la sección GM3.1
para obtener la media, la mediana y la moda tambien calcu-
lan esas medidas.
F
138 CAPfTULO 3 Medidas numéricas descriptivas
F
En el cuadro de diálogo Boxplot - One ! With Groups iqn '
Valor Z
se muesra abajo):
Utilice Standartlize para calcular el valor Z' Por ejemplo'
página 105, 2. Haga doble clic en C6Return 2009 en la lista de vq¡.
oara obtener los valores Z de la tabla 3'4, en la
abra la hoja tle cálculo CEREALS. Seleccione Calc ) bles para agregar 'Return 2009' al cuadro Graph r¡.
(que se riables y luego Presione Tab.
Standardize. En el cuadro de diálogo Standardize
muestra abajo): 3. Haga doble ctic en C2 Tlpe en la üsta de vanables p¿¡
agregar llpe al cuadro Categorical variables'
1. Haga doble clic en C2 Calories en la lista de variables 4. Haea clic en OK.
para agregar Calories al cuadro Input column(s) y pre-
sione Tab.
2. Lrgrese C5 in' (C5 es la pri-
en el cuadro Store Results
mJra columna vacía en la hoja de cálculo y los valores
Z se colocarán en esa columna.)
3. Haga clic en Substract me¡n and divide by standard
deviation.
4. Haga clic en OK.
5. Enla nueva columna C5, escnba Z Scores como el
nombre de la columla.

Si coloca el puntero del mouse sobre el diagtama de cajl

creado, aparecen varias medidas, incluyendo los cuartiles


Para los problemas que involucran datos de un solo grupo,
haga clic en Simple en One Y gallery del paso l'
Para hacer girar el diagrama de caja 90 grados (como u
hizo en la figura 3.5), reemplace el paso 4 con los siguientr
pasos 4 a 6:

4. Haga clic en Scale.


5. En la pestaña Axes and Ticks del cuadro de diálogo
Boxplot - Scale, marque Transpose value and cate
gory scales Y haga clic en OK-
ó. óe i"ereso eo el cuadro de diálogo Boxplot-One Y'

With Groups, haga clic en OIC


Forma

yili'iff xTfl:::*:E#Tü*'el,--Tió!?-*M3.4MED|DA5N'UMÉRE$NDESCRTPI''¡¡'
^--- medid¿s'
la medi4 la mediana y la moda también calculan esas -^,¡:,t-.
Media poblacional, varianza poblacional
y deivibcion estándar poblaiional
\ "'"-'- EXPLORACIÓN- DE
GM3.3 - DATOS pan-
ÑüüEÉniói Minit¿b no cuenta con comandos que calculen estos
.i* metros poblacionales de manera directa'
Cuartiles, rango intercuartil y resumen
{i.*
\.: de los cinco números Regla empírica y regla de chebyshev
Utilice Descriptive Statistics para calcular esas medidas'
rlji ^^:^ -
LasinstruccionesdelasecciónGM3.lparaobtenerlame-uatculedeformamanuallosvaloresuecesariosparaaplidr,
.ir.ii;;;;td';' obtenidos con ras iÍs'
rii
¿á, i" ."o"." y r" -oau t.oui¿o
'qll mj:i;'fl:t;;,llL?:1i'n"os
:t.:
:;i
.{i Diagrama de caja
,'::, Utilice Boxplot para crear un diagrama de caja' Por-ejem- GM3.5 COVARIANZA YFOEFICIENTE
olo, oara criar los diagramas de caja de la figura
3 5 de la DE CORRELACION
tt::
pagina tt+, abra la hója de cálculo Bond Fund-s' selec- .
.^..
Loverlanza
L,. iio'ne Graptr + Boxplot. En el cuadro de diálogo Boxplot:
r-l L Haga clic en with Groups en one Y gallery y luego utilice
covariance para calcular la covarianza' Por
ej@';

plo' para obtener la covaria¡za de los 30 valores y los inFso;


hasa clic en OK.

)
Guía del capítulo 3 para Minitab 139

se iocluyen en la tabla 3.8, abra la hoja de 3. Haga clic en OI(


yalues y seleccione Stat + Basic Statistics En la t¿bla de números producida, la covarianza es el nú-
En el cuadro de diálogo Covariance (que se mero que aparece en la celcla que conesponde a la intenec-
ción de las dos variables (la celda inferior izqüerda).

clic en C2 Revenue en la lista de vari¿bles Coeficiente de correlación


Revenue al cuadroV¡ri¡bles.
clic en C3 Value en la lista de variables Utilice Correlation para obtener el coeficiente de conela-
áoble
Value al cuadro Variables. ción. Por ejemplo, para calcular el coeficiente de co¡relación
de los 30 valores e ingtesos anuales que se observan en la
figura 3.10 de la pigna 125, abra la hoja de cáIculo NBA-
Values, seleccione St¡t )Basic Statistics )
Correl¡tion.
En el cuadro de diálogo Conelation (que es simila¡ al cua-
dro de diálogo Covariance):

1. Haga doble clic en C2 Revenue en l¿ lista de variabies


para agegar Revenue al cuadro V¡riables.
2. Haga doble clic en C3 Value en la lista de variables
para agegar Value al cuad¡o V¡riables.
3. Haea clic ed OK

a,

o
o
o
N
to
o
Probabili,Cad
básica

Árboles de decisión Regla de conteo 3


UsO DE LA ESTADíSTICA en
M&R Electronics World lndependencia Regla de conteo 4
Reglas de la multiplicación Regla de conteo 5
4.1 Conceptos de probabilidad Probabilidad marginal
básica utilizando la regla 4.5 Aspe<tos ético3
Eventos y espacios general de la y probabilidad
muestrales multiplicación
Tablas de contingencia Revisión del USO DE LA
y diagramas de Venn 4.3 Teorema de BaYes ESTADísTICA en M&R
Probabilidad simple Electronics World
Probabilidad conjunta PIENSE EN LO SIGUIENTE.
Probabilidad marginal La Divina Providencia Y el correo GUíA DEL CAPíTULO 4 PARA
Regla general de la suma basura EXCEL

4.2 Probabilidad condicional 4.4 Reglas de conteo GUíA DEL CAPíTULO 4 PAR,A
Cálculo de probabilidades Regla de conteo 1 MINITAB
condicionales Regla de conteo 2

conteo,
R Electronics World

omo gerente de marketing de M&R Elechonics World, usted está analizando los resultados de
la eniuesta cle un estudio sobre los planes de compra. En el estudio se preguntó a losjefes de
1,000 familias sobre sus planes para comprar un televisor de pantalla grande dur¿nte los si-
zuientes 12 meses. A modo de seguimiento, usted planea aplicar una encuesta a las mismas
/ meses us¡Pus¡
12 mgüEs
óersonas l.¿
oefsonas para ¡oue¡
después P4ra saber ¡r adquirieron
si 4s{uu I televisores. Ademiás de obtener esta in-
n. le zustaría saber si el televisor que compraron tiene una tecuencia de actualización rapida (120
) o uia frecuencia de actualización
estándar (69 }lz), si también comprar.on un reproductor de dis- o
en los últimos 12 meses y si est¿ban satisfechos con su compra del televisor de pantalla grande. =
;pera que usted utilice los resultados de esta encuesta para planear una nueva estategia de marke-
io.t r.ot. l*
u.otas y que se dirija sobre todo a los hogares que tienen mrás probabilidades de ad- o
mayor número de productos o artículos más costosos. ¿Qué preguntas podría plantear en esta
o
o
qué manera podría expresar las relaciones entre las diversas respuestas sobre los planes de
¿De N
las familias i¡dividuales? to
to
anteriores aprendió métodos descriptivos para resumir variables categóricas y numéricas. En
apre'ndení aspectos de la probabilidacl pan responder preguntas como las siguientes:

o ¿Curíl es la probabilidad de que una familia esté planeando compr¿r un televisor de


pantalla grande en el próximo año?
o ¿Cuál es la probabilidad de que una familia realmente compre un teleüsor de pan-
talla gande?
o ¿Cuíl es la probabiüdad de que una familia esté planeando comprar un televisor de
pantalla gande y que realrnente lo compre?
. Si la familia está planeando comprar un televisor de pantalla grande, ¿cu.ll es la
probabilidad de que realmente lo compre?
o ¿El hecho de saber si una familiap/azea compnr el televisor cambia la probabili
dad de pronosticar si la familia /o comprard?
r ¿Cuál es la probabilidad de que una familia que compre un televisor de pantalla
gande adquiera uno con una frecuencia de actualización rápida?
- ' "- --
o ¿Curíl es la probabilidad de que una familia que compre un televisor de pantalla
grandeconunafiecuenciadeactrraIizaciónnipidatarrbiénadquieraunreproductor
de discos Blue-ray?
. ¿Cuál es la probabilidad de que una familia que compre un televisor de pantalla
grande se sienta satisfecha con la compra?

Con las respuestas a preguntas como estas podría empezar a tomar decisiones para su
'
estrategia de marketing. ¿Su estrategia para vender más televisores de pantalla grande -
debe dirigine a las famiüas que indicaron tener planes de comprar un televisot? ¿Debé ,,- . - -..
concentrarse en vender televisores con una frecuencia de actualización más ñápida?
¿Es probable que a las farnilias que compren televisores de pantalla grande con fre-
cuencia de actualización nipida se les pueda convencer con mayor facilidad de adquirir
también reproductores de discos Blue-ny? 14¡
LNDC¡ Snotolsld / Shun6l@k
142 cAPÍTuLo4 Probabilidadb¡isica

os principios de Ia probabilidad srven para comunicar l":l:¡f.dt lt "*dística desq¡¡ '


tiva y la estadísticu ,oferencial el ieei este
capítulo'
:1"::ji::,i::T::f*t#*'
nueva información T:
¡n
IJffiilil:I|'.0i."i"'it-l"it.,r'las v
'.1*11'd"
evaluarlas
pF.b;,-;;i;;';ú"uli¿"¿ *' r", ri'"¿^'*llry 3g'*:":",::::"i:'liffiltrH
!ffiH; ;Iffi;üil ffiñ"r"'rioo*il y a. rorson, temas que se €st'dianin en,1

capífirlo 5.

4.1 Conceptos de Probabilidad básica


¿Qué sipifica
ffi,ilffi ;n"$uü"fi ;:
ra p nro[ti!1111.:]-"*::*:ffi::"":-1ffin::
atabnprobabitidaü ra
;; ""''"'"': I $111: Jl'":fTll?:1,i"31"',llTllli
;fffi'ff ffiftTo;;i;;;JuÑo'o'¿"qoÉ:{"-1:'l^""':':?"ui"t::H:XÍ:^"1*
ffff.1l##:il1;#;; ;;b""c; un¿ áa* con ci¡co pP':i:-E:'?d:i':':'":3T
:1n
üff ü;f.'#.iJ"li.il"ñ,"p**'ífr accióncuvovaroroscili-e"n5:,9;,1:Y",::::*n:'-T
probabiliclad de 0. un evento qr¡
I$Jñi*-,i,l}JliT"H#i;í;;;hposibre)iiene.un-a de 1'
ürriJenteJiJJ; t* .".oio tittto) tiene una probabilidad
Existen nes tiPos de Probabilidad:

'APriori
' Empirica
' Subjetiva
en el conocmrento pn'
de que ocurra un evento se basa
priori, la posibilidad
En la probabüda d a proh'
á.T t r"""ií.*¿". r" t¿t *iauo' donde cada resultado tiene las mismas
"r "".* 'it*" det'evento se define en la ecuación
(4 1)'
;ilü;iil;;;'r" p*,Uifr¿.¿ á.
"cñencia

PROBABILIDAD DE OCURRENCIA
(4.1)
Probabilidad de ocunencia = f
donde:

numero cle formas en gue ocune


el evetrto
X=
I-= núme¡o total deresultados-posibles

probabiüd¿d de sela'
rojas y 26 cartas ne*as. La
considere .na baraja estrindar con 26 carUs
hay X= 26 cartas---nlgr as y i =.52:*T i:t}
cionar una cana n eg.oes 26t52= 0.50 porque
después de ser seleccionatl4 istP'
¿Qué significa esta
probabilidad? Si se ieeáplaza cada carta porque no podero$
teleccionadas será neera? No'
t**
fica que una tle cada 2 de las puede decifqr¡esr
"g"[oi"'
ill'rlg"i.o,., ,.r.."iooes. sin ern-bargo, se
saber con certeza qu¿ o.urfi¿ de cartas negnr
este proceso de selección
"o
* ;;;;
continua' a la larga' la orooorción

seleccionadas se acercará a 0
"il;;
50;;i;ñ;t; ;i it"'t'u totoie
uoa probabilidr0
ialcula
"
a oriori.

dos' tres''cuatro'
o *'
Un dado estlíndar tiene c"r"s' Cad" cara del dado contiene uno'
sers :t:o
EJEMPLO 4.1 ae obtene¡ una cara con cinco puntos r
¿u¿0, po¿i utlaliobabiiidad
Cálculo de
ü;;il;h-tuo caras'll
ocurrir. Puesto que existen seis
probabilidades soLUclóN cada ca¡a tiene la misma probabilidad,cle
puntos es 1/6'
a priori orobabilidad de obtener una cara coú cinco
4.1 Conceptos de probabilidad básica 143

El ejemplo anterior utiliza el úétodo de la probabilidad a priori debido a que el número d€


formas en que el evento ocune y el número total de resultados posibles se conocen a partü de la
composición de la baraja o de las caras del cl¿do.
En el método de la probabilidad empírica, las probabüdades se basan en los datos observa-
dos y no en el conocimiento anterio¡ de un proceso. A menudo las encuesbs s€ utilizan para g€ne-
rar probabilidades empíricas. Algunos ejemplos de este tipo de probabilidad es la proporción de
indiüduos en la sección sobre el Uso de la Estadística que realmente coryraa televisores de panta-
lla grande, la proporción de votantes registados que preñeren a ci€rto candidato poütico y la pro-
porción de estudiantes que tienen un empleo de medio tiempo. Por ejemplo, si usted aplica una
encuest¿ a estudiantes y 60% afirma tener un empieo de medio tiempo, entonces hay una Fobabi-
Lidad de 0.60 de que un estudiante t€nga un empleo de medio tiempo.
El tercer método, la probabüdad subjetiva, difiere de los otos dos debido a que esta proba-
bilidad es distint¿ en cada persona. Por ejemplo, el equipo de desarrollo de ua nuevo producto po-
dría asignar una probabilidul de 0.ó0 al éxito del producú0, mi€ntras que el Fesidente de la empresa
podría ser menos optimista y asignarle un¿ probabilid¿d de 0.30. La asignación de probabilidades
subjetivas a diversos resultados suele basa¡se en una combinación de experiencia previa, opinión
personal y análisis de 1a situación en particular. La probabilidad subjetiva es especiatnente útil
para tomar decisiones en los casos en que no se puede utilizar una probabiii dzd' a priori o empiica.

Eventos y espacios muestrales


Los elementos básicos de la teoría de probabüdad son los resultados individuales de una variable
de estudio. Para ente¡der las probabüdades, es necesario conocer las siguientes definisi6¡s5.
o
=
EVENTO
o
Cada resultado posible de un¿ variable se denomina evento. o
Un evento simple es aquel qu€ se describe por una sola característica o
(r¡
o
o
Por ejemplo, cuando se la¡za una moneda" los dos resultados posibles son caras o cruces. Cada
uno representa un evento simple. Cuando se la¡za un dado estlínda¡ de seis lados, donde las ca¡as
contienen uno, dos, tes, cuato, cinco o seis puntos, hay seis eventos sin:ples posibles. Un evento
puede ser cualquiera de esos eventos simples, utr conjunto o un subconjunto de ellos. Por ejemplo,
el evento de un ¡¡l mero par de puntos consta de tres eventos simples, es deci¡, dos, cuatro o seis
pwfios.

EVENTO CONJUNTO
Un evento conjunto es aquel que tiene dos o más características.

Obtener dos caras cuando se lanza una moned¿ dos veces es un'ejemplo de un ev€ttto conjunto, ya
que consta de una cara en el primer lanzamienJo y de ota cara en e!-segundo lanzamiento.

COMPLEMENTO
El complemento del evento I (representado por el símbolo I') incluye todos los wentos
que no forman parte del.

E1 complernento de una cará es una cn¡z porque es el único evento que no es tma cata" El com-
plemento de cinco puntos en un dado es no obtener cinco puntos. No obtener cinco puntos consiste '

en obtener uno, dos, hes, cuatro o seis puntos.


144 CAPÍTULo 4 hobabiiidad b¡lsica

ESPACIO MUESTRAL
El conjunto de todos los eventos posibles se coooce como espacio mnestral'
y cnrces' El
El espacio muestral para el lanz¡mieoto de una monedaconsta tle caras
tres, cuatro, cinco o
esDa;io muesbal deilanzamiento de un dado consta de uno, dos,
."i, p,-tor. En el ejemplo 4.2 se denuestr¿n eventos y espacios muest"ales'

World ¡¡¡u
EJEMFLO 4.3 La sección sobre el Uso de |a estadística en la página 141 se refiere a M&R Electonics
del compoq.
tabla 4.1 se presentan los resultados de la muestra de 1,000 hogares en términos
Eventos y esPacios miento de comDra de televisores de pantalla gande
muestrales

REATEÓ tA COMPRA
TABTA 4.1 PIANEÓ
COMPRAR Tot¡l
Comportam¡ento
200 50 250
de compra oe Sí
televrsores No 100 650 150
de pantalla grande 1,000
Totrl

de eventos simples y eventos conju:rtos'


¿Cual es el espacio muestral? Dé ejemplos
"plansí
SOLUCIóN El espacio muestral const¿ de 1,000 participantes. Los eventos simples son
"compró" y "no compró"' El evento "planeó compral y real'
comprar", "no planeó comprar",
planear hacer la
-""L .oápt¿" ., un evend conjunto porque, en este, el participante debe
compra

y hacerla realmente.

Tablas de contingencia y diagramas de Venn


implica el wo de una
Existen varias fonnas de ver un espacio muestal en particular. una de ellas
4' 1' Los valore
tabla de contingencia (véase la sicción 2.2) como la que se obsewa en la tabla
el espacio muestral de 1,000 familias de
faru ur..tau, á, lu t"ülu se obtienen subdividiendo
pantalla grande y las que realmente 1o hicie
acuerdo con las que planearon comprar un televisor de
de pantalla gande y
ron. Por ejemplo, 2b0 de los participantes planealon comprar un televisor
después lo hicieron.
Unasegundaformadepfesentafelespaciomuestralco¡sisteenutiliza¡undiagranadeVeu-
Este diagrÁa representa d¿ forma gráfica los diversos eventos como 'hniones" e "intersecciones"
para una situación con dos v¡
de círculos. En la figura 4.1 se presénta un típico üagrama de vmn
riables, donde cada una tiene solo clos eventos (A y A' , y B y B')' El cí¡culo de
la izquierda repre'

senta todos los eventos que forrnan parte de l.


ñ
i¡¡- El círculo de la dereiha representa todos los eventos que forman
parte de 3' El rárea que se eú'

.!llt cuentra dentro del círculo ,4 y del círculo I (fuea cenual) es la intersección de I yI (que se reptt-
il*i
sentacomolflB),yaqueforrnapartedelytambiéndeB.Eláfeatotaldelosdosctcüosesü
unión de I y B (que se .*pr.ru .o-o I U 8) y contiene todos los resultados
:3r que solo fonnan¡arE

l, que solo forman parte clel eventó B o que forman parte ánüo de I como de B EI rárd
t:l
dei evento
rili
en el diagrama fuera de I
U B contiene los resultados que no forman parte de '4 m de B
i de los eveútos se -..r.
pues:
'
j.,: Es n-ecesario defin A y B para uear un diagrama de Venn. cualquiera
eventos E[ u
:.i: I
definir como o B, siempre y cuando haya consistencia al evaluar los diversos
ü.1 ejemplo del televisor cle pantalla grande, podemos definir los eventos como sigue:
t:\{
I = planeó comprar B = realnente compró
rJ'.i
,-ii
l' = no planeó comprar B' = realmente no comp¡ó
;\. de venn (véase la figura 4.2) debemos determinar .I iá[o. d"-1á
int"
Al dibujar el diagrama
sección de ,,i y B para-poder dividir eiespacio miestral en sus partes. I
n B consta de las 200 faÚl'

lias que planearon comprar un televisor de pantalla grande y que realmente lo hicieron'
4.1 Conceptos de p¡obabilidad básica 145

4.1 FIGURA 4.2 AñB 4n 8',= 650

Venn Diagrama de Venn


¡ns A para el ejemplo de
M&R Electronics
World

AñB

I
La parte resta¡te del evento (planeó comprar) consta de las 50 familias que planearon compmr
un televisor de pantalla grande, pero que en ¡ealidad no 1o hicieron. La parte resta¡te del evento 3
(realmente compró) coosta de las 100 familias que no planearon comprar un bleyisor de partalla
gmnde, pero que en realidad lo compraron. Las 650 familias restantes representan aquellas que no
planearon comprar un teleüsor de pantalla grande y que en realidad no lo compraron.

Probabilidad simple
Ahora está en condiciones de responder algunas de las preguntas que se plantearon en la sección
Uso de la estadística. Como los resultados se basan en datos reunidos en una encuesta (remítase a
la tabla 4. I ), podemos utilizar el método de la probabilidad empírica.
Como antes se expuso, la regla más ñ¡ndame¡tal de las probabilidades es que su valor oscila
entre 0 y l. Un evento inposible tiene una probabilidad de 0 y un evento que ocurrir:í con toda
certeza tiene una probabilidad de l.
La probabilidad simple se refiere a la probabiüdad de ocunencia de un evento simple, P(l).
Una probabilidad simple en la sección Uso de la Estadlstica es la probabilidad de planear la con- o
pra de un üeleüsor de paatalla grande. ¿Cómo se puede determinar la pmbabiüdad de seleccionar a =
una familia que haya planeado comprar rm televisor de pantalla grande? Utilizando la ecuación
(4.1) de la página 142: o
o
o
Probabilidad de ocunercia = #I qt
o
P(planeó comprar)

250
= 1,000 =nr.
Así que hay una probabiüdad de 0.25 (o 25o/o) de que una famiüa haya planeado comprar un
televisor de pantalla grande.
El ejemplo 4.3 ilusta ofa apücación de la probabilidad simple.

4.3 En la encuesta de seguimiento en la sección Uso de la estadística se plantearon Feguntas adiciona-


les acerca de las 300 familias que realmante compraron televisores de pantalla grande. En la tabla
4.2 se observan las respuestas de los consumidores a la pregunta de si el televisor adquirido tenía
una frecuencia de actualización nipida y si también compraron un reproductor de discos Blu-ray
grande @D) en los ultimos 12 meses.
renga Calcule la probabilidad de que, al seleccionar al azar a una familia que compró un televisor de
de pantalla grande, esa familia haya comprado uno con frecuencia de achralización nápida.
rápida

4.2
CO]iIPRÓ UlI REPBODUCTOR DE BD
FRECUEI{CIA DE ACTUAUZACIOÍ{
DEL IEI."EVIS{¡R COÍTPMIX}

Rripida 38 80
Estlndar 70 150 220
Épida Tot¡l 108 192 300

(BD)
: :É=
146 cAPfTtlLo4 Probabilidadbásica

SOTUOÓN Si utilizamos las siguientes definiciones:

,4= cornpró un televisor con frecuencia de actualización nápida


l' = compró un televisor con frecuencia de actualización estíndar
B= compró un reproductor de discos Blu-ray @D)
B' = no compró un reproductor de discos Blu-ray @D)

Plfrecuencia de Número de teleüsores con frecuencia de actualización Épida


actualización nípida) Número total de televisores

80
= 0.267
300

Hay una probabili dad de 26 .'7% de que un televisor de pantalla $ande comprado, elegido al ¿¿¡,
tenga fiecuencia de actualización nípida.

Probabilidad conjunta
Mientras que la probabilidad simple o marginal se refiere a la probabilidad de ocr¡r¡encia de eve¡.
tos simplei, la piobabilidad conjunta se refiere a la probabiüdad de una ocurrencia que involu
a dos o más evintos. Un ejemplo es la probabilidad de obtener cara en el primer lanzaniento d¡
una moneü y de obtener cara en el segundo lanzamiento.
En la tabla 4.1 de la página 144, el gnrpo de individuos que planearon comprar un televiso¡ &
pantalla grande y que reaünente lo compraron consta solo de los result¿dos de la celda "sí (planeo
conprar) y sí (realmente compró)". como este gru.po consta de 200 familias, la probabiüdad de seler.
cionar a una familia que planeó comprrar un televisor de pantalla grande y que realnente lo compó ec

P(planeó coroprary realmente compró, =


ffi
200
=-=u'lu
El ejemplo 4.4 también demuesaa la manera de deterrrinar la probabiüdad conjunta'

EJEMFLO 4,4 En la tabla 4.2 las compras están clasificadas con base en el hecho de si los teleüsores tiene! uD¡
frecuencia de actualizalión rápicla o una fiecuencia de actualización estríndar, y si la familia com'
Determinación de pró un feproductor de discos Blu-ray. calcule la probabilidad de que una familia que comprf
la probabilidad ielevisor ie pantalla grande, elegida al azar, también haya comprado un televisor con frecuencia uv
conjunta de que actualización rápida y un reproductor de discos Blu-ray.
una familia compró
un telev¡sor de SOTUC¡óN Con la ecuación (4.1) de la página 142,
pantalla grande Número que comPró un televisor con
\ con frecuencia de
]N!¡ frecuenci¿ de actualización r.ápida y un rcproductor
iq _qdualjzación ráPida P(televisor con frecuencia de actualización de üscos Blu-raY
üs,d y un reproductor nípida y reproductor de discos Blu-ray) - Númerc total de compradores de televisores
1{i de discos Blu-ray de pantalla grande
Iti
ilii
;; =]L=o.t,
300
'¡*
'rli.l par
;"rl Por 10 t¿nto, existe una probabilldad de 12.7% de que una familia que compró un televisor de
*."
aiI talla grande, elegida al azar, también haya comprado un televisor con fiecuencia de actualizaoon
lli nipida y un reproductor de discos Blu-ray.
l:it
q,¡¡1

h.j
-i:
Probabilidad marginal
La probabiüdad marginal de un evento consta de u:r conjunto de probabilidades conjuntas Poda
.o, drt *riou, lu probabiüdad marginal de un evento en particular utilizando el concepto de prorf
4.1 Conce¡rtos de probabilid¿d básica '147

bilidad conjunta que se acaba de describir. Por ejemplo, si B consta de dos eventos, B, y 8",
entonces P(l), la probabilidad del evento l, consta de la probabilidad conjunta de que el ev'ento 7
ocura con eI evento B, y de la probabilidad conjunta de que el evento I
ocur¡a con el evento 8,.
Para calcular probabilidades marginales se utiliz¿ la ecuación (4.2).

PROBABILIDAD MARGINAL

P(A) = P(1y Br) + P(A y Br) + .- + P(A y Br) (4.2)

donde 8r, 8r,...,.8* son.,t eventos mutuamente excluyentes y colectivamente exhaustivos


que se oennen como slgue:

Dos eventos son mutuamente excluyentes si no es posibie que ocun-an amboi de


.r m¿n€ra simultánea. Un conjunto, de eventos es colectivamente e¡hausüvo.sidebe
ocurrir uno de ellos.

Cara y crw en el lanzamiento de una moneda son eventos mutu¿mente excluyentes. El resultado
del l¡¡z¿miento de una moneda no puede ser al mismo tiempo una cara y lma cruz. Cara y cruz en
el lanzamiento de una moneda también son eventos colectivamente exlaustivos, ya que rmo tle ellos
debe ocuni¡. Si no ocur¡e una car4 entonces debe ocu¡rir una cruz. Si no ocur¡e una cruz, enúonces debe
ocu¡rú una cara. Ser mujer y ser hombre son eventos mutuamente excluyentes y colectivamente
exhaustivos. Ninguna pen¡ona es ambos (los dos son mutuamente excluyentes), y todos son uno u
oho (los dos son colectivamente exhaustivos).
Podemos utilizar la ecuación (4.2) para calcular la probabilidad marginal del evento "planeó
compraf' un televisor de pantalla grande. a,

P@laneó comprar) = P(Planeó comprar¡r compró)


* P@laneó comprary no compró) o
200 50
o
=_+_ o
I,000 1,000 (D
o
250 'ñ
= 1,000 = n",
Se obtiene el mismo resultado si se suma el número de resultados que componen €l evento simFle
"planeó comprar".

Regla generalde la suma


¿Cómo se calcula la probabilidad del evento '7 o B"? Es necesario considerar la ocurrencia del
I I
evento o del evento .8, o de y 8. Por ejemplo, ¿de qué manera podemos determinar la probabi-
lidad de que una familia haya planeado comprar o reaknente haya comprado un televisor de panta-
lla grande? El evento "planeó comprar a realmente compró" incluye a todas las familias que
planearon comprar un televisor de pantalla grande y a todas las. familias que realmente compraron
el televisor. Examinemos cada celda de la tabla de contingencia (tabla 4.1 de la página 144) pan
determinar si forma parte de este evento. De acuerdo con la tabla 4.1, la celda "planeó comprat /
en realidad no compró" forma parte del evento porque inclule a los participantes que planearon
hacer la compra. La celda "no planeó comprar y en realidad compró" se incluye porque contiene a
los participantes que reaknente hicieron la compra. Por último, la celcla "planeó comprary en reali-
dad compró" hcluye las dos caracteústicas de interes. Por lo tanto, una foma de calcular la proba-
bilidad de "planeó comprar o reaknente compró" es:
P(Planeó comprar o en realidad compró) = P(Planeó comprary en realidad no compró)
+ PQ.{o planeó conprary en realidad compró)
p¡lD]^ñ¿Á
- ^^ñ--^. y en realidad comOró)
50 100 200
tpoo*t,ooo*1poo
350
1,000
148 cA¡fruLo 4 Probabilidad básica

Amenudoesm¡isfácildeten¡natP(AoB),laprobabilidaddelevento,4oB,utilizandolarq¡
general de la suma, que se deftne en la ecuación (4'3)'

REGLA GENERAL DE LA SUMA


La probabilidacl de I o B es igual a la probabilidad de I rnás la probabilidad de B menos la

probabilidaddelyB.
P(A o B)= P(A)+ P(B)- P(AY B)
(43)

AI aplicar la ecuación (4.3) al ejemplo anterior se obtiene el siguiente resultado:

p@taneó comprar o en rearidad comprt =


igH.:.:iffJT] compró) _p(planeó
comPrarY en realidad comPró)
250 300 200

i r' 1.000 1,000 1,000


?50
=_=u.J)
1,000

La regla general de [a suma consiste en tomár la probabilidad


I
de y srmarla a la probabiliüd

¿" ¡, V fu-egJrestut la probabilidad del evento conjunto y B de ese I total' debido a que el evento
.oo¡'[to y"'nr. io.luido al calcular ta probabilidad de y la I
probabilidad de B. Remitiéndonos a h

taUü +.t áe h página lzl4, si los resultados del evento "planeó


comprai' se suman a los del evento
compró" ya fue incluido
"en reatidad com!ró", el evento conjunto "planeó com*ar y en realidad
evento conjunto se contó dos veces'
en cada uno de eios eventos simples. Por lo tanto, como este
deberestarseparaobtenerelresultadocorrecto.Enelejemplo4.5seilustraotraaplicacióndela
regla general de la suma

En el ejemplo 4.3 de la página 145, las compras se clasiñcaron


en la tabla 4'2 con base en el hecho
EJEMPLO 4.5
o una tecuencia de actu¿liza
¡ :.r áe si tos tei"visores tenían una frecuencia dé actualización nipida
(BD¡
Uso de la regla .rÁ¿*; v ,oo_¡*e en el hecho cle que la familia comprara un reprodrctor de discos Blu-ray haya
general de la suma televisor de pantalla gande
calcule iá probabilidad de que las familias que comprafon un
para las familias de BD'
adouirido un teleüsor con ftecuencia de actualización nípida y un reproductor
que comPfaron
televisores de SOLUCÉN Si utilizamos la ecuación (4.3),
*j$t pantalla grande
P(El televisor tenía ftecuencia de
(É i¡
P(El televisor tenía frecuencia de actualización
BD) - actualización nápida) + P(compró un
rápida o compró un reproductor de r.productor de BD) - P(El televisor tenía ,
\¡ frecuencia de actualización nápida y compto
un reProductor de BD)
ir$
i:l ¿
".ril
80 108 38
'h.
:l$!.
r'
300 300 300
il,,1, 150
, ;'i =_=u.)u
'ü+
ds
pantalla grande' existe un 50%
Por lo tanto, entre las familias que compraron un televisor de
liir:ii con llecuvu!"
-'r probabilidades de que una familia elegida al azat haya adquirido u¡ televlsor
ie actualización nípida o que haya comprado un reproductor de BD

)
Problemas para la sección 4.1 149

blemas Para la secclon


DE LOs FUNDAMENTOS ó) Cada participante fue clasificado según el tipo de auto-
móvil que conduce: sedán, vehículo utilitario, estadouni-
hnzan dos monedas' dense, europeo, asiático o ninguno.
¡¡ ejemplo de wr evento simPle. c) A los encuestados se les preguntó: "¿Actualmente vive
un ejemplo de
un evento conJunto.
en i. un departamento o ii. una casa?".
ei el complemento de una cara en el primer lanza- d)Un producto fue clasificado como defectuoso o no
,|
defectuoso.
qué consiste el esPacio muestral?
4,7 ¿CuáI de los siguientes eventos ocune con una proba-
uma contiene 12 pelot¿s rojas y 8 pelotas blancas. bilidad cero? Explique su respuesta para cada inciso.
una pelota de Ia uma. d) Uo votante en Estados Unidos está registrado como repu-
un ejemplo de un evento simple. blicano y como demócrata.
;Cuál es el complemento de una
pelota roja? á) Un votante en Estados Unidos es mujer y esüí registrado
consiste el espacio muestral? como republicano.
iEn qué
c) Un automóvil es un Ford y un Toyota.
Considere la siguiente tabla de contingencia:
d) Un automóvil es un Toyota y fue fabricado en Estados
BB' Unidos.

A 10 20 4.8 ¿En la actualidad toma mrás tiempo que antes ser elimi-
A' 20 40 nado de una lista de correo electrónico? Un estudio de 100
grandes minoristas en linea reveló lo siguiente:
es la probabilidad del evento
I{ECESITA DAR INESO MAS CTICS PARASBEJIIII{IUIO a,
Ati0 sí No
v82 2009 61
oBl o
2008 7 93 o
Considoe la siguiente tabla de contingencia: Fuc¡tc: Datos extraídos de "Ifo¡r Clicks to Escape a¡ Em¡il Lisf', flie
o
(D
New Yo* Tfnu,29 & mzno dc 2010, p. 82. o
(D
a) Dé un ejenplo de un evento simple.
A l0 30
á) Dé m ejemplo de un evento conjunto.
A' ?5 35 c) ¿Cuá'l es el complemento de 'Necesita dar tes o ¡ois cücs
para ser eliminado de una lista de correo electónico"?
es la orobabilidad del evento
d) ¿Por qué "Necesita dar fres o m,ís clic para ser elimi¡ado
de una lista de coneo electrónico en 2009" es un evento
Ay B2
conjunto?
a' v B'?
A' o B'? 4.9 Con respecto a la t¿bla de contingencia del problema
4.8, si un gran minorist¿ en linea se seiecciona al azar, ¿cual
DE CONCEPTOS es la probabilidad de que
4.5 Par¿ cada uno de los siguientes incisos, indique si el tipo a) necesite dar tres o más clics para ser eliminado de una
de probabilidad hvolucrada es un ejemplo de probabilidad a lista de correo electrónico?
p.nori, probabilidad empirica o probabiüdad subjetiva. á) necesite dar tres o más clics para ser eliminado de una
4) El siguiente lamamiento de una moneda justa dará como lista de correo electrónico en 2009?
resultado uaa cara. c) necesite dar tres o más clics para ser eliminado de una
ó) Ihlia ganará la Copa del Mundo de fr:tbol la próxima vez lista de coneo electrónico o de que sea un gran minorista
que se ¡ealice esta competencia. en línea encuestado en 2009?
c) La suma de las caras de dos dados será siete. d) Explique la diferencia en los resultados de los incisos á) y c).
d)El tren que lleva a un ernpleado a su trabajo llegará más 4.10 ¿Las penonas de distintos grupos de edad diñeren en su
de l0 minutos tarde. respuesta a los mensajes de coneo electrónico? Una encuesta
reaüzada por el Cenfro para el futuro digitai de la University of
4'ó Para cada uno de los siguientes incisos, indique si los
Southem Califomia (datos extaídos de A. Mindlin, "Older
eventos son mutuamente
excluyentes y colectivamente E-mail Usen Favor Fast Replies", The New York Ttmes, 14 de
ex[ausdvos.
julio de 2008, p. B3) informó que 70.7% de los usuarios mayo-
4) A los votantes
registrados en Estados Unidos se les pre- res de 70 años consideran que los mensajes de coneo elecho-
Suutó si estan registrados como republicanos o demócratas. nico deben responderse con rapidez, a diferencia del 53.6% de
50 =4
1 cArhulo Probabiiidad b¡ísica 1
dos, con base eu una muestra de 100 hornbres y 100 n',¡..
los usu¿nos que tienen entre i2 y 50 años de edad' Suponga
oue la encuesá se basó en 1,000 usuarios mayores de 70 años res, son los siguientes:
y
de edad y en 1,000 usuarios que tienen enhe 12 50 años
de
GEilERO
edad. Los resultados se resumen en la siguiente tabla: Hombre Mujer
PREFEREI{CIA PARA COMER 16¡r¡

EDAD DE t(ls Comer adentro 21 3.1

PARTICIPAI{TES Ordenar adentro Para llevar 19 l0 )!


RESP()I{OE COI¡ RA,PIDEZ 12-50 Mayor de 70 Total Ordenar desde el ¿utomóvil 60 18
-$
si )JO 70'l 1)^1 Tot¡l 100 100 200

1<1 Fucntc: Drtos cxtaídos de wwr'qsrorgrzine'con/reportldrive


No 4& 293
thrü-ttn€-thdy/200tt/200!t-ch¡¡t/wh¡6Jor¡r¡referrcd-rry-b-
Total 1,000 1,000 2'000 order_fst-food.btDL

c) Dé un ejempto de un evento simple. Si se selecciona al azar un participants, ¿cuáI es la probab¡.


D) Dé un ejenplo de un evento conJuúto. lidad de que
c) ¿Cuál es el complemento de un participante que responde ¿) prefiera ordenar desde el automóvil?
con rapidez? ói iea hombre y preñera ordenar desde el automóvil?
d) ¿Por qué un participante que responde con rapidez y que
c) sea hombre o prefiera ordenar desde el automóvil?
d) Expliqtre la <liferencia en los res:ltados de los incisos ó) y 4.
tiene m¡ás de ?0 años es un evento conjunto?
4.14 En una encuesta aplicada a 1,085 adultos se preg
4.11 En relación con la tabla de contingencia del problema
"¿Le gusta ir a comprar ropa pafa usted?". Los resultados (da'
4.10, si se selecciona un paficipante al azar, ¿curil es la pro-
tós extraídos de "SPlit decision on clothes shopping"' U,ll
babiüdad de que Tottay,28 de eoero de 2011, p. 1B) indicaron que a.5l%de
o) responda con raPidez? las mujeres les gusta ir a comprar ropa para ellas' a diferencil
ó) tenga más de 70 años de edad? de ,H% de los hombres. No se indicó el ta¡naño de las mue'
c) responda con rapidez o tenga más de 70 años de edad? tas de hombres y mujeres. Suponga que los resultados indi'
d) Explique la diferencia en los rc$¡ltados de los incisos á) y c)' caron que de los 542 hombres, 238 respondieron que si, y qw

f7ffi 4.12 Sesún una encuesta de Gallup, ta nagnltud de 543 mujercs, 276 respondieron que sí. Construya 'n4.h'
@ .o ou" loi empieados se ilvoiucran con su iugar bla de contingencia para evaiuar las probabilidades' ¿Cuil c
la probabilidad de que a un participante elegido al azar
de trabajo uuiíu d. uo país a ouo' Gallup informa que- el
a)1e guste ir a comprar ropa para él o ella?
porcentaje de trabajadores estadounidenses involucrados
á) sei mujery le guste ir a comprar ropa para ella?
con su lugar de trabajo es más del doble que el porcentaje de
t"" .ui.. , ,.u una persona a la que le gusta ir a conpru
los trabajadores alemanes. El estudio también revela que el "i ropa para ella?
hecho de contar con un mayor número de empleados invo- d) sea un hombre o una mujer?
lucrados conduce a una mayor innovación, productiüdad
y
personal En 4.'t5Cada año se reúnen evaluaciones con respecto alds
rcntabilidad, así como a una menor rotación de
'¡t I
sempsño de automóüles nuevos du¡ante los primrcros
la sizuiente tabla se resumen los resultados de la encuesta'
de uso. Suponga que los automóviles se clasific'
¡
PAIS
acuerdo con la iec.iidud d. *u ,"pn relacionada co¡
"ión la em
la garantía (sí o no) y según el pais en que se localiza
il¡volucRAillEt{To Estados Unidos Alem¡nia Total
nrJsa fabricante (Estados Unidos u otro país)' Con base
o

\- Involucrado ))u ios datos reunidos, la probabilidad de qu€ un automoYr


t,&9 nuevo necesite una reparación por garantia es de u u{'

No involucr¡do 1,345 2,994


pa
orobabilidad de que eÍ automóvil haya sido fabricado
'q. Tot¿l 1,895 1,895 3,790
i¡nu locaiizada en Estados Unidos es de 0 60' y l¡

i!Í Fuente: Datos exfaido$ de M. Ni¡k, "EEployee Dise¡gagemed Plsguca ".or.r" de que un automóvil nuevo necesite una
orobabílidad
repe
abril de 2009'
üli Germany" , Gattup Monagement Joutnal, gm!'g¡lltp'com, 9 de iación por garaniía y haya sido fabricado por una empr$l
ur
localizada in ¡st¿d-os Únidos es de 0.025' Construya
lrjf l Si se selecciona un empleado al azar' ¿cuál es la probabili-
d'1 tabla de contingencia para evaluar las probabilidades$
"r;¡ dad de que
una reparación réhcionada con una garantía- icuá-l
es. ta{
ii:! ¿) esté involucrado con su lugar de tabajo? babiliáad de que un automóvil nuevo seleccionado al
az'r
¡r\ á) sea un trabajador estadounidense? c) necesite una reparación por garantía? .-
^. .-"r,
c) esté involucrado con su lugar de trabajo o sea un habaja-
ó) necesite una reparación por garantia / haya srdo taonc'*
'Ei dor estadounidense? por una empresa localizada en Estados Unido¡? .
^ . -^n
d) Explique la diferencia en los resultados de los incisosb) c)'
y
;rl c¡ necesite uná reparacion por garantia o haya sido fabncaor
i.'1|
gente para ordenar por una empresa localizada en Estados Unidos? , .-o
4.13 ¿Cuál es la forma preferida de la
Ar:'l:
^
una encuesta en 2009, pero no se d)- necesite unarepanción por garantía o no baya sido fabncal
comida rapicla? Se realizó
por un" emprésa localizada en Estados Unidos?
reportó el tamaño de las muestras. Suponga que los resulta-
4.2 Plobabilidad condicion¿l 15'l

Probabilidad condicional
Cada uno de los ejemplos de la sección 4.1 requiere calcular la probabilidad de un evento cuando
1¿ muestra se obtuvo de un espacio muestal completo. ¿Cómo se determina la probabilidad de un

evento si se tiene cierta infomración ace¡ca de los eventos implicados?

Cálculo de probabilidades condicionales


La probabilidad condicion¡l se refiere a la probabiüdad del evento l, dada información acerca de la
ocu¡rencia de oto evento,8.

PROBABILI DAD CONDICIONAI-


I Laprobabilídad de I dada B es igual a la probabilidad tte I y 3 diüdida ente la
de B.
P(A y B)
P(AlB) = ---
P(B)
(4.4a)

La probabilidad de I dada I es igual a la piobabiüdad de I yI dividida ente la


orobabilidad de ,4 .
P(Av B\
A\ =
-P(\-RIr--l (4.4b)
P(A) v,

doude:
o
P(,4 y B) = probabilidad conjunta l yBde o
:
P(l) probabilida<l marginal de I o
(D
P(B) = probabiüdad narginal de B o
A

Remítase a la sección Uso de la estadística referente a la compra de televisores de pantalla


grande, y zuponga que se le infonnó que una familia planea comprar un televisor de pantalla grande.
A.hora, ¿cuál es la probabilidad de que la familia realmente lo compre? En este ejunplo, el objetivo
consiste en calcular P(En realidad compró | Planeó comprar). Aquí se recibe la infonnación de que
la familia planeó.comprar el'teleüsorde pmtalla.gande. For,.lo.tanto, el esp¿cio muestal no consta
de todaq las 1,000 familias dd la encuesta; consta solo de las familias que planearon comprar un
televisor de pantalla grande. De esas 250 famiüas, 200 realnente hicieron la compra. Por lo t¿nto'
con base en la tabla 4.1 de la página 144, la probabilidad de que una familia realmente haya com-
prado el televisor de pantalla grande, dado que planeó comprarla, es:

Planeó comlll{r y en realidad compró


P(En realidad compró | Planeó comprar,
'- Planeó comprar

=ffi:o.ao
Tambien podemos utilizar la ecuación (4.4ó) para calcular este resultado:

P(A v B)
P(BlA) = -rt^)
donde:

I : planeó comprar
B = en realidad compró
152 cAPiTULo4 Probabilidad básica

eatonces:

200/i,000
P(En reatidad compró | Ptaneó comprar) 250/i,000

=4=o.ao
250

condicional'
El eiemolo 4.6 ilustra de manera más clara la probabilidad

145 es una tabla de contingencia que indica si una


familia compró lxl hle.
E.¡EMPLO 4,ó La tabla 4.2 de f.págila
nn-¡al.. Sl
vrror .* *. ru1l it ia de actualización rápida y si adquirió un reproductor de fiscol
de actualización rápida, es la probabili.
Cálculo de la una familia compró un televisor con una frecuencia
¿cuál
probabilidad Ju¿ ¿. ,u.Ui¿n haya comprado un reproductor de discos Blu'ray?
*.
condicional de una frecuencia de ¿ctuaiia'
comPrar un SOLUC!óN Como sabemos que la familia compró un televisor-con
38 tambien conpn
reproductor de ;r-;pidn el espacio muestal se reduce a 80 familias' De esas 80 familias'
de que una famüa haya com
discos Blu-raY * r.p.!¿t.a. ¿L ¿iscos Blu-ray @D)' Por lo tanto, la probabiliclad
de BD, a"ao qo. compró un televisor con r¡na
frecuencia de actualizaci0n
;rrd;;..pr;ñ.ior
raoida- es:

Número que compró un lelevisor con ftecuemir


P(Compró un reproductor de BD I Compro un de actualización nipida y un reproductor de BD
teievisor con frecuencia de achnlización rápida)
- Número que comPró un televisor con
frecuencia de actualiz¿cion nipida
J6
0.475
80

Si utilizamos la ecuación (4.4b) de la página 1 5 I :

rápida
I = compró un teleüsor con fiecuencia de actualización
B = compró un reproductor de BD

entonces:
Puv B\ 38i 3oo
P(Bla) ='iÑ = s()tÑ = o'41s

Porlotanto,dadoquelafamiliacompróuntelevisorconaecuenciadeactualizaciónrápida,
,rou p.oUaiilidad ie a7.5% Je q* tutbi*
huyu tomprado.rm reproductor de üscos Blu"o}
."ist
la probabilichd,TTry"t,*-:":lT"1li.
i;;;, J";d* esta probabiliclad condicional0'36cono 36%' Estos resu-ltados:.:::i.11t"iii#"
productor de &scos Blu-ra¡ que es 108/300 =
proDaornu4w
ii^ qu. .o.p.afoo teleüsores con ftecuencia de actualización nápida tienen mayores
que compraron televisores de pantaüa
de adquirir un reproductor de discos Blu-ray que las famiüas
sandá con fiecuencia de actualización estíoda¡'

Árboles de decisión
de acuerdo con el hecho de qut plln'.ry
En la tabla 4.1 cle la págila l¿14 se clasificó a las familias
y realmente 1o com¡raron' Un árbol de decisi0¡
a<iquirir un televisor de pantalla grande o no, de si p¡r
es una altemativa a la tabla de contingencia. En la
figura 4.3 se presánta el rírbol de decisión
este eiemplo.

)
4.2 P¡obebilidad condicional 153

RA 4'3
decisión

Conjunto
A,lva)=ffi
complsto
de tamil¡as

A¡tA= lql,*

ñAy4= i9d5'0-

En la figura 4.3, comenzando a la izquierda con el conjunto completo de fanilias, se observan


dos "ramas" que indicaú-si la familia planeó la compra de rm televimr de paatalla grande. Cada
u¡a de esas ranas tiencdos subra¡nas que indican si la familia en realidad compró o en realid¿d Do
compró el teleüsor, Las probabilidades qu€ se observaú al fin¡l de las ¡am¿s iniciales representan
las probabilidades marginales de y I l'.
Las probabilidades que se loc¡li"¡n ¿l final de cada una
de las cuatro subramas reprcsentan la probabiüdad conjunta para cada combinación de los eventos a,
I y 8. La probabiüdacl condicional se calcula dividiendo la probabilitlad conjunta ente la probabi.
lidad marginal adecuada.
Por ejenplo, pan calcular la probabilidad de que la fa¡nüa realmente haya comprado el tele-
o
o
viso¡ dado que planeó hacer la compr4 tomanos P@laneó coqrary en realidad coryró) y divi- o
(D
dimos entre P(Planeó conprar). A partir de la figura 4.3,
o
or

P(En realidad compró | Planeó comprar) =


,a4Effi
200
0.80
250

El ejemplo 4.7 ilusta la manera de constuir un árbol de decisión.

4.7 Utiüce los datos clasific¿dos enlatabla 4.2 de la página i45 para constuir el árbol de decisión.
Use e[ á¡bol de decisión para calcular la probabilidad de que una familia compre un reproductor de
del
discos Blu-ray, dado que la famiüa compro un teleüsor con frecuencia de actualización nipida. :
decisión
familias SOLUCTóN El árbol de decisión para las faniüas que compraron un reproducto¡ de discos Blu-
ray y un televisor con frecuencia de actualización rápida se presenta en la fgura 4.4 de la página
de 154. Utilizando 1a ecuación (4.4á) de la página 151 y las siguientes definiciones:
grande

I = compró un televisor con frecuencia de actualización rápida


I = compró un reproductor de discos Blu-ray
P(AvB\ 38/300
P(A)= 80/300 = 0.475
P( Bl A\ = ---:---:----:
1 54 cAPfruLo 4 Probabilidad básica
?
FIGURA 4.4
Arbol de decisión
para las familias
que comPraron
un televlsor con gl 42
F,Ay =
frecuencia de 300
Conjunto
actualización
completo
rápida.y un d6 familias
reproductor de
70
discos Blu+aY AAyBI=
Purqe# 300

150
ñAi y B'l =
300

lndependencia
grande' la probabiüdad condicional c
En el ejemplo sobre la compra de televisores de pantalla
'o.go
a" que la fanoilia seleccionada en realidad haya comprado el telwisor
de panta
ioolisí =
U.g'*¿",dadoquelafamiliaplaneóhacerlacompra'Laprobabilidadsimpledeseleccionur
de 300/1,000 = 0.30. Este resultado
una"familia que en realidad haya comprado el televisor es
i"a."q*.r.o'"cimientopreviodequelafamiliaplaneóhacerlacompraafectólaprobabilidd
eveúo dependeü
L Ñiit *4"¿ compraá el televisór' En otras palabras, el renrltado de un
¡esultado de un segmdo evento.
de ocurrencia de oüo evento, se dic
cuan<lo el resilodo de rm wento no afecta la probabiüdad
que los eventos son indep€rdient€s. l¿ independencia se detennira
utilizando la ecuación (4'5)'

INDEPENDENCIA
Dbs eventos,'/ y 4 son independientes si y solo si:

P(alB'¡= P(A) (4.t

donde:

P(/ | B) :probabilidad'condicional dc '{ tlada I


' P(A) = probabilidad marginal de I

N
'{-*
En el ejenplo 4.8 se demuestra el uso de la ecuación
(4'5)'

.tl,i
que en realidad compraron tetgviioru,l
EJEMPLO 4.8 En la encuesta de seguimiento aplicada a las 300 familias
'F* Li"1^t]:j:::YiTi,f
I '.t-rl ;;;ü-gil., t. üs pregunto si estabansatisfechas con sus compras'
ta satisraccion con las respuestas a si el televisor tenia
u¡a ftecuo
Determinación íü;#;;;r;ñá so'ure
';iY
de independencia cia de actualización ráPida
, Fr.
[:1
.q,li CoMPf,A? '
Coil tA
';¡üt TABLA 4.3 mEcuEl¡clA DE ACÍUAUZAC¡fi ¿ESTA SAilSiFEC{q
No
,i'1,: DELIETEVIS{IR Sí Tot¡l
Satisfacción con la
compra de R.ipida & l6 80

televrsores ce
,
t76 44 n0
5i pantalla grande
Estándar
300
Tot¡l 240

--¿
4.2 P¡obabüdgd condicion¡l 155

Determhe si sentirse.satisfecho con la compra y la frecuencia de actualización del teleüsor


adquirido son eventos independientes.

SOLUCÉN Para esos datos,

&1300 64
=
,r/rra = S0 =
P(Satisfecho I Frecuencia de actualización nápida) O.¡O

que es igual a:
) Lt\
P(Satisfecho) =
ffi=0.80
Por lo tanto, senti¡se satisfecho con la compra y la frecueircia de act¡ulización del televisor adqu!
rido son eventos indeDendientes. Conocer un ev€úto no afect¿ la probabilidad del oto evento.

Reglas de la multiplicación
La regla general de lr multiplicación se obtiene utilizando la ecuación (4.tfc) de la página 1 51.

P(A y B)
P(AIB) =
P(B)

y despejando la probabilidacl conjunta P(l y B). o


=
o
o
,o
qt
o
ot

En el ejemplo 4.9 se demu€sf¿ el uso de la regla general de la multiplicación.

4.9 Considere a las 80 farnilias que compra¡on televisores con una frecuencia de actualización rápicla.
En la tabla 4.3 de la página 154 se observa que 64 familias esuin satisfechas con su compr4 y que
de la regla
16 familias esuán insatisfechas. Suponga que se eligen dos familias al azar del conjunto de 80.
de la
Calcule la probabiüdad de que ambas familias estén satisfechas con su compra-

SOTUCÉN En este c¿so se puede utilizar la regla de la multiplicación de la siguiente manera. Si

I = la segunda familia seleccionada está satisfecha


I = la primera familia seleccionada esüi satisfecha
entonces, utilizando la ecuación (4.6):

P@y n) = P(atB)P(B)
La probabilidad de que la primera famiüa esté satisfecha con la compra es 64/80. Sin embargo'
la probabilidad de que la segunda familia tambien esté satisfecha con la compra depenle del ren¡l-
tado de la primera selección. Si la primera famiüa no se reincorpora a la mwstra después de deter-
minar su nivel de satisfacción (es decir, si el muestreo es sin reemplazo), el nrlmero de fa¡nilias
restantes es 79. Si la primera familia estrá satisfecha, la pmbabilidad de que la segunda tambien lo
esté es 63i79, ya que en la muesfia permanecen 63 familias satisfechas. Por lo anto,
15ó cAPfTULo4 Probabilidadbrisica

P(AYB) --(#X#):06380
estén satisfechas co¡*
Hay una probabilidad de 63.80% de que las dos famiiias muestreadas
compra.

se obtiene susütuyepdo P[4p1


La regla rle la multiplicrción p¿ra eventos independientes
por P(l) en la ecuación (4.6).

REGLA DE LA MULTIPLICACIÓN PARA EVENTOS INDEPENDIENTES


Si ,4 y Brson independientes' la probabilidad de
y 8' es igual a la probabilidad
'{
de
'{ por
la probabilidad de B.
(4.7)
P(AYB) = P(a)P(B)

I
Si esta regh és válida para dos eventos, y B, entonces I y B son independientes' Por lo tan''

eüsten dos fo¡¡as de determinar independencia:

l.Los eventos y B son independientes si y solo si P(llBf P(l)'


I
2. Los eventos,{ yB son independientes si y solo si P(Ay
B)= P(AV@)'

Probabilidad marg¡nal utílizando la regla general


de la multiplicación
Enlasección4.l,laprobabili<ladmarginalsedefinióconlaecuación(4.2)delapágin-al47.loú.
de la multiplic*
.o, pt-t.. to ..uación para la probibitiaad marginal utilizando la regla general
ción. Si

P(a): P(AYB) + P(AYB) + "' + P(AYB¡)


ecuación (4'8) define la probabilidad
entonces. utiliza¡do la regla general de la multiplicación, la
narginal.

PROBABILIDAD MARGINAL UTILIZANDO LA REGLA GENERAL


DE L.A MULTIPLICACION

P(A) = P(,altr)P(Br) + P(atB2)P(82) + "' + P(atBk)P(Bk) (4'E)


.
y colectivamente exhaústivos'
donde 8r, Br,'.., B¡ son & eveD.los mutuamente excluyentes
ñs
la página 1¿14 Sean:
it$ Para iiustrar la ecuación (4.8), remitase a la tabla 4' 1 de

!;! P(l) = probabilidad de "planeó comprar"


^L:
P(8,) = probabilidad de "en realidad compró"
tii P(Br) : probabilidad de "en realidad no compró"
planeado la compra es:
i*
j.,i
Entonces, utilizando la ecuación (4.8), la probabilidad de haber

,,:*.
[i";
f ii:

itil*
^^:i':;lif iiitii&r
\¡oo/\r,ooo/ \7ool\l.ooo/
\l
--l 200 50 250
1.000 1,000 1,000
Problemas Dar¿ la sección 4.2 157

emas para la sección 4.2


DE LOs FUNDAMENTOS d) ¿La necesidad de dar hes o más clics para ser eliminado
de una lista de correo electrónico y el año son indeoen-
Coosidae la siguiente tabla de contingencia:
dientes?
BB' 4,22 ¿Las personas de distintos grupos de edad difieren en
4t020 su respuesta a los mensajes de correo electónico? Una en-
A' 20 40 cuesta realizada por el Cenho para el futuro digital de la
Universidad del Sur de Califomia ldatos extraídos de A.
es la Probabilidad de Mindlin, "Older E-mail Users Favor Fast Replies", Ifte lfew
81 York Times, 14 de julio de 2008, p. 83) informó que 70.7%
B'1 de los usuarios mayores de 70 años consideran que los men-
sajes de correo electrónico deben responderse con rapidez, a
lll.oro,; yr ron independientes? diferencia de 53.6% de los wuarios que tienen ente 12 y 50
años de edad. Suponga que la encuesta se basó en 1,000
Considere la siguiente tabla de contingencia:
usuarios mayores de 70 años de edad y en 1,000 usuarios
BB' que tienen ente 12 y 50 años de eda<I. Los ¡esultados se re-
sumen en la sisuiente tabla:
410 30
'A',25 Jf
EDAD DE LOS RESPOI¡DE COl{ RAPIIEZ

es la probabiüdad de PANITICIPAI{IES 12-50 Mayor de 70 Total


aln sí 536 707 | )L7
o
I B'1 No 464 293 757
tlB'? =
eventos I yt son independientes?
Tot¡l 1,000 i,000 2,000
o
Si P(A y B) = 0.4 y P(8) = 0.8, calcule p(l B). a) Suponga que sabe que el paficipante tiene ente 12 y 50
o
I o
años de edad ¿Cuál es la probabilidad de que responda c¡
i P(A) = 0.7, P(B) = 0.6,y A y I son independientes,
con rapidez a los mensajes de correo electónico? o
P(A y B).
á) Suponga que sabe que el participante tiene más de 70
-'
P(A)= 0.3, P(B) = O.a,y P(A y B) = 0.2, ¡r4 y B son años de edad. ¿Crúl es la probabilidad de que responda
,|
con rapidez?
c) ¿Los dos eventos, responder con rapidez y la edad del
DE CONCEPTOS participante, son independientes? Explique zu respuesta.

¿En la actualidad requiere mrís tiempo que antes ser 4.23 ¿Cuil es la forma preferida de la gente para ordenar
una lista de correo electónico? Un estudio de comida Épida? Se ¡ealizó una encuesta en 2009, pero no se
minoristas en línea reveló lo sisuiente: reportó el rrmaño de las muestras. Suponga que los resulta-
dos, con base en una muestra de 100 honbres y 100 muje-
SE REQUIERE}¡ IRES O I'IAS CUCS PARA SER res, son los siguientes:
ELIMI]IADO

Si No GEI¡ERO
39 6l PREFEREi{CUI PARA C()MER Hombre Mujer Total
7 93 Comer adentro 2L t2 33
le: Datls €xFaídos de "More Click to Escape ad Email List", t e
Ordenar adentro. parr llev¡r 19 l0 29
York Ilnes,29 de muzn de 2010, p. 82. Ordenar de¡de el ¡utomóvil 60 78 138
Totel 100 100 200
i)'' Dado que se necesita dar tes o más clics oara ser elimi-
, [ado de ¡us¡te: Drúos €xtraídos de www.qtrE¡g¡zirc,c0n/rcFort/üive,
una lista de coneo electónico, ¿cúril es la proba-
thrü_tlme_!tudy¿009/2o(D_ch¡rtíwb¡bJourjref.r¡ed_w¡y_to_
bilidad de que esto ocurriera en 2009?
ord€r_f¡st_food.hh!1.
ó) Dado que
.l ZO09 está involucrado, ¿cuál es la pro-
babilidad de "¡o
que se necesiten tres o más clics para ser c) Si un participante es hombre, ¿cuál es la probabilidad de
, eltninado de una lista de coneo
electrónico? que prefiera ordenar desde el automóvil?
c) Exptique la diferencia
en los ¡esultados de los incisos ¿) D) Si un participante es mujer, ¿curírl es la probabilidad de
, vá). oue Drefiera ordeür¡ desde el automóvil?
158 cAPÍTuLo4 P¡obabüidad básica

del gé- de uso. Suponga que los automóviles. se clasifica¡ ¡.


c) ¿La forma preferida de ordenar es independiente
acuerdo con la necesidad de una reparaclon retaclonada c0.
nero? ExPlique su respuesta.
la garantía (sí o no) y segun el país en qu€ se localiza la er'u
4.24 Segun una encuesta de Gallup, la magmtud oresa fabricante (en Estados Unidos o en otro país). C0¡
'base
en que los empleados se hvolucran con su lugar en los datos reunidos, la probabilidad de que un au0'
que- el
tle trabajo vaúa de un país a otro' Gallup informa móvil nuevo necesite una reparación por garantía es de 0.04.
porcendje de trabajadores estadounidenses involucrados
la probabilidad de que el automóvil haya sido fabricado pn
de
con su luiar de trabajo es mas del doble que el porcentaje una empresa localizada en Estados Unidos es de 0'60, y ¡
que el
los trabaj-adores alemanes. El estr¡dio también revela probabilidad de que un automóvil nuevo necesrte una rep¡
empleados invo-
hecho de contar con un mayor número de iación por garantía y haya sido fabricado por una empre$
y
lucrados conduce ¿ un¿ mayor innovación, productividad localizada en Est¿dos Unidos es de 0'025'
En
rentabilidad, así como a una menor rotación de penonal' c) Suponga que sabe qu€ una empresa localizada en hta¡q
la sizuiente tabla se resumen los result¿dos de la
encuesta'
Unidos fabricó un automóvil en particular' ¿Cuál es h
probabilidad de que el automóvil necesite una reparació'
PAIS
por garantía?
rt¡volJcnA,frllEl{To Est¡dos Unidos Alemania Tot¡l ü¡ 3upónga que sabe que una empresa loc¡lizada en Estadq
Involucrado )JU 246 /vo Unidos no fabricó un automóvil en particular' ¿Cuál es I
I 14S 1,649 r 0q¿ probabilidad de que el automóvil necesite una repardcio,
No involucrado
DOr garantía?
1,895 1,895 3,790
Total c) ¿La necesicl¿d ¿e una reparación por garantía y la locar'
Fuede: Da¡os extraídos dc M. Ni¡k "Eoployec Disc[g¿gcEcot Pl¡guls iación de la empresa que fabrica el automóvil son i¡dt'
CaUp U^agemmt Joutta!, gml'gdlu4'c¡D' 9 dc ¿bril dc
C"^ ¡, pendientes?
2009.
4.27 En 39 de los 61 años t¿¡scu¡ridos de 1950a2010,In
es de Estados Unidos, ¿curál es la
c) Dado que un tabajador acciones S&P 500 terminaron con el nivel miás alto
despus
probabiüdad de que esté i¡volucrado? de los primeros cinco días de negociación' En
34 de esos 39
es la
A¡ bado que un tr¿bajadot es de Estados Unidos' ¿cr'r'íl años. las acciones S&P 500 termimron con el nivel m^is alo

probabilidad de que no esté involucr¿do? del año. ¿Una buena primera semana es un buen augurio ól
c) bado que un trabajador es de Alemania, ¿curil es la pro-
siguiente-año? La siguiente tabla proporciona el
desempeio
babilidad de que esté involucrado? .iol y a. U pti.ou semana durante ese periodo de 61 doc
la pro-
d) Dado que un nabajador es de Alemania, ¿curil es
babilidad de que no esté involucrado? OE¡EMPEfiO AI{UAI DE tAS S&P fN
preguntó: SEtlAt{A Más alto Má¡ b¡jo
4.25 En una encuest¿ aplicada a 1,085 adultos se PR|!¡IERA

"¿Le gusta ir a comprar ropa para usted?" -Los resultados Más ¡lto 34 5

(datos extraídos de "Split decision on clot[es snopplng ' Más bsjo ll ll


USA Today,28 de enero de 2011, p 18) indicaron
que a
;
:;..' 51% de las mujeres les gusta ir a comprar ropa para ellas' a) Si se selecciona un año a[ azar, ¿cuál e1 la ¡rob.aft -
del año?"
a diferencia dé 44o/o de los hombres' No se precisó
el ta- de que las acciones S&P 500 sean las mis altas
que á)' Dado que las acciones S&P 500 terminar-on Tn
elntll
maño de las muestras de hombres y mujeres Suponga negoua'
los resultados son los que se muestran en la siguiente
tabla: mas alto después de los primeros cinco días de
.i*, ¿.o¿t la probabilidad de que sean las más altas
GÉT¡ERO del año?
"t
tE GUSIA IR A COiIPRAR R(IPA Hombre Mujer Totrl c) ¿Los dos eventos "desempeño durante l-1 Prinerase'
/ ExPu
23E 276 51+ mana" y "desempeño anual" son indePendientes

)tl que su respuest¿.
No 304 267 días,&
d) Inlnatigue el dese¡npeño dr¡r¿nte los Primeros cinco
Total 542 543 l'085
201I y-el desempeño anual de ese año de las accl0n6
dt
c) Suponga que el participante elegido es mujer' ¿Cruil es la S&P 500 en linance.yahoo.com' Comente acerca
probabilidad de que no le guste ir a comprar ropaz los resultados.
á) Suponga que al participante elegido le gusta a
comprar r 4.28 Una baraja estrfu:dar se uüliza para unjuego .Hay
cur
' es la probabilidad de que el individuo sea héboles y espaoas')' t*'
roia. ¿Cuál no palos (corazones. diamantes,
uno coo ti cartas (as. 2'3, 4, 5,6,7,8,9,10, sota'
reúá"I
hombre?
c) ¿El gusto por ir a comprar ropa y el género del individuo rey), para dar un total de 52 cartas. La baraja comPleLa "
y usted recibe las pnmen'
son independientes? Explique su respuesta' a" forma concienzuda
al de-
^"/ti^
dos cartas, sin reemplazo (la primen cart¿ no se
reglesa 4"
4.2ó Cad¿ año se reúnen evaluaciones. con respecto
primeros 90 días baraia desoués de ser seleccionada)'
sempeño de automóviles nuevos durante los

)
4.3 Teorerna de Bayes 159

6s la probabilidad de que ambas cartas sean rei¡as? c) Si se seleccionan dos guantes de la caja al azar y sin re-
65 la probabilidad
de que la primeta carta sea un l0 emplazo (el primer guante no se tegresa a la caja después
c"tta sea un 5 o un ó? de ser seleccionado), ¿cuál es la probabilidad de que los
oL lu r"guo¿"
'hirira * ru.rt.o col reemplazo (la primera carta se dos guantes seleccionados sean de¡echos?
¿la baraja después de ser seleccion¿da), ¿cual se- ó) Si se seleccionan dos gu¿ntes de la caja al azar y sin re-
en el inciso 4)? emplazo (el primer guante no se regrcsa a la caja después
la resPuesta
juego de ventiuno, las cartas con figuras (sota,-reina, de ser seleccionado), ¿cuál es la probabilidad de que se
el
valen 10 puntos, el as vale I u 11
y puntos. Todas las seleccione un guante derecho y un guante izquierdo?
cart¿s tienen su valor nominal. Se consigue vein- c) Si se seleccionan tres guantes con reemplazo (los guan-
si dos cartas suman en total 2l puntos. ¿Cuál es la tes se regresan a la caja después de ser seleccionados),
ad de lograr veintiuno en este problema? ¿cuál es la probabilidad de que los fres sean izquierdos?
d) Si hiciera un muestreo con reemplazo (el primer guante
Una caja de nueve guantes contiene dos guantes iz' se regresa a la caja después de ser seleccionado), ¿curáles

rdos y siete derechos' serían las respuestas a los incisos a) y ó)?

Teorema de Bayes
El teorema de Bayes se usa para reüsar probabilidades calculadas previamente con base en infor-
mación nueva- Creado por Thomas Bayes en el siglo xvu (véase las referencias 1, 2 y 7), el teorema
de Bayes es una extensión de lo que anteriormente eshrdiamos como probabilidad condicional.
Podemos aplicar el teorema de Bayes a la situación en que M&R Electronics World estl consi-
derando vender un nuevo modelo de televisor. En el pasado, 40% de los nuevos modelos de iele-
visores han tenido éxito, en tanto que 60% no 1o ha tenido. Antes de i¡troducir el nuevo modelo de
at,
televisor, el departamento de ir:vestigación de mercados realiza un amplio estudio y entega un in-
forme, ya sea favorable o desfavorable. En el pasado, 80% de los nuevos modelos de televisores =
que tuüeron éúto ¡ecibieron infomes de investigación de mercados favorables, en t¿nto que 30%
o
de los nuevos modelos de televisores que no tuvieroo éxito recibieron informes favorables. Para el o
nuevo modelo de televisor que se está considerando vender, el deparlamento de investigación de o
(¡¡
mercados entregó un informe favorable. ¿Cuál es la probabiüdad de que el televisor tenga éxito? o
EI teorema de Bayes se desanolló a partir de la definición de la probabilidad condicional. P¿ra o
calcular la probabilidad condicional de 4 dado l,
considere la ecuación (4.4á) (que se presentó
originalmente en la página 151 y que se reproduce a continuación):

P(Av B\ P(AlB)P(B)
P(BIA)=
,ñ: P\A)

El teorema de Bayes se deduce al sustib:ir la ecuación (4.8) de la página 156 por P(,4) en e1 deno-
minador de la ecuación (4.4á).

TEOREMA DE BAYES

P(alB)P(B)
P(4lA): p(AlB)p(B) + P(AlBr)P(&z) +.. + P(alBk)P(Bk)
(4J)

donde B, es el !ésimo evento de ¿ eventos mutuamente excluyentes y colectivamente


exhaustivos.

Para usar la ecuación (4.9) en el ejempio de la come¡cialización del televisor, sean:

evento ,S éxito
= teleüsor con evento F = informe favorable

l'J.t evento S'= televisor sin éxito evento F'= i¡forme desfavorable
fal yi

P(s) = s.as P(rls) 0.80 :


r(s') = s.66 P(.Fls') :0.30
1 ó0 cA¡iTWo 4 P¡obabiüdael básica T
Así, utilizando la ecuac!ón (4.9),

P(Fls)P(s)
P(slF) =
P(Fl s)P(s) + P(rls')P(s')
(0.80x0.40)
(0.80)(0.40) + (0.30)(0.60)

0.32 _ 0.32
0.32 + 0.18 0.50

= 0.64

La probabilidad de un televisor con éxito, dado que se recibió uo i¡forme favorable, es 0.64.
De esta maner4 la probabiüdad de un televisor que no tiene éxito, dado que se recibió un infon¡e
favorable, es I - 0.64 = 0.36.
En la tabla 4.4 se resume el cálculo de las probabilidades y en la ñgura 4.5 s€ pf€senta el á¡hl
de decisióo.

TABLA 4.4 Evento ,9, 'Probabüd¡d Probabilidarl Prob¡bilidad


pr€vis co¡dicion¡l conjunta Probabilidad revis¡da
Cálculos del ¡(rlsJ P(rls)P(sJ P(s,lD
P(s)
teorema de Bayes
oara el eiemplo ,,de
|la comerclal|zac¡on S = televisor 0.40 0.80 P(slr)=¡.37¡.56
",,' con érito = 0.ó4
del televisor
J'= telcvisor 0,60 0.30 0.18 P(S', lF) = 0.18/0.50
0.50 = 0.36
sin éxito

FIGURA 4.5
Arbol de decisión
para comercializar
un nuevo televlsor f,Sil = 0.4o

f,sy P)= flFI9 Rs1


(0.40) = 0.08
= (0.20)

ñ9) = 0.60

N ñs'v P) = f,Pls') f,s)


ff
h[-
= (0.70)
(0.60) = 0.42


;eq
-¡i

i9r. En el ejemplo 4.10 se aplica el teorema de Bayes a un problema de üagnóstico médico'

a;l.
:Í l'
t\; EJEMPLO 4.10 La probabilidad de que una persona tenga cierta enfermedad es rle 0.03. Se dispone de pruebastr
diagnóstico médico iara determinar si lá penona realmente padece la enfemedad. Si la enferne
I l'::

ffiiir
Uso del teorema
de Bayes en un
;f#;l#;ii.r*ür" p.t"uiüdad de que ta prueba de diagnóstico médico dé un resul
no e¡'
!l¡
:;i:l,l problema de
t¿do positivo (que indique que la enfermedad está presente) es de 0.90. Si la enfen¡edad
enftt'
"\¡t realm"ot" presáte, la probabilidad ae un resultado de prueba positivo (que indique que la
diagnóstico médico
medad está presente¡ es ae O.OZ. Suponga que la prueba de diagnóstico médico ha dado u¡
¡esü
s{.-
la probabilidad de que'
tado positiv; (indicando que la enfermedad está p¡esente). ¿Cuál es
enfermedad este realnente pfesent€? ¿cu.ál es la probabilid¿d de un resultado de pnreba posiüvoj
4.3 Tcoremade Bayes 1ó1

SOLUOóN Sean:

evento D = tiene la enfermeüd evento I = la pruebaes positiva


evento D = no tiene la enfermedad evento f' = la prueba es negativa
yl

P(D) = 0.03 P(IID) = 6.es


P(D') = s'e1 P(rlD',) = 0'02

Al utilizar la ecuación (4.9) de la página 159,

P(rlD)P(D)
P(Dlr) =
P(rlD)P(D) + P(rlD',)P(D',)
(0.e0)(0.03)
(0.e0x0.03) + (0.02)(0.e7)
0.0270 0.0270
0.0270 + 0.0194 0.0464
= 0.582

La probabilidad de que la enfermedad esté realnente presente, dado que ocurrió un resultado
positivo (el cual indica que la enfermedad estii presente), es de 0.582. En la tabla 4.5 se resume el
cálculo de las probabilidades y en la ñgura 4.6 se presenta el árbol de decisión.
a,

c,
rAB LA 4.5 Evento D, Prob¡bilidad Prob¡bilidsd Probabilid¡d o
del
previa condicion¡l conjunta Prob¡bilid¡d reüs¿da o
de Bayes {r) \rtD) (rtD)(D) P@tln q¡
o
a.el problema (D
D = t¡ene la 0.03 0.90 0.0270 P(Dln=0.0270t0.0464
qragnoflco enfermedad = 0.582
I/ = no tiene la 0.0194 P(D lD=0.0194/0.M64
enfermedad c0464 = 0.418

GURA 4,ó
fubol de decisión
para el problema
de diagnóstico

ll r'11 - n (¡7 ,. ffi


,..ño,v r) = ñl.lü Húl
(0.98) {0.97} = 0.9506
=

El denominador en el teorema de Bayes representa P(7), la probabilidad de un resultado de


prueba positivo, que en este caso es 0.0464 o 4.il%.
Ue ti
ivo?
162 CAPÍTULO4 Probabilidad básica
r
La Divina Providencia y el correo basur¿
0 un mensaje legítimo {llamado 'ham" en ests con- ban ei hecho de que las pmba¡ilidades condiciob
¿Supondía que los ensayos Div¡na benevolenc¡a
te\to). Primero necesitariamo{i agregar al prcgruna l€s se actual¡zan constaltsmente, y que hr
un intenb de Dmbar que el prjnc¡palfn de la Divina
de c0rfeo electrónico un "f¡ltro de coÍeo no de- palabras que alguna vez se cons¡deramn "buefla,
Providencia es la felicidad de sus criaturas y Un
pronto serían descÍtadas com0 hles por elfihl
ensayo sobre la resolución de problemas en la seado' que tenga la capac¡dad de rasüear lrecusn'
cias de oaiabras asoc¡adas con mensajes deseados conforme aumente su valor P(¡lg). 0e la mr$¡
doctina del azar fuemn escritos por la m¡sma per-
y no deseados, según los identifcamos de manera forma, a m8dida que las palabras 'extrañas'$
sona? Pmbablemente n0, y con eso so ¡lustra una
cotdft$a. tsb 0€mitrh que el filüo actEihe c00s' volvían más comunes en el coneo no desado,
aplicación modema de la eshdfstica bayesiana: el
tantemente las probab¡lidades previas necesaras pero seguian s¡endo poco comunes en el c0n6
corco basuB 0 los filtos del coneo no dossado.
mra ulil¡zar el E(f€ma de Bay€s. Con €6as probobill- deseado, acbaban como las varianles mal escnh
Es probable que no haya adivinado debido a
fü0'prEgurbrh': "¿Cuá es la fob¿bilidad oue otos habiien probado aflteriomente.
oue observó las palabras en los lfulos de los ensa- dad€6, el
de 0u€ un coreo electrónico sea basura, dada la Aün enhnces, y qu¡zá después de leer sdft
yos y concluyó que hablaban de dos asunbs dile-
or€sencia de cierb palabra?". Ia esbdística bayesiana, quienes envían mrs h
rentes. Una regla implicita que utilizó es que las
La aplicación de los términos de la ecuaciÓn sura pensaron que insertando palabras aleat0ri6
tfécuencias de las palabras varian de acuerdo con
(4.9) de la página 159 como un filtro bayesiano en sus mensaies podrían 'romp€/ 16 filtos q$
la maleria. Es muy probable que un ensayo soDre
Dan slc0neo no deseado muitjplicaría ¡a probabil¡- s¡anos. Esas palabras aieatorias afectarían elflh
eshdislica incluyera la palabra esadisúic¿ ad€más
dad de encontrü la palabn en un coneo basura, al pmvocar que detechra muchas falabr¿s coll ul
de tórminos como proüaDllida4 Wblenay solu'
que el c0re0 sea n0 valor P(/414 baio. E filtro bayssiano empe¡arh¡
cion Es más probable que un ensayo del sigl0 wn fl/414, por la probabilidad de
deseado, fl8), y luego dividlía el resulhdo ente la etiquebr much06 mensajes n0 deseados c0m0 ú.
sobre teologia y relig¡ón i¡cluyera los términos Dr-
orobab¡lidad ds enconbar la palabra en un coneo sead0s. Derdiendo así sü uso práct¡co. Sin efl.
v¡na \ Pnv¡dmc¡a cffi nayúsf'úlas.
elecfónico, el denom¡nador en la ecuación {4.9). bargo, de nueva cuenta estos ind¡viduos pr
De la m¡sma foma, seguramente usted con-
Los filtros de c0ne0 no deseado bayes¡anos tam- 0or alh el hecho de que las probabil¡dades cü'*
sideraría que algunas palabras tienen muy pocas
brén utilizan atai0s al enfocarse en un pequeño cionales se actializan c0nstanlemeflte.
Drobabil¡dades de aparecer en cualquiera de los
coniunto de palabras que tienen una alb proba¡¡l¡- otros individuos que envían coreo ba$x¡
dos libms mencionados (por ejemplo, los términos
dad de aparecer en un mens¿ie n0 deseado' y al decidieron eliminar todas o la mayoria de las da.
técnic0s de las finanzas), en bnto que es muy pro-
enfocarse en un pequeño con¡unto de ofas pala- bras en sus mensa¡es y reemplazarlas con grdq
bable que otras sstén incluidas en ambos (térm¡nos
bras que üenen p0cas probab¡l¡dades de encon- d€ manera que los flt¡os bayesianoe tuüeran n!
comunes como ut, y y i4. Términos como pmbable
trarse en un mensaje no deseado. Docas palabras para fomar probabilidades cmf
o ¡mprobable sug¡eren una apl¡cación de la teoía
Cuando los individuos que envían c0Íeo ba- cionales. Pero este método hmbién falló' yaqr
de la probabilidad. Desde luego, probable e ¡mpro.
enteraron de la ex¡stenc¡a de es6 nuevos los filtos bayes¡anos s€ lescribi€r0n para cdF¡b
bable son conceptos ¡mprecisos, y en ocasioftes sura s€
flt6. t€bfon d€ $p€rado6. Al aprender que b fil- rar olos elemeÍt0s, ad€más de las palabtrs' 6t It
podiam06 dasificar de forma inconecla un ensay0
Í0s bayesianos podrian eshr asiqnando un valor memaie. Después de tod0, el leorema de 8ayt6 $
si consideramos las cosas con tanta simpllcidad,
P(AIO el€vado a palabras que se encuentran de rel¡ere a eventos y los 'gráficos presentss s
basándonos únicamente, por ejemplo, en la pre-
manera común en el coneo basura, como viagra, texto' conslituyen un evento bn vál¡do c0m0'*
s6c¡a d6 las palabras Divina y Providencia.
pensamn que podrÍan engañar al fiüo escrib¡endo guna palabra, X, presenle en un m€nsale" 0tü
Por ejemplo, la d€scripcién del diturito Haris
la paiabra de ofa forma, como vi@gr@ o v1 agra. fucos ftJtums fallarán hmbién por la misma r¿lh
Mllstead, mejor conocido como Divlno, la esÍslla
Lo oue no hmamn 0n cuenh fue que las variantes {hr cierto, los ftbos de c0Íeo no deseado bmbie
de Hairspnay y ofas peliculas, sobre su v¡s¡ta a Pm'
mal escrihs en un mensa¡e de coneo no dessado utilizan t&nicas no bayesianas, lo que dififlft aü
v¡dencia (en Bhode ls¡and), con hda certeza n0 se
bnían más pmbabilidades de s€r enconf¿das que más la vida de quienes envían coÍeo basur4.
ía un ensayo sobre teoloqÍa. Pem si ampliáramG m d€s¿d Ú
la Dalabra orig¡nal. De esta manera, las variantes L6 ftt6 bayes¡anos d€ coneo
el número de palabras que examinamos y encon-
Íáramos lém¡nos como pel,?u/á o el nombre Jonn mal escritas facilitaron a los filtros bayesianos la un eiempl0 de la manera ¡nesperaú en
que las d
trbnes de la esbdÍstica pueden a0arec€r €rl
Waters (qu¡en d¡riqió al Divino en muchas pel¡cu' búsqueda de coneo basura.
otros ind¡viduos que envían coneo basura cotidiana. Conl0rme lea este l¡bro descubnl-
las), probablemente nos darÍamos cuenh con rapi-
d€z de que el ensayo se relaciona con el c¡ne del trataron de.engañar a los filtros agregando "bue-
s¡glo )o( y no con teoloqía y religión. nas' palabras que tendrían pocas probabilidades c¡dfu arM6nwwBaY6"q@6w
fanofiet seg4r¡do msayo que Nd
por
hdemos utilizar un proceso $milar al ffir
de de aparecer en un mensaje no des€ado, 0 pahbras cho nás
"extañas' que n0 se encuontran con fr8cuencia en oñndo un inffi faniú de IfiMr bs natutúM
clasificar un nuelro merÉaie de c0re0 €l€cirÚflic0 efl
y h@iz W deÍastat h ü¡sb$k de DB
la bandeia de entrada como c0neo basura 0 c0m0 106 mensai€s. $n embargo, eshs personas ignora'

Problemas para la sección 4.3


un resultado positivo si la enfermedad no está prese¡te
s€

APRENDIZAJE DE LOS FUNDAMENTOS


reduce de 0.02 a 0.01.
4.30 siP(B) = 0.05,P(llr) = 0.80,P(¡'):0.e5v a)' Si la prueba de diagnóstico médico h¿ dado un result¡d0
P(Al B') = 0.40, calcule P(8 ll). positivo (indicando que la enfermedad está presenE)'
esté rea¡'
4.31 siP(8) = 0.30,P(AlB) = 0.60,P(B') = 0.70v ¿cuál es la probabilidád de que la enfermedad
P(AlB') = 0.50, calcule P(8ll). mente presente?
á)' Si la prueba de diagnóstico médico ha dado un resulu&
APIICACIó}I DE CONCEPTOS o"goúuo (indicando que la enfermedad no está presenteJ'
n0 e!"
4.32 En el ejemplo 4.10 de la página 160' suponga que ta ¿cuál es Ia probabilidad de que la enfermedad
presente?
probabilidad de que una prueba de diagnóstico médico dé

)
4.4 Reslas de conteo 1ó3

de publicidad está esrudiando los hábi- c) Si se selecciona un empresario al azar, y ese individuo
Un ejecunvo
y mujeres casados de ver la televisión du- espera que su nuevo tregocio tenga 20 empleados o más
homtres
en cinco años, ¿cual es la probabilidad de que este indivi-
horuio estelar. Con base en registros
previos de los
de ver la televisión, el ejecutivo ha detemrinado que
duo sea un empresario por decisión?
estiín viendo la televisión durante el horario es- ó) Analice varias razones por las que los empresarios por
dempo. Cuando el esposo esá viendo la tele- decisión podrían tener más probabilidades que los em-
f,6o70 del
del riempo la esposa también la está viendo. presarios por necesidad de creer que su empresa creceÉ.
" el40%
el esposo no está viendo la televisión, el 30% del 4.3ó El editor de una editorial de libros de texto está tra-
la esposa la está
viendo'
tando de decidir si publicani un libro de estadistica para nego-
ule la probabilidad de que si la esposa es¡ií viendo la
cios. La información sobre libros anteriores publicados indica
el esposo tambien la esté viendo.
que l0% ha tenido gan énto,20o/o ha tenido un éxito mode-
la probabilidad de que la esposa esté vieudo la rado, 40% no ha registrado pérdidas y 30% ha anojado pérdi-
dur¿úte el horario estelar.
das. Sin embargo, antes de tomar una decisión respecto a
4,34 Olive Constuction Company estrí deter¡ni- publicarlo o no, se hará una revisión del libro. En el pasado,
nando si debe presentar una licitación para un 99% de los libros que tuvieron mucho éxito recibieron rese-
centro comercial. En el pasado, el principal competi- ñas favorables, 70% de los iibros que tuvieron un éxito mode-
Olive, Base Construction Company, ha presentado rado recibieron reseñas favorables, 40% de los übros que no
70% de las veces. Si Base Constn¡ction Corn- registraron pérdidas recibieron reseñas favorables, y 20% de
no presenta una ücitación para un trabajo, la probabili- los libros que tuüeron pérdidas recibieron reseñas favorables.
que Olive Construction Company gane la licitación a) Si el libro de texto propuesto recibe una reseña favora-
0,50. Si Base Construcüon Company presenta una li- ble, ¿de qué manera el editor debe revisar las probabili-
para un habajo, la probabilidad de que Olive Cons- dades de los diversos resultados para tomar en cuenta
Company lo consiga es de 0.25. esta i¡formación?
Olive Construction Company consigue el trabajo, ó) ¿Qué proporción de los libros de texto reciben ¡eseñas o
es la probabilidad de que Base Consüuction Com- favonbles?
no oresente una licitación?
=
4.37 Un servicio de bonos de inversión municipales tiene
es la probabilidad de que Olive Constuction Com-
hes categorías de calificación (1, B y Q. Suponga que el año o
consiga el trabajo? o
anterior, de los bonos de inversión municipales emitidos en o
A los trabajadores despedidos que se convierten en todo Estados Unidos, 70% recibió la califi cacíón A,200/o reci- c¡
ios porque no pueden enconhar un empleo signifi- bió la calificación B, y l0% recibió la calificación C De los o
en o¡ra empresa se les conoce como empresar¡ü por bonos municipales con la calificaciónl, 50% fue emitido por
The Wall Street Jourzal infonna que los empre- ciudades, 40% por suburbios y l0% por áreas rurales. De los
or necesidad tienen menos orobabilidades de oue su bonos municipales con la calificación 8, 60% fue emitido por
ra crezca que los empresarios por decrsrrín (J. Bailey, ciudades, 20% por suburbios y 20% por á¡eas rurales. De los
Than Need- Builds a Business" , The Wall certiñcados municipales con la calificación C, 90% fue emi-
-More
'Jountal,2l de mayo de 2001, p. B4). Este artículo tido por ciudades, 5% por zuburbios y 5% por áreas rurales.
que 89% de los empresarios en Estados Unidos lo c) Si una ciudad emite un nuevo bono de inversión municipal,
decisión y que l1% son empresarios por necesidad. ¿cuíl es la probabiüdad de que reciba la calificar;iónA'l
de los empresarios por necesidad esperan que su á) ¿Qué proporción de los bonos municipales son emitidos
negocio tenga 20 o más empleados en cinco años, por ciudades?
ras que 14% de los empresarios por decisión esperan c) ¿Qué proporción de los bonos municipales son emitidos
20 o mrís empleados en-cinco años. por suburbios?

Reglas de conteo
En Ia ecuación (4.1) de la página 142, la probabilidad de ocunencia de un resultado se definió
como el número de maneras en que ocune el resultado, diüdido ente el número total de resultados
posibles. A menudo existe una gran cantidad de resultados posibles y es dificil determinar el nú-
mero exacto. Para tales ci¡cunstancias se han creado reglas que penniten contar el número de ¡esul-
tados posibles. Esta sección presenta cinco diferentes reglas de conteo.

Reqla de conteo 1
La regla de conteo I determina el número de resultados posibles para un conjunto de eventos mu-
tuamente excluyentes y colectivamente ex.haustivos.
164 cA?fTULo 4 Pobabilidad brísica

REGLA DE CONTEO 1

excluyentes y coletti]T** .. .
Si cualquiera de ,t eveotos dif€rcntes mutuametrte posibles
."l"Gt"t pt ¿. ocur¡i¡ en cada uno áe n ensayos' el número de rezultados es

(4 10)

Porejerrplo,utilizandolaecuación(4'10),elnúmerodedifer-entesresultadosposiblesall¿¡'
*u.oo"dt.oo dos caras cinco veces es 25 = 2 X 2
X 2x2x2=32'
"",

posibles resultados diferentes puede¡


EJEMPTO 4.11 il"ogu q." ru-a un dado en dos ocasiones. ¿curintos
ocu¡ri¡?
Lanzamiento de
un dado dos veces sotuqóNsiuncladoconseiscarasselanzaendosocasiones,usandolaecuación(4.10),el
número de resultados diferentes es 62 = 36'

Regla de conteo 2
y permite que el número dt
La segunda regla de conteo es una versión mas general de la primera

eventos posibles diñeran de un ensayo a otro'

REGLA DE CONTEO 2
eventos en el segunto ensayo' "' y ¡t¿ €ventos
Si hay t, evenos en el primer ensayo' k,
* el ,-é'simo eosayo, entonces el número d€
resultados poslbles es:

(&) (t ). . . (f) (4.1D

g$'
establ de vehiculos autoñotores le
Por ejemplo, a la administración de un departamento dt-Tt-?Y
considemndo que et
taria saber cuántos núneros de ptacas están disponibtes' "Y"ro por tes nuno
del ingrés no incruye ra ñ) segurdas
consta de tes letras (recuerde que er abecedarió portes trúm€ros'
,". i¿.1. S).Ut*¿i ta ecuacién i+tt¡, si *S p]3."I9T3.*tres letras seguidas

ií"r ¿. resultados posibles ás (26X26X26X10X10X10) = 17,576,000


"i,iñ*"

ur
oue consta de una entrada'
.o.pl.tu . pr.cio fijo
EJEMPLO 4.12 ffi du
5 enfaL' 10 platos fuertes'
3 bebi
Dlato fuerte, una bebida y un po*
U'tt¿ pu"¿t tlegr 9fe
Determinación del '¿* y O p"t*r. Determine el número total de menus posibles'
número de comidas
diferentes SOIUOóNsiutilizalaecuación(4.11),elnúmerototaldemenusposibleses(5)(10)(3)(Q=90

Regla de conteo 3
el número de maneft$ etr que se puede
ordenar un cor
La tercera regla de conteo pennite calcular
iunto de elementos.
4.4 Reglas de conteo 1ó5

REGLA DE CONTEO 3
El número de maneras en que se puede ordenar todos los n eler¡entos es:

nt = (n)(n - 1) .. . (1) (4.rlj,


donde n! se deuomina ¿ factorial y 0l se deñne como 1.

A.13 Si un conjunto de seis libros se colocara en una repisa, ¿de cuántas maneru se podrían ordena¡ los
seis libros?

SOLUC|óN Para empezar, debe tener clarc que cualquiera de los seis übros podría ocupar el pri-
mer espacio en la repisa. Una vez que se cubre el primer espacio, se puede elegir eúre cinco übros
para ocupar el segundo espacio. Se conthria con este procedimiento de ordenamiento hasta que todos
los espacios estén ocupados. El número de maneras en que se pueden ordenar seis übros es:

nt: 6! = (óX5)(4X3X2Xr) = 720

Regla de conteo 4
En muchos casos necesitamos conoce¡ el núme¡o de naneras en que un subconjunto de un gnrpo
completo de elementos se puede acomodat en orden. Cada aneglo posible se conoce como permu-
t¡ción. a,

REGLA DECONTEO 4: PERMUTACIONES


o
o
t¿ cantid¿d de maneras de acomodar en orden.r objetos seleccionados de z objetos es; o
(D

o:
n.x 'l x)l (4.13)
\n -
donde:

n = número total de objetos

u¡ botón
: = número de objetos a ordenar
nPr, l¿ cual nl = n factorial= n(n- l) ... (1)
lr€¡Eutacro-
se utiliza eri P = símbolo para permutacionesl

4.14 Modificando el ejemplo 4.13, si se tienen seis libros, pero en el entepaño solo hay espacio para
cuato, ¿de cüfutas maneras podrá acomodar estos libros en el entepaño?

SOLUCIÓN Utilizando la ecuación (4.i3), el número de arreglos ordenados de cuatro libros


seleccionados a partir de seis libros es igual a:

P= nl = 6!
n'x =
(6XsX4X3X2X1)
= 360
(n - x)l (6 - 4)! (2Xl)

Re_gla de conteo 5
En muchas situaciones, lo que nos interesa ¡o es el orden de los resultados, sino el número de
maneras en que x elementos se pueden selecciona¡ a partir de ¿ elementos, sin importar el orden.
A cada selección posible se le llam¿ combin¡ción.
1 66 cAPiTULo 4 Probabilidad básica
? I

REGLA DE CONÍEO 5: COMBINACIONES


El número de maneras de seleccionar r objetos a partir de ¿ objetos, sin impodar el
orden, es igual a:

n-x
(1=-
;rl(z - r)!
(4.14)

donde:

n = número total de objetos

2E¡ ouchas calculadoras ¡ = núme¡o de objetos a ordenar


cientificas, existe utr botÓn
con la fu¡oión nCr, la cu¿l n! = n factorial = n(¿ - 1).. . (1)
pertrite calcula¡ combin¿cio-
fles. El síúbolo ¡ se utiliza C = símbolo para combinacioúesz
eo lugat de.t.

Si comparamos esta regla con la regla de conteo 4, vemos que la única diferencia
es que o¡
todos los arre'r^'
incluye un iérrnino ¡! en el denominador. Cuando se utilizaron permutaciones,
de 10; r objetos eran distinguibles. En el caso de las combinaciones, los x! aneglos de objetos ,

bles son irrelevantes.

€JEMPLO 4.15 Modificando el ejemplo 4.14, si el orden de los libros en el enhepaño es irrelevante, ¿de cuánbs

maneñrs se pueden acomodar esos libros en él?


Uso de la regla
de conteo 5 SOTUOÓN Utilizando la ecuación (4.14), el número de combinaciones de cuatro libros selec'

cionados a oarti¡ de los seis libros es ig¡ral a:

ol (6XsX4X3)(2X1)
a =- ,f!
ñvx .r!(n - x)! 4!(6 - 4)l (4x3x2xrx2xl)

Problemas para la sección 4.4


c) Analice las diferencias entre sus respuestas a los ir'
APTICACÉN DE CONCEPTOS
a)v b).
f7A'-ñ6il 4.38 Si hay l0 preguntas de opción múltiple en
jeans para dama está dispo
l@ uo ,**"n, ca<ia una con res respues-.as posib,es, 4.41 Una ma¡ca especifrca de
y el
secuencias diferentes de respuestas existen? nible en siete t¿llas diferentes, en tres colores distiútos
¿cuántas
tres estilos diferentes. ¿Cuántos ieans diferentes para dam
4.39 La cenádura de la caja fuerte de un banco consta de
necesita ordenar el gerente de la tienda para tener un par
0c

tres discos, cada uno con 30 posiciones' Para que la caja cada tipo?
fuerte se abra, cada ¡no de los tres discos debe estar en la
4.42 A usted le gustaría preparar una ensalada que cotso
oosición correcta.
a¡ ¿Curíntas combilaciones diferentes posibles de los discos de lechuga, jitomate, pepino y pimiento. Va al supermu'
u¡o
hay en esta cerradura? cado con-la intención de comprar una variedad de cada
$
á) ¿Cu,il es la probabilidad de que, si se elige al azar una po- de esos ingredientes. Descubre que en el supermercado
deJt
iición en cada disco, se logre abrir la caja fuerte dél banco? venden ocho vanedades de lechuga, cuatro variedades

c) Explique por qué las "combinaciones de discos" no son tomates, tres variedades de pepinos y tres variedades¡0
sr
las combinaciones matemáticas expresadas por la ecua-
pimientos. Si compra todas, ¿cuántas ensaladas difere
ción (4.14). ^¡AÁa ¡¡¡¡e¡ct'l
trr

4.40 c) Si una moneda se lanza siete veces, ¿cuántos resul-


4.43 Se forma un equipo que incluye cuaro personas
los equipos hay cuatro puestos diferentes. ¿De cuántas-úÚ'
tados diferentes soo Posibles?
nera¡¡ difercntes podría asignar a las cwrtro personas P¿rd '-
ú) Si un dado se lanza siete veces, ¿cuántos resultados dife-
cuatro Duestos?
rentes son posibles?
4.5 Cuesüones éticas y probabilidad 167

héisbol de Ias Gandes Ligas hay cinco equipos


4.48 Se elegfuán cuatro miembros de un grupo de l0 per-
sonas para formar un equipo. ¿De cuántas maneras se puede
,. orienal de la Liga Nacional: Atlanta, Florida,
seleccionar a esos cuato miembros?
Fihdelfia Washington. ¿Curántos aneglos di-
y
esos cinco equipos? (Su-
finales existen Para 4.49 Un estudiante tiene siete libros que quisiera colocar
oo hay empates en las posiciones). ¿Cree que en su mochila. Sin embargo, solo hay espacio p¿ra cuatro
probabilidades? Ana-
aneglos tienen las mismas libros. Sin importar el orden, ¿de cuántas maneras se pue-
den colocar cuato libros en la mochila?
al ¡,roblema 4.,14. ¿Cruíntos arreglos diferen- 4.50 Se lleva a cabo una lotería diaria en la que se selec-
so¡ posüles para los primeros cuaho lugares? cionan dos números ganador€s de un total de 100 números.
'irdinero tiene seis filas disponibles en su horta- ¿Cu:furtas combinaciones diferentes ile números ganadores
fob.ut ¡ito.ut"r, berenjenas, pimientos, pepinos, son posibles?

techuga. Cada verdura


puede ocupar una y solo
4.51 Una lista de lectura para un curso contiene 20 artícu-
cuántas maneras se pueden colocar estas ver- los. ¿De cuántas maneras se pueden elegir 3 artículos de
funatin? esta lista?
equipo hay ocho miembros. ¿De cuántas mane-
selecciona¡ a un líder del equipo, un auxiliar
'un coordinador?

a,

uestiones éticas y probabilidad o


Las cuestiones éticas surgen cuando se pres€nta al público cualquier afirmación rel¿cion¿da con la o
o
probabilidad, especialnente cuando esa afirmación forma parte de una campaña publicitaria para (D
un producto o servicio. Por desgraci4 muchas personas no se sienten cómodas con conceptos nu-
N
méricos (véase la referencia 5) y tienden a malinterpretar el significado de la probabilidad. En al-
gunos casos, la mala interpretación no es intencional, pero en ohos, la publicidad podría üolar la
ética y tatar de confimdir a los posibles clientes de manem deliberada
Un ejemplo de una aplicación de la probabilidad que podría viola¡ la étic¿ se relaciona con la
publicidad de las loterías estatales. Al comprar un billete de lotaía, el cliente selecciona un con-
junto de números (por ejemplo, 6) de una lista más gr¿nde (!or ejemplo, 54). Aunque casi todos los
participantes saben que es muy poco probable que ganen la loterí4 en realidad tienen una idea muy
vaga de lo irnprobable que es seleccionar los 6 números ganadores de la lista de 54 números, y tie-
nen ufla idea aún máq vaga de la probabilidad de ganar un premio de consolación seleccionando 4
o 5 n{rmeros ganadores.
Con base en lo anterior, podríamos considerar que el comercial que una lotería estatal difundió
hace poco, en el cual afirmaba "No nos detendremos hasta convedi¡ a todos en millonarios", es
engañoso y poco ético. ¿Cree que la administración estatal tiene la intención de cancelar alguna
vez la lotería, considerando que depende de ella para llenar sus arcas con millones de dólares? ¿Es
posible que la lotería pueda convertir a todos en millonarios? ¿Es ético zugerir que el objetivo de la
lotería es converti¡ a todos en millonarios?
Oho ejemplo de una aplicación que podría ser poco ética se relaciona con un boletín informa-
tivo de inversiones que prometía un rendimiento de 20% con una probabilidad de 90%. Para lograr
que la afirmación en el boletln sea ética, el servicio de inversión necesita: a) explicar las bases de
esta estimación de probabilidad; á) presentar la afirmación de probabilidad en oto fomato, como
9 posibilidades en l0; y c) explicar qué le ocr¡rre a la inversión en el 10% de los casos en los que no
se logra el 20% de rendimientó (por ejemplo, ¿se pierde toda la inversión?).
Estos son problemas éticos gmves. Si tuviera que crear un anuncio para la lotería estatal, que
describa de forma ética la probabilidad de ganar óierto premio, ¿qué diría? Si hrviera que crear un
anuncio para el boletín infonnativo de inversiones que ofrezca de manera ética la probabilidad de
un rendimiento de 20%, ¿ryé dkir?
168 CAPÍTI.,'LO 4 Probabilidad básica !
En MUR Electronics World, Revisión

omo gerente de marketing de M&R Electronics World, ¡¡L¿


está analizando los resultados de la encuesta de un estudin
sobre los planes de compra. En el estudio se preguntó a l0;
jefes de 1,000 familias sobre sus planes para comprar q 1.¡o
visor de pantalla $ande durante los siguientes 12 meses. A nododc
seguimiento, usted planea aplicar ula encuesta a las mi.smas personn¡ 12
OAlú t v.¡!o! / Corbi! meses después para saber si adquirieron televisores. Además de obtenq
esta información, le gustaría saber si el televisor que conpraron tiene una frecuencia de actuali2¿
ción rápida, si también compraron un reproductor de discos Blu-ray en los últimos 12 meses ysi
están satisfechos con el televisor de pantalla grande que adquirieron.
Al-analizar los result¿dos de esas encuestas, descubrió mucha rnformación valiosa que le ay1¡
dará a planear una estrategia de marketing para aumentar las ventas, que esté más enfocada a lor
hogares con mayores probabilidades de adquirir un mayor número de productos o artículos nx¡
costosos. Mientras que solo 30% de las famiiias en realidad compraron un televisor de pantalh
grande, si una familia indicó que planeaba adquirir un televisor de este tipo en los 12 meses si.
guientes, la probabilidad de que realmente lo comprara era de 80%. Por consiguiente, la estra
de marketing debe dirigirse a las familias que han indicado un plan de compra.
Usted determinó qu e babía 47 .5Vo de probabilidad de que las famüas que compraron un televi¡$
con frecuencia de actualización nípida t¿mbién adquirieran uu reproductor de discos Blu'ray. Do.
pués comparó esta probabilidad condicional con la probabilidad ma4inal de comprar un reproductotü
discos Blu-ray, que oa de 36%. Así, las familias que adquirieron un televisor con una ftecuencia de m'
tualización nípida tienen mrás probabilida<les de adquirir un reproductor de discos Blu-ray que las fanri
)ias que compraron un t€levisor de pantalla gande con ""a tecuencia de acn¡alización estándar.
También aplicó el teorana de Bayes a los informes sobre la investigación de mercados de M&R
Elecbonics World. Los i¡fornes investigan el potencial de comercialización de un nuevo modelo &
teleüsor antes de programar su lanzamiento. Si el informe del estudio era favo¡able, la pmbabrlidd
de que el nuevo modelo tuviera éxito era de 64Yo. Sin embargo, si el hfonne era desfavorable, mlo
había 16% de probabilidades de que el modelo tuviera éxito. Pof lo tanto, la estrategia de marketing
de M&R debe observar con cüdado si la conclusión del informe es favorable o desfavorable.

U[/IEN
Este capítulo inició con el desarrollo de los conceptos bá- dades que antes ya se habían calculado con base en ¡
sicos de la probabilidad. Aprendimos que la probabilidad información. También se describieron varias reglas de cott
es un valor numérico entre 0 y l, el cual representa la pro- teo. A lo largo del capínrlo se utilizaron tablas de condnget
babilidad o posibilidad de que ocuna un evento en particu- cia y árboló de decisión para mostrar i¡fommción Er¿l
lar. Además de la probabilidad simple, estudiamos las siguiente capitulo se esrudianín imponantes distribuclord
probabilidades condicionales y los eventos independien- de probabilidad discreras, como la disribución binommtl
tes. Se utilizó el teorema de Bayes para revisar probabili- la de Poisson.

Probabilidad de ocurrencia Probabilidad condicional


X : P(Av B\ (,1ú)
Probabilidad de ocunencia = (4.1) P(AIB\
7 P(B)
Probabiüdad marginal P(A v B\
P(BIA\: (4.4¡)

P(A) = P(Ay B¡) + P(Ay Br) P(A)


+ ... + P(Ay B¡) (4.2)

Regla general de la suma Independencia

P(Ao B) = P(A) + P(B) - r(.ty n) (4.3) r@l\ = p11¡


Problemas de ¡epaso del capítulo 169

general de
la mulüPlicación Regla d€ conteo I
(4.6) (4.r0)
Y B) = P(AIB)P(B)

de h multipüc¡ción para eventos independientes Regla de conteo 2

(4.7) (1,)(¿r) ... (¿,) (4.11)


y ü = P(¿)P(s)
¡bilidad nrarginal
utilizando la regla general Regla de conteo 3
ndtiPüc¡ción
+ P(AtB)P(82) ,r=(n)(n-1)...(1) (4.12)
= P(AtB)P(81)
... + P(AIB)P(B¿)
¡ Regla de conteo 4: Permutaciones
de BaYes p =- nl
(4.13)
tA) --
\n - x)l
P(At B)P(B) Regla de conteo 5: Combinaciones
t¡r)P(tr) + P(AtB)P(B) + + P(AtB)P(B.) a =- nl
(4.14)
(4.e) xt\n - x)l

de decisión 152 eventos colectivamente exhaustivos probabilidadsimple 145


165 t47 probabilidadzubjetiva 143
t43 eventos mutuamente excluyentes 147 regla de la multiplicación Para o
deVenn 144 independencia 154 eventosindependientes 15ó =
muestral l¿g permutación 1ó5 regla general de la multipücación
probabilidad 142 l)) o
143 o
cerbro 1,42 probabilidad a príori 142 regla general de la suma 148 o
conjunto 143 probabilidadcondicional 151 tabla de contingen cia 134 c¡

imposible 142 probabilidadconjunta 146 teorema de Bayes 159 c¡


simple 143 probabilidadempírica 143

E SU COMPRENSIóN APLICACIÓN DE CONCEPTOS


¿Qué diferencia hay entre la probabilidad a priori, Ia 4.ó0 Una encuesta realizada por el Pew Research Center
idad empírica y la probabilidad subjetiva? ("snapshots: Goals of 'Gen Next' vs. 'Gen X"' USA Today'
27 de marzo de 2007, p. lA) indicó que una de las metas de
¿Qué diferencia hay entre un evento simple y un evento
8l% de las personas que tienen entre 18 y 25 años de edad
es volverse rico, a diferencia del 62% de las personas que
¿Cómo se puede utilizar la regla general de la suma para tienen enfe 26 y 40 años. Suponga que la encuesta se basó
la probabilidad de ocunencia del evento o 8? I en 500 participantes de cada uno de los dos grupos.
4'55 ¿Qué diferencia hay entre los eventos mutuamente ex-
a) Constuya una tabla de contingencia.
cluyentes y los eventos colectivamente exlaustivos? D) Dé un ejemplo de un evento simple y de un evento conjunto.
c) ¿Cuál es la probabiüdad de que un participante seleccio-
4.56
¿Cómo se relaciona la probabilidad condicional con el nado al azar tenga la meta de volvene rico?
concepto de independencia? d) ¿Cwil es la probabilidad de que un participante seleccio-
{.57 ¿En qué difieren la regla de la multiplicación para nado al azar tenga la meta de volverse rico y que perte-
eventos que son nezca al gnrpo de individuos que tienen entre 26 y 40
independientes y eventos que no lo son?
años de edad?
4.58
¿Cómo podría utilizar el teorema de Bayes para revisar ¿) ¿Los eventos "grupo de edad" y "la meta de volverse
p¡obabilidades
a parti¡ de nueva información? rico" son independientes? Explique zu respuest¿.
459 En el teorema 4.ó1 El dueño de un restaurante que sirve platillos estilo
de Bayes, ¿en qué difiere la probabilidad
(.51. alterior de la probabilidad
revisada? continental estaba interesado en estudiar los pahones de los
170 CAPÍTULo4 P¡obabilid¿d básica

al d) sea hombre y prefiera ordenar la csna desde el automq¡


clientes para ordenar durante el fi¡ de semana, del viemes '
e) Si la persona seleccionada es mujer, ¿guál es la probabitrdd
domingo. Se llevaron registros que indicaron la demand¿ de -
de que prefiera ordenar el desayuno desde el automóvip
Doste; durante el mismo periodo. El dueño decidió estudiar
gé- 4.ó3
otras dos variables, junto con la orden de un postre: el Segun una encuesta Gallup, las empresas cuyos e¡L
nero del indrviduo y si ordenó un plato fuerte con came de pleados se involucran con su lugar de trabajo son más i¡¡1oo
res. Los resultados fueron los siguientes: doras, productivas y rentables, y tienen una menor rohciür
de penonal. Una encuesta de 1,895 trabajadorcs en Aleqarq
GÉ{ERO reveló que 13% de ellos est¿ban involucr¿dos, que 67% '','
Hombre Mujer Total estaba i¡volucrado y que 20% estaba ac¡ivamente desco¡q.
POS¡RE ORDEMÍIO
90 40 tJo tado. L¿ encuesta t¡mbien señaló que 48% de los tabajadorx
sf mostó totatrente de acuerdo con la sigurq¡
involucrados se
No 224 240 464
afirmación: "Mi kabajo actual me permite manifest¿¡ ¡¡r¡
Tot¡l 320. 280 600
idcas más creativas". Solo 20% de los trabajadores no iryolu.
crados y 3% de los habajadores activamente desconectaü,
PTATO FIJERTE CflII RES estuvieron de acuerdo con esta ¿finnación (datos ex!¿ídosü
Hombre Mujer M. NiDk, "Employee Disengagement Plagues Germany,
POSINE ORDEI{A¡IO
Gallup Management Journal, gmj.gallup.com' 9 de abnl ¿
SI 71 65 13ó
2009). Si se sabe que un b:¿bajador está totalnente de acueü
No lt6 348 4& con la afirmación "Mi trabajo actual me permite manif
Total 187 413 600 mis ideas miis creativas", ¿cuál es la probabilidad de qu" u
tabajador este involucrado?
Un mesero se ac€rca a r¡na mesa para tomar el pedido de un
poshe. ¿Cuál es la probabilidad de que el primer cliente de 4.ó4 Por to general se considera que los vehículos utilih'
rios deportivos, las camionetas y las fi:rgonetas tienden nr¡
la mesa
a las volcaduras que los automóviles. En 1997 , 24 '0% deb,
¿) Dida un posüe?
muertes en carretera involucraron volcaduras; 15.8%dt
¡i biOu u" posne o haya ordenado un platillo fuerte con res?
las muertes en 199? estuvieron relacionadas con vehículo
c) sea mujer y no ordene Postre?
utilita¡ios, camionetas y furgonetas, dado que la muertr io
d) sea mujer o no ordene Postre?
plicó una volcadua. Dado que no se involucró una vol*
,j Sopoogu que la primera persona a la que elmesero le
toma la orden de un postre es una mujer. ¿Cuál es la pro-
iura" 5.6% de todas las muertes estuvieron relacionadas m¡
babilidad de que no ordene Poste? vehículos utilitarios, camionetas y frrgonetas (datos extli'
postre son independientes? dos de A. Wilde Mathews, "Ford Ranger, Chevy Tracka
fl ¿El genero y órdenar un
Tilt in Test", The Wall Steet Journcl, 14 de julio de 1999'
g¡ iO.á.o"t un plato fuene con carne de res es indepen-
- fuente de que la persona ordene un posfie?
p. A2). Considere las siguientes definiciones:

4.ó2 ¿Qué ¿limento es más probable


que la gente ordene I = La muerte involucró un vehiculo utilitario,
pero una camioneta o una furgoneta.
desde el automóvil? En 2009 se realizó una encuesta'
no se repofó el tamaño de las muesEas. Suponga que los
I = La muerte involucró una volcadura'
resultaclos, basados en una muestra de 100 hombres de
y a) Utilice el teoremade Bayes para calcular la probabitrord

de oue una muefe involucre una volcadura, üdo que


b
100 mujeres, son los siguientes:
muérte involucró un vehículo utilitario, una camioneho
GEilENO una ñrgoneta.
AufilEltTo Hombre Mujer Total ¡) CotprF. t, t sultados del inciso c) con la probabilidd
ll
de que una muerte involucre una volcadura, y comenk
N
.r,r*
De3ayuno
Alnuerzo
t8
47
10
52
28
99
los vehículos utilitarios, las camionetas y las furgo0€6
por Io general tienden más a sufrir accidentes por votcr'
,qE
Cena 29 29 58
duras que otro tiPo de vehiculos.
: i;t
-..t"':
Botana/bebida 6915 4.ó5 El enzimoinmunoanálisis absorbente (ELIS¿)
od
:ti 4
il,j Total 100 100 200
tipo de prueba más común para detectar el virus del
vut
wrw.qs¡o.g.drc.coE/rcportJdftve'thro- €l w
,;l.t- i Fue¡te: Datos o(b¡ídos de Un resuitado positivo en la prueba ELISA indica que
6ne-stúdy/2009/2009-cb¡rtJwh¡tljf ou¡Jr€ferrcd-r¡y-to-orde¡-
i'{ki rus del VIH ..ti pt...ot.. Para la mayoría de las Poblatr
l:tli f¡st_foo¿htmL
,r;-: nes, la prueba ELISA tiene un alto grado de senslblru¿"ü
Si se selecciona a un participante al aza¡ ¿cttál es la proba- @ara détectar la infección) y especifrcidad (¡rara detectar
$l:l: "HIV lnsite Gateway t0 ru'
rfr:t bilidad de que a-usencia de infección). (Véase

a) prefiera ordenar el aknuetzo desde el automóvil? *¿ AIDS Knowledge", en HfYlnsite'ucsf'edu) Supo0Pr


ittq que la probabilidad de que una persona esté infecbda
c0[
á) prefien ordenar el desayuno o el alrnuerzo desde el auto-
móvil? vrus del Vm para cieria poblaiión es de 0 0l5 Si elvrDo
que
del VIH esÉ realnente presente, la probabilidad de
c) sea hombre o prefiera ordenar la cen¿ desde el automóvii?
Caso disital 171

positivo es de 0.995. Si el a) Seleccione una muestra de estudiatrtes de licenciatura de


dé utr resultado
la probabilidad de su escuela y realice una encuesta similar.
J-.rui ,r¿t.nr.
ptesente,
'""oriiiuo ¿. la prueba ELISA es.de 0 01' Si la ó) Utilice sus datos para construir tablas de contingencia
un resultado po_sitivo,-utilice 9l teorell del género y la carrera, del género y el posgrado de-
lio seado, del género y la situación laboral, del género y Ia
Jui.ol* tu probabilidad de que el virus del
computadora preferida, de la clase y el posgrado deseado,
esté Presetrte'
de la clase y la situación laboral, de la canera y el pos-
DE EOUIPO grado deseado, de la carrua y la situación laboral, y de ia
contiene información sobre hes va- ca:rera y la computadora preferida.
Ie una muestra de 184 fondos de bonos. c) Con base en el inciso á), ¿qué concluye con respecto a si
i¡cluyen: est¿s variables son independientes?

fondos de bonos (intennedio gubema¡nen- d) Compare los resulados del inciso c) con los del inciso b)
á de
ivo a corto Plazo) del problema 4.67.
s Dor ventas (no o sí) 4.ó9 El problema 1.28 de la página 14 describe una encuesta
dil riesgo de perdi<ta de los fondos de bonos que se apücó a ,14 estudiantes de una maestía en administa-
del promedio, promedio o por arriba del ción (los datos están alnacenados en el archivo [!!!@$
Utilice estos daüos para constuir tablas de contingencia del
tablas de contingencia de tipo y cuotas, genero y el posgndo, del genero y la canera, del genero y la
y cuotas Y nesgo. situación laboral, del genero y la computadora preferida, del
tabla de contingencia calcule todas las probabi- posgrado y la carler4 del posgrado y la situación laboral, y
gondicionaleS Y marginales. del posgrado y la computadora preferida
en el inciso a), ¿qué concluye con respecto a si ¿) En cada una de estas tablas de contingencia, calcule todas
son independientes? las probabiüdades condicionales y ma¡gi!¿les.
ó) Con base en el inciso ó), ¿qué concluye acerca de la inde-
DATOS DE tA ENCUESTA pendencia de las variables?
a,
A ESTUDIANTES
|.21 de lapig;na 13, se describe una 4.70 El problema 1.28 de la página 14 desc¡ibe una en'
el problema
¡uose aplicó a 62 estudiantes de ücenciahrn (véase
cuesta que se aplicó a 44 estudiantes de una maestría en o
Utilice estos datos oara constuir administración (los datos están almacenados en el ar- o
o
del género y la carrera, del género Y chivo@. (D

deseado, del género y la situación labo¡al, del ¿) Seleccione úna muestra de estudiantes de l¿ maestría
en administración de su escuela y realice una encuesta A
computadora preferida, de la clase y el posgrado
de la clase y la situación laboral, de la canera y el
similar.
deseado, de l¿ ca¡rera y la situación laboral, y de la ó) Utilice sus ütos para constn¡ir tablas de contilgencia del
la computadora preferida.
genao y el posgrado, del género y la canera, del genero
una de estas tablas de contingencia, calcule to- y la situación laboral, del género y la computadora prefe-
probabilidades condicionales y marginales. rida, del posgrado y la carrera, del posgrado y la situa-
en el inciso a), ¿qué concluye con respecto a sl ción laboral, y del posgrado y la computadora preferida.
son indeoendientes? c) Con base en el inciso ó), ¿qué concluye con respecto a la
independencia de estas variables?
el problema 1.27 delapáryiaa 13, se describió una
d) Compare los resultados del inciso c) con los del inciso á)
a 62 estudiantes de licenciatura (véase el
del problema 4.69.

sus conocimientos sobre las tablas de conüngencia fusa la aseveración? ¿De qué manera calcularía y estable-
adecuada de las probabílidades simple y cería la probabilidad de tener un índice de ¡endimianto
a 6te u$o digital secuencial del capíulo 3. anual no menor a 15%?
2. Con la tabla bajo el encabezado "Show Me The Winning
la "Guía oara inverti¡" de En-
Probabilities", calcule las probabilidades adecuadas para
Services y lea la información acerca del Pa-
el grupo de inversionistas. ¿Qué error se cometió al
inversión garantizada (PIG). Lea las aseveraciones
reportar la aseveración de 7% de probabiüdad?
los datos de respaldo. Luego responda las si-
3. ¿Existe algún cálculo de probabilidad adecuado para ca-
Feguntas: lificar un sewicio de inversión? Explique su respuesta.
tan orecisa es la aseveración sobre la probabilidad
del PIG de EndRun? ¿En qué aspectos es con-
]
172 cAPfruLo 4 Prcbsbilidad b¡isica

T
l. Bellhouse, D. R, "The Reverend Thomas Bayes, FRS: A
Biography to Celebrate the Tetcentenary of His Birth"'
4. Mínitab Release 1ó (State Collegc, PA.: Minit¡b,
2010 ).
,-l
Stttistícal Science, 19 (200a), p,p. 343. 5. Paulos, I. A. Innumeracy (Nueva York Hi[ and Vog
2. Low4 D. y C. Meek, "Good Word Attacks on Statistical le88).
Spao Filters", presentado en la Seguoda conferei¡cia so- 6. Silberman, S.,'"The Qu€st for Meaning", W1rcd 8.02,ta
bre correo electrónico y antispao, CEAS, 2005. b¡ero de 2000.
3. Miuosofi Excel 20J0 (Rednon4 WA: Microsoft Corp.' 7. kllq,T., "fheFigbtAgainst V1@gra (and Other Spq¡
2010). The New Yo* frmes,2l de nayo cle 2006, pp. 81,86.

i)

N
N
N
*;
.\.-:
rBA
:sn
tl
.lt
{':
'_a''lr

:i.:
**r
!ri
r['{
.ri*
:a: i
tr
I

,--
6uía del caoih:lo 4 para Excel 173

DE PRoBABTLTDAD Excel en profundidad Utilice la hoja de cálculo


f,' El|!S*os COMPUTE del libro Probabilities como plantilla para
calcular probabilidades básicas (véase la ñgura GE4. I a conti-
simple y conjunta y la regla general
nuación). La hoja de cálculo contiene los datos del compor-
tamiento de compra que se observan en la üabla 4.1 de la
Utilice Simple & Joint Probabüties para calcular página 1214. Escriba sobre estos valores cuando ingrese los
básicas. Seleccione PHStat ) Prob¡bility & datos para otos problemas.
) Simple & Joint Probabüties. El pro- Abra la hoja de cálculo COMPUTE_FORMULAS
inserra una hoja de crílculo similar a la de la figura para examinar las formulas utilizadas en la hoja de cálculo,
en el libro actual.
(A diferencia de otos procedimientos, muchas de las cuales se muestran en el recuadro de la figura
orimero un cuad¡o de dialogo). Para utiiizar la hoja GE4.l.
ilene el rírea Sample Space con sus datos.

FIGU RA G E 4. 1 Hoja de cálculo COMPUTE para el libro Probabilities

a,

o
o
o
(D

or

4.2 PROBABILIDAD CONDICIONAL


no tiene material oara esta sección.

TEOREMA DE BAYES 4,..- ., 8,...,,, C -,_ 1 ..."8-,.i.,E_-,,


)1 sayr3 Tl$rem c¿kulrtieÉ I
I en profundidad Utilice la hoja de cálculo
del libro Bayes como plantilla para calcular PEbab¡llücs
oablhdades básicas (véase la figura GE4.2 a la derecha).
.'s. EwDt . Frlori. Cordltlonál Joir¡l Reviied
[o1a de cálculo contiene el eiemolo de la comercializa- s . [.8i 012 0.64

cton del televisor que se observa en la t¿bla 4.4 de la págna


lo, 0.ú 0,3' ú.18 0.1ú

160.
7" fotd: 0.5 Joint Revi5ed
Escriba sobrqesos valores cuando inerese los datos de
otos problemas. =85 ' C5 =D5l$0S7

Abra la hoja de cálculo COMPUTE FORMULAS =06 ' C6 =0ó/3097


d)5 + 06
Pa¡a examinar lis fórmulas arirrnéticu,
,.n.]llu, que calcu-
nn las probabilidades que
dto de la
también se observan en el ¡ecua- FIGURA GE4.2 Hoja de cálculo COMPUTE del
figura GE4.2 líbro Bayes
17 4 CA-PÍTULo 4 hobabiliriad básica

número de formas en que se pueden ordenar I eleme¡1.*


GE4.4 REGLAS DE COI\¡TEO
Por ejemplo, la fórmula FACT(6) calcula 6!
Regla de conteo 1
Regla de conteo 4
Excel en profundidad Utilice la función de la hoja de
cálcuio POWIR(/r, n) en una formula de celda para calcular Excel en profundidad Utilice la función de la h3¡u¡,
el número d.e resultados, dados t eventos y n ensayos Por cálculo PERMUT(n, x) en una fórmula de celdapara ca¡¡.
ejemplo, la fórmula =POWER(6, 2) calcula la respuesta Iar el número de formas en que se pueden organlzar 'r obie.
para el ejernplo 4.11 de la página 164 tos seleccionados de n objetos, en orden. Por ejemplo, ¡
fónnula =PERMUT(ó, 4) calcula la respuesta para el ejeln.
Regla de conteo 2 plo 4.14 de la página 1ó5.
Excel en pro{undidad Utilice una fórmula que tome el
Regla de conteo 5
oroducto de funciones POWER(ft, ¡) sucesivas para resol-
ver problemas relacionados con la regla de conteo 2 Po¡ Excel en profundidad Utilice la función de la hoja¡,
*
ejemplo, la fórmula =POWER(26, 3) POWER(l0' 3) cálculo COIVIBIN(2, r) en una fórmula de celda para calqn
calcula ia respuesta para el ejemplo sobre el departamento lar el número de formas en que se pueden organtzar I ob¡.
estatal de vehículos automotores de la página 164' tos seleccionados de n objetos sin importar el orden. P¡r
ejemplo, la fórmula =COMBIN(ó, 4) calcula la respues¡¡
Regla de conteo 3 para el ejemplo 4.15 de la página 166.

Excel en pro{undidad Utilice la función de la hoja de


cálculo FACT(¿) en una fórmula de celda para calcular el

Si ya ha utilizado la calculadora durante su sesión de Mimt¿b :


GM4.1 CONCEPTOS DE PROBABILIDAD BÁsICA
tal vez necesite borrar el contenido del cuadro Expresion al :
Minitab no tiene material para esta sección. seleccionar los contenidos y presionar Supr antes de intctlt :
el paso 2.
GM4.2 PROBABILIDAD CONDICIONAL
Mínitab no tiene material para est¿ sección'

GM4.3 TEOREMA DE BAYES


Mi¡i¡ab no dene material para esta sección'

GM4.4 REGLAS DE CONTEO


Utiüce Calculator para aplicar las reglas de conteo Seleccione
Calc t Calculator. En el cuadro de diálogo Calculator
(oue se muestra la derecha):

Escriba el nombre de Ia columna de una coluna


vacla en
l.
el cuadro Store result in variable y luego presione Tab'
2. Elabore la expresión adecuada lcomo se explica más
adelante en esta sección) en el cuadro Expression Para
aplicar las reglas de conteo 3 a 5, seleccione Arithme-
tic de la lista desplegable Functions p¿ra facilitar la se-
lección de la función.
3. Haea clic en OK.
cuía del capíh¡lo 4 para Mtuitab 17 5

de conteo 1 Regla de conteo 4

una expresión
que utilice el operador exponencial Escriba una expresión que utilice la función PERMU-
ejemplo,la expresión 6 ** 2 calcula la respuesta TATIOI{S(2, x) par¿ calcular el núme¡o de maneras de aco-
ejimplo 4. 1 I de la Página 1 64. modar r objetos seleccionados de n objetos en orden. Por
ejemplo, la expresión PERMUTATIONS(d, 4) calcula la
de conteo 2 respuesta para el ejemplo 4.14 de la págin¿ 165.

¡¡a expresión que utilice el operador exponencial


*rr 3 * 10 ** 3 calcula la Regla de conteo 5
eiemplo, la expresión 26
Dara el ejemplo del depadamento estatal de vehí- Escriba una expresión que utilice la función COMBI-
iautomotores de la Página 164. NATIONS(2, .r) para calcular el núme¡o de maneras de or-
gaaizar r objetos seleccionados de n objetos sin inrportar el
de conteo 3 orde¡. Por ejemplo, la expresión COMBINATIONS(6, 4)
utilice la función FACTORIAL(í) calcula la respuesta para el ejemplo 4.15 de la página 166.
;ba una expresión que
calcular el número de maneras en que se pueden orde-
¡ elementos. Por ejemplo, la expresión FACTO-
calcula 6 !

a,

o
o
o
(D

o)
Distribuciones
de probabilidad discreta

USO DE LA ESTADISTICA en i s.z Distribución binomial Revisión del USO DE LA


Saxon Home lmprovement
estloísrtcl en Saxon Home
5.3 DistribuciónPoisson lmprovem€nt
5.'l Distribución de
cuia oel ctpírulo 5 PARA
probabilidad Para una
variable aleatoria d¡sceta EXCEL
Valor esperado de una
variable aleatoria discreta cuí¡ oel cnpírulo 5 PAR.A

Varianza y desviación MINITAB


estándar de una variable
aleatoria discreta

\\\
\i:.:
+;a.:

"'itr,-.;
..,']
_ r:.:

iL;';
!;
i,, l1
ll;.11-
¡; r.r',
''l 'l
'lrr.l
q:11: tj

'1,¡Il
r.i,, "l
n Saxon Home Improvement

sted trabaja como cont¿dor en Saxon Home knprovement Company, una empresa que
adminisba sus operaciones contables y funncieras utilizando un sistema muy modemo
de infonnación para contabilidad
Los sistemas de información contable reúnen, procesan, almacenan, tansforman y
distribuyen información financiera a los individuos que toman decisiones tanto en el
interior como en el exterior de una organización empresarial (véase la referencia 4). Estos sistemas
auditan de manera continua información contable, buscando errores o información incompleta o a,
improbable. Por ejemplo, cuando los clientes de Saxon Home Improvement Company envían pedidos
en 1íne4 el sistema de información contable de la empresa reüsa los formaúos de pedido par¿ enconÍar
posibles enores. Cualquier factura cuestionable se marca e incluye en un inforne diario o
o
de excepciones. Datos recientes ¡ecolectados por la empresa indican que la probabüdad de o
que un formato de pedido esté marcado es de 0.10. A Saxon le gustaría (D

determinar la probabilid¿d de encontar cierto número de {


formatos marcados en una muestra de un tamaño específico.
Por ejemplo, ¿curíi es la probabilidad de que, en una muestra
de cuatro formatos de pedido, ninguno esté marcado? ¿Y la de
oue uno de los fomratos de oedido esté marcado?

't77
178 CAPÍTULo 5 Distribuciones de prob¿bilidad disqeta I
¡
¡ De qué manera pgdría Saxon Home Improvement Company deterninar la,solución par¿ on I
.i tipo de problema de probabilidad? Una forma consiste en uttlizar un modelo, o ma rep¡eser l
a pequeña escala, que se aproxime al proceso. Utilizando una aproximación ¿s ish
futu"iOo
tipo, tos gerentes de Saxon podrían hacer inferencias acerca del proceso actual de los pedidos ¡j
es dwir, modelos nabná.
este casolos di¡ectivos podrían utilizar distribuciones de probabilidad,
ticos adecuados pam resolver el tipo de problemas de probabilidad que los gerentes enftent¿¡1
de proba¡i[
En este capítulo se presenta el concepto y las caracteústicas de las disnibuciones
y
dad Ademas. se estudia la manera en que se aplican las distribuciones bl¡omial de Poisson p¡¡
resolver problemas de negocios.

Pafa una variable aleatoria


discreta
5.1 Distribución de probabilidad
En la sección 1.3 se definió una v ariable numérica como una variable que produce respuestas nx-
méricas, por ejemplo, el número de revistas a las que está susc to o la estatula de un individuo,
Las variabtes num¿ricas son discr¿r¿s o continuas- Las variables numéricas continuas
producm
de una penona. L¿s
resultados que provienen de un proceso de medición, por ejemplo, la estatua
provienen un proceso de conteo, por
variables oüoé¡.* discretas producen resultados que de
estudian las dr
ejemplo, el número de levistas a las que usted está suscrito' En este capítulo se
buciones de probabilidad que representan variables numéricas discretas'

DISTRIBUCIÓN DE PROBABILIDAD PARA UNA VARIABLE ALEATORIA DISCRFIA


es u¡a lista db
Una distribnción de probabiüdarl para un¡ variable aleatoria discreta
que rndic4 ademris,
todos los.resultados numéricos posibles y mutuamente excluyentes,
la orobabilitla¡l de oc¡¡nencia de cada ¡esultado'

por díael
Por ejemplo, en la tabla 5.1 se presenta la distribución del número de intemrpciones
que todos los result¡'
un" gran ."d de computadoras. La lista de la tabla 5.1 es exhaustiva debido a
dos iosibles estrí,n,incluidos.
por consiguiente, las probabilidades suman 1. La figlra 5.1 es urú
representación gnifica de la tabla 5.1.

TABLA 5.f Probabilidad


Distribución de 0.35
0
probabilidad
del número de I 0.25

interrupoones 2 0.20
por día 3 0.10
4 0.05
) 0.05

FIGURA 5.1
Distribución de
probabilidad.
del número de
intenupciones
por día
o t u x
,ntluo",otn"" oo1o,"

Valor esperado de una variable aleatoria discreta


una distribución de probabilidad es el valor esperrdo de su va¡iable
aleatof&
La mecia, ¡.1,, cle
para calcula¡ el valor esperado, se mu^ltiplica cada resultado poribl", t, por to probabiüdad cofer

pondiente. P(X = .rJ y luego se suman esos productos.


5.1 Distribución de orobabilidad oara una variable aleatoria discretz 179

VALOR ESPERADO, ¡.r,, DE UNA VARIABLE ALEATORIA DISCRETA

dondé:

Para la distribución de probabilidad del número de intemrpciones por día en una gran red de
computadoras (tabla 5.1), el valor esperado se calcula de la siguiente manera, utilizando la ecua-
ción (5.1), lo cual también se muesta en la tabla 5.2.

.1V
tL=E(X)=)x¡P(X=x¡)
= (0)(0.35)+ (r)(0.25)+ (2)(0.20)+ (3)(0.10)+ (4)(0.05)+ (5)(0.05)

= 0 + 0.25 + 0.40 + 0.30 + 0.20 + 0.25


= 1.40

a,
FLA s.2 Interrupciones por
del valor dla (.r¡) P(X = r) xf(X = x¡)
o
Para
de 0.3s' (0x0.35) = 0.00 o
o
0.2s (l)(0.25) = 0.25 (D
0.20 (2)(0.20) = 0.40 o
0.10 (3)(0.10) = 0.30
0.05 (4x0.05) = 0.20
0.05 (5X0.05) = 0.25
1.00 p=E(4=r.to

El valor esperado es 1.40' El valor esperado de 1.4-para el número deinterntpciones por día no
es un resultado posible, ya que el número real de interrupciones en un dia determinado debe ser rm
valo¡ entero. El valor esperado representa el oúme¡o medio de interrupciones en un día determinado.

Varianza y desviación estándar de una variable aleatoria discreta


La vananza de una distribución de probabilidad se calcula multiplicando cada diferencia posible
elevada al cuadrado [r, - E(X)]2 por su probabilidad conespondiente, P(X = r,), y luego se su-
man los productos resultantes. La ecuación (5.2) define la varianza de una varisble aleatoria
discreta.

VARIANZA DE UNA VARTABLE ALEATORIA DISCREIA ]

o2 = )[¡, - E(nf P(x= x,)


Éí-'
donde;
;r, = el i-ésimo resultado dé la variable aleatoria discreta ,Y
P(X = il = probabilidad de ocurrencia. det i4simo res¡ltado de X
:..
-T
180 CAPÍTULo5 Distribuciones de probabilidad discreta i

variable ¡leatoria discreta'


La ecuación (5'13) define la desviacién estándar de un¡

DESVIACIÓNESTAI\DARDEUNAVARIABLEALEATORIADISCRETA

- E(x)12 P(X: xr) (s3)


"=lV= Lxt

intemrpciones por día se calculan cor¡¡,,


La varianza y la desviación estanda¡ del número de
(5 2) y (5'3)'
muestran en la tabla 5.3, utilizando las ecuaciones

-2 = \lr,. - E(x))'zP(x = x¡)

= (0 - 1.4)2(0.3s)+ (1- 1.4)'?(0.25) + (2- 1.42i0.20) + (3 - 14)'?(0'10)

i - i.+¡'1o.os) + (s -
1+
1.4)'?(0.05)

= 0.686 + 0.040 + 0.072 + 0.256 + 0338 + 0648

= 2.04

TABLA 5.3
Interrupciones
Cálculo de la por dla ( x-- :¡P(X = -x¡ lxt - E(x)12 P(X =
varianza y Ia
desviación estándar 0 0.35 (0x0.35) = o.oo (o-1.4)'?(0.35) =0.686
para el número I 0.25 (l)(0.25)= 0.25 (1 -1.4)'?(0.25):0.040
de intenuPclones z 0.20 (2)(0.20) = 0.40 (2-1.4)2$.20):0.w2
por día
J 0.10 (3x0.10) = 0.30 (3-1.4)'z(0.10) =0.256
0.05 (4)(0.05) = 0.20 (4-1.4)'?(0.05)=0.338
5 0.05 (s)(o.os) = o.zs ls-r.4)2(0.05)=0.648
l---.---------¡-
1.00 P=E(x)=t'40 o" = 2.M

o=r/7=\,5.04=1.42t3
es l 4' la varialza es 2 04' y la desna
De esta maner4 el número medio de intemrpciones por dia
por üa'
ción estandar es aproximadamente 1'43 intempciones

Problemas para la sección 5.1


APRENDIZAJE DE LOs FUNDAMENTOS APLICACIóN DE CONCEPTOS

La siguiente tabla incluye la distribución
de
5.2
ft$ 5.1 Dadas las siguientes distribuciones de probabilidad:
probabiiidid para el número de accidentes de trár-

W I sito diarios en una pequeña ciudad.


:iril!¡ Distribución.¿{ Distribución
ii'*1
l'l ..! X P\X -- x¡ x=x¡)
;1¡i 0 0.50 0 0.05 0 010
0.20 I 0.10 1 0.20
Ir'.;i:i
| !":r 1
2 0'45
z 0.15 2 0.15
i.. .",
3 0.10 3 0.20 3 0 15
¡,iit
4 0.05 4 0.50 4 0.0:
5 0'05
ll$
l-¡,', a) Calcule el valor esperado para cada distribución'
c) Calcule el número medio rle accidentes por día'
ái Calcule la desviación estandar para c¿da distribución'
cj Compare los .esultados de las distribuciones y B' I á) Calcule la desviación estándar.
I

.1
).1 Distribución de probabilidad para una variable aleatoria disc¡eta 1 81

i Recie emente, un concesionario regional de automóvi- c) Calcule el número esperado de llegadas por mhuto.
publicitarios a clientes potenciales, rndicán- á) Calcule la desviacióo estándar.
e¡vtó folletos
oue habían ganado uno de tres premios diferentes: un 5.ó El gerente del departamento de crédito comercial de un
"
6ptima valuado en $15,000, una tarjeta para gasolina de banco grande ha reunido datos du¡ante los últimos dos años
Án v una tarjeta para comprar en Walmart con un valor
con respecto al número de hipotecas comerciales aprobadas
ii.'para reclamar el premro, el prospecto de cliente necesi-
fotteto publicitario en la sala de exhibición por semana. Los result¿dos de esos dos años (104 semanas)
aJresenar el
indicaron 1o siguiente:
concesionario. En la parte trasera del folleto, con lehas
estaban impresas Ias probabilidades de ganar. Las
de ganar el automóvil eran de I en 31,478; ){úmero de hipotecas
probabilidades de ganar la ta{eta para gasolina eral de I
comerciales aprobadas Frccuencia
j1,418,y las Vobabilidades de ganar la ta{eta de Watnart
0 IJ
de3t,476 en31,418. I 25
rCuántos folletos publicitarios piensa usted que envió el 2
io¡cesionario de automóüles?
J t7
Con su respuest¿ al inciso a) y las probabiüdades descri-
9
tas en el folleto, ¿cuál es el valor esperado del premio
f 6
samdo por un cliente potencial que recibe un folleto?
Óonsiderando su respuesta al inciso a) y tas probabilida- 6 I
des descrit¿s en el folleto, ¿cuíl es la desviación estiíndar 7 I
lel valor del premio ganado por uu cliente potencial que
a) Calcule el número de hipotecas comerci¿les aprobadas
recibe un folleto?
que la promoción sea eficaz? Explique su respuesta. por semana.
á) Calcule la desüación est¡índar.
En el juego de feria Under or Over Seven se laoza un
de dados legales (no trucados) y la suma resultante de- 5.7 Usted está tratando de desanollar una estrategia para a,
ina si el jugador gana o pierde su apuesta. Por ejemplo, invertü en dos acciones diferentes. El rendimiento anual an-
dor puede aposhr $ I a que la zuma seni menor que 7, es ticipado para una inversión de $ 1,000 en cada acción, en
2,3,4, 5 o 6. En esta apuesta, el jugador gana $1 si el cuaho condiciones económicas diferentes, tiene la siguiente o
es m€nor que 7 y pierde $1 si el resultado es igual distibución de probabiüdad: o
que 7. De manera similar, el jugador puede apostar o
(D
a que la suma será mayor que 7, es decir, 8, 9, 10, I I o 12.
Rendimientos
est€ caso, el jugador gana $ I si el resultado es inayor que 7; Probsbilidad Condición econémica Accién X Acción Y ro
pierde $ I si el resultado es 7 o menos. Un iercer método
juego consiste en apostar $ I al resultado de 7. En esta
0.1 Recesión -50 -100
eljugador gana $4 si el resultado del la¡z¿miento es
U.J Crecimiento lento 20 50
pierde $ I con cualquie¡ otro resultado. 0.4 Crecimiento moderado 100 130
Constrya la distribución de probabilidad que represente 0.2 Crecimiento nápido 150 200
Ios dife¡entes resultados posibles para una apuesta de $ I Calcule:
a un número menor oue 7. c) El rendimiento esperado para la acción.{y para la acción Il
Co¡shuya la distribución de probabilidad que represente
á) La desviación estríndar para la acciónXy para la acción )¡.
los diferentes resultados posiibles para uoa ápuesta de I
para utr nümero mayor que 7.
$ c) ¿Invertiría en la acciín X o en la acción I? Explique su
respu€sta.
Lonshuya la distribución de probabilidad que represente
los drterentes resultados posibles para una
apuesta de $l 5.8 Usted planea invertir $ 1,000 en un fondo de bonos cor-
at numero 7. porativos o en un fondo de acciones comunes. Se dispone de
) Demuestre que, sin importar cuál método de juego utilice, la siguiente información acerca del rendimiento anual (ror
. us ganancias (o pérdidas) del jugador esperadas a largo cada $1,000) de cada una de esas inversiones en diferentes
Plazo son las mismas. condiciones económicas, así como acerca de la probabilidad
registró el número de llegadas por mrnuto a un
Se de ocurrencia de cada una de esas condiciones económicas.
localizado en el dist¡ito de negocios de una gran ciu-
)
durante un periodo de 200 minuios.
Los ¡esultados fue- Condición Fo¡do de bono¡ Fondo de
los slguientes: Prob¿bllidadeconómica corpor¡tivos accione¡comune¡

0.01 Recesión exfi€ma -200 -999


Frecuencia Llegadas Frecuencia 0.09 Recesión -70 -300
l4 f 2l 0.15 Estancamiento 30 -100
.lt 6 IO 0,35 C¡ecimietrto lento 80
,1,1 100
7 5
i1
8 2
0.30 C¡eci¡iiento moderado 100 150
29 0.10 Crecimiento rápido 120 350
182 CAPÍTULO 5 Disbibuciones de probabilidad discreta
t r
Calcule:
c) ¿lnveniría usted en el fondo de bonos corporativ¡, o* '
el fondo de acciones comr.mes? Explique su respuesta.
c) El rendimiento esperado para el fondo de bonos corpora-
tivos y para el fondo de acciones comunes d) Si en el inciso c) decidió inverti¡ en el fondo de acciones,*
munes, ¿qué piensa acerca de la posibiüdad de perdu 59q
ó) La desviación estándar para el fondo de bonos corporatt-
por cada $ 1 ,000 invertidos si hubier¿ un' recesión ex6ru1
vos v para el fondo de acciones comunes'

5.2 Distribución binomial


problemas de negocis¡
Las siguientes dos secciones utilizan modelos matemáticos para resolver

MODELO MATEMATICO
un nodelo matemático es ima expresión maternrática que representa una variable de interes.

la probabilidad exacr
cuando se dispone de una expresión matemrítica" es posible calcular
Ia ocunencia de cualquier resultado específico de [a variable'
útiles. Se utiliza cuando l¡
La distribución binomial es uno de los modelos maiemáticos mrás
muestra de ¿ observacions'
variable aleatoria clisüeta es el número de eventos de interés en u¡a
La distribución binomial tiene cuatro propiedades básicas:
. La muestra consta de un número fijo de observaciones' n'
. Cada Observación está clasificada en alguna de dos categorías
mutuamente excluyent€sy

col€ctivamente exhaustivas'
.Laprobabüdaddeqrreunaobservaciónseaclasificadacomoeieventodeinteés'''e3c0ls
de que una observacion
tante de una observación a otra. Por consiguiente, la probabilidad
observaciones'
no sea el evento de interés, I - z, es constante a lo largo de todas las
.El¡esult¡dodecualquierobservaciónesindependientedelresultadodecualquielohaobsel.
vación.
de Saxon Home Impmve
Regresemos a la sección sobre el sistema de información contable
qu€ el evento de interés se defin
ment C"ompany, presentada en la página 177, y supongamos
comounformatoclepeaoomarcado.Ustedestáinteresadoenelnúmerodeformatosdepedi,lt
a.'::..)
marcados en una muestra determinada de estos'
qu
Si Ia úuestra contiene cuatro pedidos' uno podría ser
¿Qué resultados pueden ocurrir?
ningrin' pedido upar"zc" marcado' o que uno' dos, tres o cuatro
formatos de pedido estén mafia

formatos de pedido marcados tto


aosl No poOria o.urrir ningún otro v"lo', yu qut el número de
que cero Por lo tanto' el rango de h
puede exceder al tamaño muestral, z, y no puede ser menor
ñ variable aleatoria binomial va de 0 a ¡.
de cuatro pedidos'
$H Suponga que observa el siguiente resultado en una muesha
qt',ü
;'r
irlil Primer pedido pedido Tercer pedido Cuarto pedido
ir..l Marcado No marc¿do Marcado
Marcado
i,i','l
i'! :r¡¡
0r
"R ''\ que haya tres forrnatos de ¡edido marcados en una muestla
¿Cuál es la probabilidad de
i:,ilr.[ pedido ú3t
i;:;:'¡ cuaho pedidos * s.cu.nci" .¡ particular? Como la probabilidad histórica de un
"sta
iiit cado es 0.10, la probabilidad de que cada pedido ocuna en 1a secuencia
es:

'[,],¡i
r,,ÉlS
i.ir .\ Primer pedido Segundo pedido Tercer pedido Cuarto pedido

:
a = 0.10 zr=0;10 1-¡'=0.90 z¡=010
;

¡
5.2 Dis¡ibución binonial I 83

Cada resultado es ind.ependiente de los otos, ya que los formatos d€ pedido se seleccionaron
de una población muy grande o casi infinit4 y cada formato de pedido solo puede seleccionarse
una vez. Por lo tanto, la probabilidad de que ocura esta secuencia en particular es:

rr(l-r)r=i(r-n)l
= 1n r n.I3/o oo)l
= (0.10x0.10x0.10x0.e0)
= 0.0009

Este resultado indica solo la probabiüdad de tes formatos de pedido marcados (eventos de
interés) de
'na muesta de cuato formatos de pedido en una secuezcía específca.Pan calcular el
número de maneras de seleccionar ¡ objetos a partir de n objetos, independientemente de Ia se-
cuencia, se utiliza la regla de las combinaciones dada en la ecuación (5.4), la cual se definió
c.lculado¡¡s previamente en la ecuación (4.14) de la página 166.
eriste uD botóo
l¡ cu¿l lr
;"l.rlsr"c,,
cl qti@efo de COMBINACIONES ' ,.:
:. 't ' ..' '.:, ,r' ,
l

E¡ csa8 cálcu_
El nrúdero de. combinaciones al selecciónar ¡ objetosr a par-tir de 1 objaos esÉ dado pot:
clsimbolo ¡sc utiliza ' ' ', I | ,! , .
-
nC' =
.

(5'4)
,(r- ,).
donde: r ' .

: ¡ (f) qedenonina 4 faclonal Po-r definici@ 0! : l.


at
. ,t! = (n)(z - 1)
,,
=
Conn=4y:=3,existen o
o
n! 4l 4x3x2xl o
.=
¡'¡ = = -ll
(¡¡
r!(n - .r)! 3!(4 - 3)l (3x2x1)(1) N
o
secuencias de este tipo. Las cuato secuencias posibles son:

Secuencia 1= marcado, marcado, marcado, no marcado, con probabilidad

rrnt(l - r) = r¡r(t - z)r = 0'0009


Secuencia 2 = z¿rca do, marcado, no marcado, marcado, con probabilidad
' rr(l - t)tr = é(t - a)r = 0.0009
Secuencia 3 = marcado, no marcado, marcado, marcado, con probabiüdad

r(l-r)rr="r(1 - a)r= 0.0009


Secuencia 4 = ¿o m arcado, marcailo, marcado, marcado, con probabilidad

(l - r)mnr = rf(l - ur)r = 0.0009

Por lo tanto, la probabilidad de hes formatos de pedido marcados es igual a

(Número de secuencias posibles) x (Probabilidad de una secuencia particular)

= (4) x (0.000e) = 0.0036

Usted podni obtener intuitivamente los oÍos resultados posibles de la variable aleatoria (cero,
uno, dos y cuatro formatos de pedido marcados). Sin embargo, a medida que aumenta z, el tamaño
de la muestra, los cálculos que se tienen que hacer al utilizar este método inhritivo requieren
más tiempo. La ecuación (5.5) es el modelo matemático que proporciona una fórmula general para
calcular cualquier probabilidad a partir de la distribución binomial con el número de evetrtos d€
interés,.r, dados n ya.
184 cAPrrulos Distibuciones de probabilid¿d discreta

DISTRIBUCION BfNOMIAL

p¡y = 71n,fl = xt\n


-'l - x)l
,',rf1t - n¡'-- 6q

donde:

P(X = xln,fl = probabilidad de que X= ¡ eventos de irterés' dados n y z'


n : número de obssrvaciones

rr -- pmbabilidad de un
evento de interés

.
1 -7 = p'robabilidad de no tener un evento de interés

¡ = número de eventos de interés eri l¿ muestra


(X= 0' 1'2"" n)
'
nl
'-'--'--"- .. .n
= er nr¡mero de combinaciones de ¡ eventos de interés
de enfre
xl(n - x)l observaciones

intuitiva. La variable binoniar¡


La ecuación (5.5) rsplantea lo que antes se dedujo de manera
pu"Á to-.
.oulqoier u"lot *t
to t dtud" 0 hasta ¡' En la ecuación (5 5)' el producto

d(l - r)-'
r eventos de interés a partir de n observaciones en u¡
representa la probabilidad de exactarnente
seatencía parlictlar'
El térmi¡o :

nl
r(, - "I
de combinaciones de los ¡ eventos de interés a partir de ¡ observaciones posibla
es el número '
de un evento de interes' r¡' h
Por lo tanto. dado el núme¡o oe observaciones, n, y la probabiüdad
probabiüdad de;r eventos de interés es:

P(X = xln,tr) = (Número de combinaciones ) x (Probabilidad cle una combi¡acion


en Particular)

: - nl --i(I-rr)'-'
' x!(n - fJ!

El ejemplo 5.1 ilustra el uso de la ecu¿ción (5'5)'


N
{i'i es la probabilidad de que
har
't\
'i;l$ EJEMPLO 5.1 Si Ia probabiüdad de un formato de pedido marcado es 0' 1, ¿curál
"t.._' tres formatos de pedido marcados en una muqstra de cuafto?
'l:-: ,::
Determinación de pedrdo
a.t:i
SOLUC¡óN Utiüzando la ecuación (5.5), la probabilidad de que haya tres formatos
:rti
'li¿l' de flX - 3), dados
n=4y¡=0.1 marcados en uüa muestra de cuafo es:
-+¡l
'1..it, At-
..¡.,1
P(x = 3ln = 4,n = 0 r) = lf (l - 0'l)4-3
..4
_'{ tp-:it(o
.i !t Á'l '
;t* = ___-::_(0.1)r(0.9)¡
3!(l)!'
+t'\ = 4(0.1)(0'1)(01)(0'e¡ = e'e6'u t
I
L
tr
5.2 Dstibución binonial 1 85

Los ejemplos 5.2 y 5.p muesÍan los cálculos para otos valores deX

Si la probabilidad de un formato de pedido ma¡cado es de 0.1, ¿cuál es la probabilidad de que haya


5.2
hes o más, es decir, al menos 3, fomnatos de pedido ma¡cados en la muestr¿ de cu¿to?

SOIUC|óN En ei ejemplo 5.1 encontamos que la probabilidad de qte hayt *actanente E*


3), dados
formatos de pedido marcados de una muestr¿ de cuato es 0.0036. Para calcula¡ la probabiüdad de
r=0.1
encontrar al menos t€s fomatos de pedido marcados, necesitamos sumar la p,robabilidad de tes
formatos de pedido marcados a la probabilidad de cuato formatos de pedido marcados. La proba-
bilidad de que haya cuato formatos de pedido marcados es:

p$: aln = 4,t¡ = 0 l) : - 0.1)4-4


4(# 4I(0,1)4(1

= 4!(o)!
-1-ro.r)o(o.s)o
''
= l(0.1X0.1X0.1X0.1Xl) = 0.0001

Así, la probabilidad de que haya al menos tes formatos de pedido marcados es:

P(x>3)=P(x=3)+P(x=+)
= 0.0036 + 0.0001
' = 0.0037
o
Hay una probabilidad de 0.37% de que haya al menos tres formatos de pedido marcados en una =
Euesta de cu¿to.
o
o
o
(¡¡
5.3 Si la probabiüdad de un formato de pedido marcado es 0.1, ¿cuál es la probabiüdad de que haya
N
m€nos de tes formatos de pedido ma¡cados en la muesFa de cuato?

< 3), dados SOIUC|óN La probabüdad de que haya metros de tes formatos de pedido marcados es:
yn=0.1 P(x < 3) = P(x = 0) + P(r= r) + P(x = 2)
Utiliz^ndo la ecuación (5.5) de la página 184, esas probabilida<les son:

4l
P(x = oln = 4,.1t = o.t) =
oGi oll
(o.l)0(l - 0.1)a-0 = 6.5561

. P(x=Iln=4,t=0.1)' =;;Ll
l!(4 - *(0.1)r(1
l)! ' -0.1)1-r =0.2er6
4t-
4,Í = 0D =
P(x = 2ln =
tg _ r);(0.1f(1 - 0.1)a-2 = s.0436

Por lo tanto, P(X< 3) = 0.656 t + 0.2916 + 0.0486 = 0.9963. P(X <3) tambien se podría calcu-
lar a partir de zu complemento, P(X> 3), como sigue:

P(x<3) = 1-4x>3)
=1-0.0037=0.9963

A medida que n aument4 el cálculo de las probabilidades binomiales se welve tedioso. En la


figura 5.2 se observa cómo se calculan probabiüüdes binomiales por medio de Excel (izquiuda)
y Minitab (derecha). Las probabilidades binomiales tambien se pueden localizar en una tabla de
probabüdades, como se analiza en el tema Binomial, disponible en línea en la página de descar-
gas de este übro. (Véase el apendice C para saber cómo descargar este archivo).
1 8ó cAPfTwo 5 Distibuciones de probabilidad discrcta
T
FIGURA 5.2
binomiales
Hoja de cálculo de Excel y resultados de Minitab para el cálculo de probabilidades ¡on

n=4y¡r=0.1

+rl'85
{¡. {r -05} Eiseia1 ritb n = 4 ard P = ¡.t
=5or{8rl
¡ Ptf =r)
o 0. at61
{rñoMors(^l4 S8$4 5835, t úq L 9.29L6
:8tNOMO|snAú, s6s4 s855, F^UE)
t^$q
2 0. 0t!86
4tñ oMors{a16 s8s4 s89t,
{rt{oMDlf(alt, i8s¡. s€s5, faLlE)
3 0.00É16
=sl¡¡oMoltrl^l& 98S4 SBS5' t uE) ,l 0. OOgl

valores de n y a. SieEre
La forma cle una distribución de probabilidad binomial depende de los
grande o pequeño sea el v a
que z = 0.5, la distribución binomial es simétic4 sio importar qué tan
se aproxima z a 0'5 y nayor ed
de n. Cuando z * 0.5, la distribución es asimétrica' Cuanto miás
Por ejemplo, la distribu
núme¡o de observaclones, n, menos asimétrica se vuelve la distribución'
hacia la derecha debido¡
ción del número de fonnatos de pedido marcados tiene un gran sesgo
que zr = 0.1 yn=4(véaselafigura53).

FIGURA 5.3 Histograme de la probabilidad binomial

Histograma de
la distribución
de probabilidad
binomial con n= 4
yr=0.1

*
s
¡{
, '{i;
jrl!
:.ii:
' :.¡:
i. '.i.
conti¡uas de la"set
observe en la figura 5.3 que, a diferencia del histog¡ama para variables
r¡i;
:jl i' ción 2.6, las banas para los valores son muy delgadas y existe un
gran traslape
:"nt
tY#;.
:..i (Teóricament€' r?D *
valores.'Esto se debi a que el histograma representa una variable discreta.
i,it.
,i$, nas no deberían ser anchas, sino líneas vefticales), - - Fr
producto o".:!
xü$
t.¡!ti La media (o el valor esperado) de la disfibución bi¡omial es igual al ,::";
:! ]r lugar de utilizar la ecuación (5.1) de la página 179 pal:"- calcular la media de
d]'ho"itjljj-tt
I
vanables que hentu *'
uatiti¿a¿, podemos utilizar la ecuación (5.6) para calcular la media de
distribución binomial.
.1
)
5.2 Dist¡ibución binomial 187

MEDIA DE L,A DISTRIBUCIÓN BINOMIAL


La media, p, de la distribución binomial es igual al tamaño muestal, z, multiplicado por la
probabilidad de m evento de interés,rr¡'.

Y'=E(X)=mr (5.q

En promedio, a largo plazo, teóricamente se esperan /, = E(X) = nr = (4)(0.1) = 0.4 formatos


de pedido marcados en una muesta de cuato pedidos.
La desüación estfu:dar de la disfibución binomial se calcula utilízando la ecuación (5.7).

La desüación estándar del número de formatos de Dedido marcados es:

4(o.lxo.e) = 0.ó0

Se obtiene el mismo resultado si se utiliza la ecuación (5.3) de la página 180.


En el ejemplo 5.4 se aplica la distribución binomial al servicio de un restaurante de comida a,
níoida.

o
Para las cadenas de comida nipida es muy import¿nte tomar pedidos precisos eu l¿ vent¿nfla de
o
5.4 o
sewicio al automóvil. !s m¡nsra psri$dic4 QSR Magazine (http:ihrww.qsrnagazine.com/) pu- qt
blica los resultados de sus encuestas. La precisión se mide como el porcentaje de pedidos que se N
N
entegan de manera correcta. Recientemente, el porcentaje de pedidos entegados de manera co-
necta en Wendy's fue de aproxi:nadamente 89%. Suponga que usted va a la ventanilla de servicio
al automóvil de Wendy's y hace un pedido. Al mismo tiempo, y de manera independiente, dos
arnigos suyos hacen pedidos en la ventanilla de servicio al automóvil de la misma tienda. ¿Cu.íles
son las probabilidades de que los Ees, ninguno de los tres y al menos dos de los tes pedidos se
en[eguen de manera correcta? ¿Cuáles son la media y Ia desviación estándar de la distribución
binomial para e[ número dcpedidos entregados.de manera correct¿?

SOIUCIÓN Como hay tres pedidos y la probabilidad de un pedido correcto es 0.89, n = 3 y


z¡ = 0.89. Utilizando las ecuaciones (5.6) y (5.7),

p=E(n=nr=3(0.8e)
"= l7
= \/V",@ =
= \,6(osrxot D
= \/o2w = 0.5419

Utilizando [a ecuación (5.5) de la página 184,


:ta
l pár
p(x = 3ln = 3,¡ =o.ss) =
las -;a * (0.s9)3(1
3!(3-3)! ' " - 0.89)3-3

:;;*(o'¡e)r(o ll)o
de J !(J - Jrr
1en
= 1(0.8e)(0.8e)(0.8e)(1) = 6.7e5s
1 88 cAPíTWo 5 Distribuciones de probabilidad discreta

1l -
P(x = oln = 3,r = 0.4s) = --j (0.8ef(l - ¡.se¡r-o

=
0!13-0)t ' "
=:a-(0.¡9)o(o.ll)3
= 1(l)(0.11)(0.11)(o'tt¡ = ¡6et'

P(x = 2ln:3,r = o.8e) = t+ 2)l


(0.8e)'?(1 - 0.8e¡:-z

- 2t(3 - (0.s9)2(o.l
-;i: - 2\l' " I )'
= :(O.se)(0.8e)(0.11) = 0.2614

P(x>2)=P(x=2)+P(x=3)
= 0.2614 + 0.7050

= 0.9664

El núme¡o medio de pedidos entegados correct¿mente en una muesüa de tres pedidos es


y la desviación estándar es 0.5419. La probabilidad de que los tes pedidos sean enFegados &
manera corecta es de 0.7050 o 70.50%. La probabilidad de que nhguno de los pedidos se eñr.
gue de manera conecta es de 0.0013 o 13%. La probabilidad de que al menos dos pedidos see¡
treguen correctamente es de 0.9664 o 96.640/o.

En esta sección se intodujo la distribución binomial, la cual es un modelo matemático inpr.


t¿nte en muchas situaciones de negocios.

Problemas para la sección 5.2


APRENDIZAJE DE LOS FUNDAMENTOS c) al menos cuatro welos lleguen a tienpo?
d) ¿Cu.iLles son la media y la desviación esúnda del núm¡r
5.9 Determine lo siguiente: de llegadas a tiempo?
a) P(X= 0), para n =4y¡r=0.12. e) ¿Qué suposiciones necesita hacer en los incisos a) al c[
b\ P(X = 9), pua n = l0 y z = 0.40.
5.13 Un estudiante está resolviendo un examen de op'i"r
c) P(X= 8), par¿ n = 10 y z= 0.50.
r::i'jil mütiple en el que cada pregunta tiene cuatro opcione*
d) 4X = 5), pa¡a n = 6 y tt = 0.83.
ponga que el estudiante ignora larespu€st¿ co[ecta de tod6
5.10 Si z=5 y zt =0.40, ¿curíl es la probabilidad de que las preguntas y que decidió utilizar una estrategia que con
a) X= 4? siste en colocar cuaho pelotas en una caja (marcadas c0! 16
b\ x=32 letas l, 8, C y D). De manera aleatoria selecciona una9e
cl X<21 lota para cada pregunta y la regesa a la caja. [¿ marca en l¡
d)x> 1? pelota determinará su respuesta a la pregunta. El exaúer
ionsta de cinco preguntas de opción múltiple. ¿Cüil es I
APIICAqóN DE CONCEPTOS probabiüdad de que obtenga
5.'l 1 Se supone que el aumento o la reducción del precio de a) cinco respuestas correctas?
una acción ente el inicio y el ñnal de un día comercial es un á) al menos cuaho respuestas conectas?
evento aleatorio que tiene las mismas probabilidades de ocu- c) ninguna respuesta correcta?
rrir. ¿Cuál es la probabilidad de que una acción registe un in- d) no rn ás de dos respuest¡s correct¡s?
crernento en zuprecio de cien€ dufa¡úe cinco días corsecutivos? 5.14 Los consejeros de inversiones coinciden en que16
y 0:
5.12 El Departamenüo de Transpode de Estados Unidos re- funuos jubilados, que son aquellos individuos enüe 55
portó que en 2009 Southwest superó a todas las aerolíneas de años cte eda4 deben tener carter¿s equiübradas. La mafon
ese país en las llegadas a tiempo para welos nacionales, con de los consejeros sugieren que estos individuos no ter$*
una asa de 0.825. Utilizantlo ta distribución binonial, ¿cuál es más de 50% de sus i¡versiones en ¿cciones. Si¡ emba4o
ú
ta probabilidad de que €n los siguientes seis welos durante [a gran caída que sufrió el mercado cle accio¡es
dt
o) cuatro welos lleguen a tiemPo? 2008,22Ylde los futuros jubilados tenían 9fflo o más l
ú) los seis vuelos lleguen a tiempo? dinero invertido en acciones. (P. Regnier, "Wbat I Leal¡o
5.3 Distibución Poisson 189

es la probabilidad de que dos o nás clientes exce-


Lloney, mayo de2009,p' 114) Suponga
d) ¿Cuál
'-".sna de 10
aleatoria uE personas 4
IU Pslluuaut a r4! que
las qus dan sus límites?
rnü€Süa ateat(Jlta
Liaeró futr:ros jubilados. ¿Cuál es la pro- I.E;l 5.16 En el ejemplo 5.4, de la página 187, usted y
Jr¡ante 2008 . .. @ oos an'gos oecroeron u a ñ*oyi. rnooau ,.rpoogn
.^900/0 o fias Cle SU dlnero lnvefiloo en ac- que deciden ir a Popeye's, una cadena que el mes pasado
entregó aproximadamente 84.8% de los pedidos de manera
ntien 90%o o más de su dinero inver- conecta. ¿Cu.il es la probabilidad de que
,|
c) los tes pedidos se eflteguen de manera conecta?
invertido
ñüeran 90% o más de su dinero ó) ninguno de los pedidos se entegue de mane¡a correcta?
c) al menos dos de los tes pedidos se enteguen corect¿mente?
90% o más de su dinero invertido en d) ¿Cuáles son la media y la desviación estándar de la disti-
bución binomial uülizada en los incisos a) al c)? ilterpreie
esos valores.
cli€nte hace un pedido en Rudy's On-Line
ul sistema de información contable com- 5.'17 En el ejemplo 5.4, de la página 187, usted y dos ami-
oor las sigias de Accounting Information gos decidieron ir a Wendyt. Ahora suponga que deciden ir
ve¡ifica de manera autonática si el a McDonald's, una cadena que el mes pasado entregó
su límite de crédito. Registos anteriores aproximaclamente 90.1% de los pedidos de manera corecta-
de que los clientes excedan su
¿Cuál es la probabilidad de que
es de 0.05. Suponga que, en un día d€ter- a) los tes pedidos se entreguen de manera correcta?
iútes r€¿lizan pedidos Suponga que el nú- ó) ninguno de los pedidos se entregue de maner¿ correcta?
oue el AIS detecta que exceden su llmite de c) al menos dos de los Ees pedidos se €ntegu€n conectamente?
ove cooo ,"ta variable aleatoria binomial. d) ¿Curíles son la meüa y la dewiacion estánda¡ de la distri-
h nedia y la dewiación estánda¡ del número bución binomial utilizada en los incisos a) al c)? Int€rpr€te
exceden su límite de cédito? esos valores. a,
de que ningún clie e exceda su
e) Compae los resultados de los incisos o) al d) con los de
Popeye's en el problema 5.16 y los de 9[endy's en el
nrobabilidad de que un cliente exceda su ejemplo 5.4 de la página 187. o
o
o
(D
N
ución Poisson (D

Muchos esü¡dios se basan en conteos de las veces en que ocuue un ev€nto en partiq¡ld enqerlaórca
de oporhmidad.Un área de oportunld¡d es u¡a unidad continua o un intervalo de tiempo, volumen
o cuatquier rárea fisica donde pueda haber mrás de un¿ ocunencia de uo eveno. Ejerylos de vaiables
que siguen la distibución Poisson son los defectos en la superficie de un auwo refrigerador, el oú-
mero de veces que falla una red en un di4 el número de penonas que llegan a u banco y el número de
pulgas que üven en el cuerpo de un perro. Podemos utiliz¡r la distribución Poisson para calcular
probabilidades en sih¡aciones como estas, siempre que se cumplan las siguientes propiedades:
. . Usted esüí interesado en contar el número de veces que ocurre un evento en particular en u:r
área de oportunidad dada. El rárea de oportmi¡¡d se define como tiempo, longitud, rírea de
superficie, etcétera
. La probabilidad d€ que un evento ocurra en un á¡ea de oportunidad dada es la misma para
todas las áreas de oportunidad.
. El número de eventos que ocurren en un área de oportunidad es independiente del número
de eventos que ocurren en cualquier ot¿ área de oporh¡nidad.
. La probabilidad de que dos o más eventos ocuran en un rírea de oportunidad se aproxima a
cero a medida que esta se vuelve más pequeña.
Considere el número de clientes que llegan durante el almuer¿o a un banco localizado en el
distrito central de negocios en una gran ciudad. A usted le interesa conocer el número de cüentes
que llegan cada minuto. ¿Esta situación cumple con las cuatro propiedades de la dishibución Pois-
son descritas anteriormente? En primer lugar, eI nento de iaterés es la llegada de un cliente, y el
área de oportunidad dada se defne como un intervalo de un minuto. ¿Llegaún cero clientes, un
cliente, dos clientes, etcétera? En segundo lugar, es razonable suponer que la probabilidad de que
un cliente llegue durante un intewalo específico de un minuto, es la misma que para todos ios otos
i¡tervalos de un minuto. En tercer lugar, la ilegada de un cliente en cualquier intewalo de un mi-
nuto uo tiene efecto alguno, es decir, es independiente de la llegada de cualquier oto cliente en
t__.

190 CAPíTIJ'I-o 5 Distribuciones de Probabilidad discreta

cualquier otro intervalo de un minuto. Por último' la probabifdad de que.lleguen dos o *is c¡er
tes en un periodo dado se aproxima a cero a medida que el intewalo de hempo se welve ¡¡¿, n.
queño. Por ejemplo, la probabilidad de que dos cüentes lleguen en '¡ intervalo de 0 01 seg¡¡[[
es pnicticanentó de ceio. Por lo tanto, podemos utilizar la distribución Poisson para deter¡,ol
probabiüüdes que involucran el número de clientes que llegan al banco en un intervalo deu¡ri
nuto durante la hora del almuerzo.
La distribución Poisson tiene una característica, llamada ,\ (la letra griega minuscula /dnódul
que es la media o el númao esperado de eventos por unidad- I¿ varianza de 'na distrfuución Pois¡i
también es igual a ,\, y la desviación estándar es igUal a ,\ . El número de eventos,..l de la va¡iablc
aleatoria Poisson oscila de 0 a infinito (co).
La ecuación (5.8) es la expresión matemática para la distribución Poisson que permite calculat
la probabilidad de f= ¡ eventos, dado que se esperan ,\ eventos.

Pafa ilusü'ar una aplicación de la distribución Poisson, suponga que el número medio de cüet :
tes que llegan por minuto al banco enhe el mediodía y la I p.m. es igual a 3.0. ¿Ctuíl es la
probabr' :
'
uaaa oe que en un minuto dado lleguen exactamente dos clientes? ¿Y cu.il es la probabilidad &
que lleguen más de dos clientes en un minuto dado?
utilizando la ecuación (5.8) y I = 3, la probabilidad de que en un minuto dado lleguen exrt' -

úente dos clientes es:

,-3 011 ol2


P(x=2l^=3)=--;- (231s28)3Q)
= 0.2240

para determina¡ la probabilidad de que lleguen más de dos clientes en cualquier minuto d¡¡^

P(x>2)=p(X=3)+P(x= 4) + " +P(x= co)


Como en una distibución de probabilidad todas estas deben sumar 1, los términos ubicados.del
l¿do derecho de la ecuación PIX > 2) también representan el complemento de la probabilidad
dc

que Xsea menor que o igual a 2, es decir, 1 - P(X< 2). Por lo tanto,

P(x > 2) = 1 - P(x < 2) = t - tP(x = 0) + P(x= t) + P(x = 2)l


Ahora. si usamos la ecuación (5.8),

, + n * a l
fe-3.0(3.0)0 r3.0(3.0)r ¿-3.0(3.0)2.l
p(x>z)=t-L
= I - [0.0498 + 0.1494 + 0.2240]
=I-0.4232=0'5768
en el mtstno
De esta manera, existe una probabiüdad de 57.68% de que lleguen mrás de dos cüentes
mrnuto.
El cálculo de probabilidades Poisson tal vez sea tedioso. En la figura 5 4 se mu:sTa]i
fli#
(derer'
en que se calculan probabilidades Poisson por medio de Excel (izquierda) y Minihb
en el ap¡up-
Este tipo de probabüdades tambien se pueden buscar en una tabla, como se analiza
Poisson, disponible en línea en la página de descargas de este libro.
Problemas pan la sección 5.3 191

A 5.4
cálculo de

para el

irobabili-
<ón con

+orssoN(a* s44 FArsE'l


+orssoNtÁlo, $r$4 FAuiEl
+o|sso (A1! sE$4 FAr.sEl Poisloa rith Ea¡ - 3
{o¡sso (a12, s64 F^utE)
+orsso¡(Ar], ss+ F^r.sEl
r P( ¡ = ¡ )
+ols!oH(a1+
o 0,0t9?8?
SES¡".FA15El
+orsso¡¡(Ar5, sE$4 FArsE)
1 0.149:tó1
2 9.224Ít12
+OlssoNlÁ16' SS¡r, FALsEl
3 0.221042
=Porssori {a17, $64 FAr.sE)
I 0.168031
+orsJoÍla ,sE q, FArsEl
5 0.100019
+or55or{{ax), sEs4 F^r.sEl 6 0. f!:t0a09
+orsson (a2r, s€s+ fArsE) ? 0.021604
+orsson (a2r" 5S4 FAtsE) I 0,008102
+orBsox (A22, SES4, FA15E) 9 0.002701
+or3!o¡¡(^¡, sEs+ F uiE) 10 0.000810
+orssoN(ru¡4, 9E94 FArsE) t1 0.000221
+orssoNiÁ25, ss4 FArsÉ) t2 0.000055
=Polsror{(A25, 9SA FAl.ltEl 13 0. 000013
+orssor{ 1a27, s€54 FAt S[) 14 0.000003 a,
+orssoN(A28, s854, FAr.sE) 15 0.000001

o
o
Se sabe que el número de lesiones de trabajo me$n¡ales €n una planta de meufactura sigue rma disti- o
(D
bución Poissoq coo uDa media de 2.5 lesiooes de babajo mensuales. ¿Cu.il es la probabilidad de que en
N
un mes determinado no ocuran lesiotr€s de fabajo? ¿Y de que ocuna al me[os una lesión de fabajo? A
SOLUCóN Utilizando la ecuación (5.8) de la página 190, con ,\ = 2.5 (o Excel, Minitab o 'rn,
tabla de Poisson), la probabiüdad de que en un mes dado no ocurr¿n lesiones de tabajo es:

o-2.5 ¡1 5¡0
P(X=0lr=2.5)=-
' il'-'=
u! (2.7r82q2s0)
= 0.0821

La probabilidad de que no ocurranJesiones''de tr@o en m-mes dado es 0.0821 u 8.21%;Tor lo tanto,

P(x>1)=1-P(x=0)
= 1 - 0.0821

= 0.9179

La probabilidad de que ocuna al menos un¿ lesión de fabajo es 0.9179 o91.79%.

emas para la sección 5.3


DE tos FUNDAMENTOS 5.19 Suponga una distribución Poisson.
Suponga una
s) Sii = 2.0, calcule P(X > 2).
üstribución poisson.
,) Si^ = 8.0, calcule P(X > 3).
= 2.5, calcule P(X = 2).
¿) Si^ = 0.5, calcule P(X< l).
= 8.0, calcuie P(.f = 8). d) Sii = 4.0, calcule P(X z I)
= 0.5, calcule P(.Y = t ).
¿) Si,\ = 5.0, calcule P(X < 3)
= 3.7, calcule P(,f = 0).
It
192 cAPÍTWo 5 Distribuciones de probabilidad discreta
r
I
= 5 0' ¿Cuíl
c) en un rollo de 50 pies haya 5 o más defectos y 15 o rne.
5.20 Suponga una distribución Poisson con '\
de que nos defectos?
es la probabilidad
a\X=l' 5.27 J Power and Associates calcula y publica divq,,n
.D.
blx<l? estadísticas sobre la calidad de automóviles. La calihc¿q¡6r,
cJ x> l? de la calidad r¡icial mide el número de problemas en qaü
¡t)x < l? automóvil nuevo vendido. Para Ios automÓvlles n¡del'
2009, Ford tuvo 1.02 problemas en cada automóvil, en ¡¿,,10
APTICACIóN DE CONCEPTOS que Dodge tuvo 1.34 problemas en cada autoúóvil (dat'$
5.21 Suponga que el número de enores de red experimen- extraídos de S. Carty, "U.S. Autos Power Forward 11,ith
(LAN) se distribuye
tados en un dia en una red de área local Gains in Quality Survey", USI Today,Z3 de junio de 2009,
como una variable aleatoria de Poisson. El número medio p. 3B). Suponga que la variable aleatoria -{ es igual al nú.
de enores de red experimentados en un día es de2'4' ¿Cuál mero de problemas en un Ford 2009 recién adqutrido.
es la probabilidad de que en cualquier día dado a) ¿Qué suposiciones se deben hacer para que .x se dishl.
¿) ocunan cero errores de red? buya como una variable aleatoria de Poisson?
ó) ocuna exactamente un enor de red? Con las mismas suposicioú€s que se hicieron en el inciso 41,
c) ocur¡andos o más errores de red? si usted comprara un Ford 2009, ¿cual es la probabilida{ ¡¡
d) ocunaa menos de ffes eúor€s de red? que el automóvil nuevo tenga
á) cero problemas?
f-7Ñ-tn6i EI serente de contol de calidad de Marilyn's
5.22 c) dos o menos problemas?
'.
:..1 Effi! 6¡6¡¡65 g-stá inspeccionando un lore de galletas con d) Proporcione una defrnición operacional del problena.
chispas de chocolate que icaba de homearse. Si el proceso
de
es importante pa.i¿ ir'
partes ¿Por qué la defrnición operacional
proáucción está bajo control, el número medio de
terpretar la calificación de la calidad inicial?
áe chocolate por galleia es de 6.0. ¿Cu.il es la probabilidad de
que en cualquier galleta en particular ilspeccionada 5.28 Remítase al problema 5.27. Si usted comprara un Ddp
-
o¡ r. *.uaonao.aoos de cinco partes de chocolate? ^ 2009, ¿curíl sería la probabilidad de que el automóvil nuevo .

á) se encuentsen exactamente cinco pafes de chocolate? h.rviera


ci se encuentren cinco o más partes de chocolate? a) cero problemas?
d) se encuentren cuaÍo o cinco partes de chocolate? á) dos o menos Problemas?
c) Compare sus respuestas y ó) con sus ra'
a los incisos a)
5.23 Remítase al problema 5.22. Loúá¡ntas galletas en un problema 5'27 del Ford
puestas a los incisos ó) y c) del
lote de i00 debe esperar el gaente que sean descartadas si las
politicas rle la empresa exigen que iodas las galletas con chis- 5.29 Remítase al problema 5.27. Oho adículo reportÓ ryem '

2008 Ford tuvo 1.li problemas en cada arfomóvrl y


que Dodgt
pas de chocolate iengan al menos cuatro partes de chocolate?
tuvo 1.41 problemas por auiomóvil (datos extraídos deS'
5.24 El Departamento de T¡ansporte de Estados Unidos re-
Carty, 'Tord Moves Up in Quality Surv ey", USA Todry,5
te.
gistra datos estadísticos del maltrato de maletas por cada un Ford 2008,
¡unió'ae zoot, p. 3B). 3i usted comprara ¿cuál
i,000 pasajeros de aerolínea. Durante los primeros nueve
sería la probabilidad de que el automóvil nuevo tuvie¡a
i': :.' ..r..
;,. d. 2b10, Delta maltrató 3.52 maletas por cada 1,000
pasajeros. ¿Cuál es la probabilidad de que, para los siguien-
a) cero problemas?
á) dos o menos problemas?
tes 1,000 Pasajeros' Delta
c)' Compare sus respuesas a los incisos a) y b) t91 l" T^E:T
a) no maltrate maletas?
t", uio, incisos á) y c) det problema 5 27 del Ford 2009
á) maltrate al menos una maleta?
DodS
c) maltrate al menos dos maletas? 5.30 Rernítase al problema 5.29 Si usted comprara un
2008, ¿cuál sería la probabilidad de que el automóvil
nu€vo
5.25 E1Departamento de Transporte de Estados Unidos ¡e-
¡uvlera
gistra datos estadísticos de las quejas de los consumidores
los prime- a) cero problemas?
for cada 100,000 pasajeros de aerolínea. Durante ó) dos o menos Problemas?
io. nu.u" meses de 2009, las quejas de los consumidores
' Cotp*" ,* tatpo"rtas a los incisos a) y b) con sus resper
fueron 0.99 por cada 100,000 pasajeros. ¿Cuál es la proba- "j tu, .iot incisos a¡ y b) del problema 5 28 del Dodge 20ur'
bilidad de que entre los siguientes 100,000 pasa.¡eros
grah!ft
a) no haya quejas? 5.31 Sus clientes disponen de un número rclefónico
0r
ú) haya al menos una queja? de las 9 a.m. a las 9 p.m., para regisrar sus quejas acerca
qu'
c) haya a1 menos dos quejas? un producto adquirido en su empresa. El hisbrial i¡dlca

Con base en expenencia previa- se supone que el número


se recibe un promedio de 0.8 llamaüs Por Íunuto ¡- ,1.
5.2ó la 5'
a) ¿Que proiiedades deben ser verdaderas acerca de
de defectos por pie en rollos de papel grado 2 sigue una distri-
ú¡ación aqui descrita para poder utilizar la distnbuct'"
bución Poision con una media de 1 defecto por cada 5 pies de coo
Pcisscn con la frnalidad de calcular probabilidades !'
papel (0.2 defectos por pie). ¿CurLl es la probabilidad de que
respecto al número de llamadas tetefónicas recibid¡s
a) en un rollo de un pie haya al menos dos defectos?
un periodo de un miluto?
Di en rm rol1o de 12 pies haya al menos un defecto?
Ecuaciones clave 193

oue esta situación cumple con las propiedades c) se reciban hes o más llamadas telefónicas?
en el inciso a), ¿cuál es la
probabilidad de que du- d) ¿Curíl es el número mrlximo de llamadas telefonicas que se
recibinín en un periodo de un minuto el 99.99% del tierpo?
f"flIJ;:'. llamadas telerónicas?

En Saxon Home Improvement, Revisrón


n la sección sobre Saxon Home Improvement, al inicio de este
capítulo, supusimos que usted trabajaba como contador pa¡a la
empresa. El sistema de informacióu contable de la empresa revisa
de manera automática los oosibles e¡rores en los formatos de De-
dido de los clientes en línea. Cualquier factura cuestionable se marca y se in-
cluye en un informe diario de excepciones. Sabiendo de antemano que existían
0.10 de probabilidades de que un pedido sería marcado, utilizó la distibución
binomial para determinar la probabilidad de calcular cierto número de formatos marcados en un ta-
maño de muestra de cuatro. Encontró una probabilidad de 65.6% de que ninguno de los fonnatos
estuviera marc¿do, una probabilidacl de 29.2% de que uno estuüera marcado y una probabilidad de
5.2% de que dos o más estuüeran marcados. También deter¡rinó que, en promedio, se espera que 0.4
formatos estén marcados y que la desviación es[índar del número de formatos de pedido marcados
sea 0.6. Ahora que aprendió a utilizar la distribución binomial para una probabilidad conocida de
0.10 y un tamaño de muesta de cuaho, será capaz de aplicar el mismo méodo a cualquier probabiü-
dad y tamaño de muestra d¿dos. Por coosiguiente, podrá hacer inferencias acerca del proceso de pe-
didos en línea y, más importante, evaluar cualqüer cambio o propuesta de cambio para el proceso. a,

=
o
o
o
caoítulo estudiamos la esDeranza matemática (el va- ¿Hay un número ñjo de obsewaciones, n, cada una de
(¡¡

ésperado) y dos importantes distribuciones de probabili


N
las cuales se clasifica como un evento que es de inte¡es or
discreta: las distribuciones binomial v Poissoú. En el o uno que no es de interés? ¿O existe alguna rirea de
capítulo se estudiará la distribución continua más oportunidad?
la distribución normal. Si hay un número ñjo de observaciones, n, cada una de
-Para detemrinar qué disbrbución de orobabilidad se debe las cu¿les se clasifica como uú evento que es de inteÉs
en una situación específica, necesita plantear las si o uno que no es de interés, se utiliza la distibución bi-
nomial. Si existe un rírea de oportunidad, se utiliza la
distribución Poisson.

esperado, p, de una variable aleatoria discreta Distribución binomial


.nl
' I' = E(x) = );¡p(x = .r¡) (s.t) P(X = xln,n)' = -; -L¿(t - z)'-' (s.s)
xi(n - xll
Media de la distribución binomial

i = ZLx¡ - L\x))"Plx = x,) (5.2) P--E(E=n¡ (t.0,


'ca Desvi¿ción estándar de la üstribución binomial
a.(
,Desüación estándar de una variable aleatoria discreta
rG : úr"4X) = \/r"(t - /,
s= \/d = ,/ it., _ E(.r4l2P(.Y = x,) (s.3)
":
Distribución
") tf,.

Y- Poisson
Cornbinaciones e-^ E
akl
P(X = ;r l,\) = (s.8)
(s.4)
.r!(n - .r) |
194 CAPÍTULO 5 Distibuciones de probabilidad discreta
I
l
,RN/,iltt\Í'os 'ejLA ¿

I
distribuciónPoisson 189 valor esperado, P, de una variable
área de oporhrnidad 198
modelo matemático 182 aleatoria disc¡eta 179
desviación estandar de una variable
regla de combinaciones 183 varianza de una variable aleatona
aleatoriadiscreta 180
valor esperado 178 discreta 179
distribuciónbinomial 182
distribución de probabilidad para una
variable aleatoria disc¡eta l7E

a) el siguiente año?
VERIFIOUE SU COMPRENSÉN
á) el año posterior al siguiente?
5.32 ¿Cuál es el significado del
valor esperado de una dis-
ci en cuatro de los siguientes ci-nco años?
tribución de Probabilidad? l¡ en ninguno de los siguientes crnco años?
5.33 ¿Cuáles son las cuatro propiedades que deben estar ,Í Put" .itu situación, ¿qué supuesto de la distribución bi'

presentes para utiliz¿r la distribución binomial? nornial podría no ser válido?


5.34 ;.Cuáles son las cuato propiedades que deben estar 5.37 A fi¡ralesde 2007 se reporto que 79% de los adultos esu
presenies para utilizar la distribución Poisson? dormidenses tenían un teléfono celular (datos extaídos
de L C

Baig, ''Tips Help Navigate Tech-Buying Maze"' US:4 Tldq'


APLICAOÓN DE CONCEPTOS 28 áe noviembre de 2002, p. 5B). Suponga que a ftnales &
5.35 Darwin Head, de 35 años de edad y quien u'abaja en un 2010 ese porcentaje fue de 85%. Si se selecciona una muesf¿
aserradero, ganó un millón de dólares y un Chewolet
Malibu cle l0 aduitos estadourudenses, ¿cu.il es la probabiüdad de que

juego Van-
Hvbrid al aiotar 15 goles en 24 segundos en el ¿) ocho tensan un teléfono celular?
couver Canuck Nanonal Hockey League (B' Ziemer"Darwtn ái al menoiocho tengan un teléfono celular?
óe fe'
Evolves into an I¡stant Miilionaire", Vancower Sun, 28 c) los l0 tengan un teléfono celular?
dinero para-pagar muesb:¿ en una zona geogranca o
brero de 2008, p. 1). Head dijo que usaría el d) Si usted seleccionara la
su hipoteca y dar manutención a sus hijos,
y que no teDla pla' partrcular y encontrara que mnguno de los l0 paficipants
-tenia
nes de renuncia¡ a zu t-abajo. El concuno en pafe del
Chevro' teléfono celular, ¿qué diría acuca de que el porceDqe
de 8570?
let Malibu Million Dollar Shootout' paüocinado por General de dueños de teléfonoJ cilula¡es en esta rárea er¿
Motors Canadian Division. ¿La GM de Canadá amesgó el 5.38 Una teoría respecto del Índice Dow Jones lndustrui
los anos de
millón de dólares? ¡No! GM de Canadá adquirió un seguro Dlantea que es probable que este aumente durante
!i.".ioo.t p..ri¿.ociales en Estados Unidos De l9ó4 a 2trE
para eventos con una empresa especializa<la en prcmoclones en
de biás- ei Ío¿i.. Oo* ¡ones Industnal aumentó en 9 de los 12 a¡os
eventos deportivos, como un ti¡o desde media cancha
quetbol o un regalo por un hoyo en rmo en el tomeo de golf lo- áL .I...ion", pr.tidenciales en Estados Unidos' Suponte.
ál de candad. La empresa de seguros para eventos estima Ia 0". Iti. i"c.á¿ot un evento aleatorio sin valorpredietivo'
que "s
el indicador fuera conecto 50% de las veco'
probabilidad de que un participaote gane el concuno y' por un si esperaría
;t' que el Índice Dow Jones au'
iobro ¡nodesto, asegurá el evento. Los promotores pagan
la ;¿;i ü probabilidad cle

prima del seguro. pero no asumen ningún riesgo adicional' ya irente ";
en 9 ó más de los 12 años de elecciones
presidocir'
Ies en Estados Unidos, si la probabilidad de un
incre¡ne¡to
que la emp.eia deieguros pagará la cantidad mayor en el caso
N i-p.oU"Ut. de que un participante gane' Para ver cómo firn- en el Índice Dow Jones es de 0.50?
á) ; Cuál es ta probabilidad de que el indice Dow
Jones au
.,( ciona esto, .upoog" qrl" la ernpresa de seguros estima-que
la -'
t,¡ gane rm tiro de un millón de it.nt" .n S o rn^ de los 12 añós de elecciones presidenoa'
orobabrlidad de que ur participante
les en Estados Urudos, si Ia probabilidad de un
incremeru
if\!r iólares es de 0.0bt y que la anpresa de seguros cobra $4,000' de 0 75?
en el Índice Dow Jones en iualquier año es
.:l c) Calcule el valor esperado de las ganancias de la empresa
:.ii. de seguros' 5.39 Los enores en el proceso de facfi'ración a menudo-DtÚ
es una ¿'*,
: :!i^ á) Muchos consideran que este tipo de situación vocan i¡sarisfacción en los clientes y, en último termuu
de seguros y eÍ
i..* oporhnidad de ganar-ganar para la empresa nn las ganancias generales. Un artículo plblicado yuo:::
i ..1 ptomoto. ¿Está de acuerdo? Explique su respuesta' Progresi 1L. Tatikonda 'A Less Costly nilline ftggess
"i -'"v;
fityhrogress, enero de 2008, pp. 30¡38) se refirió
a unx
i.i\ 5.3ó Enhe 1896, el año en que se creó el índice Dow Jones' y ",u
',:: enOrcs "
(datos extraídos-de oresa doinde 4002, de las factur¿s emiridas contedan
1;ü 2009, el índice aumentó en 64% de los años que
M. úulbert, "What üe Past Can't Tell Invutors", The New ,, p...tun 10 facturas, ¿cuíl es la probabilidad de
:,$ c) cero facturas contengrn enores?
est¿ ut-
York Times,3 de enero de 2010, p BUZ)' Con base
{,-l en
distribución binornial' ¿cuál cree ,) exactamente una factura co[tenga un error'f
formación y suponiendo una
aumente ci dos o m:ís facturas contengan erores?
que es la piobabilidad de que el mercado bursátil
Problemas de repaso del capítulo 1 95

Cuáles son
la media y, La desüación esrándar de Ia disfi- 5.44 Una teoría respecto del Índice S&P 500 plantea que si
,,/:iótr de ProbaDl oflo l este aumenta durante los primeros cinco días comerciales del

problema 5.39. Suponga que una inicia- año, es probable que aumente durante el año completo. De
Remítase al
la calidad ha reducido el porcentaje de 1950 a 2010, el indice S&P 500 tuvo estas tempmnas ganan-
o¿¡a mejorar
errores a 20010. Si se procesan l0 fac- cias en 39 años. En 34 de esos 39 ¿ños el índice aumentó du-
¡¿s que contienen
la de que rante todo el año. Suponiendo que este indicador es un evento
is, ¿c,ríl es Probabilidad aleatorio sin valor predictivo, se esperaría que el indicador
'cero
facturas conteng¿rn errores /
una facfilfa contenga un enor? fue¡a conecto 50% de las veces. ¿Cu.ál es la probabilidad de
i*u,*rn " que el indice S&P 500 aumente en 34 o más años si la proba-
fachuas_contengan enores?
¿¡s o más
bilidad verdadera de un incremento en el índice es de
,ruriles son la media y la desviación estíndr de la distri-
¿) 0.50?
iución de Probabilidad2
b) 0.701
Cgrnpare los resultados
de los incisos a) a c) con las res-
de los incisos a) a c) del problema 5.39. c) 0.90?
d) Con base en los resultados de los incisos a) a c), ¿cuál
¡,1 El inicio de sesión en rma red social implica recomenda¡ cree que sea la probabilidad de que el I¡dice S&P 500
ir un artículo que se haya leído en línea. En el primer
aumente si existe una ganancia temprana en los primeros
de 2011 (T. Wayne. One Log-In Catches on for Many
dias comerciales del año? Explique su respuesta.
*", Drilling Down, The New York Times, 2 de mayo de
ll, p. B2), segun Janr¿in, 35% de los usuarios iniciaron se- 5.43 Una conelación upuria xrefiete a la relación aparente
por m€dio de Facebook y 3 I % por medio de Google. entre variables que no tieúen una verdadera relación o que
Si se selecciona una muestra de 10 i¡icios de sesión en la estiín relacionadas coD otras v¿riables que no se ban medido. Un
social, ¿cual es la probabilidad de que índice del mercado de valores muy conocido en Estados
miás de cuatro inicien sesión utilizando Facebook? Unidos, que es ejemplo de ''¡¡ correlación espuri4 es la rela-
de cuaho inicien sesión utilizando Goosle? ción ente el ganador del Super Bowl de la Nation¿l Football
nineuno iricie sesión utiüzando Facebook? League (NFL) y el desempeío del lndice Dow Jones du¡ante a,
¿Qué suposición debe hacer para responder a los incisos ese año. El "indicado/' establece que el año en que un equipo
a c)? que existía antes de que la National Football League se fusio-
Una de las mayores tustaciones para la industia de los nara con la A¡nerican Football League gana el Super Bowl, el o
electrónicos es que los clientes están ¿costumbra- Índice Dow Jones aumentaní. (Desde luego, cuaQuier corre- o
a devolver los productos por cualquier razón (C. lación ente esto es espuri4 ¡ya que un a¡¡unto no tiene abso- o
(D
"The War on Retums", The Wall Steet Journal, 8 lutamente nada que ver con el ota!). Desde que se realizó el N
mayo de 2008, pp. Dl, D6). Recientemente se reportó que primer Super Bowl en 1967 hasta 2010, el indicador ha estado o)
de las devoluciones "no se encontró un Droblema". en lo corecto en 35 de ,14 veces (datos exü"aidos de W. Powo,
una muestra de 20 clientes que devolvieron los '"The Bulls Want Jets Grounded", Ifr¿ Wall Steet Journal,22
electónicos que adquirieron. Utiiice el modelo bino. de enero de 2011, p. B2). Suponiendo que este indicador es
par¿ rcsponder las slgulentes pregufitas: un evento aleatorio sin valor predictivo, se esperaría que el
¿Cuál es el valor esperado o la media de la distribución indicador esh¡viera en lo conecto 50% de las veces.
binomial? c) ¿Cuál es la probabilidad de que el indicador esté en lo
¿Cuí,I es la desviación esríndar de la
distibución binomial? conecto 35 o más veces en 44 años?
¿Curíl aprobabiiidad de que 15 de los 20 cli€ntes devuel-
la á) ¿Qué le indica esto acerca de la utilidad de este indicador?
van un aparato en el que 'ho se encontó un problema"?
5.4ó En 2009 se perdieron aproximadamente 300 millones
¿Cuál es la probabilidad de que no más de 10 de los
de pelotas de golf en Estados Unidos. Suponga que el nú-
clientes dewelvan un aparato en que ,,no el se encontró
problema"? mero de pelotas de golfperdidas en un partido de 18 hoyos
un
se distribuye como una variable aleatoria de Poisson con
¿Cr:.íl es la probabilidad de que l0 o m¿ás de los clientes de-
vuelvan un aparato en el que una media de 5 pelotas.
'ho se mcontró un problema"?
a) ¿Qué supuesto se necesita hacer p¡¡ra que el número de
¡.43 Remítase al problema 5.42. Durante el mismo pe-
pelotas de golfperdidas en un partido de 18 hoyos se dis-
nodo, 27oA de las devoluciones se debieron ,.anepenti-
a tribuya como una variable aleatoria de Poisson?
¡uento del comprador".
¿)
Si se hacen las suposiciones del inciso a), ¿cu.íl es la proba-
¿Cuál es el valor esperado o la media de Ia distribución
bnomial? bilidad de que
ó) á) se pierdan 0 pelotas en u¡ partido de 18 hoyos?
¿Curíl es la desviación estrindar de la
distrbución binomial?
F c) ¿Cuál es ta probabilidad c) se pierdan 5 o menos pelotas en un partido de 18 hoyos?
de que ninguno de los 20 clien-
Ies devuelva un aparato "porque d) se pierdan 6 o m:is pelotas en un pafido de 18 hoyos?
€s. si ,, se arrepintió"?
d)¿Cuál es
la probabilidad áe que no más de 2 de los clien- 5.47 Según una encuesta de Virginia Tecb, los esh¡diantes uoi-
Ies hagan una
-, devolución "porque se arrepintieron"? versitarios realizan un promedio de l1 llamadas por teléfono
¿)
¿Cuál es la probabilidad dl qúe 3 o más de los clientes celular cada día. Ademrís, 80% de los estudiattes encueshdos
laga¡ nn¡ (sy6[¡6ión "porque se arrepintieron"?
indicaron que sus padres pagan los gastos de su teléfono celular
196 CAPÍTITLO 5 Distibuciones de probabilidad disc¡eta

c) Si selecciona una muestra aleatoria de 10 estudlaotes, ¿*


(J. Elliot, "Professor Researches Cell Phone Usage Among
distnbución podria utilizar pan modelar ta proporción dr
it'rdents", www.physorg.com, 26 de febrero de 2007)'
estudiantes cuyos padres que pagan sus gastos de telefonia
a)
' ¿Qué distibuiión podría utilizar para modelar el número
celular?
áe lumud"s qu. un estudiante realiza en un día?
probabili- d) Utilizando la distribución seleccionarla en c), ¿cuíl h j
Si selecciona un estudiante al azar, ¿cuál es la
es
á) padr-e-s que pagan
dad de que realice más de 10 llamadas en un día? ¿Más
probabilidad de que 1os 10 tengan ¡,
eastos de telefonía celular? ¿Al menos 9? ¿Al menos ¡r
de 15? ¿Nfas de 20?

Suponga que luego la encuesta real de 50 clientes pote¡¡¡u.


El departamento de marketing de Ashland MultiComn Servi-
les. cuano se suscriben al servício 3-For-AII'
ces (AMS) desea aumentar las suscripciones para su s€rvrclo
d) ¿Qué indica esto acerca de la estimación anterior {s l¡
combinado de teléfono, cable e Intemet 3-Fo r-AII EI depant
proporción de clientes que se suscribirían al servic;q
úento de marketing de AMS puso en ma¡cha una campaña
postales y 3-For-Alll
agresiva de marketing directo que incluye correos
Rehoalimenta- 2. En lugar de evttar ofrecer canales de alta calidad giatLnoq
eiectrónicos, así como solicitudes telefónicas'
de alta como en el problema i, zuponga que se incltryen dos ca¡x'
ción de esos esfuerzos indica que la inclusión de canales
les de alta calidad gratuitos en el sewicio 3-For-AllDü*
calidad en este servicio combinado es un factor muy impor-
los result¿dos anteriores, ¿cuá es la probabilidad de que
tante para los suscriptores actuales y los posibles suscriptores'
¿) menos de 3 clientes se suscriban al servicio -l-For-,4]P
Despues de varias sesiones de lluüa de ideas' el deparamento
calidad á) cero clientes o un cliente se suscriban al servicio
de Áarketing decidió agregar canales de cable de altra
3-For-Alll
como rm beneficio sin costo al suscribirse al' servtcio 3-For-All'
c) miis de cuaho clieútes se suscriban al servicio 'i-For-llll i
Mona Fields, directora de nvesrigación, está planeando
d) Compare los resftados de los incisos a) a c) con los dell i
realizar una encuesta eDhe clientes potenciales para deterrLi-
Suponga que luego de la encuesta real de 50 clients ¡
nar cuántos canales de alta calidad deben añadirse al servicio potenciales,6 se suscriben al servicio J-tor'AIl' . i
j-For-AlI pana geterar una suscripción al mismo Con base .
e¡ ¿qué indica esto acerca de la estimación antenor de l¡ i
'
* an-teriores y en datos de la i¡dustri4 esüma lo
proporción de clientes que se suscribirían al servicio ;
"".p"ñ*
sisuiente: 3-For-Alf!
del inciso e) acerca del efcto*
Número de canales Probabilidad de -/) ¿Qué inclica el resultado
de alta calidad gratuitos sobre Ia probali'
gratuitos suscripciones ófrecer canales
de altx calidad
lidad de obtener suscripciones al servicto 3-For-AlÍl
0.02 po
0 3. Suponga que se aplicaron otras encuestas a 50 clientes
0.04 canales dc
tenciat-es en las que se varió el número de
¡lt¿
1

2 0.0ó calidad gratuitos y que los resultados fueron los siguientm:


3 0.07
4 0.08 Número de canales Número de
5 0.085 de alta calidad gratuitos suscripciones

1. Si se selecciona una muestra de 50 clientes potenciales


y I 5

servi 3 6
no se agregan canales de alta calidad a la ofert¿ del
s
litu
cio 3-For-All, dados los resultados anteriores' ¿cuál es
probabilidad de que
la 4
5
6
,7

.iil
.f,{} ¿) menos de tes clientes se suscriban al seúicio 3'For-All?
calidad gratuitos debe recomendir
ái cero clientes o un cliente se suscriban al servicio ¿Curintos canales de alta
t,h la directora de investigación que se incluyan en el
servici0
I' irtr 3-For-Alf!
rrii:
c) más de cuato cüentes se suscriban al sewicio 3'For'Al!l 3-For-Alll Explique su respuesta.

l:ir t¡c
3. Minitab Release 16 (State College, PA: Mínrtab'
,: i* l. Levine, D. M., P. Ramsey y R. Smidt, Applíed Statistics
l0).
$$ - - ¿t ¿ ngineers and Scientkts (Jsing Miuosoft Excel and
'M¡n¡tib
20
A., M. G simkin y N A Bagranofl
[od
ll CtJooer Saddle River, NJ: Pientice Hall' 2001)'
4. ü;r.0"., S.
L io'-
'
\ Concepts of Accounling Informatíon Syslems'
2. Microsoft Éicel2010 (Redmond, WA: Microsoft Corp''
2010). fNueva York: WileY, 2010).
uura oe I caplruo ) para txcet ly I

1. DISTRIBUOÓN DE PROBABILIDAD Binomial. En el cuadro de diálogo del procedimiento (que


PARA UNA VARIABLE ALEATORIA se muestra en la siguiente columna):

D6CRETA l. Ingrese 4 como Sample Size.


orofundidad Utilice la hoja de cálculo COMPUTE 2. Ingrese 0.1 como Prob. ofan Event of Interest.
Discrete Random Variable (que se muestra abajo) 3. Ingrese 0 como valor de Outcomes Fron y escriba 4
para calcular el valor esperado, la varianza y como valor de (Outcomes) To.
estándar de una variable aleatoria discreta. L¿ 4. Escriba un título en Title, marque Histogram y haga
cálculo contiene los datos del ejernplo de la sección clic en OK.
en la página 178, acerca del núme¡o de inte-
por día en una gran red de cómputo. Para otros
escriba sobre los valores Xy en las colum- P(!
B, respectivam€nte. Si un probiema tiene más o me-
resultados, seleccione el rango de celdas A5:85. Si
tiene miás de seis resultados:

cüc con el botón derecho y luego haga clic €n Ins€rt


menú nipido.
aparece un cuadro de diálogo, haga clic en Shift cells
y luego haga clic en OK. a,
los pasos I y 2 las veces que sea necesítno.
las fórmulas en el rango de celdas C4:E4 y
en los nuevos renglones de la tabla. o
los nuevos valores X y P(X) en las colur¡rnas o
yB.
o
(D
N
tiene menos de seis resultados, haga clic con {
derecho y seleccione Delete del menú rápido. Si
;e un cuadro de diálogo, haga clic en Shift cells up y

en OK. Repita este procedimiento las veces que sea


y luego ingrese los nuevos valores Xy P(JQ en las Para agegar colunmas a la tabla de probabilidades binomiales
para P(< = X), P(< X), P(> E y PP_ X\ marque Cumula-
A vB.
tive Probabiüties antes de hacer clic en OK en el paso 4.

Excel en profundidad Utilice la función BINOMDIST


de la hoja de cálculo para determimr probabilidades bino-
miales. Ingrese Ia función como BINOMDIST (X, larzaña
0 1,9ó
olJ 0,76: muestral, n" acumulada), donde X es el número de eventos
- de interés, n es la probabilidad de un evento de interés y
iio; o¡, ¿.si .!.P6, tqa ü-qrtF¡ f)G.{rlF2. acumulada es un v¿lor Verdadero o Falso. (Cuando acu-
!:9tr . ..q ¡: 6,?6
.0.11!i :A4i84
{44-sHs3}^t
I a,75t !2961 9.M; =a5'85 la5-s8$3)¡? :O5'85 mulada es Yerdadero, la función calcula la probabilidad de
{a6 - trslr2 Xo menos eventos de interés; cuando act mulada esFalso,
={47 - $srr2
={A8 - 98S!)^2 :O8'88 la función calcula la probabilidad de exactamente X eventos
:14!:!!9lr¡ :O9 r9t
de i¡terés).
Utilice la hoja de cálculo COMPUTE del libro Bi-
nomial, que se muestra en la figura 5.2 de la página 186,
.2 DISTRIBUCIÓN BINOMIAL como plantilla para calcular probabilidades binomiales. La
hoja de cálculo contiene los datos para el ejemplo de los
rb, Utilice Binomial para calcular probabilidades bi- pedidos marcados de la sección 5.2. Escriba sobre esos va-
uales. Por ejemplo, para
crear una labla de probabilida- lores y ajuste la tabla de probabilidades para otros proble-
ornomiales y un
histograma para el ejemplo 5.3, incluido Ílas. Para crear un histog¡ama de la distribución de
la página t8s, simrlÁ n to.'¿" t^ figuras 5.2 y 5.3, se- probabilidad, utilice las instrucciones de la sección F.5 en
crotre PHStat + Probability & prob. Distributions ) los apéndices.
1 98 cAPÍTtil-o 5 Distribuciones de probabilidad disc¡eta

Para agregar columnas a la tabla de probabilidades P6i*n


GE5.3 DISTRIBUCIÓN POISSON
en P(< = X), P(< tr¡ P(> X) y P(3 $,
marque Cum¡¡¿¡rj
PHStat Utilice Poisson para calcular probabiiidades Poisson. Probabilities antes de hacer clic en OK en el paso 2. p¡,
Por ejernplo. para crear trna tabla de probabilidades Poisson si- crear un histograma de las distnbuciones de probabilid¿¿,i
milar a la de la figura 5.4, incluida en la págiaa 19l, selec- una hoja gráfica separada, marque llistogram antes de
cione PHStat t Prob¿bility & Prob. Distributions ) cer clic en OK en el paso 2.
ha.

Poisson. En el cuaclro de diálogo del procedimiento (que se


muestra abajo): Excel en profundidad Utilice la función POISSON de la

hoja de cálculo para calcular probabilidades Poisson. Ing¡$,


1. Ingrese 3 como Mean/Expected No. of Events of
Inter€st. la firnción como POISSON(X, lamhda, acumuladu),6¡n¡,
X es el número de eventos de interés, /amóda es el prornsdl,
2. Escriba un tíhrlo en Title y haga clic en OK.
o el número esperado de eventos de interés y acumulatla es
un valor Verdadero o Falso. (Cuando aclrmulcdo es \¡erd¡.
dero, la frrnción calcula la probabilidad de X o menos evsnl.t
de interés; cuando acumulada es Falso, 1a función calcul¡ ¡,
probabilidad de exactamente X eventos de interés).
Utilice la hoja de cálculo COMPUTI' del libro Pois.
son, que se muestra en la hgura 5.4 de la págim 191, co¡¡
plantilla para calcular probabilidades Poisson. La hc'
cálculo contiene los datos para el problema sobre la lleg*
de los clientes del banco en la sección 5.3. Para adaptar e$r
hoja de cálculo a otros problemas, cambie Mean/[xpected
Number of Events of Interest en la celda 84. Para c¡earun
histograma de la distribución de probabilidad, utilice lar
instrucciones de la sección F.5 en los apéndices.

GM5.1 DISTRIBUCIÓN DE PROBABILIDAD


PARA UNA VARIABLE ALEATORIA
DISCRETA
Valor esperado de una variable
aleato¡:ia discreta
Utilice Calculator para calcular el valor esperado de una
variable aleatoria discreta. Por ejemplo, para calcular el va-
lor esperado en el ejemplo de la sección 5.1, incluido en la
página 178, acerca del número de intemrpciones por dia en
una gran red de computadoras, abra la hoja de cálculo Ta-
ble-5.1. Seleccione Calc )Calculator' En el cuadro de
diáiogo Calculator (que se observa a la derecha):

1, Ingrese C3 en el cuadro Store result in variable y


luego presione Tab. (C3 es la primera columna vacía en
la hoja de cálculo).
2. Haga doble clic en Cl X en la lista de variables para
1 Ingrese X*P(X) como nombre de la colunura C3
X al cuadro ExPression
agregar
*
3. Haga clic en * en el teclado simulado para agregar al )
8. Seleccione nuevamente Calc Calculator'
cuadro Expression. En el cuadro de diálogo Calculator' ¡
4. Haga doble clic en C2 P(X) en la lista de vanables para
formar la expresión X * 'P(X)' en el cuadro Expression' 9. Ingrese C4 en el cuadro Store result in vari¡blel
vac'o*
5. Marque Assign as a formula. Iuego presione Tab. {C4 es la primera columna .

6, Haea clic en OK. la hoja de cálculo) I


¡
¡
I
Distribución normal

UsO DE LA ESTADíÍICA en ó.3 Evaluación Revisión del USO DE LA


OurCampus! de la normalidad ESTADísTKA en OurCampusl
Comparación de las caracte-
6.1 Distribucíones de rísticas de los datos con culn oel cepírurc o
probabilidad continuas las oropiedades teóricas PARA EXCEL
Construcción de la gráfica de
6.2 Digtribuciónnormal
probabilidad normal gull oeL cApítuto ¿
PARA MINITAB
Cálculo de probabilidades
con la normal

PIENSE EN LO SIGUIENTE:
¿Qué es normal?

EXPLORACIONES
VISUALES.
Exploración de la
distribución normal

probabilidades a partir de
distribución normal para re

,--l
OurCampus !

trabaja como diseñador en el sitio web de Or:¡Campus!, un sitio de redes sociales


dirigido a estudiantes universiiarios. Para atraer y conservar
a los visitantes del sitio,
necesita asegurarse de que los üdeos diarios de contenido exclusivo pued¡n descargarse
y reproducirse con rapidez en el navegador del usuario. El tiempo de descarga, la
cantidad de tiempo (en segundos) desde el primer contacto con la página principal
del sitio web hast¿ el momento en que el primer video está listo para reproducirse,
depende tanto de la tecnología de transmisión multimedia como del
número de usuarios simultá¡eos del sitio web.
Para venficar la rapidez de descarga de un üdeo, abre un
buscador de lntemet en una PC de l¿s oficin¡s corporaüvas
de OurCampus ! y mide el tiempo de descarga. Datos
anteriores indican que el tiempo medio de descarga es de
T,segundos y que la desviación estand¿r es de 2 segundos.
Aproximadamente dos terceras partes de los tiempos de
descarga varían entre 5 y 9 segudos, y al¡ededor de
95% de los tiempos de descarga varían entre 3 y 11
segundos. En otras palabras, los tiempos de descarga
se distribuyen en una curva en forma de carnpana,
con un asuoamiento de los datos al¡ededor de la
media de 7 segundos. ¿De qué manerapodria u¡liza¡
esta información para responder pregu¡tas acerca
de los tiempos de descarga del primer video?

201
202 .**tJ-^.oució¡norm¿l
T
fl n el capínrlo S,.los di¡ectivos de Saxon Home lmprovement Company deseaüan respqnl I
ff preguntas acerca del número de articulos m¿rcados en un tamaño de muesra ¿eterhi¡; i
IJComo diseñador de OurCampus!, usted enfrenta una tarea dif€rente, la cual inplie J E

medición continua debido a que el tiempo de descarga podría tomar cualquia valor y no s¡¡fr !
núme¡o entero. ¿Cuáles serían sus respuestas a preguntas como las que siguen acerca ¿s,fr i
variable mtmérica continua'l t
. ¿Qué proporción de las descargas del video toman más de 9 segundos? [
. ¿Cuantos segundos transcurren antes de que se complete el 10% de las
descargas?i
. ¿Cufurtos segundos üaúscurren atrtes de que se complete el 99olo de
las descargas?i
. ¿Cóno influhán las mejoru en la tecnología de ta¡smisión mullimedia que se utilice e[ ¡¡¡ |
respuestas a estas Pregultas? !
Al igual que en el capítulo 5, puede utilizar una distibución de probabilidad como modelo.lr
lecfira de este capíhrlo le ayudará a conócer las características de las distsibuciones de probabili¿¡¡
continuas y la manera de utilizar la distibución normal para resolver problemas de negocios.

6.I Distribuciones de probabilidad continuas


Una función de densidad de probabilidad es una expresión matemática que defile la dis¡i$
ción de los valores para una variable aleatoria continu¿. En la figura 6.1 se presentan gáficas 6
hes funciones de densidad de probabiüdad-

FIGURA ó.1
Tres distribuciones
u,
de probabilidad
continuas

o
Valores de X Valores de X Valores de X o
Gráfica A Gráfica B Gráfica C
o
(D
D¡stribuc¡ón normal Distribuc¡ón uniforme Distribución exponencial N
to
La gnífica A describe ¡nt distribución ¿orn¿l. La distibución normal es siméúica y forma w
campan4 lo que impüca que la mayoría de los valores tienden a agnrparse alrededor de la mdi4h
cu¿I, debido a la foma siménica de la distibucióq es igual a la mediana- Aunque e,n una distrtuciot
nonnal los vaiores pueden variar desde el infinito negativo hasta el infilito positivo, su forma h¡a
= que sea muy improbable que ocun'aa valores extemadame,nte grandes o muy pequeños.
-
i La gniirca b describá wa disnibución unifurme, donde cada valor tiene la misma probabiü
dad de ócur¡i¡ en cualquier parte del rango, ente el valor mrás pequeüo y el valor más grande i'a
distibución unifon¡e, que también se conoce como d¿s tribución rectangular, es simétric4 por Io

oo'f"Tffi:'¿#
ili?#ff;^^"rn
exponenciat,taotal eshi sesgada hacia ra derecha,Eo
¡t vocando que la media sea menor que la mediana. El rango para una distribución exponenculvl
*, _ , -
d9!99¡o aiinfurito positivo, pero su forma hace que sea muy improbable la ocunencia de valorel
..-
,ñ.
. rfreptdametite giandesr'
,l
't
-*I
.

',i
'-6.2 Distribuciónnormil
- -
-:--
.ir : -. La distribución.normal (en ocasiones conocida como distribución gaussiara) es la distribuoor
,,i

conti¡ua de uso m¡ís común en Ia estadística. La distibució¡ normal es muy importante pars
.i estadística sobre todo por hes razones:
¡r{ . Diversas variables continuas que son comunes en la adminisF¿ción tienen distribucio¡d
t.:;
i[.]
.- parecen
^,,- se
que -,,^La aa la
^".-^- mucho r. distribución normal. . !:ri_
+ . La distibución normal se puede utilizar para aproximar varias distribuciones de probour
.'i
'\,, .
dad discretas.
a9
La distribución normal conformq las bues parala inJer.m! eydí:t(y cl,á1!9¿ debido
relación con el teorc¡na del límite central (que se estudia¡á en la sección 7.4)'
6.2 Distihxión ¡orn¡l 203

La distribución normal se repres€ot¿ con la clásica fo¡ma de campa¡a que se obs€rva en la


gnáfica A de la figura 6.1. En Ia distibución nonnal se puede calculu la probabilidad de que los
valores se presenten dento de ciertos raagos o i¡tervalos. Sin embargo, debido a que la probabiü-
dad de las variables continuas se mide como un área bajo la curva, la probabilidad exacta de in
valor particular a partir de una distribución continua, tal como la distibución normal, es cero.
Como ejemplo, el tiempo (en segundos) se mide y no se cuenta Por lo tanto, pode,mos determinar
la probabüdad de que el tiempo de descarga para un video en un navegador de Int€rnet varíe ent€
7 y 10 segundos, o la probabilidad de que el tiempo de descarga sea de ente 8 y 9 segundos, o la
probabilidad de que el tiempo de descarga sea de eirte 7.99 y 8.01 segundos. No obstanté, l¿ pro-
babiüdad de que el tiempo de descarga s@. q,acttnente de 8 segundos es cero.
l¿ distrbucion norm¿l tiene varias propiedades t€óricas importatrtes:
. Es simética, por lo que su media y su mediana son iguales.
. fiene la apariencia de una campana- .
. Su rango intercuartil es igual a 1.33 dewiaciones est¡indar. Por lo t¿nto, el 5ülo de los va-
miad está¡ contenidos deirho de un interrr¿lo de dos tercios de ¡ma
lores que se ubican a la
desviación estindar por debajo de la media y dos tercios d€ "ña dewiación estándar por
a¡¡rba de la media.
. Tiene un rango infnito (-- < Í< m).
En la pníctic4 muchas variables tienen distibuciones que se asemejan mucho a las propieda-
des teó¡icas de la distibución normal. Los datos de la tabla 6.1 representan la cantidad de bebid¿
gaseosa en 10,000 botellas de un lit¡o que fueron llenadas durante un dla, La variable co¡tinu¿
de interés, la cantid¿d de lleaado de bebida gaseos4 se puede aproximar por medio de la distibu-
ción no¡nal. Las mediciones de la ca¡tidad de bebida gaseosa eD las 10,000 botellas se agrupan en
el intervalo de 1.05 a 1.055 litos, y se distibuyen de forma simética alrededor de esa agrupa-
ción, formando rm panon en forma de campana"

ó. f Cuüd¡d de llen¡do FrYecuenci¡ rcl¡tiv¡


de llenado < 1.v25 .48/10,000= 0.0048
botellas 1.025 < 1.030 122110,000= 0.0rn
1.030 < 1.035 325 /10,0N = 0.0325
1.035 < 1.0¿10 695/10,000 :0.0695
1.040 < 1.045 1,198/10,000 = 0.1198
1.045 < 1.050 1,664110,000 = 0.1664
1.050 < 1.055 1,896/10,000 = 0.1896
1.055 <1.060 1,664/10,000 = 0.1664
1.060 <1.065 1,198/10,000 = 0.1198
1.065 <1.070 695/10,000 = 0.0695
1.070 <1.075 32s /10,000 = 0.032s
1.075 <1.080 122/10,000 = 0.0122
1.080 o mtís a8l10,000 = 0.0048
Total 1.0000

En la ñgura 6.2 se observan el histograma y el polígono de frecuencia relativa para la dishbu- ,,


ción de las cantidades de llenado en 10.000 botell¡s.

A ó.2
ray
de
relat¡va
de
en 1 0,000
de una
gaseosa

datos
de /a
1.025 1.035 1.045 1.055 1.065 1.075
1.03 1.04 1.05 1.06 1.07 1.08
C€nt¡dades de llenado {litros}
204 cA.Pfrulo 6 Distibución normal

Para esos datos se cubren aproximadamente las primeras tes propiedades teóricas
de la disq6

ción no¡mal. Sin embargo, la cuart4 esto es, que tenga un raago i¡finito,.no se cum¡le. c¿¡t¡* la
de lle,¡ado en una botella no puede ser cero o menos de cero, y es imposlble renafla q1s dlá Oo,
capacidad. En la tabla 6.1 se óbserva que se espera qurc solo 48 de cada 10,000 boqlT,l*td^ -;
que 1'025 üfos
tengan 1.08 litos o más, y se espera que el mismo número conteogn€nos
Elsimbolo/(l)seuol-p-n'.p..'*t''unafimcióndedensidaddeFobabilidad.I.¿folcü[
póbabilidaá parala distribución normal está dada por la ecuación (6.1).
de densirtad dá

FUI{CIÓN DE DENSIDAD DE PROBABILIDAD NORMAL


t_.
f( A = -*- e-0 lz)l(x- t')/" l' (6.1)
\/2ra
donde:

e = constante matemática ap¡oximada por 2.71828


t! = coústante mat€mática aproxirnada por 3.14159
I = media
o = dewiación estlíndar
1= cualquier valor de l¿ variable continu4 donde (-oo < X< oo)

Aunque la ecuación (6. i ) tal vez parezca complicad4 ya que como .¿ y t¡ son constantes m&. ,

máticas, iL probabilidades de la variable aleatoria Xdependen únicamente de los dos panámet6


.

de la tlistribución normal: la medi4 ¡, y la desviación estándaf, d'. cada vez


que se especifica¡ '

valores particulare s de p y o, se genera una distribución de probabili dad Ñtual diferente.E\h '.

ñgura 6i se ilusta este priocipio. Las distibuciones I I


y tien€n la misna media (a), po.o
l.ol(dj 3
diferentes desviaciones esüá,ndar. Las distribuciones I y C tienen la mism¿ desviaclÓn estandar k
Dero diferentes medias. Las distribuciones I y C tienen diferantes valores de p y a'
o
:

Io
FIGURA ó.3 c¡
Tres distribuciones

normales
o

Cálculo de probabilidades con la normal


Para calcular probabilidades con la normal primero se convierte una variable aleatoria
distribuld¡
lfiiliualdo fórmula de tr¡Ñ
normalnente, x, en una v¡riable ¡Ieatoria nornal es tlad']f , z, la
I;F formación que ie presenta en la ecuación (6.2). La apücacióo de esta fórmr¡la permite la búsqud¡
y cornple
;ü de valores á una übla de probabilidades de la normal para evitar los cálculos tsdiosos
jos que eúge Ia ecuación (6.1).
I
1:
LA FÓRMULA DE TRANSFORMAOÓN
.: ll 0'
El valor Z es igual a la diferencia ent.e ,{ y la media p, diüdida eote la clesviación estínda¡
r:i
] .,1 a- X- u
_____----:- (ó.2)
o
r.:i'
''
i^S
'i¡ La fórmula de transformación calcula un valor Z que expresa la diferencia del valor de
la f n'd'
¡ en unidades de la dewiación está¡da¡ (véase la sección 3 .2 en la página 1 04\ Ilamzdas .unrw ¿' !
estandarizadas.lvltent as que una variable aleatoriaxtiene uoa media p y una desviación está'nda¡
va¡iable aleatoria estanda¡ Z siempre tiene una media p = 0 y una desviación es&ándar o = I
62 Distibucion norm¡l 205

Luego podemos determinar la probabilidad utilizando la tabla E.2, la distribución tormal


estánd¡r ¡cumühdr. Por ejemplo, en la sección sobrc el Uso de la estadística incluida en lzÍ pá-
eim 201, los datos anteriores indican que el tiempo para descagar rn video se disuibuye de manera
normal,conunamedia¡=Tsegundosy"ttadesviaciónestándara=2segundos.Enlafigr:ra6.4
se obs€rva que cada mediciónXti€ne rm¡ medición est¡ind¿r Z conespondiente, calculada por me-
dio de la ecuación (6.2), la fórnula de tansformación. Por lo tanto, un tiempo de descarga de
9 segundos es equivalenb a 1 unidad ctlándar (l dewiación estándar) por aniba de la nedi4 porque

Z:' ¿:' =+l

Ti€mpo de d$cargE
d6lv¡d€o de Ourcamousl

I 11 13 Escslsx(p=7,a=21
+1 +2 +3 Escalazlt¡=0.o=1)

Un tiempo de desca4a de I segundo es equivalente a -3 unidades est¿inda¡ (3 desviacio¡es


esrándar) por debajo de la media, porque

Z= - ¿ = -3
='
En la figura 6.4 se obsen a que la dewiación estrá¡dar es la unidad de medición En otra6 pala-
bras, un tiempo de 9 segundos es 2 segundoo (t desviación estÁndar) mayor (;zrÍs brro) que el tiempo
promeilio de 7 segundos. De m¡aera simila¡', un tiempo de I segundo es 6 segundos (3 dewiacio-
nes esüindar) menor (nas rópido) qre el tienpo promedio.
Pr:¿ ilustar más l¡ f&mula dc transformacióD, srponga que el tie."Fo de descarga de un video
de oto sitio web se disnbuye de manera nomal, con
"n¡ media p = 4 segundos y una desviación
esüínda¡ o = I segundo. En la ñgura 6.5 se presenta esta distibución.

4 Esca¡a X{p= 4, a= 1)

-3 -2 -1 0 +1 +2 +3 Esc8l8 Z(p= 0. d = l)
_._: il
206 cAriTuLo6 Distibución nonnat F
I
A1 comparar esos resulados con los del sitio web de OurCampus!, se observa que un tie6* í
descarga de 5 seguodos estrí I desüación esüinda¡ por arriba del tiempo medio de descarga pqrqt- "
a-L
Z=:------ =+l
Un tiemrpo de I segrmdo esüi 3 dewiaciones estrindar por debajo del tiempo nedio de descarga porqq

Después de obtener el valor Z buscamos la probabilidad normal utilizando una tabla de v¡¡"
res a partir de la distibución no¡mal esuindar acumuladg como la tabla E.2 del apendice !. 5|l.
ponga que quiere calcular la probabilidad de que el tiempo de descarga para el sitio web de
OrCampus! es menor que 9 segundos. En la página 205 vimos que la tansformación de X= 9 a
unirtadesZestándar,dadasunamediadep=Tsegundosyunadesüaciónest¡indaro=2se$¡.
dos, conduce a un v¡e¡ / ds + 1.00.
Una vez que tenemos este valor, utilizamos la tabla E.2 para calcular el área acumulativa bg6
la curva ¡o¡mal menor que (a la izqui erdz de\ Z = + I .00. Para leer la probabilidad o rárea bajo ¡¡
cuwa menor que Z = + 1.00, buscamos hacia abajo en la coh¡¡na Z en l¿ tabla 8.2 hasta locatia¡
el valor Z de interés (en décimas) en el renglón Z para 1.0. Después, buscamos a lo la¡go de we
renglón hasta interceptar la column¿ que contiene el centésimo del valor Z. Por lo t¿nto, enei
cuerpo de la tabl4 la probabilidad para Z = 1.00 conesponde a la intersección del renglón Z = 1.0
con la columna Z = 0.00. En la abla 6.2, donde se reproduce una parte de la tabla 8.2, se mues¡¡
esta intersección. La probabilidad que se muestra en la intersección es 0'8413, lo cual signlu
que hay 84.13% de probabilidades de que el tiempo de descarga sea menor que 9 segundos. Er o
la ñgura 6.ó se muesta una gnifica de esta probabilidad
=
TABLA ó.2 o
Probabilidades acumu.ladas o
Cálculo del área
.07
o
acumulada bajo (¡t
(¡t
la curva normal .5040 .5080 .5120 .5160 .s199 .5239 5279 .5319 .5359
0.0
0.1 .5438 .5478 .5517 / .)JvO .5636
.5JJ .5675 .57t4 .s153
0.2 s832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
0.3 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
0.4 .6591 .6628 .666/. .6700 .6736 .67't2 .6808 .6844 .6879
0.J .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
0.6 .729t .1324 .135'7 .7389 .7422 .7454 .7486 .7518 .1549
0.7 .1612 ;1642 .7673 .7704 .7'134 .7764 .1794 .7823 .7852
0.8 ;7910 .7939 .1967 .199s .8023 .8051 .8078 .8106 .8133
0.9 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
.8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8ó21
Fu€nt€: Extaído de la tabla E.2.

FIGURA ó.ó Tlempo de desca¡ga


del video de OurcamDusl
Determinación del
I área menor que Z
apart¡r de una
distr¡bución normal
,l estándar acumulada

,t.
.i!
1 3 5 7 9 11 13 Escala X
:t,
-3,00 -2.00 -1.00 0 +1.00 +2.00 +3.00 Escals Z

Sin embargo, para el otro sitio web se observa que un tiempo de 5 segundos está I umdad
quo''
estandar por arriba del tiempo medio de 4 segundos. De esta manera, la Probabiiidad de
i

6.2 Distibucion no¡mal 207


I

tiempo de descarga sea m€nor que 5 se$mdos tambien es de 0.8413. En la figura 6.7 se observa
que, sin irnportar el valor de la media p y de la desviacióu estándar a de una va¡iable üstribuida de
maaera normal, la ecuación (6.2) puede transformar el valor X en un valor Z.

URA ó'7 Otro s¡tio web

Íansformaclon
¡las Pañ¡ ,
acumulaoaS

de dos curvas

Ahora que ya aprendimos a usa¡ la tabla E.2 co¡ la ecuación (6.2), estaremos en condiciones
de reqponda muchas preguntas relacionadas con la descarga de üdeos en OurCampus! utilizando
la distibución normal.

A' ¿Curíl es la probabiüdad de que el tiempo de descarga de videos en el sitio web de OurCampus !

sea de al menos 9 segundos?


de flX>9)
SOLUCÉN Ia probabilidad de que el tiempo de desca¡ga sea menor que 9 segundos es de 0. 84 I 3
(véase la figura 6.6 incluida en la págiaa 206). Así, la probabilidad de que el tiempo de descarga
sea de al menos 9 segundos es el cozplanento de menor quc 9 segrmdos, 1 - 0.8413 = 0.1587. En
la fieum 6.8 se ilustra este resultado.

FIGURA ó.8
deflX>9)

Area = 0.1587

E 7 9 '11 '13 Escala X


-3.00 -2.00 -1.00 0 +1.00 +2.00 +3.00 Escala Z

¡JEMPLG é"3 ¿Curíl es la probabilidad de que el tiempo de descarga de videos en el siüo web de OurCampus !

sea menor que 7 segundos o mayor que 9 segundos?


Cálculo de
flX<7ox>9) SOLUCÉN Para obtena esta probabilida( calculamos de manera separada la probabilidad de un
tieryo de descarga menor que 7 segundos y la probabiüdad de un tiempo de descarga mayor que 9
segundos, y después sumamos ambas probabilidades. En la figura 6.9 de la página 208 se ilusta este
resultado. Como la media es 7 seguados, 50% de los tiempos de descarga son meirores que 7 segun-
dos. A partir del ejemplo 6. I , sabemos qr la ptobabiüdad de que el tiernpo de descarga sea mayor que
9 segundos es de 0.1587. Por lo tanto, la probabilidad de que el tiempo de descarga sea menor
que 7 segudos o mayor que 9 segundos, .P(1 < 7 o X> 9), es de 0.5000 + 0. I 587 = 0.6587.
208 cAPiTULo 6 Dist¡ibución no¡mal J
,
FIGURA ó.9 Area = 0.34'13 porqu6 I
0.8413-0.5000=0.913
Cálculo de
P(X<7oX>9)

l'¡E 7 9 11 13 Escala X
-3.00 -2.00 -1.00 0 +1.00 +2.00 +3.00 Escala Z

*iEMPL* é.3 ¿Cuál es la probabilidad de que el üempo de descarga de videos en el


sitio web de OurCa¡p¡¡r
sea de ente 5 y 9 segundos, es decir' P(5 <X< 9)?
Cálculo de
fl5 < X< 9) SOLUCÉN En Ia figura 6.10 se observa que el área de interés se localiza ente dos valorcs, 5 y 9.

Aroa = 0.1587 porque Area acumulada = 0.8413 porque


FIGURA ó.10
7= X-tt =-t.oo
X-lA
z= =,1.@
Cálculo de
P(5<X<9)

1 3 5 7 9 11 13 Escala x
-3.00 -2.00 -1.00 0 +1.00 +2.00 +3.00 Escala Z

En el ejemplo 6.1 de la página 207 se calculó que el área bajo la curva normal menor que9

segu:rdos es 0.8413. Para obtener el área bajo la cuwa normal menor que 5 segundos,

7 = :------ --
-2
Usamos la tabla E.2 para,ter que Z = -l .00 y encontar 0.1587' Por lo unto, 1a probabilidad dc
que el tiempo de descarga sea de entre 5 y 9 segundos es de 0.8413 - 0.1587 = 0.6826, co¡no st
observa en Ia figura 6.10.

El resultado del ejemplo 6.3 nos pen::ite afirmar que;para cualquier distibución normal, 68 2é%
de los valores caen dento de *1 desviación estandar de la media En la figura 6.1 1 podemos obser'
var que 95.44% de los valores caen denfo de +2 desüaciones esüánd¿r de la media. AÉi,95.44%&
los tiempos de descarga estiín ente los 3 y los 11 segundos. En la figura 6'12 podemos ver
que

99.73% de los valores están def,to de +3 desüaciones estándar por amiba o por debajo de la media
Por consiguiente, 99.73% de los tiempos de descarga están ente 1 y 13 segundos. Por lo tanto'
er

qtÉ
poco probable (0.0027 o solo 27 en 10,000) que un tiempo de descarga sea tan Épido o tan lento
(es decr. I
tome menos de I segundo o más de 13 segundos' En general, podemos utilizar 6o desot

desviaciones estáadar por debajo de 1a media hasta 3 desüaciones estríndar por arriba de la me¡nl
como una aproximación práctica del rango para los datos qüe se distibuyen de manera nonnal'

FiGURA ó.11 EI área debaio es 0.9772 porque


Cálculo de
fl3<X<11)

5 7 9 11 13 Escala X

-3.00 -2.00 -1.00 0 +1.00 +2.00 +l.uu Escata z


Disfrbución normal 209

A 6.12 El área debajo es 0.00135 porque El á¡ea debajo es 0.99865 porque

z=
r:! =-s.oo z=
X-F
= +3.00
o o
x<13],

1 3 5 7 I 11 13 Escala X
-3.00 -2.00 -1.00 0 +1.00 +2.00 +3.00 Escala Z

En las ñguras 6.10,6.11 y 6.12 se ilustra que para cuaiquier distribución normal,

. Aproximadamente 68.26% de los valores ca€n dento de +1 desviaciones estándar de la media.


95.44% de los valores caen dento de * 2 desviaciones de la media.
. Aproximadamente 99.73% de los valores caen dento de + 3 desüaciones de Ia media.

Este resultado es la justificación para la regla empírica que se presenó en la página I I 8 . La preci-
sión de la rcgla eIpírica aumenta a medida que el conjunto de dafos se aproxima má" a la distibución
normal
Los ejemplos 6.1 a 6.3 requieren el uso de la tabla E.2 de la distibución normal para calcular
un area bajo la curva nonnal que corresponda a un valor X específico. Existen nuchas circunstan-
cias en las que se desea calcula¡ el valorXconespondiente a un área específica- Los ejemplos 6.4
v 6.5 ilu$aa este tioo de situaciones.

6.4 ¿Curánto tiempo (en segundos) tanscunini antes de que el 10% de las descargas más rápidas de los
videos de OrCampus! se completen?
def valor
Pan¡ una Prooa- SOLUCIóN Como se espera que 10% de los videos se descarguen en menos de ,( segrmdos, el
acumulada rirea bajo la curva nomal menor que este valor es 0. 1 000. Utilizando al cuerpo de la tabla 8.2 bus-
0.10 camos el área o la probabilidad de 0.1000. El resultado más cercano es 0.1003, como se observa
en la t¿bla 6.3 (que se extajo de la tabla E.2).

AB[A ó,3
Probabilidades ¡cumuladas
ۇlculo del valor Z
conespondiente a
.03 .04 .05 .06
área-acumulada
particular (0.10)
debajo de la curva
normal
-1.5 .06ó8 .0655 .0643 .0630 .0618 .0606 .0s94 .0582 I .U))v
-1.4 .0808 .0793 .0778 .0764 .0749 .0735 .0721 .0708 .0681,
-1.3 .0968 .0951 .0934 .0918 .0901 .0885 .0869 .0853 .0823
.0985

Fue¡te: ExFaído de la tabl¿ E.2.

Si partimos de esta área hacia los nrÁrgenes de la tabla, enconFamos que el valor Z correspon-
diente al renglón Z (-1.2) y a la colunna Z(.08) específicos es -1.28 (véase la figura 6.13).

FIGURA ó.13
Cálculo de Z para
oeterminar X
210 cA?ÍTuLo6 Disribución normal

Una vez que se obtiene Z, se utiliza la ecuación (6.2) con la fonnula de transformación ¿, ¡,
páeina 204 para determi¡ar el valor X. Dado que

7 =x -ú t"
entonces,

1¡= ¡1 + 7,o

SustituYendo P = 7, o = 2 Y Z = -1.28

X = 7 + (-1.28X2) = 4.'l4segundos
Por lo anto, 10% de los tiempos de descarga son de 4.44 segundos o menos.

En genenl, utilizamos la ecuación (6.3) par¿ calcula¡ un valorx.

CALCULO DE UN VALOR XASOCIADO CON UNA PROBABILIDAD CONOCIDA


El valor X es igual a la media p miis el producto del valo t Z y la desviaciót estinda¡ a.
y: ¡t + Zc (6J)

Para calcular un valor partictlar xociado con una probabilidad conocida se siguen los paso
que se üstan a continuación: a,

l.Dibuje la ctwa normal y luego coloque los valores para la media yXen las escalas.f,y Z
2. Calcule el áLrea acumulada menor que X o
3. Sombree el área de interés.
o
o
4.Utilice la tabla E.2 para determinar el valor Z correspondiente al iirea bajo la curva nornai (D
menor que X. (D
(D
5. Utilice la ecuación (6.3) y despeje X
1¡=¡t+Zc

EJEMPLO ó.3 ¿Cuáles son los valores inferior y superior de X, distribuidos de manera simét¡ic¿ al¡ededor
de la media, que incluyen el 95oA de los tiempos de descarga de un video en el sitio web de
Cálculo de los
OurCampus !?
valores X que
induyen el 95% SOLUOóN En primer lugar, necesitamos calcular el valo¡ inferior de ,f, (llamado Xr) y despuá
de los tiempos de el valor superior deX(llamado fJ. Puesto que 95% de los valores esuin entreX, Y Xoy oomo X,! Xs
descarga son equidistantes de la media, 2.5% de los valores están por debajo de Xr (véase la figura 6.14)

FIGURA ó.14
Cálculo de Z para
determinar X,

Xt7 Escala X
-1.96 0 Escala Z

Aunque no se conoce ,f, es posible calcular el valor Z corespondiente debido a que el á:d
bajo la curva nonnal menor que esta Z es 0.0250. Utilizando el cuerpo de la tabla 6.4 se buscs'"
orobabilidad 0.0250.
6.2 Dstrtusion ncmal 211

BLA 6.1 A¡ea acumulad¡


del valor Z
.04
ii ¿é acum'1"- ;: :
nt 1,)
.oisz
lva de 0'025 .ois8 .0183
irb.jo d" lu t"u .0244 .0239 o?? ?
nofmal -- 1.8 .0359 .0351 .0344 .0336 .0329 .0307 .0301 .0294
Fuedc: Exeaído de l¡ tabla E.2.

Si partimos del cuerpo de la tabla hacia los márgeires, observamos que el valor Z conespon-
diente al renglón Z (-1.9) y la colunna Z (0.06) especíñcos es -1.96.
Una vez que se obtiene Z, el riltimo paio consiste en utiliza¡ la ecuación (6.3) de la página 210
como sigue:

¡= ¡t" + Zo
= 7 + (_1.e6)(2)
=7 -3.92
= 3.08 segundos

Para obtena x, se utiliza un proceso similar. Puesto que solo 2.5% cle las descargas de video
ta¡dan m.ís de .X, segundos, 97 .5% de las descargas de üdeo tardan menos que .{" segundos. A
partir de la simetría de la distribución normal se obtiene que el valor Z deseado, coño se muestra
en la figura 6.15, es +1.96 (dado que z c¿e a la derecha de la media estanda¡izada de 0). Este valor
Z tanbien se puede obtener de la tabla 6.5. Podemos ver que 0.925 es el rirea bajo la curva normal
me,nor que el valor Z de +1.96.

GURA ó.I5
Cálcllo de Z para
X.

Escala X
Escala Z

TAB!A ó,5 Are a acumul¡da


Cálculo del valor Z z .00 .01 .02 .03 .M .0s .07 .0E .09
conespondiente al
area acr:mulada de a
:
0.975 debajo de la + 1.8 .9693 .9699 .9706
curva normal .9756 .9761 .97ü
+2.0 .9772 .9778 .9783 .9788 .9793 .9798 .9808 .98t2 .9817
¡uqtc: Extsído dc l8 bbla E.2.

Utilizando la eouación (6.3) de la p¡gina 210,


y=p"+Za
= 7 + (+1.e6)(2)
= I + 5.92.
= 10.92 segundos

Por lo t¿nto, 95% de los tiempos de descarga estrÍn ente 3.08 y 10.92 segundos.
212 c.A?iTLao 6 Dist¡ibución normal

En lugar de buscar las probabilidades acumul¿das en uoa tabl4 poderoos utilizar Excel o ivli.
nitab para'calcular probabiiidades con la normal La frgura 6.16 es una hoja de cilculo de ei¡i
que calcula probabilidades con la normal para problemas similares a los planteadosen los e¡qol
plos 6.t a 6.+. En la figura 6.17 se presenian los resultados de Minitab Para los ejemplos 6.1 y 6¿

FIGURA 6.1ó
Hoja de cálculo de
Excel para ca lcular
probabilidades con
ta normal

=5rAñ DAnDr¿E{P,84.8t
="ro*oot*{rlr*ri} :5IAl 0A¡D¡iE(El,S4e5l
-roRr¡ 0rs(08,0+85,I¡u€¡
:!¡O8 ol5rIs.B+85,If,UE
+¡onMDr5T{ E¡,g+R5,IUq
+rs{Eu-E14
=S[ANoAROf ¿ElB1l,8¡,85)
:l-¡i oRMDrsf {8t3,84,85,¡¡UE)

+lo¡I'¡SINV(E161
+,aoRr¡¡v{E¡6,¡¡,grl
=8!¡x¡ú

FIGURA ó.'I 7 cumulaüv€ Disúiü¡{on Funclion lrwerss Cumuhiyé Disüibu$on Funcü,on


r¡o-ú úfth ¡.¿u - 7 !¡d ttüdard d€viltlóo - 2 r¡o!¡¡1 r1t! !€a¿ - 7 dd ttedatd <itri¿tfo¡ = 2 l
Resultados de P(x<-¡) .4,
Minitab para los 9 0.1{:1345 0.1 l. a3e90 i<
ejemplos ó.1 y ó.4
i<
lo
lo
rcl
iq¡
t(D
¿Qué es normal? :A
:

calificaciones. un fenómeno que realmenle ocuffe colapso global {véase 'A Finer Formula for Asst
De manera irón¡ca. el especialista en estadistica
que populadzó el uso del lérm¡no 'normal' para en muchas escuelas. sin embargo, ¿alguna vez ha sing Risk', tre /vew forir l7nes, 11 de mayoú ,
pensado qu€ una 'prueba' de esa inlación (que 2010, p. B2). H uso de la disfibución n0ma¡P
describir ta distr¡bución que se estudió en la sec-
hay 'muy pocas'puntuaciones ba¡as porque las vocó que estos bancos sobrestimaran la prdaü
ción 6.2 n0 pretendí.a dar a la distribución el sen-
l¡do de una ocunencia anücipada y coüdiana que püntuac¡ones están sesgadas hacia A y B) ¡mpl¡ca dad de contar con condiciones de nerc¡dl
suele sugerir el adjetvo ,?oma¿ eróneamente que las calif¡caciones deben disüi- estables y subestimaran la probabilidad dep¿d '
En una publicación de 1894, l(arl Pears0n ar- bu¡rse "de manera normal"? cuando termine de das de mercado exces¡vamente'grandes. seg|¡
queiir
gumerÍó qu€ las mediciones de los fenómenos n0 leer este libro tal vez comprenda que, puesto que esb teoria, el uso de ofas distribuciones
los estudlanles universitarios repr€senlan peque' nen un áfea menor en la zona media de sus cuY6
cumplen de manera natural o "normal" con la clá-
ñas muestns no aleatorias, existen abundantes ra- y, por lo tanto, un área mayor en las "c0la$" qü ,
s¡ca forma de campana. Aunque en la actualidad
zones para sospechar que la distribuc¡ón de las repres€ntan resulbdos de mercado inusuales,P
este es un principio subyacente en la eshdíst¡ca, el
punto de visb de Pearson era radical para los con- puntuaciones no es "normal". dían haber pmvocad0 pérdidas menG grav¿s
A lo largo de los años han ocurrido mal0s en- A medida qüe estudie este capitülo, ase{lt
temporáneos que veian el mundo como algo estan-
rese de entender los sl.lpuestos que deben
cln
dadzado y normal. Pearson camb¡ó la mentalidad al tend¡d0s acerca de la distribución normal en los
demostar qüe algunas poblaciones están Sesga- negocios y en el ssclor públlco. Esbs malos enten- oi¡rrro.rá a uso adecuado de la distr¡buci¡l

"nomai", supuestos que los banqueros de rls


das de manera naturaj (de ahí se acuñó el término) didos han causado varios erores adninisrativos y
rd
y ayudó a la ideade qüe la distribución normalsub- han generado d¡versos debates de poliüca pública, ,iont *'ttrfto.ion oé rorma explicih. Y algo

yace en bdos los fenómenos. enfe bs que 9e incluyen los que provocaron el c0- imoorhnte. tenqa siempre preseÍte que elteÍÍ|¡
en eisdr
Por desgracia, en la actual¡dad las peBonas lapso de grandes instituciones fnancieras en 2008, dist¡bución normai no significa normal
De acuerdo con una teoría 6l haberapl¡cado la d¡s- t¡do cotidiano de la oalabra.
continúan cünetendo el t¡po de eror que Pearson
rebat¡ó. Como estudiante, tal vez usted esié fami- tribución normal a la industria de las inversiones
liaIizado con d¡scus¡ones sobre la iflflación de las bancarias para evaluar riesgos quizá contribuyó al

)
hoblem,as para la sección ó.2 213

Exploración de la distribución normal

el procedimieoto Visual Explorations Normal


,;lotioo p-. ver los efectos que tienen los cambios
í ¡ redra y l" des"iación estándar en el área bajo una
Lv¡ de dis¡ribución normal. Abn el libro complemen-
y¡suel Explorations (véase la sección D.4 en los
éndices). Seleccione Add-ins ) Visud Erplontions

¡emplo de las desca¡gas de OurCampus! y un panel de con-


flota¡te (véase la ilustación a la derecha). Utiüce 1os
ú¡¡[es del pa¡el de contol para modificar los valores de la
estándar y el valor X, y observe los
ñedia, la desviación
efecbs que tienen estes carnbios sobre la probabiiidad de X
valor y el iirea sombreada conespondiente bajo la curva
vease l¿ ilushcion a la detecha). Si gefiere ver l¿ cun"¿ nor-
etiquetada con los valores t baga clic en Z Values.
. Haga clic en el botón R€set para restablecer los valo-
del panel de control o haga clic en Help para obtener
adicional ace¡ca del problema. Haga cüc en
finish cuando termine de explorar.

emas para la sección ó.2


DE LOs FUNDAMENTOS b) P(z<4.2t)
Dada un¿ disribución nor¡aal estánda¡ lcon una media c) P(-1.96<Z<4.21)
0 y una dewiación esüí¡dar de 1, como en la tabla E.2), d) ¿Cuál es el valor de Z, si solo el 15.87% de todos los v¿-
es la probabilidad de que lores posibles de Z son miás grandes?
sea menor que 1.57?
ó.5 Dada una distribución normal con4 = 100 y o= 10,
sea mayor que I.84?
est€ ente 1.57 y 1.84? ¿cruil es la probabilidad de que
t) X> 75?
sea menor que 1.57 o mayor que I .84?
b) x<101
Dada una distribución nor¡ral estándar (con una media c) X< 80 o X> 110?
y una desviación estándar de 1, como en la tabla E.2), d) ¿Entre cuáles dos valores X (distribuidos de manera si-
iál es la probabilidad de que mét¡ica al¡ededor de la media) se encuentra el 80% de los
Z esté ente -1.57 y 1.84? valores?
¿ sea m€nor que .57 o mavor que 1.84?
-l
¿Curii es el valor de Z si soio el).5% de todos los valo-
ó.ó Dada una distibución normal con p = 50y o=4, ¿cttál
res posibles de Z son más srandes? es la probabilidad de que
a) X> 43?
¿Entre cuáles dos valoreide Z (distribuidos de manera
stmétrica alrededor de la media) estará contenido el b) x< 422
68.2ó% de todos Ios valores posibÍes de Z c) el 5% de los valores sean menores que curí,I valor de J0
d) ¿Ente cuáles dos valores X (distibüdos de manera si-
I Dada una distribución normal estíoda¡ (con una media
métrica alrededor de la media) se encuenba el 60% de los
0y una desüación estrándar de 1, como en Ia tabla E.2), valores?
i,cuil es Ia probabilidad cle oue
a) Z sea que l.0g?
ménor APUCAC6N DE CONCEPTOS
ü) Z seamayor que -{.21?
v z sea menor ó.7 Se reportó que en 2008 el consu¡ro de café per cápita
que -0.21 o mayor que la media?
d)Zsea menor que j.ll o-#vot qu. r.osl
en Estados Unidos era de 4.2 kg o 9.24 libras (datos extai-
dos de en.wikipedia.org/wiki/List_of_countries by_co-
Dada una distribución normal estándar (con una media ffee_consumption3er_capita). Suponga que el consumo
!;a^
u y una desviación
"c están<ia¡ cie i, como en lalabla E.2 ¡, de café per cápita en Estados Unidos se distribuye aproxi-
olTtmin. las
sizuientes probabilidades. madamente como una variable aleatoria normal, con una
4)P(z> l.o8)
media de 9.24 libras y una desviación eslíndar de 3 libras.
214 cAPiTLLo 6 Distibución no¡rual It
que un i::dividuo en Estados 62 y la clesviación estándar es 3? Demuestre su respuc{b I
a) ¿Crui,l es la probabilidad de
Únidos haya consumido rnás de 10 libras de café en 2008? estadísticamente Y exPliquela.
á) ¿Cuál es la probabilidad de que un individuo en Estados ó.'l 1 Un análisis estadístico de 1.000 llamadas telefónic,.
Únidos haya consumido ente 3 y 5 libras de cafe en 2008? de larga distanci4 ¡ealizadas desde las oficinas centr¿¡ol
¿Cuál es 1a probabilidad de que un individuo
c) en Estados
Bricks and Click Computer Corporation, indica que ¡ ¡]
Únidos haya consumido menos de 5 libr¿s de café en 2008? ración de esas Ilamadas se distribuye de fonna nor¡¡¿¡
d) ¿El99% de la población en Estados Unidos consumió *
p = 240 seguudos y o= 40 segundos.
menos de cuántas libras de café? a) ¿Cu,íi es la probabilidad de que una llamada haya 6¡o¡n

ó.8Toby's Trucking Company determinó que Ia menos de 180 segundos?


distancia que cada camión recone al año se distri- á) ¿Curil es la probabilidad de que una liamada haya dur¿dn

buye normalnente con una media de 50,000 millas y una ente 180 y 300 segundos?
desviación estríndar de 12,000 millas. c) ¿Curíl es la probabiüdad de que rma llamada haya du6¡o
' ente 110 y 180 segundos?
a) ¿Qué proporción de camiones se puede esperar que via-
jen enne 34,000 y 50,000 millas en un año? d) ¿El l% de las llamadas durarán menos que cuánto¡

puede esperar que viajen segundos?


á) ¿Qué porcentaje de camiones se
menos de 30,000 o más de 60,000 millas en un año? 2Se informó que eu 2008 el consumo de café per e[,
ó.1
c) ¿Cuántas millas seráLn recorridas por al menos el 80% de pita en Suecia fue de 8.2 kg o 18.04libras (datos exhaid¡¡
los camiones? de en.wikipedia.org/wiki/List-of-countries-by-cofre
d) ¿Cuáes serían sus respuestas a las preguntas de los incisos
consumption3er-capita). Suponga que el consuno pi
a) a c) si 1a dewíación estíndar fuera de 10,000 nillas? cápita de café en Suecia se distribuye aproximadamenb
ó.9 Los consr¡midores gastan rm promedio de $21 semana- como una variable aleatoria nomal con una media de 18.04
les en efectivo si¡ saber en qué los gastaron (datos extaídos übras y una desviación estándar de 5 libras.
de "snapshots: A llole in Our Pockets", USA Today' 18 de a) ¿Cu.ál es la probabilidad de que un individuo en Sued¡
enero de 20i0, p. 1A). Suponga que la cantidad de efectivo
que gastaron, sin saber en qué, se distribuye de malera nor-
mal con una desviación esLindar de $5.
c) ¿Cuál es la probabilidad de que una persona elegida al
azar gaste mrís de $25?
D) ¿Cuál es la probabilidad de que una persona elegida al
azar gaste entre $10 y $20?
c) ¿Entre cuáles dos valores se ubicará el 95% intermedio
de las cantidades de efectivo gastado?

ó.10 Un conjunto de las puntuaciones obtenidas en el exa- en un agujero de válvula. Un diseño particular requtere u
men final de un curso de htroducción a la estadística se dis- eje con un diámeto de 22.000 ñm, aunque los ejes con diá'
tribuyen de manera normal con una media de 73 y una metros entre 21 9g0 ñtn y 22 .0 i 0 mm son aceptables. St
desviación est¡hdar de 8. ponga que el proceso de manufactu¡a produce e3es col
a) ¿Cuál es la probabilidad de que un estudiante haya obte- dirimetros que se distribuyen normalmeD.te con una meo[
nido una puntuación menor que 91 en este examen? de 22.002 mm y una desviación estínda¡ de 0.005 mm Pa'¡
á) ¿Cual es la probabilidad de que un estudiante haya obte- este proceso, ¿cuál es
nido una puntuación entre 65 y 89? a) la proporción de ejes con un diámeto entÍe 21.99 rrtn'!
c) ¿Existe una probabilidad del 5% de que el estudiante que 22.00 mm?
responda el exarnen obtenga una puntuación mayor que un ó) la probabilidad de que un eje sea acepnble?
c) el diámetro que será excedido únicamente por el l%
ul
valor determinado? Si es así, ¿cuál es ese valor?
d) Si el profesor califica sobre rma cr¡rva, es decir, asigna los ejes?
una calificación de A al l0% mejor de la clase, sin impor- d) ¿Cuáles serían sus respuestas a las pregunras de los Úct
ur
tar la puntuación que obtenga en el exameq ¿a usted le sos a,/ a c) si la desviación estándar de los diámeÍos
irá mejor con una puntuación de 81 en este examen o con los ejes fuera 0.004 nm?
una puntuación de 68 en oüo examen donde la media es

6.3 Evaluación de la normalidad


se aprort
Como se expuso en la sección 6.2, muchas variables continuas que se utilizan en los negocios
man a una dist¡ibución normal. Para determinar si un conjunto de datos puede aproxrú!'r
las yF
por medio de la distribución normal, se compr¡ran las características de los datos con
piedades teóricas de la distribución normal o si construye gráfica de probabilidad nornal
'na
6.3 Evalu¿cio¡ de la norm¿lidad 215

Comparación de las características de los datos


con l-as prop¡edades teóricas
La distrbución normal tiene varias propiedades teóricas iDportantes:
. Es siméticE por lo tanto, la media y la mediana son iguales.
. Tiene forma de campana; por lo ta¡to, se aplica la regla enpírica-
. El rango iatercuartil es igual a 1.33 desüaciones estindar.
. El rango es aproxinadamente igual a 6 dewiaciones estándar.

Muchas va¡i¿bles continua¡ tiena caacterísticu que se aproximan a estas propiedades teoricas.
Sin embargo, con frecuencia otras va¡iables conti¡uas no están distibuidas norm¿lmente ni se
apnoximan a una disnibución normal Pa¡a estas variables, las carac'terísticas descriptivas de los da-
tos son incongnt€ntes con las propiedades de uaa distibución no¡mal. Un método que pemit€ deter-
mina¡ si la variable sigue nn¡ disribución no¡nal consiste en comparar las caracterír1¡s¿5 6S5grrad¡q
de la variable con lo que se esperaría si est¿ tuviera una distrbución norm¿l. Par¿ ello, podeoros
. Constuir gáficas y obsewar su apariencia- Para conjuntos de daúos pequefros o de tanafio
moderado, podemos crear uu diagrama de tallo y hoja o un diagrama de caja. Para conjuntos
de clatos grandes también podemos constuir un Listograma o un poügono.
. C¿lcular estadísticos descriptivos y compararlos con las propiedades teoricas de la distibucion
normal. Compare la media y la mediana ¿El rango intercuartil es aproximadamente 1.33
veces la desviación estándar? ¿El raago es aproximadamente 6 veces la desviación está¡da¡?
' Evaluar có,mo se distitn¡yen los valores. Det€mdnar si aprorimadanente dos t€rc€ras part€s de
los v¿lores se ubican ente la media y +l tlewiaciones eslándar Det€rmina¡ si ahededor de cuato
quiobs part€s de los valores se ubica¡ e,nte la media y +2 desviaciones estínda. Determi¡¿¡ si
agorinadaente 19 de cada 20 valces se ubicaa ente l¿ media y +2 desviaciones estánda.
Por ejemplo, estas técnicas se pueden utilizar paa deterninar si los rendimientos de 2009 que
ss enaliz¡rotr s¡ lss capltulos 2 y 3 (almaceoados eir el archivo l@@ siguen el paton de
,'na distribución normal. Las figuras 6.1 8 y 6.19 presentan resultados relevantes de Excel para
esos datos, y la figura 6.20 muestra una gnifica de caja de Minitab para los mismos datos.

URA ó.18

Par¿

I.

RA ó.19 loxplot for the Eond Funds 2(tr9 R€tums

de cinco
y diagrama
Par¡¡ los

i.n¡ro 2O9
216 CAPÍTULo 6 Distibuciór normal

FIGURA ó.20 Boxplot for Bond Funds 2009 Retums

Diagrama de caja
de Minitab

-10 0 l0 20 30
Returñ 2Ol¡9

A partir tle las figuras 6.18 a 6.20 y del arreglo ordenado de los rendimientos (que no se nues.

ra aquí), podemos hacer las siguieltes aseveraciones:


. Lamediade 7.1641 es mayor que la mediana de 6.4. @n una distibución normal la med¡,
la mediaaa son iguales).
. El diagrama de caja está muy sesgado hacia la derecha y tiene una larga cola a la dereclu
(La distribución normal es simétrica). !
. il,l rango intercuartil de 7.4 es aproximadamente 1.21 desviaciones estandar. (En una die i
aibución normal, el rango intercuartil es 1.33 desüaciones estríndar). i-
. El rango ¿e 40.8 es igual a 6.70 desviaciones estándar. @n l.'na distribución normal elranp f
es aproximadamente igual a 6 desüaciones estíndar)' f
. El ¿.91% de los ¡endimientos están dentro de +l desüación estrtodar de la nedia- (En un I
distribución normal, el 68.26% de los valores se ubican dento de + I desüación esÉodar & 5
la media). i
. El 85.33% de los rendimientos están dentro de +1.28 desviaciones estándar de la media" (h ?
una distribución normal, el 80% de los valores se ubican dentro de +1.28 desviaciones es $
tánda¡ de Iamedia). '
. El 96.20% de los rendimientos están dentro de +2 desviaciones estánd¿r de la media' (h :
una distribución n ormal, el 95 .44oA de los valores se ubican dentro de *2 desüaciones es '
ríndar de la meüa).
. La asimetía es 0.9085 y la curtosis es 2.456. @n una distribución normal estos estadístic¡s .

son iguales a cero).


CoD base eD estas aseveraciones y en los criterios presentados en la página 215, podemos mn'
cluir que los rendimientos de 2009 esirím muy sesgados hacia la derecha y tienen rn¡is valores ubicr
que s
dos dónft de +1 clesviación estandu de la media de lo esperado. El raago es mayor de lo
esperaría en una distibución normal, pero esto se debe principalnente al valor extremo de 32 Más

qü nada debido a 1a asimetía, pode;os concluir que lÁ caricterísticas de los datos correspondien'
*¡ tes a los rendimientos de 2009 difiefen de las propiedades teóricas de una distibución nonnal.
;i,*
,".i
ii Construcción de la gráfica de probabilidad normal
si los
Una gráfrca rle probabiüdad normal es una representación visual que nos ayuda a evaluar
I;,
dat¡s estan distibuidos de manera normal. Una gnífica comun es la llarnada gnifica cuantil+uansl
Para crear est¿ gráfic4 primero se tansforrna cada valo¡ ordenado en un valor Z. Por ejemplo'
sr¡o

.;ir. de:
tieoe r¡na muesta de n = lg , el valir Z para el dato m.ás pequeño conesponde al área acumula<h

:li
''I I 1 I ^^,
.

,+t=19il=t=uu)'
€r
El valor Z para un área acumulativa de 0.05 (de la tabla E.2) es -1.65. En 1a tabla 6.6 se ilustra
t,iü'
:,$ conjunto completo de valores Z para una muesta de n = i9.
"En
una gráfica cuantil-cuantil, Ios valores Z se grafican en el eje -ly los valores coresp0ú
¡t.''::. dientes de la variable se grafican en el eje f. Si los datos se distribuyen normalmente, los
vatu'"

formarán una línea aproximadamente recta.

)
6.3 Evaluación rtc l¿ so¡nalidad 217

6.6 V¡lor ordeh¡do Vdororden¡do Ytlo¡ Z


1 - 1.65 tl 0.13
, -1.28 l¿ 0.25
J - 1.04 l3 0.39
4 -0.84 t4 0.52
) -0.67 l5 0.67
6 -0.52 l6 0:E4
7 -0.39 t7 1.04
8 -0.25 l8 1.28
9 -0.13 t9 l.of
t0 -0.00

ilusta la forma típica <te la gráfica o.rantil*uantil de probabüdad no¡mal


En la figura 6.21 se
para distibución sesgada hacia la izquierda (gráfica A), una distibución normal (gnáfica B) y
'me
una disfibución sesgada hacia la derecha (gráfica C). Si los datos están sesgados hacia la iz-
quierd4 la curva se elevará coo mayor rapidez eo un inicio y luego se nivelará. Si los d¿tos se
distibuyen normalmente, los puntos formarán ¡¡¡¿ [i¡s¡ rñás s ¡etres ¡ecta- Si los d¿tos están ses-
gados hacia la izquierd4 la ctwa se elevará lenumenüe en un inicio y después se elevará con ma-

la
yor rapidez con los valores más altos de la variable grafic¡d¡.

l.z
RA 6.21
de proba-

í
normal para

hacia la
una disui-
normal y una
sesgada
rl
Sesgada hacia la izquierda
Gnífica A
Normal
Gráfica B
Sesgada hac¡a la dEredrs
Gráfics C
derecha
En la figura 6.22 se muestra una gráfica de probabilidad normal para los reodimientos <te 2009
creada por Excel (resultados a la izquierd4 una gráficá cuaotil-cuantil) y Minitab (resultados a la
derecha). la gnáñca cua¡tikuantil de Excel que pres€nta los rcndini€ntos de 2009 se eleva lenta-
mente en un inicio y después con nayor rapidez. Por lo tanto, podemos concluir que los rendi-
mi€ntos de 2009 están sesgados hacia la derecha-
La gráñca de probabilidad no¡mal de Minitab co¡tiene la variable Rendimientos de 2009 so-
bre el eje Xy el porcentaje acumulado par¿ r'n¡ distibución normal sobre el eje L Como ocune
con la gnifica cuantil-cuantil, si los datos están distibuidos normalnente, los puotos fonnarán una
línea más o menos recta. Sin embargo, si los datos están sesgados hacia la derecha, la curva se

RA 6.22
de probabilidad normal de Excel (cuantil-cuantil) y Minitab pan los rendimientos en 2009
Itorrnal Ptob€b¡llty Pld ol lxD Reün¡s Pmüabl¡lty Pbt of 2009 Retums
llor||r.l

;.r

l-_l
.¡i
¡1 to 20
t !'t| zmt

.¡¡ i--_.-_
218 cA-PÍTtLo 6 Distibución no¡rnal

elevará con mayor rapidez en un hicio y después se nivelañi' Si los datos están sesgados hacie t.
izquierd4 la curva se eleva¡á lentamente en un inicio y después se elevará de fon¡a nás nl¡i¿'
con los valores miás altos de la variable graficada. Observe que los valores aumental con ¡*i.'*
en rm inicio y después se nivela¡, lo que indica una distribución sesgada bacia la de¡echa"
' -'

Problemas para la sección ó.3


APRENDIZAJE DE LOs FUNDAMENTOS
FUNDAMENTOs millones para Alcoa, hasta $426,400 millones para E¡¡on
Mobil. la población completa cle los valores de capiuti¿,¡i
ó.14 Demueste que para una muesta de ¡ = 39, los valo- FÑf#.?i!{ "
de mercado está almace,nada en el archivo
res Zmás grandes y mas pequeños son -1.96 y +1.96, y que
Fu.út€: Datos exF¿idos dc ooley.cnn.con" 8 dc ab¡il dc 2011.
el valor Z intermedio (es decir, el ügésimo) es 0.00.
Determine si la capitalización de ¡ercado de las emp6¡
ó.15 Pa¡a una muestra de n =6, liste los seis valores Z.
pertenecientes a la DJIA parece distribuine de mens¡ .¡
APTICACIóN DE CONCEPTOS o menos no¡mal
a) comparando sus características con 1as propiedades teoric¡
Tzl_ñ61 ó.1ó El a¡chivo E@ contiene las millas totales
ü) constuyendo una gníñca de probabilidad norm¿I.
@ po. gaión IMPG; ñ-vehícr¡los urilianos pequeños
c) constuyendo un histograma.
2011l¡ = 25\:
20 24 22 23 20 22 21 22 22 19 22 22 26
6.20 La operación de u¡a cortador¿ consiste en cortar ftr
zos de acero en partes que después se utilizanín corno ss
19 19 23 24 21 21 19 21 22 22 16 16
tructura para los asienúos frontales de un automóvil. El acen
Fue¡te: Datos extFidos de "Rati¡gs", Co¡su¿er RePotls, d.20ll'
^bnl se cort¿ con una sier¡a de diamante y se requiere que las
DD. JJ.JO.
partes resultantes estéD dento de +0.005 pulgadas de la 106
óetermi¡e si parece que los clatos se distnbuyen de manera
gitud especiñcada por la empresa automotiz- Se reunis¡m :
más o menos normal ln
datos de una muest'a de 100 partes de acero y se aln:acenum
c) comparando sus car¿ctedsticas con las propiedades teóricas. F
á) constuyendo una gnifica de prcbabiüdacl normal.
en el archivo l@. ta medicion reportada es Ia ctfere¡cr¡ o
pulgadas entre la longitud real de la parte de acero, me. ib
ó.17 Puesto que los salarios de los jugadores han aunen- dida por medio de un aparato de medición láser, y la long. F
tado, el costo de las entradas a los juegos de béisbol se ha i¡- tud especificada para la misma. Determine si parece que los b
crementado de forma dnistica- El archivo [!!!E!@
incluye datos se distribuyen de manera más o menos normal
i.
i¡formación sobre el costo de cuatro boletos, dos cervezas, h
a) comparando sus características con las propiedades teodct
cuaho bebidas gaseos¿ts, cuatro emparedados de salchicha, D) construyendo una gnifica de probabiüdad nonnal.
dos prognmas dejuegos, dos gonas de béisbol y la tarifa de
est¿cionamiento para un vehículo que tuvieron que gast¡lf ó.21 El archivo ![f@ incluye información sobre el r@'
quienes asistieron a alguno de los 30 encuenaos de béisbol de dimiento pa¡'a un certificado de depósito (CD) a un aloy
las Grandes Ligas en 2010.
para un certificado de depósito (CD) a cinco años en 23
bancos de Estados Unidos el 4 de abril de 20 1 1 .
t72, 335, 250, 180, l?3, 162, 132, 207, 316, 17 8,
Fue¡te: Drlos cxtraidos de wwwS¡trkr¡te.comy' de ab¡il de 20 I I .
184, l4i, 168, 208, 115, 158, 330, 151, 16l, 170,
ü'
Deterrrine, para cada trpo de inversión, si parece que los
212, 222, t60,227, 227, r21, 217, 12r, 221, 216
tos se distibuyen de maner¿ más o menos normal
Fueñe: Datos exts¡ídos de te¡mmarketilg.com, I de ab¡il de 2010.
a) comparando sus caI-¿cerísticas con las propiedades teonos
Determine si parece que los datos se distribuyen de maoera á) construyendo una gníñca de probabiüdad normal.
más o menos normal
a) comparando sus características con las propiedades teóricas. ó.22 El archivo @S lista los siguientes costos d€ el€Ún'
!!
.,\ ú) construyendo uaa grafica de probabilidad nomal. cidad, en dóla¡es, que una muesta aleatoria de 50 depan¡'
mentos con un dormitorio en uDa gran ciudad generu
ó.18 El archivo [@ lista los impuestos vigentes
durante iulio de 2010.
l.
sobre 1a propiedad pe¡ cápita para los 50 estados y el distrito
i'
I
de Columbia de Est¿dos Unidos. Deiermine si parece que los 96 111 Z0Z t78 147 l0Z r53 t97 07 82

i!' datos se distibuyen de manera nás o menos nomnl 157 185 90 1t6 172 lll 148 213 130 ló5
..1 a) comparando sus ca¡acterísticas con las propieüdes teóricas. 141 149 206 r75 123 128 144 168 109 ló7

ó) construyendo una gmfica de probabilidad normal. 95 163 150 154 130 143 t87 166 Úg 149

ó.19 L¿ DJIA esta compuesa por 30 empesas. ¿Qú tan gmn- 108 l 19 183 151 r 14 135 191 137 09 tt,g

.i], .' des son esas ernpresas? Un metodo comun para medir el tamaño
Detomine si parece que los datos se distribuyen de rna!ú
de una empresa consiste en considerar su capit¿lización de
mercado, la cual se calcula multiplicando el número de accio- más o nenos normal
t.,
nes bursátiles por su precio de mercado. El 8 de abril de 2011, a) comparaado sus car¿cterísticas con las propiedades teonras
la capitalización de mercado de esas empresas iba de $i9,200 á) constnryendo una gnífica de probabiüdad normal'

I
Ecu¿ciones clave 219

En OurCampusl, Revisión
n 1¿ sección sobre OurCampus!, supusimos que usted tabajaba
como diseñador de un sitio web para redes sociales. Quería ase-
gurane de que un video pudiera descargane con rapidez para que
los visitantes pudiaan reproducirlo en zu navegador. (La repro-
ducción nipida de los videos ayudaría a ataer y a cons€rva¡ a esos üsitantes).
Realizando experimentos en las oficin¿s corporativas, usted determinó que la
canticlad de tienpo, en segundos, que t'a¡scrme desde el primer coDtacúo con
el sitio web hast¿ la present¿ción completa del video es una distribución en forma de c¿¡mpana
con un tiempo medio de descarga de 7 segundos y una desviación est¡inda¡ de 2 segundos. Por medio
de la distibucion non¡al, usted calculó que aproximadamente 84% de los tiempos de descarga son
de 9 segundos o menos, y que 95% de los tiempos de descarga est¡in ente 3.08 y 10.92 segundos.
Ahora que sabe cómo calcular probabüdades a parti¡ de la distribución normal estrí en condi-
ciones de evaluar los tiempos de descarga de un video utilizando diferentes diseflos de página
web. Por ejemplo, si la dewiación está¡dr permaneciera en 2 segundos, reducir la media a 6 se-
gundos reduciría la disnibución coryleta en I segundo. Por consiguiente, aproxina.damente 84%
de los tieryos de descarga seriao de 8 segundos o menos, y 95% de los tieryos de descarga serían de
ente 2.08 y 9.92 segundos. Otro cambio que podría reducir los largos tiempos de descarga sería la
disminución de la variación. Por ejemplo, considere el caso de que la media siguiera siendo de 7
segundos, pero que la desviación estíndar se redujea a I segundo. Nuevamente, al¡ededor de 84%
de los tiernpos de descarga serían de 8 segundos o menos, y 95% de los tiempos de descarga esta-
rían ente 5.04 y 8.96 segundos.

N
y en el anterior estudiamos los modelos m¿- media y su mediana son iguales. También tiene forma de
como distibuciones de probabilidad, campan4 y aproximadamente 68.26% de sus observaciones
en que se utilizan para resolver problemas esuinderto de I desüación estándar de la medi4 mác 6 ¡s-
En el capitulo 5 utilizamos disribuciones de ¡os 95.4404 de sus observaciones estín dentro de 2 desvia-
discretas eD situaciones en que los resultados ciones estándar de la media, y alrededor de 99.73% de sus
un proceso de conteo (por ejemplo, el número observaciones están dento de 3 desviaciones estánd¿r de la
estii tonando o el número de formatos de De- media. Aunque muchos conjunüos de datos en los negocios
en un ¡eporte gene¡ado por un sistema de i.n- se aproximan a la distibución normal, no üodos los datos se
). En este capítulo aprendimos que las pueden aproximar utilizando este tipo de distribución. En la
el resultado de sección 6.3 se'estudiaronvarios métodos'para evaluar la nor-
medición (por ejemplo, la estatua de nna p€r- malidad con la finalidad de determinat si la distribucién
de descarga de un üdeo). Las distribuciones no¡¡nal es un modelo matemático razonable v aplicable a si-
continuas tienen varias formas, pero la más tuaciones específicas.
importante en los negocios es la disfibución En el capitulo ? se utiliza la distribución norrnal para
normal es simérica, por lo que su desa¡rolla¡ el tema de la inferencia estaüstica-

'ACIONES CLAVE ....


de probabilidad normal CáJculo de un valor X asociado con un¡ probabilidad
c0nocidN
I
lz)l.x- r) lo)' (6.1)
2¡t "-lt X=p+Zo (6.3)

transformación

(6.2)
220 cAPiTWo 6 Distribución normal

TÉRMINOS CLAVE
1 r

distribuciónno¡¡al 202 fi¡nción de densidad de probabilidad gráficacuantil-cuantil 216


distribución no¡rnal estándar acumu- 202 gnífica de probabüdad nomal 2¡
'
lada 205 función de densidad de probabilidad variable aleatona normal estfudar
fórmula de fra¡sfo rmaciín 204 para la distribución nonnal 204 204
L
I
I
Í

VERIFIOUE SU COMPRENSION ó.31 En un esfuerzo por reducir el número de botella¡ cn.


contienen menos de 1.90 litros la fábrica embotelladorz ¡.,
6,23 ¿Por qué solo se necesita una tabla de distribución problema 6.30, se ajusta la máquim de llenado pa¡a ob¡ener
normal (como la tabla E.2) para calcular cualquier probabi-
una media de 2.02 litos. En estas cücunstancias, ¿cuiilss s*
lidad bajo la curva normal?
úan sus respuestas a los incisos a) ai e) del problema 6.30?
6.24 ¿Cómo se calcula el área entre dos valores bajo la
curva normal? ó.32 Un productor rlejugo de naranja compra todas las ¡a¡o
jas a una gr¿n huerta. La cantidad de jugo exprimida de cad¡
ó.25 ¿Cómo se calcula ei valor X que corresponde a un
oercentil dado con 1a distribución normal? naranja se distibuye de fon¡a máq o menos normal, co¡ ¡¡
ó.2ó ¿Cuáes son algunas de las propiedades üstintivas de media de 4.70 onzas y una dewiacion est indar de 0.40 onas.
una distribución nonnal? a) ¿Cuál es la probabilidad de que una naranja elegida al

zzar conteoga entre 4.70 y 5.00 onzas de jugo?


6.27 ¿F,n qué üfiere la forma de la dist¡ibución normal de
la forma de las distibuciones unifo¡ne y exponencial? á) ¿Cuál es la probabilidad de que una naranja elegida¡
azar contetrga entre 5.00 y 5.50 onzas de jugo?
ó.28 ¿Cómo podemos utilizar Ia gráfica de probabilidad
normal para determinar si un conjunto de datos se distri- c) ¿Al menos curintas onzas de jugo contendrá el'1'706 &la
naranjas? i.,
buye normalmente?
d) ¿El 80% del contenido de las naranjas está ent¡e cuále l=
APLICACIÓN DE CONCEPTOS dos valores (en onzu de jugo), distibuido de manera si. ;<
mética al¡ededor de la media poblacional? I
ó.29 Una máquin¿ de coser industrial utiliza cojhetes de P
bolas que deben tene¡ un diámetro de 0.75 pulgadas. Los Ií- ó.33 El archivo [!!@!! indica el porcentaje dealco to
¡o
mites inferior y superior de especificación con los que los hol, el número de calorías en12 otzas y el número de w' iq¡
cojinetes pueden operar son 0.74 pulgadas y 0.76 pulgadas, bohidratos (en granos) en 12 onzas para 145 de las cervezn !.,
respectivamente. La experiencia ildica que el diámetro real artesanales mrás vendid¿s en Estados Unidos. Determine, pan :o
del cojinete de bolas se distribuye de forma más o menos cad¿ una de las nes variables, si los clatos parece! estar diñi
normal, con una media de 0.753 pulgadas y una desviación buidos de manera más o menos normal. Respalde su detemr
esLíndar de 0.004 pulgadas. ¿Cuál es la probabilidad de que nación utilizando los estadísticos y gniñcos adecuados.
un cojinete de bolas esté Fuetrt€: D¿tos ext¡:¿idos de www.Beer100.con, 1 de ab¡il de 2011.
a) entre el valor buscado y la media real? ó.34 Al gerente ¡octumo de un ¡est¿urante le preocupabl
á) ente el límite inferior de especificación y el valor buscado? mucho la cantidad de tiempo que algunos clientes tenian qut
c) por arriba del límite superior de especificación? espera¡ par¿ que se les asignara una mesa. También le preocu
d) por debajo del límite inferior de especiñcación? pJtan tós tiempos que ocupaban la mesa, es decir, el lapso
e) De todos los cojinetes de bolas, 93% de los diiimehos son enhe el momento en que se les asignaba una mesa y.el lll0
mayores que un valor. ¿Cuál es ese valor? mento en que abando¡aban el restaula¡te. Durante ei tra¡s
ó.30 La cantidad de llenado de bebida gaseosa en botellas curso de una semana, se seleccionaron 100 clientes al azar
de 2 litos se distribuye de manera normal, con una media de - (no mas de uno por grupo) y se registaron los hempos oe 9s'
2.0 litros y rura desviaeión estándar de 0.05 lihos. Si las bo- pera y los tiempos que ocupaban la mesa (en minutos); la Ú
tel1as contienen menos de 95% del contenido neto anun- iormáción se encuentra en él archivo [l[
ciado (1.90 litos en este caso), el fabricante estaria expuesto a) Piense en su restauante favorito. ¿A cuál distrlbücl0l
ua
a una sanción por la agencia estatal de defonsa al consumi- cree que se asemejan más los tiempos de espera, a
dor. Las botellas que tienen un contenido neto mayor que uniforme, a una exponencial o a una normal?
qür
2.10 litros podrían provocar que el líquido se derrame al ó) Nuevamente, piensi en su restau¡ante favorito. ¿Cree
abrirse ia botella. ¿Qué proporción de las botellas contendrá los tiempos qüe los clientes ocupan la mesa se asemrJ¡r
a) enhe i.90 y 2.0 lifros? más a un¿ distribución uniforme, a una exponenclalu"
á) enhe 1.90 y 2.10 liaos? una nomral?
c) menos de 1.90 litros o más de 2.10 lifros? c) Consruya un histograma y una gráfica de probablllüd'

d) ¿Al menos qué cantidad de bebida gaseosa contiene 99olo ¡ormal con los nempos de espera. ¿Cree que estos ¡!¡"
de las botellas? pos de espera se asemejan más a una dist¡ibucto¡ u'"
e) ¿El99% de las botelias contienen una cantidad que está forme. a una exponencial c a una normal?
entre cuáles dos valores (distribuidos de forma simética) d) Consn-uya Lrn hisograma y "n¡ gráñca de probabrldads
al¡ededor de la media? mal con los riempos que los clientes ocupan la rn€sa;\"'
Problemas dc rc¡nso del capínrlo 221

que o"*an la m€sa s€ asqllej¿¡n mas a-uD'¿¡ prueba esta teoría utilice un periódico o I¡temet para selec-
Arcs tiemPO-S
i,-;óo miforme, a t'n¡ ex[onencial o a una normal? cronar una empresa que opere en la NYSE, ota que opere
pnncipll^es^índices del mercado bu¡sátil en American Stock Exchange y una compañía que opere en
Todos los el NASDAQ, y luego haga lo siguiente:
El ¡endimiento- medio anual
Át gln^acias_ tl_29
-l
0._

grupo de 500 empresas l. Registe el precio accionario de ciene diario para cada
,cciones de S&P 500 de un
,.,r¿s fue de 12.8o/o. El rendimiento medio anual una de esas empresas durante seis semanas consecutivas
(para que tenga 30 valores por empresa).
Ñ¡S¡,CQ, un g¡upo de 3200 empresas pequeñas y
de 16.9o/0. En el pasado, los rendimientos 2. Calcule los ca¡¡bios diarios en el prccio accionario de cie-
"" fue distribuido de una manera aproximad¿mente rre para cada nna de esas empres¡¡s durante seis semanas
se han
consecutivas (para que tenga 30 valores por eqresa).
l¡ desviación esuinda¡ en las empresas de S&P 500 es
del 20%, y la desviación estíndar de NASDAQ Para cad¿ uno de sus seis conjuntos de valores, determine si
30%. los datos se distribuygq ds ma¡qa más g menos normal
es la probabilidad de que una acción de la¡i empre- a) constuyendo un diagrama de tallo y hoj4 un hisúograma
S&P 500 haya aument¿do su valo¡ en 2010? o un poligono y un diagrama de caja"
es ta probabüdad de que una acción cle las empre- ó) comparando las caracteisticas de los datos con las pro-
cb S&P 500 baya ganado 10% o más €tr 2010? piedades teóricas.
es la probabilidad de que tn¡ acción de las empre- c) constuyendo una gnáfica de probabilidad normal.
de S&P 500 haya perdido 20olo o m.is en 20 I 0? d) Analice los resultados de los incisos a) a c). ¿Qué diría
es la probabiüdad de que 'rn¡ acción de las empre- acerca de sus tes acciones con respecúo a los precios diaios
de S&P 500 haya pe¡dido 40% o más en 20 I 0? de ciene y a los cambios diarios en los precios de cie¡re?
los incisos a) a d) pa¡a una ¿cción de las empresa¡r ¿Curil de los conjuntos de datos se distribuye de maner¿
a. aproximadanente normal, si es que alguno lo hace?
un breve resumen de sus hallazgos. Asegúrese de NolA:. La leoría de b carninata aleotoia se 6¿t¿ a los c@ibías diorios eñ el
un análisis de los riesgos asociados con una des- pecio d¿ ciene de lat occiones l no al precio diarío de ciqn d¿ las a¿ciones.
esLíndar grande.

velocidad en que se descarga la prigina principal de


PROYECTO DE EOUIPO
L¿
io web es una característica importante de su calidad. El archivo f!@@ contiene información acerca de ocho
rga que el tiempo medio para descargar la página prin- va¡iables de una muesta de 184 fondos de bonos:
del Servicio de recaudación de impuestos es de 1.2 se- Tipo: tipo de bonos que conforman el fondo (intermedio
Suponga que el tiempo de descarga se distribuye de gubernanental o corporativo a corto plazo)
ia normal. con una desviación est¡indar de 0.2 seeun- Acüvos: en millones de dólares
Cuál es la probabilidad de que un tiempo de descarga Cuotas: cargos por velta (no o sí)
menor que 2 segundos? Indice de costo: cociente de los gastos con los activos ne-
ente 1.5 y 2.5 segundos? tos en porcenlaJe
mayor que 1.8 segundos? Rendimientos en 2009: rendimiento de 12 meses en 2009
99% de los tiempos de descarga son mayores que Rendimientro a tes años: rendimierto anualizado , de 2007
segundos? a20C9
95% de los tiempos de descarga está ente cuáles dos Rendimieirto a ci¡co años: rendimiento anualizado, de 2005
valores. dishibuidos de fo¡ma simética al¡ededor de la a2Cf9
j Riesgo: factor de riesgo de pérüü de los fondos mutuos
(debajo del promedio, promedio o por aniba del pro-
Suponga que el tiempo medio de descarga en un sitio
medio).
eparación de impuestos come¡ciales es de 2.0 segun-
Suponga que el tiempo de descarga se disübuye nor- ó.39 Determine si el índice de costo. el rendimiento a tes
con una desviación estándar de 0.5 sesundos. años y el rendimiento a cinco años se distibuyen de manera
es la probabilidad de que un tiempo de descarga aproxinadamente normal
sea menor que 2 segundos? a) comparando las ca¡acterísticas de los datos con las pro-
este €nhe 1.5 y 2.5 segudos? pieüdes teoricas.
sea nayor gue 1.8 segundos? á) constuyendo una gráfica de probabilidad no¡mal.
¿El 99% dé los tiemlpos de descarga son mayores que
cuantos segundos?
BASE DE DATOS DE LA ENCUESTA
uonpare los resultados para el sitio de servicio de rccau-
APLICADA A ESTUDIANTES
dación de impuestos dei problema 6.36 con los del sitio
mnocial. ó.40 El problema 1.27 de la página 13 describe una en-
cuesta aplicada a 62 estudiantes de licenciatur¿ (al¡nacen¿da
9.:$ (P*y..to pr., l¡ cl¡se) Una teoría acerca de los cam- en ei ¿rcilvo GIEEEEü[!!D. Dec;rmrne, para caria vana-
Dtos diarios en el precio de óiene de las acciones plantea ble numéric4 si los datos se distribuven de manera aoroxi-
9tte e$os cambios sizuen \M caninata aleator¡¿ es decü. que madamente normal
estos
eventos diarioi son indepenaliettes ente rí, u.r.*üo a) comparando las características de los datos con las pro-
0dlsninuyen de
una forma aüatori4 y que pueden aproxi- piedades teóricas.
mane por
medio de una distibución nórmai.-para someter a á) consauyendo una gnífica de probabilidad normal.
222 cAPÍTwo 6 Dstribución normal

ó.41 El problema 1.27 delapág)na 13 describe una encuesta a) comparando 1as características de los datos con las
FG
aplícada a 62 estudiantes de iicenciatura (y se encuenha al- oiedades teóricas.
macenada en el archivo EEEEE!ÑID. á) ionstuyendo una gráfica de probabilidad norma¡
a) Seleccione una mueska de estudiantes de licenciatura y ó.43 El problema 1.28 de la página 14 describe ¡¡r.,
aplíqueles una encuesta similar.
cuesta aplicada a 44 estudiantes de la maestría.en a¡ij'
á) Para los datos reunidos en el inciso a), repia los incisos nistración (y se encuentra almacenada en el a¡ch¡"^
a) y b) del problema 6.40.
c) Compare los resultados del inciso á) con los del pro- G@,
a) Seleccione una muestra de estudiantes de posg¡ado u
.

blema 6.40.
aplíqueles una encuest¿ similar.
ó.42 El problema 1.28 de la página 14 describe una encuesa á) Para los datos reunidos en el inciso a), repita los insis.t
aplicada a 44 eshrdiantes de l¿ maestria q! adroini-stración $ a) y á) del problena 6.42.
sé encuentra aknacenada en el archivo ![!!@$. Deter- c) Compare los resultados del inciso b) con los del p¡6
mine, con estos valores y para cacla variable numericq si Ios blema 6.42.
d¿tos esüfur distribuidos de manera aproximad¿mente non¡al

El departamento de servicios técnicos de AMS se ha compro- EJERCICIOS


metido en un esfuerzo por mejorar la calidad. Su primer
proyecto se relaciona con el mantenimiento de la velocidad
l. Suponiendo que la distribución no ha cambiado desde el
año pasado, ¿cuiíl es la probabilidad de que la velocidr¡
con la'que se sube la información a 1os suscriptores de su
de subida
servicio de Intemet. Las velocidades de subida se miden so-
c) sea menor que 1.0?
bre un¿ escala estándar en la que el valo¡ meta es 1.0. Los
á) este entre 0.95 y 1.0?
d¿tos reunidos dr¡rante el año anterior indican que la veloci-
c) esté 1.0 y 1.05?
ente at
dad de subida se distribuye de manera más o menos normal
d) sea menor que 0.95 y mayor que 1.05?
con una media de 1.005 y una desviación estándar de 0.10. =
2. El objeúvo del equipo de operaciones es reducir la proh.
Cada día se mrde una velocidad de subid¿. La velocidad de
bilidad de que la velocidad de subida esté por debajo dr o
subida se considera aceptable si la medición en la escala es-
aindar está ente 0.95 y 1.05.
1.0. ¿El equipo debe enfocarse en mejorar un proceso o
que incremente la velocidad media de subida a 1.05, o q o
(¡t
mejorar un proceso que reduzca la desüación esüánda¡ & (¡t
la velocidad de subida a 0.075? Explique su rcspue$a"

cAso
Aplique sus conocimientos acerca de la distribución normal informe interno que documenta el trabajo del equipo y sls

en este Caso digital que amplía la sección sobre el Uso de la conclusiones. Después, responda lo siguiente:
estadística de este capítulo.
1. ¿Los datos reunidos pueden aproximarse pol medio dt

Para reducir las preocupaciones de sus posibles clientes, la una distribución norm¿l?
administración de OurCampus ! realizó un proyecto de in- 2. Reüse y evalúe las conclusiones planteadas por el equip
vestigación para conocer la cantidad de tiempo que les toma de ir:vestigación de OurCampus! ¿Cuáles conclusione!
\ a los usuarios cargar una página con aplicaciones complejas son correctas? ¿Cuiíles son incorrectas?
de video. El equipo de investigación reunió datos e hizo 3. Si OurCampus! pudiera mejorar el tiempo promedio ett

ciertas afirmaciones con base en el supuesto de que los da- cinco segundos, ¿cómo cambiaran las probabilidades?
tos trenen r¡na distribución normal.
Abra OC_QRTStudy.pd{ que documenta el trabajo de
un equipo de respuesta de calidad en OurCampus ! Lea el

REFERENCIAS
1. Gunter, 8., "Q-Q Plots", quality Progress (febrero de 3. Micmsofi Excel 2010 (Redmon4 WA' Mic¡osoft Cor!"

1994). 8l -86. 2010). , ^l


l. Levine. D. M.. P Ramsey y R. Sn:dt, Applied Statirtics 4. Millu, J., "Eariiest Known Uses of Some of the Wot6',
for Engineer and Scientists Using Microsoft Excel and Mathematics". bttp ://j etr560.kipoücom/mathword;bS
Minitab (Upper Saddle River, NJ: Prentice hall,2001). 5. Minitab Release /ó (Stare College, PA' ffioO
"... 'u'u'
Guía del capítulo 6 para Excel 223

o,arl. R., "Karl Pearson, 1857-1936", Journal ofthe 8. Walker, H., "The Contnbutions of Karl Pearson", "/ournal
',l,ian S taris tic al Ass ociation, 3 I (I 936), 653-664. ofthe American Sntistical Association, 53 (1958), 11-22.
í"",.on, E. S.. "Some Incidents in the Early History of
and Statistics, 1890-94", Biometrika, 52
SilÚ]rtty
[rrs¡':-ts'

1 DISTRIBUCIONES DE PROBABILIDAD similares. Para resolver un problema similar al del ejemplo


CONTINUA 6.5, i¡cluido en la página 210, cambie dos veces la celdilla
Cumulative Percentage, una vez para determinar el valor
no tiene instrucciones para esta sección. inferior de Xy oaa para deteminar el valor zuperior de X.
La hoja de cálcuio COMPLffi taúbien utiliza la función
I-A DISTRIBUc|ÓN NORMAL STAMARDTT.P para calcular valo¡es Z, NORMDIST para
pHstat2 Utiüce Normal para calcular probabilidades nor- calcular la probabüdad de un valor menor o igual que la ,Y
para crear la hoja de crilculo de la figura dadq, NORMSII{V para calcdar el valor Z del porcenbje acu-
¡rales. Por ejemplo,
mulado, y NORMINV para calcular el valorXpara Ia probabi-
i.l6 1uéos. la págna 212), que calcula las probabilidades
¡an varios ejemplos del capítulo 6, seleccione PHSt¿t .¡ lidad acumu.lad4 lamedia y la desviacion estanda¡ dadas.
irobability 9Prob. Distributions )
Nornal. En el cua- La hoja de criiculo tambien incluye fórmulí¡s que ¿¡ctu¿-
'dm
d€ diáüogo de este procedimiento (que se muest'a abajo): liz¡n las stiq¡sas de probabilidad cuando se cambia un va-
lor X. Abra la hoja de cálculo COMPUTE_FORI\{ULAS
: 1. Escñ:ba 7 €n Mean y 2 en Standard Deviation.
para examinar todas las fó¡nulas.
2. Moque Probability for: X<= e ingrese 7 e,u zu cuadro.
Marque Probabiüty for: X > e ingrese 9 en su cuadro. GEó.3 EVALUACIÓN DE LA NORMALIDAD
Marque X for Cumulative Percentage e hgese l0 en
Comparación de las características de los datos
su cuadro.
con las propiedades teóricas
5. Escnba un tí¡rlo en Title y haga clic en OK.
Utilice las i¡stucciones de las secciones GE3.1 a GE3.3, de
la guía del capítulo 3 para Excel, y compare las ca¡acterísti-
cas de los datos con las propiedades teóricas.

Construcción de la gráfica de probabilidad normal


PHStat2 Utilice Normal Probabüty Plot para crear r¡Ita
gnifica de pobabilidad normal Por ejemplo, para crear la gní-
fica de p,robabilidad normal que se presena en la ñgura 6.22 de
la página?l7 sobre los rendimientos de2009, abra.la hoja
de cálculo DAIA del libro Bond Funds, seleccione PHStat
) Probability t Prob. Distributions ) Normal Proba-
i
r
o¡rFrt Ogüd13
IIj3¿'
bility Plot. En el cuadro de diálogo del procedimiento (que
se muesta abajo):

lreb I l: o(;l cád I 1. Ingrese F1:F185 en Variables Cell Range.


2. Marque First cell contains label.
3. Escriba un título en Title y haga clic en OK
Excel en profundidad Utilice la fimción NORMDIST de
la hoja de cálculo para obtener probabilidades normales. In-
Sese la firnción como NORMDIST(X value, mean,, stan-
tlanl deviation, True) y obtenga la probabilidad acumulada
para un valor
meDor o igual que la X especificada.
Utilice la hoja de cálcuto COMPUTE del libro Nor-
n¡L que se muestra en la figura 6.16 de la pigina 212,
c0trto plantilla para
),1 calcular probabilidades normales. La
nola de cálculo contiene los datos oara ¡esolver los oroble-
of
mas de los eiemplos 6.1 a 6.4. Cambie los ualoiid bará
Il1ean, Stan¿ardbeüation.
II X Value. From X Value. io X
Value y/o
D Cumulative Percentage para resoluer problemas
224 cAPiTuLo 6 Distribución normal

Además de la hoja con la gráfica de probabiiidad normal, el


y C. Las fórmulas de la columna B diüden la celda de 6*
procedimiento crea una hoja de cálculo con los datos de la lumna A entre Ia cantidad n + I (185 para los datos ¿s 1l
gráfica que utiliza la fimción NORMSINV para calcular los rendimienros de 2009) para calcular porcentajes acünuh.
valores Z utilüados en la gráfica. dos, y las fórmulas de la colum¡a C utilizan la fir¡,¡6n
NORMSINV para calcular los valores Z de esos porcequ¡o
Excel en profundidad Constuya una gráfica de probabili- acumulados. (Abra la hoja de cálculo PLOT-FORMU¡i¡
dad normal en un proceso de dos pasos. Primero el¿bore una en el mismo libro para examina esas fórmulas).
hoja que Ie permita calcular los valores Z para los clatos,qu.e Si tiene menos de 184 valores, bo¡¡e renglones de a¡nh
se graficanin. Luego constuya una gráfica a padir de esa-hoja
hacia abajo. Si tiene mris de 184 valores, imerte renglonq ¡
deiáculo. Utilice la hoja de crilculo PLGDATA del libro partir de algutn punto dento del cuerpo de la tabla, pa¡ *.
NPP como modelo para calcular valores Z. Esta hoja de cál- gurarse de que la gr:ifica de probabilidad normal se ac',r¡a.
culo contiene columnas para el rango, la proporción, el valor lice de manera adecuada. Para c¡ear su propia gráfic¿ ¡¡
probabilidad normal para la v¿riable Retum 2009, 5¿¡,.
Z y la variable Refurn 2009, y es la fuente de datos de la
hoja gráIica NORMAL-PLOT que contiene la g!í'fic1 de iione el rango de celdas Cl:D185. Luego seleccione Insq1
probabüdad normal que se presenta en la figura 6.22 (véase ) Scatter y la primera opción de la galgría Scatter (Scat
1a pág1ra 217). Para otos problemas, pegue datos delaria- ter with only Markers). Reubique la gráñca en una ho¡
bles ordenados en la columna D, actualice el ¡úmero de ran-
grirfica y ajuste ei fomato utilizando las inslrucciones del

gos en la colurma A, y ajuste las fórmutas en las coh¡mnas B apéndice L

4. Haga clic en Input Column y escriba Cl eo zu cuadr¡. u,


GMó.1 DISTRIBUCIONE5 DE
Hasa clic en OK
PROBABILIDAD CONTINUA
Minitab preseda la probabilidad del ejemplo 6.1 para ru
La guía de Minitab no tiene instucciones para esta sección' o
tiempo de descarga que es menor que 9 segundos con p = 7 J o
o = 2 (véa.se lapareizquioda de la figura 6.17). Para calculn o
GMó.2 LA DISTRIBUCIÓN NORMAL (¡t
la probabiüdad normal en el ejenplo 6.4, ingrese Cunul*
A
Utilice Nornal para calcular probabilidades normales. Por tive Percent¿ge como nombre de la columna C2 y escrih o
ejemplo, para calcular las probabiliclades normales que se 0.1 en la celd¿ del renglón 1, en la columna C2' Nuevamenle
muestran en la figura 6.17 delapágna2l2, abra una hoja seleccione Calc )Probability Distributions ) Norn¡l
de cálculo nueva y vacía. Escriba X Value como nombre de En el cu¿dro de diálogo Normal Distibution:
la columna Cl y escriba 9 en la celda del renglón 1 de la
columna Cl. Seleccione Calc )
Probabiüty Distributions l Haga clic en Inverse cumulative probability.
2. Ingrese 7 en el cuadro Mean.
+ Normal. En el cuadro de diálogo Normal Distribution 3.. Ingrese 2 enel. cu¿d¡o St¿nd¡rd Deviation.
(que.se muestra abajo):
4. Haga cüc en Input Column y escriba C2 en su cuadro

l. Haga clic en Cumulative probability. 5. Haga clic en OK.


2. Ingrese 7 en el cuadro Mean'
Minitab presenta el valor Z del ejemplo 6.4, conesptr
3. Ingrese 2 en el cuadro Standard Deviation.
.: diente a un área acumulada de 0.10 (véase la parte daecil
de Ia figura 6.17).
ir
¡
;.. GMó.3 EVALUACIÓN DE LA NORMALIDAD
::. Comparación de las características de los datos
úlFr F- con les propiedades teóricás
I
sa'¿n¿¿""r** lT- Utilice las instiucciones de las secciones GM3 ' 1 a GM3
i
!:.
Je h guía del capítulo 3 para Minitab, y compre las
carac'
:l l' !.Éncd¡ffi 1!t-
oDlirEi rú¡qe terísticas de los datos con las propiedades teóricas

¡rl a lFútóctnt normal


il ,;
I
Construcción de la gráfica de Probabilidad
...,..,1 optixd c(!-as
r-ltilice Probabiütv Plot para crearrma gráfica de probabiüdd
ri:! 0 r''
¡"i€b I
I oK :¡ a¡.K! I normal. Por ejemplo, para crear Ia griífica de la figura
incluida en la págila 2l?, con los datos de Ios rendtfoE!"'
rl
Guia del capítulo 6 para Minitab 225
i

¡. ab.¿ la boia de cálculo Bond Funds, sgleccione Haga clic en la pestaña Date Disptay. Haga clic en
¿ ProbabiütY Plot Y: Synbols onl¡ quite la marca del cuad¡o Show conf-
Probability Plot haga clic en
denceinterv¡I.
el cuadro de diálogo Hasa ciic en OK.
y luego en Oli
cuadro de diálogo
Probability Plot - Sirgle (que se
abajo):

Hasa doble clic en C6 Return 2009 en la lista de vari-


para agregar'Return 2009' al cuadro Graph
"blis
v¡ri¡bles'
Haga clic en Distribution.

I
I
I 1 De regreso en el cuadro de ürilogo Probability Plot-
I
I Single hrga clic en OK

el cuadro de dirilogo Probability Plot - Distibution:

Ilaga clic en la pestaña Distributiotr (que se muesta


abajo) y seleccione Normal de la üstr desplegable Dis-
tribution.

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy