Estadística Capitulo 1 Utp 2021
Estadística Capitulo 1 Utp 2021
Estadística Capitulo 1 Utp 2021
Son diversos los vocablos que se citan como antecedentes del término estadística, entre los que
podemos nombrar:
Status (latín): que significa situación, posición, estado.
Statera (griego): que quiere decir balanza, ya que la estadística mide o pesa los hechos.
Staat (alemán): que se refiere al Estado como expresión de unidad política superior.
El término estadística tiene su raíz en la palabra Estado. Surge cuando se hace necesario
para sus intereses cuantificar conceptos. En la mayoría de los casos esta cuantificación se hará
en función de unos fines económicos o militares. El estado quiere conocer censo de personas, de
infraestructura, de recursos en general, para poder obtener conclusiones de esta información.
La mayoría de las personas asocian la palabra estadística con las publicaciones censales o las
noticias que recogen cifras de producción, de nacimientos, de admitidos a la universidad, de
accidentes de tránsito, etc. O con los cuadros y gráficos que aparecen en las revistas o diarios; o
cuadros de porcentajes que usan los políticos en sus discursos, precedidos de la frase ritual: “Las
estadísticas muestran que….”. Este concepto corresponde al plural de estadísticas, el cual se
utiliza para indicar un conjunto de cifras, de datos estadísticos, que son organizados y
presentados para mostrar las características o comportamiento de un cierto fenómeno de interés.
La Estadística es la parte del método científico que tiene por objeto hacer predicciones acerca de
una población con base en la información obtenida a través de una muestra.
DEFINIR EL OBJETIVO
ANALIZAR LA
SITUACIÓN ACTUAL
INVESTIGACIÓN
PRELIMINAR
SÍ
ANALIZAR E
INTERPRETAR LOS
DATOS
PREPARAR EL INFORME
ESCRITO PARA LA GERENCIA
MONITOREAR O DAR
SEGUIMIENTO AL
ESTUDIO
Objeto de estudio de la Estadística:
Primer Paso: Formulación del Problema: en este punto se debe especificar de manera clara
la pregunta que se debe responder y la población de datos asociada a la pregunta . Los
conceptos deben ser precisos y deben ponerse limitaciones adecuadas al problema motivadas
por el tiempo, dinero disponible y la habilidad de los investigadores. Algunos conceptos como,
artículo defectuoso, económico, salario, pueden variar en cada caso y para cada problema
debemos coincidir con las ideas señaladas en el estudio.
Segundo Paso: Diseño del Experimento: este aspecto es de gran importancia, puesto que
la recolección de datos requiere dinero y tiempo. Es siempre nuestro deseo obtener máxima
información con el mínimo costo ( dinero y tiempo) posible. Incluir excesiva información en la
muestra es a menudo costoso y antieconómico. Incluir poca también es también poco
satisfactorio. Esto implica, entre otras cosas, que debemos determinar el tamaño de la
muestra o la cantidad o tipo de datos que nos permita resolver el problema de la manera más
eficiente.
Tercer Paso: Recolección de Datos: Esta parte, por lo general, es la que exige más tiempo
en la investigación. Esta recolección debe ajustarse a reglas estrictas ya que de los datos
esperamos extraer la información deseada.
Cuarto Paso: Tabulación y Descripción de los Resultados: en esta etapa, los datos
muestrales se exponen de manera clara y se ilustran con representaciones tabulares y
gráficas (diagramas, histogramas, etc.); además se calculan las medidas estadísticas
apropiadas para el proceso inferencial que haya sido escogido.
Quinto Paso: Inferencia Estadística y Conclusiones: este último paso constituye tal vez la
contribución más importante de la estadística al proceso inferencial. Aquí se fija el nivel de
confiabilidad para la inferencia; esto es debido a que las conclusiones derivadas de inferencias
estadísticas jamás se pueden tomar con un 100% de certeza, pero sí se les puede asociar un
nivel de confiabilidad en términos de probabilidad denominados nivel de confianza y nivel de
significancia. El proceso inferencial nos llevará a una conclusión estadística que servirá de
orientación a quien o quienes deban tomar la decisión ( administrativa o clínica) sobre el tema
objeto de estudio.
Estadístico de prueba: Tipo de estadístico a ser calculado de una muestra aleatoria simple
tomada de la población de interés en una prueba de hipótesis y a utilizarse para establecer la
verdad o falsedad de la hipótesis nula.
← La Teoría de muestras.
← La estimación de parámetros.
← El Contraste de hipótesis.
← El Diseño experimental.
Una población puede ser finita o infinita. Por ejemplo, la población consistente en todas las
tuercas producidas por una fábrica un cierto día es finita, mientras que la determinada por todos
los posibles resultados (caras, cruces) de sucesivas tiradas de una moneda, es infinita.
POBLACIÓN FINITA: Es aquella que indica que es posible alcanzarse o sobrepasarse al contar.
Es aquella que posee o incluye un número limitado de medidas y observaciones.
También se le llama variable de azar o variable estocástica, y significa cantidad que puede tomar
varios valores imprevistos.
Ejemplo 1.- Sea el experimento aleatorio de lanzar un dado al aire. Los posibles resultados del
experimento (sucesos elementales) son los siguientes: <<que salga 1>>, <<que salga 2>>, <<que
salga 3>>, <<que salga 4>>, <<que salga 5>> y <<que salga 6>>. Resulta sencillo asociar a cada
suceso elemental el número correspondiente a la cara del dado que haya salido. Por tanto, la
variable aleatoria, X, será:
X= 1,2,3,4,5,6
Ejemplo 2.- Sea el experimento aleatorio de averiguar la marca de tabaco que preferirá un
individuo entre las posibles marcas: <<X>>, <<Y>>, <<Z>>.
En este caso la asociación de un número para cada suceso elemental posible del experimento no
es inmediata. En consecuencia, se establece una correspondencia entre el conjunto de los
sucesos elementales posibles y el conjunto de los números reales, del modo siguiente:
El número asociado a cada suceso elemental puede ser cualquiera dentro del conjunto de los
números reales, con la condición única de que a sucesos elementales distintos le correspondan
números también distintos. Se comprueba fácilmente que la correspondencia así definida entre el
conjunto de los posibles sucesos elementales de un experimento aleatorio y el conjunto de los
números reales es una aplicación inyectiva.
Las variables aleatorias pueden ser continuas o discontinuas. En este último caso se denomina
también discretas.
Si X es una Variable aleatoria continua, puede tomar cualquier valor de un intervalo continuo o
dentro de un campo de variación dado. Es aquella que puede tomar cualquier valor entre dos
números prefijados.Las probabilidades de que ocurra un valor dado x están dadas por una
función de densidad de probabilidad de que X quede entre a y b. El área total bajo la curva es 1.
Ejemplo.- Sea el experimento aleatorio consistente en medir la altura que es capaz de saltar cada
miembro de un conjunto de personas. En este experimento, cada miembro del conjunto
observado da lugar a un número, por lo que se toma como variable aleatoria el conjunto de las
medidas de las alturas que son capaces de saltar las distintas personas.
En el supuesto que una persona hubiera saltado 105 cm y otra 106 cm, no existiría ninguna razón
para que otra no hubiera saltado un valor intermedio cualquiera entre las dos anteriores, como
105.5 cm. Se trata de una variable aleatoria continua.
Se dice que una Variable aleatoria Discreta o Discontinua X, tiene un conjunto definido de valores
posibles x1,x2,x3,…..xn con probabilidades respectivas p1,p2,p3,…..pn., Es decir que sólo puede
tomar ciertos valores dentro de un campo de variación dado. Como X ha de tomar uno de los
valores de este conjunto, entonces p1 + p2 +…+ pn=1.
Una variable aleatoria Discreta X es aquella que sólo puede tomar algunos valores entre dos
números dados. Así por ejemplo son variables aleatorias discretas las siguientes:
En general, una variable aleatoria discreta X representa los resultados de un espacio muestral en
forma tal que por P(X = x)se entenderá la probabilidad de que X tome el valor de x. De esta
forma, al considerar los valores de una variable aleatoria es posible desarrollar una función
matemática que asigne una probabilidad a cada realización x de la variable aleatoria X. Esta
función recibe el nombre de función de la probabilidad.
Ejemplo.- Sea el experimento aleatorio consistente en lanzar una moneda al aire. Los sucesos
elementales del experimento, <<que salga cara>>, <<que salga cruz>>, no vienen representados
por los números, por lo que casa suceso elemental se le hace corresponder un número real. Así
al suceso elemental <<que salga cara>> se le hace corresponder el número “1” y al suceso
elemental <<que salga cruz>> se le hace corresponder el número “2”.
Se trata de una variable aleatoria discontinua o discreta, ya que únicamente puede adoptar los
valores 1 y 2.
4. TIPOS DE DATOS.
4.1. Datos continuos. Datos que no se limitan a un valor determinado (como ocurre con los
categóricos), sino que pueden tomar un número infinito de valores (por ej., algunas variables que
dan lugar a datos continuos son edad, altura o presión arterial).
Datos que pueden tomar cualquier valor (un número infinito de valores) dentro de un cierto
intervalo.
Por ejemplo, las estaturas de un grupo de personas forman datos continuos, pero el número de
personas en ese grupo forman datos discretos.
Ejemplos:
Peso
Longitud
Velocidad
temperatura
Datos categóricos. Datos que no derivan de mediciones, sino que se organizan bajo epígrafes,
como por ejemplo por países, por centros hospitalarios, etc.
4.2. Datos discretos: Datos que sólo toman un número finito de valores, lo opuesto a datos
continuos. El número de un grupo de personas es un ejemplo de ello.
Ejemplo: Número de artículos defectuosos
Número de clientes que visitan un almacén por día.
Número de fallas en la línea de llenado por cada lote producido.
Número de ausencias del personal por semana.
4.3. Datos nominales: Comprenden categorías, como el sexo, carrera de estudio, material de los
pisos, calificaciones, etc. Las características mencionadas no son numéricas por su naturaleza,
pero cuando se aplican, ya sea en una población o una muestra, es posible asignar a cada
elemento una categoría y contar él numero que corresponde a cada elemento. De esta manera
estas características se convierten en numéricas.
5. Clasificación de la estadística
El objetivo de la estadística descriptiva es hacer que los datos se comprendan mas fácilmente,
que sea más sencillo referirse a ellos y analízalos.
5.2. Estadística inferencial
Métodos que nos permiten hacer posible la estimación de una característica de la población,
sobre la base del estudio de una muestra. Bernoulli, De Moivre y Karl Gauss fueron los
precursores del objeto de la estadística inferencial. Tiene por objetivo describir las
características de un conjunto, pero sin la necesidad de realizar el registro de datos a todos los
elementos o unidades del conjunto o población, sino a una parte de esta.
La inferencia constituye la base teórica del muestreo, permite conocer el todo con cierta
aproximación, a partir del estudio de una parte. La estadística inferencial no nos da una certeza
completa en sus resultados, sino que están sujetas a una probabilidad de error. Una incorrecta
selección de las unidades muéstrales puede acarrear la imposibilidad de inferir correctamente las
características de la población.
6. Recolección de datos
La recolección de datos se refiere al uso de una gran diversidad de técnicas y herramientas que
pueden ser utilizadas por el analista para desarrollar los sistemas de información, los cuales
pueden ser la entrevistas, la encuesta, el cuestionario, la observación, el diagrama de flujo y el
diccionario de datos.
Podemos resumir que al realizar diseño de experimentos, o dicho de otra manera, el planear paso
a paso las operaciones nos lleva a obtener un resultado satisfactorio a nuestro problema
planteado.
Para el diseño de un experimento debemos tener en cuenta los efectos y las características de
nuestro problema a resolver. Como se puede apreciar un diseño debe de ser lo más sencillo
posible y así poder ahorrar tiempo, inversión y personal, pero no por eso se deben de olvidar
considerar los principios básicos en el diseño.
Observamos el trabajo conjunto, de los investigadores con los estadísticos, que nos llevan a
obtener una mejor planeación del experimento, aunque tiene sus desventajas se puede notar que
actuando de manera correcta se puede cambiar la forma de ver de los inconvenientes que puede
representar el alto costo que se tiene con los estadísticos.
Los analistas utilizan una variedad de métodos a fin de recopilar los datos sobre una situación
existente, como entrevistas, cuestionarios, inspección de registros (revisión en el sitio) y
observación. Cada uno tiene ventajas y desventajas. Generalmente, se utilizan dos o tres para
complementar el trabajo de cada una y ayudar a asegurar una investigación completa.
6.1.3.1. LA ENTREVISTA
Las entrevistas se utilizan para recabar información en forma verbal, a través de preguntas que
propone el analista. Quienes responden pueden ser gerentes o empleados, los cuales son
usuarios actuales del sistema existente, usuarios potenciales del sistema propuesto o aquellos
que proporcionarán datos o serán afectados por la aplicación propuesta. El analista puede
entrevistar al personal en forma individual o en grupos algunos analistas prefieren este método a
las otras técnicas que se estudiarán más adelante. Sin embargo, las entrevistas no siempre son la
mejor fuente de datos de aplicación.
Preparación de la Entrevista
Conducción de la Entrevista
Secuela de la Entrevista
Son valiosas las opiniones, comentarios, ideas o sugerencia en relación a como se podría hacer
el trabajo; las entrevistas a veces es la mejor forma para conocer las actividades de las
empresas. La entrevista pueden descubrir rápidamente malos entendidos, falsa expectativa o
incluso resistencia potencial para las aplicaciones de desarrollo; más aún, a menudo es más fácil
calendarizar una entrevista con los gerentes de alto nivel, que pedirle que llenen cuestionario.
Los analistas también deben dividir el tiempo entre desarrollar preguntas para entrevistas y
analizar respuesta. La entrevista no estructurada no requiere menos tiempos de preparación,
porque no necesita tener por anticipado las palabras precisas de las preguntas. Analizar las
respuestas después de la entrevista lleva más tiempo que con la entrevista estructuradas. El
mayor costo radica en la preparación, administración y análisis de las entrevistas estructuradas
para pregunta cerradas.
Ejemplo: obtener la información sobre las Ejemplo: obtener la información sobre las
características de diseños críticas para los
Características de diseño críticas para los
empleados.
empleados.
" algunos empleados han sugerido que la mejor
" La experiencia le ha proporcionado una amplia
forma para hacer eficiente el procesamiento de
visión en cuanto a la forma en la que la empresa
pedidos es instalar un sistema de computadora
maneja los pedidos..." Me gustaría que usted
que maneje todos los cálculos..."
contestara algunas preguntas específicas en
bajo estas circunstancias ¿apoyaría usted el relación en lo anterior:
desarrollo de un sistema de este tipo?.
-¿Qué etapas trabajas bien?¿cuáles no
Entre otros
Selección de Entrevistados
La entrevista se aplican en todos los niveles gerenciales y de empleados y depende de quien
pueda proporcionar la mayor parte de la información útil para el estudio, los analistas que
estudian la administración de inventarios pueden entrevistar a los trabajadores del embarque y de
recepción, al personal de almacén y a los supervisores de los diferentes turnos, es decir. Aquellas
personas que realmente trabajan en el almacén, también entrevistarán a los gerentes más
importante.
Realización de Entrevista
La habilidad del entrevistador es vital para el éxito en la búsqueda de hechos por medio de la
entrevista. Las buenas entrevista depende del conocimiento del analista tanto de la preparación
del objetivo de una entrevista específica como de las preguntas por realizar a una persona
determinada.
Hoy en día la palabra "encuesta" se usa más frecuentemente para describir un método de obtener
información de una muestra de individuos. Esta "muestra" es usualmente sólo una fracción de la
población bajo estudio.
Por ejemplo, antes de una elección, una muestra de electores es interrogada para determinar
cómo los candidatos y los asuntos son percibidos por el público… un fabricante hace una
encuesta al mercado potencial antes de introducir un nuevo producto… una entidad del gobierno
comisiona una encuesta para obtener información para evaluar legislación existente o para
preparar y proponer nueva legislación.
No tan sólo las encuestas tienen una gran variedad de propósitos, sino que también pueden
conducirse de muchas maneras, incluyendo por teléfono, por correo o en persona.
A diferencia de un censo, donde todos los miembros de la población son estudiados, las
encuestas recogen información de una porción de la población de interés, dependiendo el tamaño
de la muestra en el propósito del estudio.
Una "encuesta" recoge información de una "muestra." Una "muestra" es usualmente sólo una
porción de la población bajo estudio.
Aún así, no hay una regla simple para el tamaño de muestra que pueda ser usada en todas las
encuestas. Mucho de esto depende de los recursos profesionales y fiscales disponibles. Los
analistas frecuentemente encuentran que una muestra de tamaño moderado es suficiente
estadística y operacionalmente. Por ejemplo, las muy conocidas encuestas nacionales
frecuentemente usan cerca de 1,000 personas para obtener información razonable sobre
actitudes y opiniones nacionales.
Las encuestas pueden ser clasificadas en muchas maneras. Una dimensión es por tamaño y tipo
de muestra. Las encuestas pueden ser usadas para estudiar poblaciones humanas o no humanas
(por ejemplo, objetos animados o inanimados, animales, terrenos, viviendas).
Muchas encuestas estudian todas las personas que residen en un área definida, pero otras
pueden enfocar en grupos particulares de la población -niños, médicos, líderes de la comunidad,
los desempleados, o usuarios de un producto o servicio particular. Las encuestas también pueden
ser conducidas con muestras locales, estatales o nacionales.
Las encuestas pueden ser clasificadas por su método de recolección de datos. Las encuestas
por correo, telefónicas y entrevistas en persona son las más comunes. Extraer datos de
récords médicos y otros se hace también con frecuencia. En los métodos más nuevos de recoger
datos, la información se entra directamente a la computadora ya sea por un entrevistador
adiestrado o aún por la misma persona entrevistada. Un ejemplo bien conocido es la medición de
audiencias de televisión usando aparatos conectados a una muestra de televisores que graban
automáticamente los canales que se observan.
Las encuestas son una fuente importante de conocimiento científico básico. Las encuestas por
correo, a través de entrevistas telefónicas o en persona son las más comunes.
Las encuestas por correo pueden ser de costo relativamente bajo. Como con cualquier otra
encuesta, existen problemas en usar este método si no se presta suficiente atención a
obtener niveles altos de cooperación.
Las entrevistas telefónicas son una forma eficiente de recoger ciertos tipos de datos y se
están usando con cada vez mayor frecuencia. Se prestan particularmente bien a
situaciones donde es necesario obtener resultados oportunos y cuando el largo de la
encuesta es limitado.
Las entrevistas en persona en el hogar u oficina de un participante son mucho más caras
que las encuestas telefónicas o por correo. Estas pueden ser necesarias especialmente
cuando se debe recoger información compleja.
Algunas encuestas combinan varios métodos. Por ejemplo, una encuestadora puede usar el
teléfono para identificar participantes elegibles y luego hacer cita para una entrevista en persona.
Podemos clasificar las encuestas también por su contenido. Algunas encuestas enfocan en las
opiniones y actitudes (tal como las encuestas pre-eleccionarias), mientras que otras se
preocupan por características o comportamiento reales (tal como la salud de las personas,
vivienda, gastos del consumidor o hábitos de transportación).
Las preguntas pueden ser abiertas ("¿Por qué siente así?"), o cerradas ("¿Aprueba usted o
desaprueba?"). Los entrevistadores pueden solicitar al participante que evalúe un candidato
político o un producto usando alguna escala, o pueden solicitarle que ordene varias alternativas.
El trabajador de encuestas más conocido por el público es el entrevistador que llama por teléfono,
el que aparece en la puerta del hogar o el que detiene a personas en un centro comercial.
Tradicionalmente, las entrevistas para encuestas, aunque requieren ocasionalmente largos días
de trabajo en el campo, eran hechas principalmente por personas empleadas a tiempo parcial.
6.1.3.3. Cuestionario
Los cuestionarios proporcionan una alternativa muy útil para la entrevista; sin embargo, existen
ciertas características que pueden ser apropiada en algunas situaciones e inapropiadas en otra.
Al igual que la entrevistas, deben diseñarse cuidadosamente para una máxima efectividad.
Para los analistas los cuestionarios pueden ser la única forma posible de relacionarse con un gran
número de personas para conocer varios aspectos del sistema. Cuando se llevan a cabo largos
estudios en varios departamentos, se puede distribuir los cuestionarios a todas las personas
apropiadas para recabar hechos en relación al sistema. En mayor parte de los casos, el analista
no verá a los que responden; no obstante, también esto es una ventaja ya que exige mayor
anonimato y pueden darse respuestas más honestas (y menos respuestas pre-hechas o
estereotipadas). También las preguntas estandarizadas pueden proporcionar datos más
confiables.
Existen dos formas de cuestionarios para recabar datos: cuestionarios abiertos y cerrados, y se
aplican dependiendo de si los analistas conocen de antemano todas las posibles respuestas de
las preguntas y pueden incluirlas. Con frecuencia se utilizan ambas formas en los estudios de
sistemas.
Cuestionario Abierto
Al igual que las entrevistas, los cuestionarios pueden ser abiertos y se aplican cuando se quieren
conocer los sentimientos, opiniones y experiencias generales; también son útiles al explorar el
problema básico, por ejemplo, un analista que utiliza cuestionarios para estudiar los métodos de
verificación de crédito, es un medio.
El formato abierto proporciona una amplia oportunidad para quienes respondan escriba las
razones de sus ideas. Algunas personas sin embargo, encuentran más fácil escoger una de un
conjunto de respuestas preparadas que pensar por sí mismas.
Cuestionario Cerrado
El cuestionario cerrado limita las respuestas posibles del interrogado. Por medio de un cuidadoso
estilo en la pregunta, el analista puede controlar el marco de referencia. Este formato es el
método para obtener información sobre los hechos. También fuerza a los individuos para que
tomen una posición y forma su opinión sobre los aspectos importantes.
6.1.3.4. La OBSERVACIÓN
Otra técnica útil para el analista en su progreso de investigación, consiste en observar a las
personas cuando efectúan su trabajo. Como técnica de investigación, la observación tiene amplia
aceptación científica. Los sociólogos, sicólogos e ingenieros industriales utilizan extensamente
ésta técnica con el fin de estudiar a las personas en sus actividades de grupo y como miembros
de la organización. El propósito de la organización es múltiple: permite al analista determinar que
se está haciendo, como se está haciendo, quien lo hace, cuando se lleva a cabo, cuanto tiempo
toma, dónde se hace y por qué se hace.
"¡Ver es creer! Observar las operaciones le proporciona al analista hechos que no podría obtener
de otra forma.
Tipos de Observación
Primero, puede observar a una persona o actitud sin que el observado se dé cuenta y su
interacción por aparte del propio analista. Quizá esta alternativa tenga poca importancia
para el análisis de sistemas, puesto que resulta casi imposible reunir las condiciones
necesarias.
Segundo, el analista puede observar una operación sin intervenir para nada, pero estando
la persona observada enteramente consciente de la observación.
Por último, puede observar y a la vez estar en contacto con las personas observas. La
interacción puede consistir simplemente en preguntar respecto a una tarea específica,
pedir una explicación, etc.
La entrevista, se lleva a cabo en todos los niveles de operación desde el Presidente o el Jefe de
Operaciones.
Utilizando procedimientos que pueden variar desde muy formales hasta los casuales.
El cuestionario, es otra de las formas que utiliza el analista con el fin de lograr un consenso,
siendo un canal de comunicación poco limitado, el analista debe determinar lo que desea saber,
estructurar preguntas que pueden dar las respuestas y formular el cuestionario.
La observación, se emplea para verificar los resultados de una entrevista y tiene una aceptación
científica.
Existen dos métodos de selección de una muestra, según la manera de seleccionar sus
elementos, que son: hago un muestreo probabilístico y muestreo no probabilístico.
6.2.1. Muestreo no probabilístico: Incluye todos los métodos en que los elementos de la
muestra no se seleccionan mediante procedimientos al azar o aleatorios, o con probabilidades de
selección conocidas. Algunos procedimientos de selección del muestreo no probabilístico son:
Muestreo de juicio: Es un proceso a través del cual los elementos se escogen basándose en
opiniones informadas que garantizan la representatividad de la población que se estudia.
Muestreo por cuotas: Es un proceso de selección en el cual los elementos son elegidos en el
campo mismo, por los entrevistadores, utilizando categorías prefijadas de elementos de la
muestra, para obtener un numero predeterminado de casos en cada categoría.
Muestreo de agrupación causal: Son muestras formadas por ejemplos que se han reunido
ocasionalmente o de acceso fácil, tales como los estudiantes inscritos en una clase que van
pasando por una esquina. Dichas muestras no permiten generalizaciones que vayan más allá
de las agrupaciones mismas y por lo general no tienen interés científico.
Por ejemplo se puede utilizar la tabla de números aleatorios, el bombo, la ruleta, el dado de 20
caras.