Metodologia Unidad 3
Metodologia Unidad 3
Metodologia Unidad 3
METODOLOGÍA DE LA INVESTIGACIÓN I
Licenciatura en Psicología
Licenciatura en Psicomotricidad
Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional
2
Estadística: concepto y definición
Seguramente, si nos ponemos a pensar qué es la estadística, vendrá a nuestra mente un conjunto de ideas relacionadas con
números apilados y gráficos de diversos aspectos, que hacen referencia a una disciplina actual, reciente. A decir verdad, la
estadística trabaja en gran medida con datos numéricos y representa sus resultados muchas veces a través de tablas y gráficos
pero, sin embargo, no podemos decir que se trate de una disciplina reciente.
Desde el origen de nuestra civilización, el ser humano se ha interesado por tratar de representar con números los datos que eran
valiosos para su época; por ejemplo: cantidad de bolsas de maíz cosechadas en una determinada superficie, mortandad
comparativa de las ovejas según la estación del año, cantidad de enfermos de tuberculosis, etcétera…. Por lo tanto, podemos decir
que la estadística ha sido una disciplina auxiliar de todas las demás ciencias. Así, actualmente la estadística asiste a la economía
con la finalidad de medir la evolución de precios y de la pobreza; a la sociología le permite estudiar los perfiles y la dinámica de los
grupos sociales; en el marketing la estadística brinda información para determinar las estrategias más eficaces para difundir un
determinado producto; en la salud la estadística brinda datos que permiten determinar el grado de prevalencia de las enfermedades,
la edad de ocurrencia y los grupos más vulnerables de la población, etc. Como podrás ver constituye una poderosa herramienta
siempre vinculada con la generación del conocimiento.
La estadística que conocemos hoy en día, debe gran parte de su estatus a los trabajos matemáticos de aquellos hombres que
desarrollaron la teoría de las probabilidades, con la cual la estadística fue adhiriéndose a las ciencias formales.
Dado que es una disciplina muy amplia, existen diferentes definiciones de la misma según el enfoque en el que se plantee. Para
nuestro curso, podemos decir que:
….es una disciplina que tiene el objetivo de reunir, procesar e interpretar información cuantitativa
concerniente a individuos grupos techos etcétera, con la finalidad de describir, realizar previsiones para
el futuro o tomar decisiones más efectivas.
La Estadística es fundamental para muchas ramas de la ciencia desde la medicina a la economía. Pero, sobre todo, y en lo que a
nosotros importa, es esencial para interpretar los datos que se obtienen de la investigación científica y de las prácticas
profesionales.
Entonces, más puntualmente… ¿Para qué sirve la Estadística?
Para Gorgas-García, Cardiel-López. & Zamorano-Calvo (2011), la estadística permite entre otras cosas:
Analizar muestras: Eligiendo un pequeño grupo extraído de una población se pueden hacer deducciones de esa población
a partir de lo observado en la muestra, sin necesidad de gastar tantos recursos ni tiempo como demandaría conocer las
características de todos los sujetos que componen la población (sondeos de opinión, control de calidad, etc).
Descripción de datos: toda la información obtenida se puede resumir y representar de una manera clara y concreta que
favorezca su interpretación (por ejemplo, usando gráficos y/o tablas).
Contrastar hipótesis: de esta manera nos garantizamos que las conclusiones a las que arribamos en nuestras
investigaciones sean lo suficientemente sólidas y válidas.
Medir relaciones entre variables: por ejemplo, podemos interesarnos en averiguar si existe relación entre un rasgo de
personalidad y la forma de abordar las situaciones traumáticas, en este caso la estadística provee procedimientos que no
solo corroboran tal posibilidad, sino que además nos brindan información acerca de cuál es la tasa de error que podemos
tener en esa afirmación.
Predecir: estudiando las posibles combinaciones de relaciones entre variables se puede determinar el comportamiento de
otra variable.
En cambio, LA ESTADÍSTICA INFERENCIAL se ocupa de generalizar la información (muchas veces obtenida por los métodos de la
estadística descriptiva) intentando hacer inferencias (estimaciones) de las características de la población, partiendo de datos de la
muestra. Es decir, investiga a una población, valiéndose de los datos y resultados que se obtienen de una muestra. Es importante
que sepas que para que esto sea posible, las muestras deben tener ciertas características que verás un poco más adelante en esta
unidad.
Este tipo de estadística se utiliza en la aplicación de tratamientos con nuevos fármacos, o cuando se intenta hacer proyecciones de
cómo puede influir ciertas intervenciones en la comunidad, o cuando deseamos corroborar el efecto de nuestras intervenciones.
Este poder de generalización de datos, de predicción de resultados ha favorecido que la estadística inferencial tenga un desarrollo
creciente y, asimismo, una acentuada evolución de métodos y estrategias (Salazar. & Castillo, 2018).
4
Recolección de datos: instrumentos, población y muestra
Bien sabemos que en una investigación recopilamos un conjunto de información que luego analizaremos para tratar de encontrar
relaciones que nos lleven a determinadas conclusiones. Toda esa información que obtenemos a través de distintos instrumentos de
medida pasa a configurar los datos. Entendemos por dato estadístico a cada uno de los valores que se han obtenido al realizar un
estudio.
Un dato puede ser el sexo, la edad, una característica psicológica, un atributo físico... en fin cualquier tipo de atributo que pueda ser
entendido a través de una variable que pueda ser registrada o medida.
Resulta importante que sepas que algunos datos suelen ser transformados al momento de incluirlos a la matriz de datos, con la
finalidad de ser procesados a través de algún programa estadístico. Por ejemplo, para la variable Estado civil podemos determinar
que está categorizada por: soltero, casado, separado, divorciado y viudo. En esta situación generalmente se codifica en la matriz de
datos de la siguiente manera:
soltero = 1
casado = 2
separado = 3
divorciado = 4
viudo = 5
Esto favorece el posterior análisis que realiza el programa estadístico, con el cual pretendemos encontrar diversas respuestas a
nuestros interrogantes. En otras oportunidades, variables como: altura, peso, edad, antigüedad laboral o diversas características
psicológicas no son necesarias transformar y conservan la medida original.
Ahora bien, ya sabemos que es el dato, cabría preguntarnos a través de que medio los obtenemos….
Instrumentos: Un instrumento de medida es cualquier objeto que se usa como medio para obtener un dato. Es un elemento que
resulta sensible al fenómeno que se pretende medir. Por ejemplo, una cinta métrica es un instrumento idóneo para obtener
información acerca de la altura de los sujetos que nos interesan medir, pero nada nos puede decir del peso de esas personas, ni de
la personalidad, ni de las estrategias de afrontamiento que utilizan. De ahí viene el concepto de Validez.
La Validez de un instrumento de medida está dada por la capacidad que tiene de medir adecuadamente la característica y/o
propiedad que nos interesa.
La Exactitud de un instrumento de medida, es un aspecto distinto, tiene que ver la capacidad de describir el fenómeno sin
sobrevalorarlo o subvalorarlo.
La Confiabilidad de un instrumento está dada por la capacidad de brindar medidas similares aun si se mide reiteradamente el
mismo fenómeno.
Los diferentes tipos de instrumentos son adecuados de acuerdo al propósito y nivel de la investigación. Cualquiera sea el motivo de
esta elección, los mismos deben tener niveles significativos de confiabilidad y validez que se deben reportar ineludiblemente en la
investigación que estamos realizando.
Población y muestra
Decimos que la población es el conjunto total de datos provenientes de personas, objetos, ideas o acontecimientos, que le interesa
al investigador y que pretende estudiar. En estadística, la población tiene un concepto un tanto más amplio que el demográfico.
Para los investigadores, la población incluye no solamente a las personas sino a todos los elementos que han sido escogidos para
su estudio. Por ejemplo; cuando nos proponemos estudiar las características de la población de Argentina que presenta dificultades
psicomotoras, nos estamos refiriendo a la totalidad de personas que poseen una particularidad bien definida.
Como podrás ver en el ejemplo estamos haciendo referencia a un conjunto de elementos (totalidad de personas) que poseen
características comunes (dificultades psicomotoras) y sobre los cuales el investigador hará extensivas las conclusiones de su
trabajo. Igualmente, lo que entendemos como población, guarda relación con la delimitación del problema y el objeto de estudio (ya
que esto queda determinado por el interés del investigador); siguiendo con el ejemplo que propusimos más arriba, no será
considerado como población al conjunto de personas con deserción académica, ya éstas tendrán características distintas a las
fijadas por el investigador.
La muestra, en cambio, es una porción de la población. Siguiendo con el ejemplo, podrás apreciar que hacer un estudio que evalúe
la totalidad de las personas que tienen problemas psicomotores en Argentina puede traer muchos inconvenientes (dificultad de
localizar la totalidad de las personas, problemas de costos, demoras en el relevamiento de los datos, etcétera), por tal motivo surge
la necesidad de adecuar la recolección de datos a una forma que permita, tomando un menor número de sujetos, arribar a las
mismas conclusiones que si se evaluara a toda la población de interés.
Ahora bien, para que podamos considerar que un subconjunto de la población pueda ser una muestra, ésta tiene que reflejar
adecuadamente las características de la población de la cual fue extraída. A esto se le llama representatividad de la muestra y es
un aspecto muy importante para poder generalizar los resultados. Decimos que una muestra es representativa cuando contiene
características similares de la población y presenta márgenes de error pequeños, los que deben ser calculados por el investigador.
En función a esto podemos hacer una primera categorización entre muestras probabilísticas y no probabilísticas:
6
No probabilísticas: la característica principal de este tipo de muestra es que son fácilmente accesible para el investigador
porque no representan mayores dificultades en la selección de los sujetos que la componen, pero por lo general son
mucho menos representativas que las probabilísticas, ya que tienen un riesgo mayor de tener un sesgo. A estas muestras
se le suele llamar: Accidentales (cuando se obtienen fortuitamente, sin un plan); Intencionales (cuando se eligen los
sujetos, no de manera fortuita sino deliberadamente, teniendo en cuenta las características que para el investigador le
resultarán importante); o Muestra de voluntarios (cuando está compuesta por individuos que desean participar de una
convocatoria que hace el investigador).
Probabilísticas: este tipo de muestra implica una cuidadosa selección de los sujetos en base a las probabilidades de que
la misma posea características similares a la población de la cual es extraída. Los muestreos probabilísticos pueden ser:
Azar simple (de una población se selecciona los individuos de manera aleatoria); Azar sistemático (es similar al azar
simple pero en este caso el investigador primero hace una lista numerada de sujetos, luego elige aleatoriamente al primer
sujeto de la población y posteriormente selecciona a los siguientes tomando como base una regla, por ejemplo:
seleccionará uno cada diez sujetos de la lista); Por conglomerados (se divide la población en varios grupos que tengan
características similares y luego se analizan completamente algunos de los grupos, descartando los demás) y,
Estratificado (el investigador divide a toda la población en diferentes subgrupos o estratos, y luego de cada estrato,
selecciona aleatoriamente a los sujetos finales).
Los datos pueden ser numéricos, o también características que se pueden expresar por palabras, esto depende de la naturaleza de
la variable y su nivel de medición (tema que veremos en otra unidad). Los datos numéricos pueden ser: la altura, el peso o bien el
resultado de un determinado test. Otras variables, como por ejemplo sexo, no son naturalmente numéricas, pero se las suele
codificar mediante números para procesarlas a través de los programas estadísticos (Hombre = 0; Mujer = 1).
Ahora bien, como podrás ver, una vez ordenados los datos tenemos mejores condiciones para analizar la información… es decir
están mejor organizados, pero sin embargo no podemos todavía tener una impresión acabada de cuáles son las características del
conjunto de esos datos hasta tanto no los procesemos.
Con esos datos estamos en condiciones de determinar qué cantidad de mujeres y hombres componen el análisis, cuál es el valor
promedio de las variables cuantitativas, etcétera.
Para obtener esta información existen diversos procesos estadísticos, algunos de ellos veremos a continuación.
La Tabla de frecuencias permite mostrar los resultados de una forma organizada y facilitar análisis posteriores de mayor
complejidad.
Es una tabla estadística de doble entrada donde se presentan los datos resumidos, de tal manera que se puede tener una visión
general del comportamiento de la/s variable/s. En las filas se ubican los valores que ha obtenido la variable y en las columnas un
conjunto de estadísticos de resumen; como por ejemplo, Frecuencia absoluta, Frecuencia relativa, Frecuencia absoluta
acumulada, Frecuencia relativa acumulada, Porcentaje, Porcentaje acumulado.
La Frecuencia absoluta indica el número de veces que una característica o valor se repite en una variable determinada. Se suele
escribir como ni , y la suma de todas las frecuencias absolutas debe coincidir con el total de elementos estudiados(N).
Por lo tanto, si deseamos calcularlo lo que tenemos que hacer es ordenar los datos (de manera creciente cuando éstos son
numéricos) y luego contar cuántas veces se repite cada uno de ellos.
Veamos un ejemplo, tengo la siguiente matriz de datos:
8
Analizaremos la variable Sexo: lo que debemos hacer es contar cuantas veces se repite el valor Mujer y el valor Hombre…. Esto
nos da que la muestra está compuesta por 7 Mujeres y 9 Hombres….!!!
Ahora podremos hacer una tabla para presentar los resultados ;)
Sexo
Frecuencia absoluta
Mujer 7
Hombre 9
Total 16
Como podrás ver, ya tenemos información que podremos comprender, por ejemplo, notamos que hay más hombres que mujeres;
aunque no sabemos con precisión cuál es la proporción o el porcentaje, éste lo podremos calcular luego.
Ahora para comprender los otros estadísticos (indicadores) tomaremos la variable Edad como ejemplo, pero antes te mostramos el
siguiente cuadro para comprender que significa cada uno de ellos así luego puedes ejercitarte:
Edad
Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa Porcentaje
absoluta relativa acumulada acumulada Porcentaje Acumulado
12 1 0,0625 1 0,0625 6,25 6,25
13 1 0,0625 2 0,125 6,25 12,5
14 2 0,125 4
16 1
17 1
21 2
23 2
27 1
32 1
41 1
44 2
45 1
Total 16
Intervalos de clase
Los intervalos de clase son particularmente útiles cuando las variables poseen muchos valores, se los suele utilizar como
resúmenes de los datos. Proporcionan una mejor comunicación acerca del patrón que poseen los datos y facilitan luego la
manipulación de los mismos.
Supongamos que estas estudiando semanas de tratamiento de pacientes con algún problema psicomotriz y tienes los siguientes
datos: 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28,
38, 41, 48, 15, 32, 13.
Como puedes ver, esta información se muestra confusa, extensa y poco útil, por lo que podemos pensar en agrupar los datos en
clases.
¿Cómo lo hacemos?
1. Lo primero que debes hacer es identificar el valor mínimo y máximo de la distribución. En este caso son 3 y 48.
2. Ahora debes tomar el valor máximo y restarle el valor mínimo (48 - 3 = 45)
3. A continuación, y si hace falta, debemos aumentar el número obtenido para que cumpla dos condiciones: a) que sea un
número entero y no tenga decimales y, b) que sea divisible por el número de intervalos que deseamos hacer.
4. El número obtenido lo dividiremos en la cantidad de intervalos que deseemos.
5. Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior
no pertenece al intervalo.
6. Construiremos una tabla de frecuencias de clase.
Siguiendo el ejemplo, si deseamos que nos queden agrupados los datos en 5 intervalos tomaremos el 45 y lo dividimos por 5 lo que
nos dará 9 (esta será la cantidad que le tendremos que sumar al valor mínimo de cada clase)
10
Tabla 2: Tabla de frecuencias para los Intervalos de clase dela variable Edad.
¿Puedes analizar la información que presenta esta tabla? Intenta sacar las conclusiones más importantes y consúltalas con los
profes ;)
La representación gráfica de una distribución de frecuencias depende del tipo de datos que la constituya y lo que nosotros
queramos poner en evidencia. Es generalmente un excelente complemento de las tablas y ofrecen un análisis rápido, directo y
comprensible para un conjunto amplio de personas.
En el caso de los gráficos de barras e histogramas en el eje horizontal (eje X) se suelen mostrar las variables que estamos
midiendo, mientras que en el eje vertical (eje Y) se indica el número de observaciones que toma la variable representada.
Como verás abajo hay distintos tipos de gráficos y cada uno de ellos resulta conveniente para un propósito. Por ejemplo, si
deseamos graficar la proporción de sujetos probablemente usaremos un gráfico de sectores, mientras que si deseamos graficar las
frecuencias de edad usaremos diagramas de barra.
Diagramas de barras: muestran los valores de las frecuencias absolutas sobre un sistema de ejes cartesianos, cuando la
variable es discreta o cualitativa.
Histogramas: formas especiales de diagramas de barras para distribuciones numéricas.
Gráficos de sectores: circulares o de torta, dividen un círculo en porciones proporcionales según el valor de las
frecuencias relativas.
Tomaremos como ejemplo la matriz de datos de más arriba para graficar algunas variables mediante Excel:
Ejercicio 2 ¿Te atrevez a interpretar cada uno de los gráficos?.... Puedes comenzar de esta forma:…
En gráfico 1 se observa que la muestra presenta una mayor proporción de hombres (56%), en tanto que la porción de mujeres representa….. el… …. …. .. . .
…………………………………………………………………………………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………………………………………………………………………………
…
Sin duda uno de los hechos que más ha acercado a la gente a la estadística es el uso de la informática ya que, hace mucho tiempo
atrás, procesar la información que provenía del trabajo de campo llevaba un considerable de tiempo aplicado a las matemáticas,
hasta tanto llegar a alguna conclusión.
Hoy día el proceso es mucho más simple, el usuario no tiene por qué conocer las fórmulas, aunque si tiene que saber interpretar
información y procesarla de acuerdo a las condiciones de sus variables. Si la persona tiene desconocimiento o un plan de trabajo
deficiente, el Software no resolverá sus problemas, más bien puede complicarlo aún más… el Software debe ser usado eligiendo la
técnica que sea adecuada en base a los objetivos que se quieran alcanzar.
Un software estadístico es un programa de computación que está particularmente orientado a resolver los problemas estadísticos.
Existe una gran cantidad de ellos, algunos te los comentaremos a continuación.
EXCEL: Si bien no es un programa estadístico en el sentido estricto, posee muchas capacidades para ser utilizado. La ventaja del
mismo es que la mayoría de los ordenadores tienen una versión de éste o de algún otro sistema similar con licencia libre.
12
SPSS: Podemos decir que es el software estadístico más conocido a nivel mundial para ciencias sociales y humanas. Presenta una
gran flexibilidad para transformar los datos y para analizarlos a través de un sinnúmero de pruebas estadísticas. Tiene la posibilidad
de realizar gráficos, aunque éstos son un tanto básicos y deslucidos. La desventaja que presenta es que es una versión paga, sin
embargo, hay una versión demo en spss.com/es/
MINITAB: es otro de los programas más usados. Permite calcular la mayoría de los estadísticos habituales: análisis exploratorio de
datos, gráficos estadísticos, estadística no paramétrica, regresión y sus variantes, análisis multivariado de datos, etc. Similar al
SPSS es una versión paga en la cual se puede encontrar versiones de prueba por un tiempo limitado
STATGRAPHICS: es un programa de fácil manejo y, por lo tanto, una buena herramienta para la enseñanza de la estadística y
para la investigación. En statgraphics.net se puede descargar una versión demo del programa (en español de duración limitada)
INFOSTAT: Es un programa desarrollado por docentes de estadística de la Universidad Nacional de Córdoba -Facultad de Ciencias
Agropecuarias. Tiene una muy buena facilidad de transportar datos a programas de Windows y gran potencia como herramienta de
cálculo estadístico.
Finalmente te contamos del software con el cual trabajaremos en este curso, el PSPP ya que es una aplicación libre y
gratuita para el análisis de datos. Proporciona análisis útiles como: frecuencias, tablas cruzadas, comparación de media;
regresión lineal, fiabilidad, reordenamiento de datos, pruebas no paramétricas, factor de análisis entre otras
características. Lo puedes descargar en https://sourceforge.net/projects/pspp4windows/
BIBLIOGRAFÍA
Gorgas-García, J., Cardiel-López, N. & Zamorano-Calvo, J. (2011). Estadística básica para estudiantes de ciencias. Departamento
de Astrofísica y Ciencias de la Atmosfera Facultad de Ciencias Físicas Universidad Complutense de Madrid. Recuperado el
22/2/19 de http://webs.ucm.es/info/Astrof/users/jaz/ESTADISTICA/libro_GCZ2009.pdf
Salazar, C. & Castillo, S. (2018). Fundamentos básicos de estadística. Recuperado el 22/2/19 de
http://www.dspace.uce.edu.ec/bitstream/25000/13720/3/Fundamentos%20B%C3%A1sicos%20de%20Estad%C3%ADstica-
Libro.pdf
13
SIMULACIONES
Las simulaciones te permitirán comprender en mayor profundidad los detalles en la medida que vayas modificando los
valores. ¡Atrévete a jugar y reforzar tus conocimientos!!!
Percentiles: https://www.bioestadistica.uma.es/analisis/percentil/
SOLUCIONES
Ejercicio 1
Tabla 2: Tabla de frecuencias para la variable Edad. Respuestas
Edad
Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa Porcentaje
absoluta relativa acumulada acumulada Porcentaje Acumulado
12 1 0,0625 1 0,0625 6,25 6,25
13 1 0,0625 2 0,125 6,25 12,5
14 2 0,125 4 0,25 12,5 25
16 1 0,0625 5 0,3125 6,25 31,25
17 1 0,0625 6 0,375 6,25 37,5
21 2 0,125 8 0,5 12,5 50
23 2 0,125 10 0,625 12,5 62,5
27 1 0,0625 11 0,6875 6,25 68,75
32 1 0,0625 12 0,75 6,25 75
41 1 0,0625 13 0,8125 6,25 81,25
44 2 0,125 15 0,9375 12,5 93,75
45 1 0,0625 16 1 6,25 100
Total 16 100
Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional