Ejercicios Unidades Vi y Vii
Ejercicios Unidades Vi y Vii
Ejercicios Unidades Vi y Vii
Análisis Cluster
1. Utilizando la base “HATCO” utilizada en clase, y el programa R-Studio, se pide
a) Aplicar un análisis cluster jerárquico, utilizando como métodos de conglomeración el
método de Ward y al menos un método más, a su elección. Defina el número apropiado
de cluster, apoyándose en los criterios vistos en clase u otros criterios que estén incluidos
en la librería de R-studio.
b) Aplique al menos uno de los métodos no jerárquicos indicados en clase (k-medias, k-
medianas, h-medias), utilizando como valores semilla los centroides de los clusters
obtenidos mediante alguno de los métodos jerárquicos aplicados en a).
c) Etiquete los cluster obtenidos en b) y fundamente claramente el uso de dichas etiquetas
d) Ahora caracterice los clusters obtenidos, utilizando para ello las variables x8, x9, x12 y
x13.
2. Realizar una aplicación de las técnicas de análisis clúster revisadas en clase, previo un análisis
exploratorio de la data, en un problema de clasificación de la vida real. Pueden aplicar
cualquiera de las técnicas vista en clase o una combinación de ellas (clúster jerárquico, clúster
no jerárquico o clúster bietápico), pero se debe justificar su uso. La aplicación realizada
puede estar basada en otras investigaciones. Este ejercicio lo pueden hacer en parejas.
3. Cluster con variables categóricas. Utilizando la misma base de datos “HATCO”, trabajada en
clase, aplique un análisis cluster jerárquico, pero esta vez utilice para formar los clusters
únicamente las variables categóricas binarias X8, x11, x12 y x13. Para la formación de los
clusters aplique el método de vinculación completa (vecino más alejado). Como medida de
similaridad puede usar el índice de coincidencias simple o el índice de Sneath y Sokal. Luego
de definir el número adecuado de clusters, asígnele una etiqueta o nombre a cada uno. Para
este ejercicio puede usar el software que usted desee.
Análisis Discriminante
1. En este ejercicio también se utilizará la base “AREA_ESTUDIO.dot”. Con esta base se pide
aplicar el análisis discriminante para clasificar a los estudiantes en relación a la variable
categórica 𝑎𝑟𝑒𝑎. Para ello, deberá realizar lo siguiente:
a) Establezca una lista de variables independientes que para usted pueden ser útiles como
variables clasificadoras y justifique su uso
b) Aplique el análisis discriminante lineal en SPSS con todas las variables antes indicadas. Luego
repita el análisis con el proceso stepwise.
c) Con las variables seleccionadas en el literal previo, aplique el análisis discriminante cuadrático
en STATA e interprete los resultados
2. Se desea discriminar entre 3 poblaciones normales con vectores de medias (0,0), (1,1) y
(0,1), con varianzas (2,4) y coeficiente de correlación lineal 𝜌 = 0.5. Calcular y dibujar las
funciones discriminantes y hallar su punto de corte.