Clase 4 - TipTratamientoDatos

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 10

DIPLOMADO

Big Data, Analytics y Business


Intelligence
DATA
ANALYTICS
MODULO II
DATA ANALYTICS
Regresión Lineal
• Determina el tipo de relación que existe dos variables cuantitativas
• Línea que se ajuste a todos los puntos
• Línea recta que se ajuste a todos los puntos de
dispersión con el menor error mínimo

y Y= A+BX

Y=A+BX1+CX2
B

x
Recta de regresión
• Línea tal que la distancia entre cada uno de los
puntos y la línea recta sea lo mínimo posible
El método mínimos cuadrados nos
garantiza que
La sumatoria de las distancias
verticales entre cada uno de los
puntos de dispersión y la recta de
regresión es la mínima posible

Existe un error entre


y - y estimada
Regresión Lineal
• Mejor curva, línea que se ajuste a mis datos
Sobreajuste: implica que la línea pase
por todos los puntos
Regresión RIDGE LASSO
• COMO ? Existe sobreajuste cuando dividimos
los datos en un set:
Entrenamiento (train)
• Aplicando una penalización Prueba(test)

train test

Suma de cuadrados =0
perfecto
Buen ajuste Mal ajuste
TRAINING DATA SET
Suma de cuadrados = ALTO
ALTA VARIANZA

Sobreajuste Ridge -> Evita sobreajuste


Rediciendo l;a variabilidad
Regresión RIDGE
• Encontrar una línea/curva que mejor represente a los datos de prueba

Cambia la línea

Baja rendimiento del modelo


en datos de entrenamiento
Pero considera un mejor
rendimiento considerando
ambos datasets
RIDGE
• IMPLICA QUE SEA MENOS
SENSITIVO A VARIACIONES DE
LA VARIABLE INDEPENDIENTE
(x)

Termino de penalizacion
LASSO
• TOMA EN CUANTA EL VALOR ABSOLUTO DE LA
PENDIENTE
• UTILIZADO PARA DETERMINAR VARIABLES MENOS
UTILES-> REDUCE LA PENDIENTE A CERO AL
TRATARSE DE VALOR ABSOLUTO

Termino de penalización

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy