Banaketa normal
Probabilitate teorian eta estatistikan, zorizko aldagai bat banaketa normalari jarraitzen diola, zorizko aldagai gausstarra dela, edo laburrago normal banatzen dela esaten da, zorizko aldagaiaren trinkotasun funtzioa honelakoa denean:
Estatistikan gehien erabiltzen den probabilitate banaketa da, bere ezaugarri bereziengatik. Zorizko aldagaiak har ditzakeen balioei buruz inongo murrizketarik jartzen ez duela (bere balio posibleak -tik -ra baitoaz), bere trinkotasun funtzioak kanpai itxura erakusten du beti (eta horregatik Gaussen kanpaia ere deitzen zaio), datuen histograma irudikatuz gero errealitateko aldagai asko bezalaxe. Hori dela eta, aldagai askoren eredu gisa aukeratzen da, hortik datorkio normal izena. Bestalde, oso propietate matematiko interesgarriak ditu: probabilitate banaketa anitzen limitea da eta inferentzian zenbatesle askoren banaketa izanik, hipotesi kontraste eta konfiantza tarte askotarako erabiltzen da. Limitearen teorema zentralari esker, banaketa normala zorizko aldagaia faktore anitzen ekarpenen batura denerako ere da baliozkoa.
Banakuntza normala bi parametroren araberakoa da: μ eta σ, batez bestekoa edo itxaropen matematikoa eta desbideratze estandarra hurrenez hurren. Horrela, X aldagai bat banaketa normalari jarraitzen diola honela adierazten da:
Banakuntza normal estandarra μ=0 eta σ=1 parametroak dituen banaketa normala da eta beste banaketa normaletako probabilitateak kalkulatzeko oinarri gisa erabiltzen da. Banakuntza normal estandarra honela irudikatzen da:
Propietateak
[aldatu | aldatu iturburu kodea]- Banakuntza normalaren itxaropen matematikoa μ da. Desbideratze estandarra σ da.
- Banakuntza normalaren trinkotasun funtzioa simetrikoa da, ardatzaren inguruan.
- Mediana eta moda bat datoz μ itxaropen matematikoarekin.
- Itxaropen matematikoaren inguruko probabilitateak hauek ditugu:
- [μ - σ, μ + σ] tarteko probabilitatea %68,26 da.
- [μ - 2σ, μ + 2σ] tarteko probabilitatea %95,44 da.
- [μ -3σ, μ + 3σ] tarteko probabilitatea %99,74 da.
- Banakuntza normal estandarrean inferentzia estatistikoan maiz erabiltzen diren pertzentil jakingarri hauek daude:
- , hau da, banaketa normal estandar batean bere azpitik 0.9995eko probabilitatea uzten duen balioa 3.29053 da.
- X aldagai normal bati aldagai aldaketa lineala egiten bazaio, X ~ N(μ, σ) eta a, b zenbaki errealak izanik, orduan (aX + b) ~ N(aμ+b, |a|σ).
- X ~ N(μx, σx) eta Y ~ N(μy, σy) izanik, non X¡ eta Y elkarrekiko independenteak diren, orduan:
- U = X + Y ~ N(μx + μy, σx2 + σy2)
- Arestikoaren alderantziz, independenteak diren bi zorizko aldagaien batura normal banatzen bada, bi zorizko aldagaiak normalak izan behar dira, Cramerren teoremaren arabera.
- V = X - Y ~ N(μx - μy, σx2 + σy2)
- X eta Y zorizko aldagaiek bariantza berdinak badituzte, U eta V elkarrekiko independenteak dira.
Probabilitateen kalkulua eta zorizko aldagai normalen estandarizazioa
[aldatu | aldatu iturburu kodea]Probabilitateak banaketa funtzioa erabiliz kalkulatzen dira, μ eta σ zehaztu ondoren:
Aurreko kalkulua eskuz oso konplexua denez, probabilitateak estandarizazioa delako prozesu batez kalkula daitezke errazago. Estandarizazioaz banaketa normal guztiak banaketa normal estandarrera bihurtzen dira. Bihurketa hau egin eta gero, banaketa normal estandarreko probabilitateak taula batez aise kalkulatzen dira (taula ikusteko, eranskinera jo). X zorizko aldagai normal bat estandarizatzeko, μ itxaropena kendu eta emaitza σ desbideratze estandarraz zatitzen da:
Adibidez, dugularik, zenbatekoa da probabilitatea?
Balio batetik gorako probabilitateak eta balio negatiboei dagozkien probabilitateak banaketa normalaren simetria eta probabilitateen osagarritasuna erabiliz kalkulatzen dira. balioetarako probabilitateak ia 1 direla esan daiteke, taulan agertzen den zehaztasunerako.
Taularik ezean, banaketa funtzioaren probabilitateak errore funtzioa, erf ikurrez irudikatzen dena, eta bere Taylorren garapena erabiliz kalkula daitezke. Banakuntza normal estandarraren banaketa funtzioa honela lotzen da errore funtzioarekin: