Distribuciones Continuas: Distribucion Normal

Esta distribución resulta útil no sólo porque un gran número de distribuciones de frecuencias presentan formas aproximadamente normales, sino también por su gran significado teórico en el campo de la estadística inferencial. En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal:

Caracteres morfológicos de individuos: talla, peso,..
Caracteres sociológicos: consumo de un cierto producto por un grupo de individuos, puntuaciones de examen…
Caracteres psicológicos: cociente intelectual, grado de adaptación a un medio,..
Valores estadísticos muestrales: la media.
Otras distribuciones como la binomial o la de Poisson son aproximaciones normales.

No obstante, hay que tener cuidado al suponer que un determinado conjunto de observaciones se puede aproximar por una distribución normal.
La distribución normal la obtuvo inicialmente De Moivre en 1733 como límite o aproximación de la distribución $Distribución Normal$ cuando $Distribución Normal$ . Posteriormente Gauss en 1809 y Laplace en 1812 llegaron a obtenerla empíricamente al estudiar la distribución de errores accidentales en Astronomía y Geodesia.
Una justificación de la frecuente aparición de la distribución normal es el teorema central del limite, que veremos más tarde, que establece que cuando los resultados de un experimento son debidos a un conjunto muy grande de causas independientes, que actúan sumando sus efectos, siendo cada efecto individual de poca importancia respecto al conjunto, es esperable que los resultados sigan una distribución normal
La curva normal responde al tipo de curva perfectamente simétrica, y unimodal basada en un número infinito de casos, por lo que sólo puede ser tratada de forma aproximada cuando se opera con datos reales. Por tratarse de una curva simétrica coinciden la media, la moda y la mediana.
Diremos que la variable aleatoria, de tipo continuo, sigue una distribución Normal de parámetros $Distribución Normal$ , si su función de densidad es:    $Distribución Normal$ , donde $Distribución Normal$ y tales que $Distribución Normal$ y $Distribución Normal$
La función de densidad depende de dos parámetros: media y varianza de la distribución, y puede verse por la definición que no hay una única distribución normal sino una familia completa de distribuciones.
Abreviadamente esta distribución la indicaremos por: $Distribución Normal$
Se observa que tiene forma de campana, de aquí que frecuentemente se le llame curva o campana de Gauss.
Los parámetros:

$Distribución Normal$ , es el centro de la distribución y también se corresponde con el punto máximo de la distribución.
$Distribución Normal$ , nos da una idea del grado de apertura de la distribución.

Veamos los siguientes ejemplos:

En este caso tenemos dos curvas normales $Distribución Normal$ y $Distribución Normal$ que tienen distintas medias pero tienen la misma desviación típica, por tanto sus centros están en diferentes lugares pero el grado de apertura de ambas distribuciones es el mismo.
En este segundo caso tenemos dos curvas normales $Distribución Normal$ y $Distribución Normal$ que tienen distintas desviaciones típicas pero tienen la misma media. Ahora las curvas están centradas en el mismo punto m pero su grado de apertura es distinto. Como d 1 < d 2 la curva de mayor desviación típica, en este caso d 2 tendrá una mayor dispersión.

Características de ésta distribución:

Función de distribución:

$Distribución Normal$

La integral correspondiente a esta función de distribución sólo puede calcularse mediante métodos numéricos aproximados. Una manera de simplificar estos cálculos es mediante el proceso de tipificación de una variable aleatoria normal, que nos permite pasar de una $Distribución Normal$ a una $Distribución Normal$
La variable normal con media cero y desviación típica la unidad se denomina normal estándar $N(0,1)$; su función de distribución está tabulada. Para calcular probabilidades en el caso general, transformaremos la variable aleatoria normal $Distribución Normal$ en la variable normal estándar $Distribución Normal$ , mediante:
$Distribución Normal$
Si aplicamos el cambio de variable tenemos como función de densidad:
$Distribución Normal$
y su función de distribución es:
$Distribución Normal$
Las características que presenta la normal tipificada son:

No depende de ningún parámetro.
La curva $Distribución Normal$ es también es simétrica respecto del eje OY.
Para realizar la representación gráfica de la función de densidad $Distribución Normal$ correspondiente a la normal $Distribución Normal$ procederíamos de forma análoga a como se hizo para la distribución $Distribución Normal$ .

Media y Varianza

$Distribución Normal$ $Distribución Normal$

Cálculo de probabilidades

Sea $Distribución Normal$ una variable aleatoria normal $Distribución Normal$ con función de distribución acumulada $Distribución Normal$ , y sean $Distribución Normal$ y $Distribución Normal$ dos posibles valores que verifican que $Distribución Normal$ . Entonces: $Distribución Normal$

d normal 3 Distribución Normal

Cualquier probabilidad puede obtenerse a partir de la función de distribución acumulada, sin embargo, como vimos anteriormente calcular la integral correspondiente a esta función de distribución sólo puede hacerse mediante métodos numéricos aproximados. No obstante cualquier distribución normal puede expresarse como una normal estándar $Distribución Normal$ :
$Distribución Normal$

Donde $Distribución Normal$ es una variable aleatoria normal estándar que está tabulada. En esta tabla encontraremos los valores de:
$Distribución Normal$

d normal 2 Distribución Normal

No debemos olvidar que se trata de una distribución simétrica y que el área bajo la curva normal es igual a la unidad. Por tanto:

$Distribución Normal$
$Distribución Normal$
$Distribución Normal$

Valoración de la normalidad

La decisión de describir una distribución mediante una curva normal puede determinar el análisis que posteriormente se haga de los datos. Una forma de ver si los datos son aproximadamente normales es observando su histograma. Este nos puede revelar de forma clara características no normales de una distribución: las asimetrías prolongadas, los vacíos entre datos, etc.
Una forma de valorar si una distribución es normal es señalando los puntos $Distribución Normal$ en el eje de ordenadas y observando la probabilidad comprendida en estos intervalos. En el caso de una distribución normal $Distribución Normal$ :

El 68,3 % de las observaciones se encuentran entre $Distribución Normal$
El 95,5 % de las observaciones se encuentran entre $Distribución Normal$
El 97,7 % de las observaciones se encuentran entre $Distribución Normal$

Propiedades de ésta distribución

Si $Distribución Normal$ son variables aleatorias independientes, distribuidas según una $Distribución Normal$ , y si $Distribución Normal$ , entonces la variable aleatoria: $Distribución Normal$ , sigue una distribución: $Distribución Normal$
La suma de n variables aleatorias independientes, $Distribución Normal$ y distribuidas según una $Distribución Normal$ sigue una distribución: $Distribución Normal$
Si $Distribución Normal$ son n variables aleatorias independientes e idénticamente distribuidas según una $Distribución Normal$ , entonces la variable aleatoria suma de las n variables: $Distribución Normal$ , sigue una distribución: $Distribución Normal$
Si $Distribución Normal$ son n variables aleatorias independientes e idénticamente distribuidas según una $Distribución Normal$ , entonces la variable aleatoria media aritmética de estas n variables: $Distribución Normal$ , sigue una distribución: $Distribución Normal$

Aproximación a la distribución normal la distribución binomial

El teorema de Moivre (1.756) permite realizar esta aproximación considerando que las variables aleatorias sigan una distribución binomial con: $Distribución Normal$ . Este teorema fue generalizado posteriormente por Laplace en 1.810 para distribuciones no simétricas $Distribución Normal$ .
Vimos que la variable aleatoria binomial era el número de éxitos que tienen lugar cuando se realizan n repeticiones independientes de un experimento o prueba de Bernoulli. La variable aleatoria $Distribución Normal$ puede escribirse como la suma de n variables aleatorias de Bernoulli: $Distribución Normal$
Si $Distribución Normal$ es una variable aleatoria binomial, $Distribución Normal$ , con media $Distribución Normal$ y desviación típica $Distribución Normal$ entonces, cuando $Distribución Normal$ la variable aleatoria: $Distribución Normal$ , es decir: $Distribución Normal$

En la práctica, decir que n es lo suficientemente grande, se traduce en:
$Distribución Normal$
Lo que se hace es aproximar una distribución discreta, como es la binomial, a una distribución normal que es continua, y ya que en el caso continuo la probabilidad o masa asociada a un valor concreto de la variable aleatoria es nulo, tendremos que utilizar la corrección de continuidad de Fisher para calcular la probabilidad deseada:

Probabilidad en $Distribución Normal$	Corrección de continuidad
$Distribución Normal$	$Distribución Normal$
$Distribución Normal$	$Distribución Normal$
$Distribución Normal$	$Distribución Normal$
$Distribución Normal$	$Distribución Normal$

Aproximación a la distribución normal la distribución de Poisson

En el caso de la distribución de Poisson, la variable aleatoria nos establece el número de veces que ocurre un suceso en un determinado intervalo de tiempo, sabemos que la media y la varianza de esta distribución coincide con el parámetro $Distribución Normal$ .
Si el número de ocurrencias esperadas $Distribución Normal$ es elevado y el intervalo de tiempo se divide en subintervalos de idéntica longitud. En ese caso, el número total de ocurrencias es la suma de las ocurrencias de cada subintervalo, y puede verse como la suma de un número moderadamente grande de variables aleatorias, cada una de las cuales representa el número de ocurrencias en un subintervalo del periodo de tiempo, puede utilizarse la distribución normal como una aproximación a la distribución de Poisson. En la práctica la aproximación es aceptable si $Distribución Normal$ .
El procedimiento práctico es análogo al caso de la binomial, así pues si tenemos una variable aleatoria $Distribución Normal$ que se distribuye según una distribución de Poisson de parámetro $Distribución Normal$ , entonces cuando $Distribución Normal$ la variable aleatoria:
$Distribución Normal$ , es decir: $Distribución Normal$
Al igual que en el caso de la distribución binomial es necesario aplicar la corrección de continuidad para calcular las probabilidades.