GoyesDev

Posted on Feb 21 • Edited on Feb 25

[Notas] Distribuciones de Probabilidad e Inferencia

#ai #masterdegree #viu

Distribuciones de probailidad:

Variables Discretas
- Binomial B(n,p)
  - n número de elementos de la muestra y p probabilidad de éxito.
  - $P( x = k) = \binom{n}{k} p^{k} (1-p)^{(n-k)} = \frac{n!}{(n-k)!k!} p^k (1-p)^{(n-k)}$
  - Valor esperado $E[x] = n * p$
  - Varianza $V[x] = n * p * (1 - p)$
- Poisson:
  - Se usa cuando un evento se mide de forma discreta, pero a lo largo del tiempo. e.g. Números de accidentes que ocurren en tres horas en una ciudad, números de llamadas que entran en un callcenter por tres horas.
  - $P( X = k ) = \frac{\lambda ^ k * e ^ {- \lambda}}{ k! }$
  - Valor esperado $E[x] = \lambda = \mu$
  - Varianza $V[x] = \lambda = \mu$
Variables Continuas
- Normal (Estimaciones intervalo de confianza, test de hipótesis)
- t-student
- chi cuadrado
- F de fisher.

Ejemplos

Binomial

El jefe de recursos humanos de una empresa realiza un test de diez items a los aspirantes de un puesto, teniendo en cada item cuatro posibles respuestas, de las que solo una es correcta. Suponiendo que los aspirantes teniendo la misma probabilidad de responder. Se pide hallar las probabilidades para el aspirante:

Probabilidad de acertar respuesta: $P( A ) = \frac{1}{4}$
Probabilidad de fallar respuesta: $P( \overline{A} ) = \frac{3}{4}$

Conteste todos los items mal ( $n = 10$ , $p = 3/4$ )

P(k = 10) = \binom{10}{10} \left(\frac{3}{4}\right)^{10} \left(\frac{1}{4}\right)^{(10-10)}

P(k = 10) = \frac{10!}{(0)!10!} \left(\frac{3}{4}\right)^{10} \left(\frac{1}{4}\right)^{(0)}

P(k = 10) = \left(\frac{3}{4}\right)^{10} = 0.056

Conteste al menos cuatro items bien (sumatoria de probabilidad binomial con $p(A) = 1/4$ , $p(\overline{A}) = 3/4$ y $n = [4, 10]$ )

P(X \ge 4) = 1 - P(X \le 3) = 1 - \sum_{k=0}^{3} \binom{10}{k} \left(\frac{1}{4}\right)^k \left(\frac{3}{4}\right)^{10-k}

P(X \ge 4) = 1 - \Bigg[ \binom{10}{0} \left(\frac{1}{4}\right)^0 \left(\frac{3}{4}\right)^{10} + \binom{10}{1} \left(\frac{1}{4}\right)^1 \left(\frac{3}{4}\right)^{9} + \binom{10}{2} \left(\frac{1}{4}\right)^2 \left(\frac{3}{4}\right)^{8} + \binom{10}{3} \left(\frac{1}{4}\right)^3 \left(\frac{3}{4}\right)^{7} \Bigg]

P(X \ge 4) = 1 - \Bigg[ \left(\frac{3}{4}\right)^{10} + 10\left(\frac{1}{4}\right)\left(\frac{3}{4}\right)^{9} + 45\left(\frac{1}{4}\right)^2\left(\frac{3}{4}\right)^{8} + 120\left(\frac{1}{4}\right)^3\left(\frac{3}{4}\right)^{7} \Bigg]

P(X \ge 4) = 1 - \frac{1}{4^{10}} \left( 3^{10} + 10 \cdot 3^{9} + 45 \cdot 3^{8} + 120 \cdot 3^{7} \right)

P(X \ge 4) \approx 0.224

Conteste entre cuatro y seis items bien

P(6 \ge X \ge 4) = P(X = 6) + P(X = 5) + P(X = 4)

Conteste todos los items bien

P(X = 10)

Conteste menos de tres items bien

P(X \le 2) = P(X = 2) + P(X = 1) + P(X = 0)

Poisson

En un servicio de urgencias de un determinado hospital, se sabe que por término medio llegan diez pacientes durante una hora. Calcula la probabilidad de que:

Sean X el número de pacientes y $E[x] = \lambda = \mu = 10$

a) Lleguen exactamente cinco pacientes en una hora

P( X = k ) = \frac{\lambda ^ k * e ^ {- \lambda}}{ k! }

P( X = 5 ) = \frac{10 ^ 5 * e ^ {- 10}}{ 5! }

P( X = 5 ) \approx 0.037

b) Lleguen menos de cinco pacientes en una hora

P( X < 5 ) = P( X = 0 ) + P( X = 1 ) + P( X = 2 ) + P( X = 3 ) + P( X = 4 )

P( X < 5 ) = \frac{10 ^ 0 * e ^ {- 10}}{ 0! } + \frac{10 ^ 1 * e ^ {- 10}}{ 1! } + \frac{10 ^ 2 * e ^ {- 10}}{ 2! } + \frac{10 ^ 3 * e ^ {- 10}}{ 3! } + \frac{10 ^ 4 * e ^ {- 10}}{ 4! }

P( X < 5 ) \approx 0.02925

c) Lleguen más de cuatro y menos de ocho pacientes en una hora

P( 4 < X < 8 ) = P( X = 5 ) + P( X = 6 ) + P( X = 7 )

P( 4 < X < 8 ) = \frac{10 ^ 5 * e ^ {- 10}}{ 5! } + \frac{10 ^ 6 * e ^ {- 10}}{ 6! } + \frac{10 ^ 7 * e ^ {- 10}}{ 7! }

P( X < 5 ) \approx 0.191

Aproximaciones entre distribuciones discretas

Se puede aproximar una distribución con otra, si se dan ciertas condiciones en el problema.

En la distribución de Binomial se tiene que:

Valor esperado $E[x] = n * p$
Varianza $V[x] = n * p * (1 - p)$

En la distribución Poisson se tiene que:

Valor esperado $E[x] = \lambda = \mu$
Varianza $V[x] = \lambda = \mu$

Se puede aproximar Binomial a Poisson cuando $n \ge 20$ y $p < 0.05$ , y se usa $\lambda = n \cdot p \le 10$

Es más fácil calcular con Poisson (con exponencial) en lugar de combinatorias.

Ejemplos

Una compañía de seguros garantiza pólizas de seguros individuales contra retrasos aéreos de más de doce horas. Una encuesta ha permitido estimar a lo largo de un año que cada persona tiene una probabilidad de cada mil de ser víctima de un retraso aéreo que esté cubierto por este tipo de póliza y que la compañía aseguradora podrá vender una media de cuatro mil pólizas al año. Se pide hallar las siguientes probabilidades:

a) Que el número de retrasos cubiertos por la póliza no pase de cuatro por año

Sea X número de retrasos, $p(X) = 1/1000$ , $n = 4000$ , y $n \cdot p = 4 < 10$ .

Por esto se puede calcular la probabilidad con Poisson usando $\lambda = n \cdot p = 4$

P( X \le 4 ) = P( X = 0 ) + P( X = 1 ) + P( X = 2 ) + P( X = 3 ) + P( X = 4 )

P( X \le 4 ) = \frac{4 ^ 0 * e ^ {- 4}}{ 0! } + \frac{4 ^ 1 * e ^ {- 4}}{ 1! } + \frac{4 ^ 2 * e ^ {- 4}}{ 2! } + \frac{4 ^ 3 * e ^ {- 4}}{ 3! } + \frac{4 ^ 4 * e ^ {- 4}}{ 4! }

P( X \le 4 ) = 0.6288

b) Número de retrasos esperados por año

E[ X ] = n \cdot p = \lambda = 4

c) Que el número de retrasos sea superior a dos por año

P( X > 2 ) = 1 - P( X \le 2 ) = 1 - P( X = 2 ) - P( X = 1 ) - P( X = 0 )

Variables aleatorias continuas

Distribución normal

Media poblacional $\mu$ .
Desviación estándar $\sigma$ .

X \sim \mathcal{N}(\mu, \sigma)

Distribución normal estándar

$Z = \frac{X - \mu}{\sigma}$ .

Z \sim \mathcal{N}(0, 1)

Ejemplo

Dado:

X \sim \mathcal{N}(\mu = 60, \sigma = 10)

Calcular:

$P(X \ge 70)$ , $P(X \le 80)$ , $P(39 \le X \le 80)$ .

Podemos tener

Z = \frac{X - \mu}{\sigma} = \frac{X - 60}{10}

Luego, lo que piden es equivalente a:

$P(Z \ge 1)$ , $P(Z \le 2)$ , $P(-2,1 \le X \le 2)$ .

P(Z \ge 1) = 1 - P(Z < 1) = 1 - 0.8413 = 0.1587

P(Z \le 2) = 0.9772

P(-2,1 \le X \le 2) = P( X < 2 ) - P( X < -2.1 ) = P( X < 2 ) - P( X > 2.1 ) = P( X < 2 ) - 1 + P( X < 2.1 ) = 0.9772 - 1 + 0.9821 = 0.9593

Aproximación de variable discreta a continua

Se puede aproximar una distribución Binomial o Poisson a continua Normal.

Binomial:

Valor esperado $E[x] = n * p$
Varianza $V[x] = n * p * (1 - p)$

Poisson:

Valor esperado $E[x] = \lambda = \mu$
Varianza $V[x] = \lambda = \mu$

Normal:

Valor esperado $E[x] = \mu$
Varianza $V[x] = \sigma^2$
Se puede aproximar Binomial a Normal si $n \cdot p > 5$
Se puede aproximar Poisson a Normal si $\lambda > 10$

Aproximación por continuidad o Regla de Yales

P( x = k ) = P(k - 0.5 \le X \le k + 0.5)

P( x \le k ) = P(X \le k + 0.5)

NOTA: Se puede aplicar para el caso de lanzamiento de un dado mil veces.

Introducción a la Inferencia Estadística

Inferencia estadística: Son las afirmaciones válidas acerca de la población o proceso basadas en la información contenida en la muestra.
Estadístico: Función de los datos muestras que no contiene parámetros desconocidos (medidas de tendencia central: media, medidas de dispersión: varianza, desviación estándar)
Distribución de probabilidad de X: Relaciona el conjunto de valores de X con la probabilidad asociada con cada uno de estos valores.
Estimador puntual: Estadístico que estima un valor específico de un parámetro (media poblacional, $\hat{\mu}$ ).

Ejemplo

La media poblacional es un estimador de la media muestral $\hat{\mu} = \overline{X}$

Se pueden proponer tantos estimadores para los parámetros como se quiera. (Se puede calcular el valor esperado)

En lo que sigue se denotará como parámetro $\theta$ y estimador del parámetro $\hat{\theta}$

En la Población tenemos parámetros, media ( $\mu$ ), varianza ( $\sigma^2$ ), desviación estándar ( $\sigma$ ) y proporción ( $p$ ).
En la muestra tenemos estadísticos, media muestral ( $\overline{X}$ ), varianza muestral ( $s^2$ ), desviación estándar ( $s$ ) y proporción ( $\hat{p}$ ).
Un ESTIMADOR de los PARÁMETROS de la población son los ESTADISTICOS de una muestra. Se dice que el valor esperado del estadístico muestral ( $E[\hat{\theta}]$ ) es el parámetro poblacional ( $\theta$ ). Es decir: $E[\overline{X}] = \mu$ , $E[s^2] = \sigma^2$

Lo anterior implica lo siguiente:

$E[X \pm Y] = E[X] + E[Y]$

$E[X \cdot Y] = E[X] \cdot E[Y]$

$E[k \cdot X] = k \cdot E[X]$

Para la varianza, el mejor estimador es la cuasivarianza. Así como se encuentran valores esperados, se puede encontrar la varianza. El que tenga una variable pequeña es el mejor estimador.

$V[X \pm Y] = V[X] + V[Y]$

$V[k \cdot X] = k^2 \cdot V[X]$

La varianza es la diferencia (qué tan cerca) o variabilidad de las muestras alrededor de la media.

$V[k] = 0$

Propiedades de los estimadores

Un estimador es insesgado, si se verifica que $E[\hat{\theta}] = \theta$ .
En caso de no ser insesgado, es sesgado y este está dado por $E[\hat{\theta}] - \theta$ .
Eficiencia es el estimador con menos varianza: Sean $\hat{\theta_1}$ y $\hat{\theta_2}$ dos estimadores insesgados de $\theta$ . Diremos que $\hat{\theta_1}$ es más eficiente que $\hat{\theta_2}$ si se verifica que $V( \hat{\theta_1} ) < V( \hat{\theta_2} )$
Error cuadrático medio: $ECM( \hat{\theta} ) = V( \hat{\theta} ) + sesgo(\hat{\theta})^2$

Ejemplo

Verificar si los siguientes estimadores son insesgados. Si tiene por media poblacional $\mu$ y desviación típica $\sigma$ . ¿Cuál es más eficiente?

\hat{\theta_1} = 0.5 \cdot x_1 + 0.15 \cdot x_2 + 0.25 \cdot x_3 + 0.1 \cdot x_4

$E[\hat{\theta_1}] = E[ 0.5 \cdot x_1 + 0.15 \cdot x_2 + 0.25 \cdot x_3 + 0.1 \cdot x_4 ] = 0.5 \cdot E[ x_1 ] + 0.15 \cdot E[ x_2 ] + 0.25 \cdot E [ x_3 ] + 0.1 \cdot E [ x_4 ] = 0.5 \cdot \mu + 0.15 \cdot \mu + 0.25 \cdot \mu + 0.1 \cdot \mu = (0.5 + 0.15 + 0.25 + 0.1) \cdot \mu = \mu$

$V[\hat{\theta_1}] = V[ 0.5 \cdot x_1 + 0.15 \cdot x_2 + 0.25 \cdot x_3 + 0.1 \cdot x_4 ] = 0.5^2 \cdot V[ x_1 ] + 0.15^2 \cdot V[ x_2 ] + 0.25^2 \cdot V[ x_3 ] + 0.1^2 \cdot V[ x_4 ] = 0.5^2 \cdot \sigma + 0.15^2 \cdot \sigma + 0.25^2 \cdot \sigma + 0.1^2 \cdot \sigma = (0.5^2 + 0.15^2 + 0.25^2 + 0.1^2) \cdot \sigma = 0.345 \cdot \sigma$

\hat{\theta_2} = \frac{x_1 + 2 \cdot x_2 + 3 \cdot x_3}{6}

$E[\hat{\theta_2}] = \frac{1}{6} \cdot E[x_1 + 2 \cdot x_2 + 3 \cdot x_3] = \frac{1}{6} \cdot (E[x_1] + 2 \cdot E[x_2] + 3 \cdot E[x_3]) = \frac{1}{6} \cdot (\mu + 2 \cdot \mu + 3 \cdot \mu) = \frac{6}{6} \cdot \mu = \mu$

$V[\hat{\theta_2}] = \frac{1}{6^2} \cdot V[x_1 + 2 \cdot x_2 + 3 \cdot x_3] = \frac{1}{36} \cdot (V[x_1] + 4 \cdot V[x_2] + 9 \cdot V[x_3]) = \frac{1}{36} \cdot (1 + 4 + 9) \cdot \sigma = \frac{14}{36} \cdot \cdot \sigma = 0.3889 \cdot \sigma$

\hat{\theta_3} = \frac{x_3 - 4 \cdot x_2}{-3} = \frac{4 \cdot x_2 - x_3}{3}

$E[\hat{\theta_2}] = \frac{1}{3} \cdot E[4 \cdot x_2 - x_3] = \frac{1}{3} \cdot (4 \cdot E[x_2] - E[x_3]) = \frac{1}{3} \cdot (3 \mu) = \mu$

$V[\hat{\theta_2}] = \frac{1}{3^2} \cdot V[4 \cdot x_2 - x_3] = \frac{1}{9} \cdot (16 \cdot V[x_2] + V[x_3]) = \frac{17}{9} \cdot \sigma = 1.8889 \cdot \sigma$

El estimador más eficiente es

\hat{\theta_1} = 0.5 \cdot x_1 + 0.15 \cdot x_2 + 0.25 \cdot x_3 + 0.1 \cdot x_4

$E[\hat{\theta_1}] = \mu$

$V[\hat{\theta_1}] = 0.345 \cdot \sigma$

Estimación por intervalo de confianza

Estimación intervalo de confianza para la varianza

Para dicha estimación debe ser conocido el valor de la varianza o desviación estándar o típica (el estadístico); es decir $s^2$ donde:

\sigma^2 \in \left( \frac{(n-1)s^2}{\chi^2_{\alpha/2,\, n-1}}, \; \frac{(n-1)s^2}{\chi^2_{1-\alpha/2,\, n-1}} \right)

\chi^2_{\alpha/2,\, n-1} \quad (\text{Chi cuadrado})

Estimación Intervalo de confianza para la varianza de dos poblaciones

Para dicha estimación debge ser conocido el valor de las varianza o desviaciones estándar o típica (el estadístico); es decir: $s_1^2$ , $s_2^2$ donde

Tamaño de la muestra

Se considera el error como

Contrastes de hipótesis

Hipótesis estadística Es una afirmación sobre los valores de los parámetros de una població o proceso, que puede probarse a partir de la información contenida en una muestra.
Hipótesis nula: $H_0$ Es considerada como la que hace referencia al valor del parámetro que se quiere probar como verdadero.
Hipótesis alternativa: $H_1$ Corresponde a la falsedad o estableciendo que el parámetro puede ser mayor, menor o igual, de acuerdo con la propuesta hecha en la hipótesis nula.
Estadístico de prueba o contraste Número calculado a partir de los datos y de $H_0$ , cuya magnitud permite discernir si se rechaza o no la hipótesis nula.
Región de rechazo Es el conjunto de posibles valores del estadístico de prueba que llevan a rechazar la hipótesis nula.
Nivel de significación $\alpha$ es el recíproco de la confianza, el cual debe ser fijado antes de escoger la muestra.
Observación Los tests de hipótesis pueden ser unilaterales o bilaterales.