01-Media aritmética

Tags: #centralización #estadística_descriptiva #medidas_resumen #fórmulas

Media aritmética

1. Media poblacional (μ)

Promedio de todos los valores en una población de tamaño N.

μ=i=1NxiN

2. Media muestral (x¯)

Promedio aritmético de una muestra. Es el centroide o punto de equilibrio físico de los datos.

x¯=i=1nxin    (datos no agrupados)x¯=i=1mca(mcai fr)    (datos agrupados)
Cuidado

El principal defecto de la media aritmética es que su valor se ve drásticamente afectado por la presencia de un solo valor atípico (outlier) extremo.

3. Interpretación

Para entender qué significa el resultado de estas fórmulas, imaginemos que estamos analizando los tiempos de vuelta de Lewis Hamilton en una sesión de clasificación libre de 20 vueltas.

La media es el rendimiento general esperado. Si su tiempo medio es de 1:20.500, ese es su ritmo promedio. Un valor más alto significa un ritmo más lento en general, y un valor más bajo significa un ritmo más rápido en general.
El problema de la media es que es muy sensible. Si en una vuelta Lewis se despista, entra a boxes y marca un tiempo de 3:00.000, ese único dato "tira" del promedio hacia arriba, haciéndonos creer que su ritmo en general fue más lento de lo que realmente fue.

4. Propiedades de la media aritmética

Propiedad 1

Equivalencia de la sumatoria total
La suma de todos los valores individuales de un conjunto de datos es igual a multiplicar la media x¯ del conjunto por la cantidad total de datos n.

i=1nxi=nx¯
Propiedad 2

Transformación lineal
Dada una variable x, si aplicamos y=ax+b, la nueva media será directamente:

y¯=ax¯+b
Propiedad 3

Suma de desviaciones nula
La suma de las desviaciones de cada dato respecto a su media siempre es cero:

i=1n(xix¯)=0
Propiedad 4

Mínimos caudrados
La suma de los cuadrados de las desviaciones de n datos con respecto a una constante c, es decir:

i=1n(xic)2

es mínima cuando esa constante es exactamente la media (c=x¯).

Observacion

En estadística, cuando hablamos de una desviación, nos referimos pura y exclusivamente a la distancia o diferencia que hay entre un dato específico y el promedio. Matemáticamente, la desviación de un dato es simplemente esta resta: xix¯.

4. Demostración de propiedades

- Propiedad 1

Partimos de la definición matemática fundamental de la media muestral:

x¯=i=1nxin

Multiplicamos a ambos lados de la ecuación por n:

nx¯=i=1nxinn

Entonces, llegamos a la propiedad:

i=1nxi=nx¯

- Propiedad 2

Definimos nuestra nueva variable y aplicamos la fórmula de la media:

y¯=i=1ny1n

Sustituimos yi por su transformación lineal axi+b:

y¯=i=1n(axi+b)n

Distribuimos la sumatoria:

y¯=i=1n(axi)+i=1nbn

Sacamos la constante a fuera de al sumatoria y resolvemos la sumatoria de la constante b (que es nb). Luego separamos la fracción en dos términos.

y¯=ai=1nxi+nbn            y¯=a(i=1nxin)+nbn

El paréntesis es la definición de x¯, y las n del segundo término se cancelan, entonces demostramos:

y¯=ax¯+b

- Propiedad 3

Queremos demostrar que i=1n(xix¯)=0. Entonces, distribuimos la sumatoria Σ:

i=1n(xix¯)=i=1nxii=1nx¯

Como x¯ es una constante, sumar una constante n veces es igual a nx¯:

i=1n(xix¯)=i=1nxinx¯

Por la propiedad 1, sabemos que i=1nxi=nx¯. Entonces, sustituimos esto en nuestra ecuación y demostramos:

i=1n(xix¯)=nx¯nx¯=0

- Propiedad 4

Sea c cualquier valor constante. Queremos evaluar la expresión:

i=1n(xic)2

Entonces, sumamos y restamos la media x¯ dentro del paréntesis (esto no altera el valor):

i=1n(xix¯+x¯c)2

Agrupamos los términos convenientes para formar un binomio al cuadrado:

i=1n[(xix¯)+(x¯c)]2        i=1n[(xix¯)2+2(xix¯)(x¯c)+(x¯c)2]

Habiendo desarrollado el binomio al cuadrado, distribuimos la sumatoria en los tres términos resultantes. Notamos que en el segundo término, 2(x¯c) es una constante, por lo que sale de la sumatoria.

i=1n(xix¯)2+2(x¯c)i=1n(xix¯)+i=1n(x¯c)2

Por la segunda propiedad, sabemos que i=1n(xix¯)=0. Por lo tanto, todo el término del medio se hace cero y desaparece:

i=1n(xix¯)2+0+i=1n(x¯c)2

El término (x¯c)2 es una constante sumada n veces, entonces:

i=1n(xic)2=i=1n(xix¯)2+n(x¯c)2

Entonces, como todo número elevado al cuadrado es positivo (o cero), la cantidad n(x¯c)2 siempre será 0. Por lo tanto, demostramos que la sumatoria total será lo más chica posible (mínima) únicamente cuando el término n(x¯c)2=0, y eso solo ocurre cuando c=x¯.