lunes, 27 de mayo de 2013

ESTADÍSTICA ELEMENTAL

Aplicas la estadística elemental

Población 
En estadística, también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan unas de las observaciones. Población es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia).una población es un conjunto de sujetos o individuos con determinadas características demográficas, de la que se obtiene la muestra o participantes en un estudio epidemiológico a la que se quiere extrapolar los resultados de dicho estudio (inferencia estadística). La estadística es comúnmente considerada como una colección de hechos numéricos expresados en términos de una relación sumisa, y que han sido recopilado a partir de otros datos numéricos.
Muestra
Es un subconjunto de casos o individuos de una población estadística.
Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste.
Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de toda la población porque el manejo de un menor número de datos provoca también menos errores en su manipulación. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente estudiados.
El número de sujetos que componen la muestra suele ser inferior que el de la población, pero suficiente para que la estimación de los parámetros determinados tenga un nivel de confianza adecuado. Para que el tamaño de la muestra sea idóneo es preciso recurrir a su cálculo.
Medidas de tendencia central: para datos agrupados y no agrupados
Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición.1 En este caso se incluyen también los cuantiles entre estas medidas.
Entre las medidas de tendencia central tenemos:

La moda se refiere al dato más repetido, el valor de la variable con mayor frecuencia absoluta.
Su cálculo es extremadamente sencillo, pues sólo necesita un recuento. En variables continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la interpolación.
Por ejemplo, el número de personas en distintos vehículos en una carretera: 5-7-4-6-9-5-6-1-5-3-7. El número que más se repite es 5, entonces la moda es 5.
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos se encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.
La moda, cuando los datos están agrupados, es un punto que divide el intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:
\frac{p}{c-p}=\frac{n_i-n_{i-1} }{n_i-n_{i+1} }
Siendo n_{i} la frecuencia absoluta del intervalo modal y n_{i-1} y n_{i+1} las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al
Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la siguiente tabla (debajo):
Calificaciones123456789
Número de alumnos224589342

Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución esbimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8Mo = 4



Cálculo de la moda para datos agrupados


1º Todos los intervalos tienen la misma amplitud.

moda
Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:
moda

Ejemplo

Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:
 fi
[60, 63)5
[63, 66)18
[66, 69)42
[69, 72)27
[72, 75)8
 100
moda
moda

2º Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas.
alturas
La clase modal es la que tiene mayor altura.
moda

La fórmula de la moda aproximada cuando existen distintas amplitudes es:
moda

Ejemplo

En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda.
 fihi
[0, 5)153
[5, 7)2010
[7, 9)126
[9, 10)33
 50 
moda
moda

Mediana

Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables cuantitativas.

Cálculo de la mediana

Ordenamos los datos de menor a mayor.
Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5
Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12Me= 9.5

Cálculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre cociente.
mediana
Li es el límite inferior de la clase donde se encuentra la mediana.
cociente es la semisuma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos.

Ejemplo

Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:
 fiFi
[60, 63)55
[63, 66)1823
[66, 69)4265
[69, 72)2792
[72, 75)8100
 100 
100 / 2 = 50
Clase modal: [66, 69)
mediana

Media aritmética

La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.
símbolo de la media aritmética es el símbolo de la media aritmética.
fórmula de la media
media

Ejemplo

Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
media aritmética

Media aritmética para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:
media
media

Ejercicio de media aritmética

En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuación media.
 xifixi · fi
[10, 20)15115
[20, 30)258200
[30,40)3510350
[40, 50)459405
[50, 60558440
[60,70)654260
[70, 80)752150
  421 820
media
Medidas de dispersión
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la mediana media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).

LA VARIANZA (S2 ó δ2 ):

La varianza es una medida de dispersión relativa a algún punto de referencia. Ese punto de referencia es la media aritmética de la distribución. Más específicamente, la varianza es una medida de que tan cerca, o que tan lejos están los diferentes valores de su propia media aritmética. Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza; cuando más cerca estén las Xi a su media menos es la varianza. Y se define y expresa matemáticamente de la siguiente manera:
La varianza para datos no agrupados
Dado un conjunto de observaciones, tales como X1, X2, … , Xn, la varianza denotada usualmente por la letra minúscula griega δ (sigma) elevada al cuadrado (δ2)y en otros casos S2 según otros analistas, se define como: el cuadrado medio de las desviaciones con respecto a su media aritmética"
Matemáticamente, se expresa como:
   
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber: 18,23, 25, 27, y 34. Al calcular la media aritmética (promedio de las edades, se obtuvo 25.4 años, encontrar la varianza de las edades de estos estudiantes:
Para calcular se utiliza una tabla estadística de trabajo de la siguiente manera:

Xi

( Xi - )
( Xi - )2
18
(18 – 25.5)=-7.4
(-7.4)2=54.76
23
(23 – 25.5)=-2.4
(-2.4)2= 5.76
25
(25 – 25.5)=-0.4
(-0.4)2= 0.16
27
(27 – 25.5)= 1.6
( 1.64)2= 2.16
34
(34 – 25.5)= 8.6
( 8.6)2 =73.96
Total
xxxx
137.20
Respuesta: la varianza de las edades es de 27.4 años
La varianza para datos agrupados
Si en una tabla de distribución de frecuencias. Los puntos medios de las clases son X1, X2, … , Xn; y las frecuencias de las clases f1, f2, … , fn; la varianza se calcula así:
Σ(Xi-)2f1
δ2 = ----------------
Σfi
Sin embargo la formula anterior tiene algún inconveniente para su uso en la practica, sobre todo cuando se trabaja con números decimales o cuando la media aritmética es un número entero. Asimismo cuando se trabaja con máquinas calculadoras, La tarea de computar la varianza se simplifica utilizando la formula de computación que se da a continuación:
ΣXi2fi - [(ΣXifi)2/N]
δ2 = ----------------------------
N donde N=Σfi
Ejemplo:
Se tienen los datos de una muestra de 30 cuentas por cobrar de la tienda Cabrera’s y Asociados dispuestos en una tabla de distribución de frecuencias, a partir de los cuales se deberá calcular la varianza, para lo cual se construye la siguiente tabla estadística de trabajo, si se calculó anteriormente la media aritmética y se fijó en 43.458 (ver ejemplo del calculo en "media aritmética para datos agrupados) de la siguiente manera

clases
Punto medios
Xi
fi
Xi2
Xifi
X2fi
7.420 – 21.835
14.628
10
213.978
146.280
2,139.780
21.835 – 36.250
29.043
4
843,496
116.172
3,373.984
36.250 – 50.665
43.458
5
1,888.598
217.270
9,442.990
50.665 – 65.080
57.873
3
3,349.284
173.619
10,047.852
65.080 – 79.495
72.288
3
5,225.555
216.864
15,676.665
79.495 – 93.910
86.703
5
7,533.025
433.965
37,665.125
Total
XXX
30
19,053.936
1,304.190
78,346.396

    = 21,649.344 / 30 = 721.645
    Respuesta: la varianza de las cuentas por cobrar es igual B/.721.645
    • Propiedades de la varianza :
    • s siempre un valor no negativo, que puede ser igual o distinta de 0. Será 0 solamente cuando Xi=
    • La varianza es la medida de dispersión cuadrática optima por ser la menor de todas.
    • Si a todos los valores de la variable se le suma una constante la varianza no se modifica. Veámoslo:
    Si a xi le sumamos una constante xi’ = xi + k tendremos (sabiendo que  )
    • Si todos los valores de la variable se multiplican por una constante la varianza queda multiplicada por el cuadrado de dicha constante. Veámoslo:
    Si a xi’ = xi · k tendremos (sabiendo que  )
    • Si en una distribución obtenemos una serie de subconjuntos disjuntos, la varianza de la distribución inicial se relaciona con la varianza de cada uno de los subconjuntos mediante la expresión
    Siendo
    Ni è el nº de elementos del subconjunto (i)
    S2i è la varianza del subconjunto (i)



    Rango o recorrido

    El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.

    Desviación media

    La desviación respecto a la media es la diferencia entre cada valor de la variable estadística y la media aritmética.
    Di = x - x
    La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.
    La desviación media se representa por signo
    desviación media
    desviación media

    Ejemplo

    Calcular la desviación media de la distribución:
    9, 3, 8, 8, 9, 8, 9, 18
    media
    desviación media

    Desviación media para datos agrupados

    Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:
    delegación media
    desviación media


    Ejemplo

    Calcular la desviación media de la distribución:
     xifix· fi|x - x||x - x| · fi
    [10, 15)12.5337.59.28627.858
    [15, 20)17.5587.54.28621.43
    [20, 25)22.57157.50.7144.998
    [25, 30)27.541105.71422.856
    [30, 35)32.526510.17421.428
      21457.5 98.57
    media
    desviación media


    Desviación típica

    La desviación típica es la raíz cuadrada de la varianza.
    Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.
    La desviación típica se representa por σ.
    de relación típicadesviación

    Desviación típica para datos agrupados

    desviación típicadesviación
    Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
    desviación típicadesviación típica

    Desviación típica para datos agrupados

    desviación típicadesviación típica

    Ejercicios de desviación típica

    Calcular la desviación típica de la distribución:
    9, 3, 8, 8, 9, 8, 9, 18
    media
    Desviación típica
    Calcular la desviación típica de la distribución de la tabla:
     xifixi · fixi2 · fi
    [10, 20)15115225
    [20, 30)2582005000
    [30,40)351035012 250
    [40, 50)45940518 225
    [50, 60)55844024 200
    [60,70)65426016 900
    [70, 80)75215011 250
      421 82088 050
    media
    desvición típica


    EMPLEAS LOS CONCEPTOS ELEMENTALES DE LA PROBABILIDAD
    PROBABILIDAD CLASICA

    PROBABILIDAD CLASICA

    Es el número de resultados favorables a la presentación de un evento dividido entre el número total de resultados posibles. Asignación de probabilidad "a priori", si necesidad de realizar el experimento.
    La probabilidad clásica o teórica se aplica cuando cada evento simple del espacio muestral tiene la misma probabilidad de ocurrir.
    Fórmula para obtener la probabilidad clásica o teórica:


    EJEMPLO: ¿Cuál es la probabilidad de obtener un número mayor que 3, en el lanzamiento de un dado? Si E: 4, 5, 6, entonces el número de resultados favorables es n (E) = 3.
    Si S: 1, 2, 3, 4, 5, 6, entonces el número total de resultados posibles es (S) = 6.
    Por lo tanto:



    FIN










    1 comentario: