domingo, 8 de junio de 2014

Estadística

La estadística es una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.
Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad.
La estadística se divide en dos grandes áreas:
Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada.
Hay también una disciplina llamada estadística matemática, la que se refiere a las bases teóricas de la materia.
La palabra «estadísticas» también se refiere al resultado de aplicar un algoritmo estadístico a un conjunto de datos, como en estadísticas económicasestadísticas criminales, entre otros

Probabilidad

La probabilidad es un método por el cual se obtiene la frecuencia de un acontecimiento determinado mediante la realización de un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables.
La teoría de la probabilidad se usa extensamente en áreas como la estadística, la física, la matemática, las ciencias y la filosofía para sacar conclusiones sobre la probabilidad discreta de sucesos potenciales y la mecánica subyacente discreta de sistemas complejos, por lo tanto es la rama de las matemáticas que estudia, mide o determina a los experimentos o fenómenos aleatorios.
MODELOS MATEMATICOS Y DEFINICION DE MEDIDAS DE TENDENCIA CENTRAL 
Cómo calcular, la media, la moda y la mediana
Media aritmética PyE_001o promedio
Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos.
PyE_002
Ejemplo 1:
En matemáticas, un alumno tiene las siguientes notas:  4, 7, 7, 2, 5, 3
n = 6 (número total de datos)
PyE_003
La media aritmética de las notas de esa asignatura es 4,8. Este número representa el promedio.
Ejemplo 2:
Cuando se tienen muchos datos es más conveniente agruparlos en una tabla de frecuencias y luego calcular la media aritmética. El siguiente cuadro con las medidas de 63 varas de pino lo ilustra.
Largo (en m)
Frecuencia absoluta
Largo por Frecuencia absoluta
5
10
5          .       10  =   50
6
15
6          .        15 =   90
7
20
7          .        20 =  140
8
12
8          .        12 =    96
9
6
9            .          6 = 54

Frecuencia total = 63
430

PyE_004
Se debe recordar que la frecuencia absoluta indica cuántas veces se repite cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos (si la frecuencia absoluta es 10, significa que el valor a que corresponde se repite 10 veces).
Moda (Mo)
Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o sea, cual se repite más.
Ejemplo 1:
Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de niñas de un Jardín Infantil.
                  5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3
La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)
Ejemplo 2:
               20, 12, 14, 23, 78, 56, 96
En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de valores no tiene moda.
Mediana (Med)
Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a menor o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante corresponde al número del caso que representa la mediana de la distribución.
Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual número de valores antes y después de él en un conjunto de datos agrupados.
Según el número de valores que se tengan se pueden presentar dos casos:
Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos.
Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).
Ejemplo 1:
Se tienen los siguientes datos:  5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene:  1, 2, 4,  5, 8, 9, 10
El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.
Ejemplo 2: 
El siguiente conjunto de datos está ordenado en forma decreciente, de mayor a menor, y corresponde a un conjunto de valores pares, por lo tanto, la Med será el promedio de los valores centrales.
     21, 19, 18, 15,  13, 11, 10, 9, 5, 3
PyE_005          
Ejemplo 3:
                  estadística004

Interpretando el gráfico de barras podemos deducir que:
 5 alumnos obtienen puntaje de 62
5 alumnos obtienen puntaje de 67
8 alumnos obtienen puntaje de 72
12 alumnos obtienen puntaje de 77
16 alumnos obtienen puntaje de 82
4 alumnos obtienen puntaje de 87
lo que hace un total de 50 alumnos
Sabemos que la mediana se obtiene haciendo
estadistica004a

MEDIDAS DE DISPERCION 

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.
Las medidas de dispersión son:

Rango o recorrido

El rango es la diferencia entre el mayor y el menorde los datos de una distribución estadística.

Desviación media

La desviación respecto a la media es la diferencia entre cada valor de la variable estadística y la media aritmética.
Di = x - x
La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.
La desviación media se representa por signo
desviación media
desviación media

Ejemplo

Calcular la desviación media de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
media
desviación media

Desviación media para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:
delegación media
desviación media

Ejemplo

Calcular la desviación media de la distribución:
 xifix· fi|x - x||x - x| · fi
[10, 15)12.5337.59.28627.858
[15, 20)17.5587.54.28621.43
[20, 25)22.57157.50.7144.998
[25, 30)27.541105.71422.856
[30, 35)32.526510.17421.428
  21457.5 98.57
media
desviación media

Varianza

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
La varianza se representa por signo.
varianzavarianza

Varianza para datos agrupados

varianzavarianza
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
varianzavarianza

Varianza para datos agrupados

varianzavarianza

Ejercicios de varianza

Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
media
varianza

Calcular la varianza de la distribución de la tabla:
 xifixi · fixi2 · fi
[10, 20)15115225
[20, 30)2582005000
[30,40)351035012 250
[40, 50)45940518 225
[50, 6055844024 200
[60,70)65426016 900
[70, 80)75215011 250
  421 82088 050
media
varianza

Propiedades de la varianza

La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
Si a todos los valores de la variable se les suma un número la varianza no varía.
Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por elcuadrado de dicho número.
Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular lavarianza total.
Si todas las muestras tienen el mismo tamaño:
varianzas
Si las muestras tienen distinto tamaño:
varianzas

Observaciones sobre la varianza

La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.
En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.
La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al cuadrado.

Desviación típica

La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.
La desviación típica se representa por σ.
de relación típicadesviación

Desviación típica para datos agrupados

desviación típicadesviación
Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
desviación típicadesviación típica

Desviación típica para datos agrupados

desviación típicadesviación típica

Ejercicios de desviación típica

Calcular la desviación típica de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
media
Desviación típica
Calcular la desviación típica de la distribución de la tabla:
 xifixi · fixi2 · fi
[10, 20)15115225
[20, 30)2582005000
[30,40)351035012 250
[40, 50)45940518 225
[50, 60)55844024 200
[60,70)65426016 900
[70, 80)75215011 250
  421 82088 050
media
desvición típica

Propiedades de la desviación típica

La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
Si a todos los valores de la variable se les suma un número la desviación típica no varía.
Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número.
Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se puede calcular la desviación típica total.
Si todas las muestras tienen el mismo tamaño:
desviación típica
Si las muestras tienen distinto tamaño:
desviación típica

PROBABILIDAD SIMPLE Y CONJUNTA

PROBABILIDAD SIMPLE


La posibilidad que hay de que ocurra algún evento determinado, por ejemplo, que de un recipiente con 5 pelotas verdes, 2 azules y 3 rojas obtengamos una roja es de .3, siempre debe ser un número menor o igual a uno, excepto cuando lo expresas en porcentaje.
Probabilidad simple es igual a la cantidad de formas en que un resultado específico va a suceder entre la cantidad total de posibles resultados.
Una manera, muy usada en la práctica, de denominar la probabilidad un evento simple de un espacio muestral es como probabilidad simple o marginal, la cual hace referencia a la probabilidad de un evento simple, y se denota con P(A), siendo A el evento simple en cuestión. El nombre de probabilidad marginal se debe a que esta medida se puede obtener a partir de los totales marginales de una tabla de contingencia.
cantidad de formas en que un resultado especifico va a suceder
Probabilidad=———————————————————————————————
cantidad total de posibles resultados
Ejemplo Probabilidad simple
 Hay 87 canicas en una bolsa y 68 son verdes. Si se escoge una, ¿cuál es la probabilidad de que esta sea verde?Solución:
  • Divide la cantidad de formas de elegir una canica verde (68) por la cantidad total de canicas (87)
  • 68 ÷ 87 = 0.781609
  • Redondea a la precisión deseada (es decir 0.781609 redondeado a centésimos es 0.78.


Hay 87 canicas en una bolsa y 68 son verdes. Si se escoge una, ¿cuál es la probabilidad de que esta sea verde?

Solución: 

Divide la cantidad de formas de elegir una canica verde (68) por la cantidad total de canicas (87)

68 ÷ 87 = 0.781609

Redondea a la precisión deseada (es decir 0.781609 redondeado a centésimos es 0.78)

----------------------

Si yo tengo una canasta llena de peras y manzanas, de las cuales hay 20 peras y 10 manzanas. ¿Qué fruta es más probable que saque al azar de la canasta?

Para este ejemplo tenemos que 30 es el total de frutas en la canasta; es decir los casos posibles. Para calcular la probabilidad de sacar una manzana mis casos favorables son 10 puesto que existen sólo 10 manzanas. Así, aplicando la fórmula obtenemos que:

P(Manzana)=10/30=1/3= 33.3% probable

Calculando igual, la probabilidad de sacar pera es:

P(Pera)=20/30=2/3= 66.7% probable

Como 66.7 es mayor que 33.3 es más probable que saque una pera, pues hay más peras que manzanas en la canasta.


PROBABILIDAD CONJUNTA


Es la probabilidad de ocurrencia de dos o más eventos.
De la expresión P(B|A)=P(A∩B)/P(A) se pude despejar P(A∩B)=P(A)P(B|A) expresión llamada Ley de multiplicación de probabilidades.
P(A∩B) recibe el nombre de probabilidad conjunta y corresponde a la probabilidad de que se presenten resultados comunes a los eventos A y B.
Supónganse dos eventos A y B que pertenecen al espacio muestral S
ab
La probabilidad conjunta de A y B, es la probabilidad de que ocurran el evento A y el evento B de manera
simultánea.
Es decir:
P(A B) P(A| B)P(B) o bien: P(A B) P(B | A)P(A) A B
ejercicio:
  • Una urna tiene ocho bolas rojas, 5 amarilla y siete verdes. Si se extrae una bola al azar calcular la probabiliidad de:
1.Sea roja.
Solución:
p(roja)= 8/ 20 = 0.4
2. Sea verde.
Solución:
p(verde)= 7/20 = 0.35
3.Sea amarilla.
Solución:
p(amarilla)= 5/20 = 0.25
MUTUAMENTE EXCLUYENTES
1 si se tira un dado calcular la probabilidad de:
A caen 3 puntos o menos o
B caen 5 puntos o mas
Como son Mutuamente excluyentes AnB=0
P(AoB)=P(a)+P(B)
=P(salen 3 o menos)+P(salen 5 o mas)
=3/6 + 2/6
=5/6

2 se tiene una urna con 50 papeles de colores 15 rojos, 5 morados, 9 verdes, 11 naranjas y 10 azules.
Cual es la probabilidad de:
A sale un papel azul o
B sale un papel rojo
P(AoB)=P(AuB)=P(A)+P(B)
=P(sale un azul)+P(sale 1 rojo)
=10/50 + 15/50
=25/50
=1/2

EVENTOS INDEPENDIENTES 
1 En la urna A tenemos 7 bolas blancas y 13 negros y en la urna B 12 blancas y 8 negras.
Cual es la probabilidad de que se extraiga una bola blanca de cada una
P(AyB)=P(A)*P(B)
=7/20 * 12/20
=84/400
=81/100

2 en una baraja de 52 cartas se toma una carta al azar luego se regresa y se toma otra.
Cual es la probabilidad de A la primera sea de diamantes, y B la segunda sea de tréboles.
P(AyB)=P(A) * P(B)
=13/52 * 13/52
=169/2704



MUTUAMENTE NO EXCLUYENTES 
se lanza un dado.

Definamos el evento E1 como E1=Sale el numero dos. Y el evento E2 como E2=Sale un numero par. Por lo tanto,

E1={ 2 } y E2={ 2, 4, 6 }

Como E1 interseccion E2 = { 2 } que es distinto del conjunto vacio, concluimos que E1 y E2 son eventos NO excluyentes.

Si definimos E3=Sale un numero impar, entonces

E2 interseccion E3 = el conjunto vacio, pues no hay ningun numero que pueda estar en E1 y en E3 (i.e. que pueda ser par e impar al mismo tiempo). Por lo tanto E2 y E3 son eventos excluyentes.

Y asi te construyes mas ejemplos de experimentos, y defines eventos en el espacio muestral tales que su interseccion sea no vacía.


EVENTOS DEPENDIENTES 


Una caja contiene 4 canicas rojas, 3 canicas verdes y 2 canicas azules. Una canica es eliminada de la caja y luego reemplazada. Otra canica se saca de la caja. Cuál es la probabilidad de que la primera canica sea azul y la segunda canica sea verde?
Ya que la primera canica es reemplazada, el tamaño del espacio muestral (9) no cambia de la primera sacada a la segunda así los eventos son independientes.
P(azul luego verde) = P(azul) · P(verde)

SOLUCION 

=(2/9) (3/9)= 6/81 = 2/27 

Una caja contiene 4 canicas rojas, 3 canicas verdes y 2 canicas azules. Una canica es eliminada de la caja y no es reemplazada. Otra canica se saca de la caja. Cuál es la probabilidad de que la primera canica sea azul y la segunda canica sea verde?
Ya que la primera canica no es reemplazada, el tamaño del espacio muestral para la primera canica (9) es cambiado para la segunda canica (8) así los eventos son dependientes.
P(azul luego verde) = P(azul) · P(verde)
SOLUCION 


= (2/9) (3/8)= 6/72 = 1/12