Matematicas 2 : junio 2014

Probabilidad

Definición de Probabilidad.

Un experimento aleatorio se caracteriza porque repetido muchas veces y en idénticas condiciones el cociente entre el número de veces que aparece un resultado (suceso) y el número total de veces que se realiza el experimento tiende a un número fijo. Esta propiedad es conocida como ley de los grandes números, establecida por Jakob Bernouilli. Tiene el inconveniente de variar la sucesión de las frecuencias relativas de unas series de realizaciones a otras, si bien el valor al que se aproximan a medida que el número de realizaciones aumenta se mantiene estable.

La frecuencia relativa del suceso A:

Propiedades de la frecuencia relativa:
1. 0f_r (A)1 cualquiera que sea el suceso A.
2. f_r() = f_r(A) + f_r(B) si = Ø.
3. f_r(E) = 1 f_r(Ø) = 0.
Esta definición presenta el inconveniente de tener que realizar el experimento un gran número de veces y además siempre obtendremos un valor aproximado de la probabilidad.

Probabilidades

En ocasiones realizamos acciones, por ejemplo lanzar una moneda al aire, en las que conocemos de antemano los posibles resultados que se pueden dar (cara o cruz) pero no sabemos exactamente cual de ellos se va a dar.

Lo mismo ocurre cuando lanzamos un dado: sabemos que puede salir 1, 2, 3, 4, 5, o 6, pero no sabemos cual de ellos saldrá.

Los resultados de estas acciones dependen del azar:

Sabemos cuales pueden ser pero es imposible determinar de antemano cual será.

La probabilidad mide las posibilidades de que cada uno de los posibles resultados en un suceso que depende del azar sea finalmente el que se de.

Por ejemplo: la probabilidad mide la posibilidad de que salga "cara" cuando lanzamos una moneda, o la posibilidad de que salga 5 cuando lanzamos un dado.

1.- Sucesos

Llamamos sucesos a los posibles resultados de una acción que depende del azar.

Distinguimos 3 tipos de sucesos:

Suceso posible: Es un resultado que se puede dar.

Por ejemplo, el 5 es un suceso posible cuando lanzamos un dado.

Suceso imposible: Es un resultado que no se puede dar.

Por ejemplo, el 7 es un suceso imposible cuando lanzamos un dado (el dado no tiene el número 7).

Suceso seguro: Es un resultado que siempre se va a dar.

Por ejemplo, "número menor de 7" es un suceso seguro cuando lanzamos un dado (cualquier número que salga al lanzar el dado será menor que 7).

2.- Probabilidades de los sucesos

Dentro de los sucesos posibles vamos a distinguir:

Suceso igual de probable: es aquel resultado que tiene la misma probabilidad que los demás:

Por ejemplo: cuando lanzamos una moneda, el suceso "cara" tiene las mismas probabilidades que el suceso "cruz".

Suceso muy probable: es aquel resultado que tiene muchas probabilidades de darse:

Por ejemplo: en una bolsa con 100 bolitas numeradas del 1 al 100, el suceso "sacar una bola con un número entre 1 y 98" tiene muchas probabilidades de ocurrir.

Suceso poco probable: es aquel resultado que tiene muy pocas probabilidades de darse:

Por ejemplo: en una bolsa con 100 bolitas, 99 blanca y 1 negra, el suceso "sacar la bolsa negra" tiene pocas probabilidades de ocurrir.

3.- Cálculo de probabilidades

Para calcular probabilidades se utiliza la siguiente fórmula:

Probabilidad = Casos favorables / Casos posibles

El resultado se multiplica por 100 para expresarlo en porcentaje.

Veamos algunos ejemplos:

a) Calcular la probabilidad de que salga "cara" al lanzar una moneda:

Casos favorables: 1 (que salga "cara")

Casos posibles: 2 (puede salir "cara" o "cruz")
Probabilidad = (1 / 2 ) * 100 = 50 %

b) Calcular la probabilidad de que salga "3" al lanzar un dado:

Casos favorables: 1 (que salga "3")

Casos posibles: 6 (puede salir "1, 2, 3, 4, 5 o 6")
Probabilidad = (1 / 6 ) * 100 = 16,6 %

c) Calcular la probabilidad de que salga "un número entre 1 y 4 " al lanzar un dado:

Casos favorables: 4 (sería válido cualquiera de los siguientes resultados "1, 2, 3, o 4")

Casos posibles: 6 (puede salir "1, 2, 3, 4, 5 o 6")
Probabilidad = (4 / 6 ) * 100 = 66,6 %

d) Calcular la probabilidad de que salga el número 76 al sacar una bolita de una bolsa con 100 bolitas numeradas del 1 al 100:

Casos favorables: 1 (sacar el número 76)

Casos posibles: 100 (hay 100 números en la bolsa)
Probabilidad = (1 / 100 ) * 100 = 1 %

e) Calcular la probabilidad de que salga "un número entre 1 y 98" al sacar una bolita de una bolsa con 100 bolitas numeradas del 1 al 100:

Casos favorables: 98 (valdría cualquier número entre 1 y 98)

Casos posibles: 100 (hay 100 números en la bolsa)
Probabilidad = (98 / 100 ) * 100 = 98 %

Estadistica

Definición:

La estadística es una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.

Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica.

Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad.

La estadística se divide en dos grandes áreas:

-La estadística descriptiva, se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide población, gráfico circular, entre otros.

-La estadística inferencias, se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas sí/no estimaciones de unas características numéricas pronósticos de futuras observaciones, descripciones de asociación o modelamiento de relaciones entre variables

La estadística descriptiva

La estadística descriptiva es una gran parte de la estadística que se dedica a recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de describir apropiadamente las características de este. Este análisis es muy básico. Aunque hay tendencia a generalizar a toda la población, las primeras conclusiones obtenidas tras un análisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qué medida los datos se agrupan o dispersan en torno a un valor central. Esto es lo que podría ser un concepto aproximado.

Parámetro estadístico

En estadística, un parámetro es un número que resume la gran cantidad de datos que pueden derivarse del estudio de una variable estadística. El cálculo de este número está bien, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población

Los parámetros estadísticos son una consecuencia inevitable del propósito esencial de la estadística: crear un modelo de la realidad.

El estudio de una gran cantidad de datos individuales de una población puede ser farragoso e inoperativo, por lo que se hace necesario realizar un resumen que permita tener una idea global de la población, compararla con otras, comprobar su ajuste a un modelo ideal, realizar estimaciones sobre datos desconocidos de la misma y, en definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial los parámetros estadísticos.

Principales parámetros

Habitualmente se agrupan los parámetros en las siguientes categorías:

Medidas de posición.

Se trata de valores de la variable estadística que se caracterizan por la posición que ocupan dentro del rango de valores posibles de esta.

Entre ellos se distinguen:

Las medidas de tendencia central: medias, moda y mediana.

Las medidas de posición no central: cuantíales (cuartiles, deciles y percentiles).

Medidas de dispersión.

Resumen la heterogeneidad de los datos, lo separados que estos están entre sí. Hay dos tipos, básicamente:

Medidas de dispersión absolutas, que vienen dadas en las mismas unidades en las que se mide la variable: recorridos, desviaciones medias, varianza, desviación típica y media.

Medidas de dispersión relativa, que informan de la dispersión en términos relativos, como un porcentaje. Se incluyen entre estas el coeficiente de variación, el coeficiente de apertura, los recorridos relativos y el índice de desviación respecto de la mediana.

Medidas de forma: Su valor informa sobre el aspecto que tiene la gráfica de la distribución. Entre ellas están los coeficientes de asimetría y los de curtosis.

armónica), la mediana y la moda.

La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos.

Sus propiedades son:

Su cálculo es muy sencillo y en él intervienen todos los datos.
Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor:

\frac{\sum_{i=1}^n (x_i-\overline{x})}{n} = \frac{\sum_{i=1}^n x_i}{n} - \frac{\sum_{i=1}^n \overline{x}}{n} = \overline{x} - \overline{x} = 0

Minimiza las desviaciones cuadráticas de los datos respecto de cualquier valor prefijado, esto es, el valor de $\frac{\sum_{i=1}^n (x_i-k)^2}{n}$ es mínimo cuando $k = \overline{x}$ . Este resultado se conoce como Teorema de König. Esta propiedad permite interpretar uno de los parámetros de dispersión más importantes: la varianza.

Se ve afectada por transformaciones afines (cambios de origen y escala), esto es, si

x_i' = ax_i+b

entonces

\overline{x'} = a \overline{x} + b

, donde

\overline{x'}

es la media aritmética de los

x_i'

, para i = 1, ..., n y a y b números reales.

Moda

La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta. En cierto sentido se corresponde su definición matemática con la locución "estar de moda", esto es, ser lo que más se lleva.

Su cálculo es extremadamente sencillo, pues sólo necesita de un recuento. En variables continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la interpretación.

Mediana

La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que estos están ordenados de menor a mayor. Por ejemplo, la mediana del número de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:

\underbrace{1,\ 1,\ 1,\ 1,\ 1,\ 1, }_{Mitad \; inferior} \; \underbrace{\color{Red} 2, }_{Mediana \;} \; \underbrace{2,\ 2,\ 2,\ 3,\ 3,\ 4}_{Mitad \; superior}

En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores:

\underbrace{1,\ 1,\ 1,\ 1,\ 1, }_{Valores \; inferiores} \; \underbrace{\color{Red} 1,\ 2, }_{Valores \; intermedios} \; \underbrace{2,\ 2,\ 3,\ 3,\ 4}_{Valores \; superiores}

Se toma como mediana

1,5 = \frac{{\color{Red}1}+{\color{Red}2}}{2}

Histograma

En estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados, ya sea en forma diferencial o acumulada. Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o la muestra, respecto a una característica, cuantitativa y continua, de la misma y que es de interés para el observador (como la longitud o la masa). De esta manera ofrece una visión en grupo permitiendo observar una preferencia, o tendencia, por parte de la muestra o población por ubicarse hacia una determinada región de valores dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir la característica. Así pues, podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisión entre los valores de todas las partes que componen la población o la muestra, o, en contraposición, poder observar el grado de variabilidad, y por ende, la dispersión de todos los valores que toman las partes, también es posible no evidenciar ninguna tendencia y obtener que cada miembro de la población toma por su lado y adquiere un valor de la característica aleatoria-mente sin mostrar ninguna preferencia o tendencia, entre otras cosas.

En el eje vertical se representan las frecuencias, es decir, la cantidad de población o la muestra, según sea el caso, que se ubica en un determinado valor o sub-rango de valores de la característica que toma la característica de interés, evidentemente, cuando este espectro de valores es infinito o muy grande el mismo es reducido a sólo una parte que muestre la tendencia o comportamiento de la población, en otras ocasiones este espectro es extendido para mostrar el alejamiento o ubicación de la población o la muestra analizada respecto de un valor de interés.

En general se utilizan para relacionar variables cuantitativas continuas, pero también se lo suele usar para variables cuantitativas discretas, en cuyo caso es común llamarlo diagrama de frecuencias y sus barras están separadas, esto es porque en el "x" ya no se representa un espectro continuo de valores, sino valores cuantitativos específicos como ocurre en un diagrama de barras cuando la característica que se representa es cualitativa o categórica. Su utilidad se hace más evidente cuando se cuenta con un gran número de datos cuantitativos y que se han agrupado en intervalos de clase.

Ejemplos de su uso es cuando se representan franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.

Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.

Tipos de histograma

· Diagramas de barras simples

Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categoría que representa.

· Diagramas de barras compuesta

Se usa para representar la información de una tabla de entrada doble o sea a partir de dos variables, las cuales se representan así; la altura de la barra representa la frecuencia simple de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia simple de cada modalidad.

· Diagramas de barras agrupadas

Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, el cual es representado mediante un conjunto de barras como se clasifican respecto a las diferentes modalidades.

· Polígono de frecuencias

Es un gráfico de líneas que de las frecuencias absolutas de los valores de una distribución en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor.

· Ojiva porcentual

Es un gráfico acumulativo, el cual es muy útil cuando se quiere representar el rango porcentual de cada valor en una distribución de frecuencias.

Gráfico circular

Las gráficas circulares, también llamados gráficos de pastel, gráficos de torta o gráficas de 360 grados, son recursos estadísticos que se utilizan para representar porcentajes y proporciones. El número de elementos comparados dentro de un gráfico circular puede ser de más de 4.

Al igual que en la gráfica de barras, el empleo de tonalidades o colores facilita la diferenciación de los porcentajes o proporciones. A diferencia de otros tipos de gráficos, el circular no tiene ejes x o y.

Se utilizan en aquellos casos donde interesa no sólo mostrar el número de veces que se da una característica o atributo de manera tabular sino más bien de manera gráfica, de tal manera que se pueda visualizar mejor la proporción en que aparece esa característica respecto del total.

Esta además es muy eficaz ya que en este tipo de gráfica se puede colocar una mayor cantidad de datos a comparación que en la de barras.

Definiciones de términos estadísticos

u Población: es el conjunto de elementos, individuos o entes sujetos a estudio y de los cuales queremos obtener un resultado.

u Variable: es la característica que estamos midiendo.

Existen dos tipos de variables:

Variable cualitativa: Es aquella que expresa un atributo o característica, ejemplo: Rubio, moreno, etc.

Variable cuantitativa: Es aquella que podemos expresar numéricamente: edad, peso, etc. Esta a su vez la podemos subdividir en:

Variable discreta, aquella que entre dos valores próximos puede tomar a lo sumo un número finito de valores. Ejemplos: el número de TSE de una familia, el de obreros de una fabrica, el de alumnos de la universidad, etc.

Variable continua la que puede tomar los infinitos valores de un intervalo. En muchas ocasiones la diferencia es más teórica que práctica, ya que los aparatos de medida dificultan que puedan existir todos los valores del intervalo. Ejemplos, peso, estatura, distancias, etc.

La variable se denota por las mayúsculas de letras finales del alfabeto castellano. A su vez cada una de estas variables puede tomar distintos valores , colocando un subíndice, que indica orden.

X = (X₁, X₂ , ...... X_n)

u Muestra: Conjunto de elementos que forman parte de población . La muestra representa a esta población.

u Tamaño muestral: Es le número de elementos u observaciones que tomamos. Se denota por n ó N.

u Dato: Cada uno de los individuos, cosas, entes abstractos que integran una población o universo determinado. Dicho de otra forma, cada valor observado de la variable.

Frecuencias absolutas, relativas y acumuladas.

u Frecuencia absoluta: Llamaremos así al número de repeticiones que presenta una observación. Se representa por n_i.

u Frecuencia relativa: Es la frecuencia absoluta dividida por el número total de datos, se suele expresar en tanto por uno:

La suma de todas las frecuencias relativas, siempre debe ser igual a la unidad.

u Frecuencia absoluta acumulada: es la suma de los distintos valores de la frecuencia absoluta tomando como referencia un individuo dado. La última frecuencia absoluta acumulada es igual al nº de casos:

N₁ = n₁

N₂ = n₁+ n₂

N_n = n₁ + n₂ + . . . . . . + n_n-1 + n_n= n

u Frecuencia relativa acumulada: es el resultado de dividir cada frecuencia absoluta acumulada por el número total de datos, se la suele representar con la notación: F_i

Tabla de frecuencias para una variable discreta.
x_i	n_i	N_i	f_i	F_i
x₁	n₁	N₁	f₁	F₁
x₂	n₂	N₂	f₂	F₂
x₃	n₃	N	f₃	1
	Sn_i=N		1

EJEMPLO 1º

Queremos hacer un estudio estadístico del número de Técnicos Superiores en Electricidad (TSE) que existen en las empresas eléctricas de una determinada ciudad. Para ello se ha encuestado a 50 empresas y se han obtenido los siguientes datos:

2	4	2	3	1	2	4	2	3	0	2	2	2	3	2	6	2	3	2	2	3	2	3	3	4
3	3	4	5	2	0	3	2	1	2	3	2	2	3	1	4	2	3	2	4	3	3	2	2	1

Se pide:

a) ¿Cuál es la población objeto de estudio?

b) ¿Qué variable estamos estudiando?

c) ¿Qué tipo de variable es?

d) Construir la tabla de frecuencias?

e) ¿Cuál es el número de empresas que tiene como máximo 2 TSE?

f) ¿Cuántas empresas tienen más de 1 TSE, pero como máximo 3?

g) ¿Qué porcentaje de empresas tiene más de 3 TSE ?

SOLUCIÓN:

a) La población objeto de estudio es las empresas de electricidad de una ciudad.

b) La variable que estamos estudiando es el número de TSE por empresa.

c) El tipo de variable es discreta ya que el número de TSE solo puede tomar determinados valores enteros.

d) Para construir la tabla de frecuencias tenemos que ver cuantas empresas tienen un determinado número de TSE. Podemos ver que el número de TSE, toma los valores existentes entre 0 TSE, los que menos y 6 TSE, los que más y tendremos:

xi	ni	Ni	fi	Fi
0	2	2	0.04	0.04
1	4	6	0.08	0.12
2	21	27	0.42	0.54
3	15	42	0.30	0.84
4	6	48	0.12	0.96
5	1	49	0.02	0.98
6	1	50	0.024	1
	N = 50		1

e) El número de empresas que tienen dos o menos TSE es: 2+4+21 = 27

f) El número de empresas que tienen más de un TSE pero tres como máximo es: 21 + 15 = 36

Por último el porcentaje de empresas que tiene más de tres TSE, son aquellos que tienen 4; 5 y 6 es decir 6+1+1= 8

El porcentaje será el tanto por uno multiplicado por cien es decir, la frecuencia relativa de dichos valores multiplicado por 100: ( 0.12+0.02+0.02)* 100 = 0,16 + 100 = 16 %

Marca de Clase

Cuando nos encontramos con una distribución con un gran número de variables, se se suelen agrupar en intervalos para facilitar la comprensión de los datos Se indica por L_i-1 al extremo inferior del intervalo y por L_i al extremo superior. Cerramos el intervalo por la izquierda y abrimos por la derecha, pero se puede hacer al contrario; [Li-1 , Li) Para operar utilizaremos la marca de clase, el punto medio de un intervalo

u Amplitud del intervalo: la longitud del intervalo, se representa por: a = Li - Li-1

u Nº de intervalos: A partir de la raíz cuadrada del número de datos, decidimos, redondeando el número de intervalos.

u Recorrido: Valor mayor, menos valor menor de los datos. Re= x_n-x₁

u Amplitud: División entre el Recorrido y el número de intervalos que hayamos decidido.

EJEMPL0 2º

Se desea hacer un estudio estadístico del precio de un pequeño interruptor eléctrico de la marca Interelec, en las tiendas de material eléctrico de una ciudad. Para ello se conocen los precios en 40 tiendas de esa ciudad. Los datos obtenidos en euros son:

3,9	4,7	3,7	5,6	4,3	4,9	5,0	6,1	5,1	4,5
5,3	3,9	4,3	5,0	6,0	4,7	5,1	4,2	4,4	5,8
3,3	4,3	4,1	5,8	4,4	4,8	6,1	4,3	5,3	4,5
4,0	5,4	3,9	4,7	3,3	4,5	4,7	4,2	4,5	4,8

Se pide:

a) ¿Cuál es la población objeto de estudio?

b) ¿Qué variable estamos estudiando?

c) ¿Qué tipo de variable es?

d) ¿Qué problema plantea la construcción de la tabla de frecuencias?

e) ¿Cuántas tiendas tienen un precio entre 3,25 y 3,75 euros?

f) ¿Cuánto tiendas tienen un precio superior a 4,75 euros?

g) ¿Qué porcentaje de tiendas tienen precios menores de 4,25 euros?

SOLUCION:

a) La población objeto de estudio son las tiendas dematerial eléctrrico de una ciudad

b) La variable que estamos estudiando es el precio de un interruptor de la marca Interelec.

c) El tipo de variable es continua.

d) El problema que plantea es que existen muchos valores diferentes para por tanto es conveniente agrupar la serie en intervalos.

La manera de hacerlo sería la siguiente: primero, calculamos el recorrido Re = x_n– x₁= 6.1 –3.3 = 2.8

Cuando no se nos dice nada el nº de intervalos, se obtiene calculando la raíz cuadrada del nº de datos observado. Veremos que la raíz cuadrada de 40 es igual a 6.32 por lo tanto tomaremos 6 intervalos.

Como el recorrido es 2.8 si lo dividimos por el nº de intervalos tendremos la amplitud de cada uno de ellos y así: 2,8/6 = 0,46.

Importante: La amplitud es de 0,46 por lo que además de no ser muy fácil operar, puede que no cubra el rango de la variable. Lo podemos evitar, tomaremos un valor superior, en este caso 0,5:

[Li-1,, Li)	ni	Ni	fi	Fi
[3,25, 3,75)	3	3	0.075	0.075
[3,75, 4,25)	8	11	0.2	0.275
[4,25, 4,75)	14	25	0.35	0.625
[4,75, 5,25)	6	31	0.15	0.775
[5,25, 5,75)	4	35	0.1	0.875
[5,75, 6,25)	5	40	0.125	1
	N= 40

e) 3

f) 15

g) %=F₂*100=0.275*100=27.5

Alumna: Frida Fernanda Prudencio Carrillo

Grupo:208 N.L29

Matemáticas 2

4 Parcial

Matematicas 2

domingo, 1 de junio de 2014

Probabilidad & Estadistica

Definición de Probabilidad.

Definición:

La estadística descriptiva

Parámetro estadístico

Mediana

Gráfico circular