Probabilidad y estadistica ITR
miércoles, 13 de febrero de 2013
martes, 12 de febrero de 2013
“1.6. CUANTILES”
Los
cuantiles son aquellos valores de la variable, que ordenados de menor a mayor,
dividen a la distribución en partes, de tal manera que cada una de ellas
contiene el mismo número de frecuencias.
Constituyen
una generalización del concepto de mediana. Así como la mediana divide a la
serie estudiada en dos partes con el mismo número de elementos cada una, si la
división se hace en cuatro partes, o en diez partes, o en cien partes, llegamos
al concepto de cuantil.
Hay, principalmente, tres
cuantiles importantes: cuartiles, deciles y percentiles:
Cuartiles
Son
tres valores con las siguientes características:
Q1: Primer
cuartil, que es el valor de la variable por debajo del cual queda 1/4 de los
elementos de la serie estudiada.
Q3: Tercer
cuartil, que es el valor de la variable por debajo del cual quedan los 3/4 de
los elementos que constituyen la serie.
Evidentemente el segundo
cuartil coincide con la mediana. Como puede comprobarse, no tendría ninguna utilidad
definir el cuarto cuartil. El cálculo de los cuartiles se realiza por el mismo
procedimiento que el cálculo de la mediana, pues hay únicamente una diferencia
cuantitativa entre ambas medidas, pero tienen significados paralelos.
Percentiles
Hay
99 percentiles que se denotan: P1, P2, P3,.......,P98,
P99. Así P90, por ejemplo, deja por debajo de él el 90%
de los elementos.
Ejercicio: De la siguiente
serie hallar el primero y el tercer cuartil, el segundo y el séptimo decil y
los percentiles 8 y 73.
Resp: Q1 = 34,82;
Q3 = 47,36; D2 = 32,85; D7 = 45,83; P8
= 26,94; P73 = 46,75.
Obsérvese que entre los 6
cuantiles calculados, aparecen valores muy parecidos. En particular se dan las
siguientes coincidencias:
Ø El segundo cuartil
equivale a la mediana.
Ø El quinto decil y el
quincuagésimo percentil se corresponden también con la mediana.
Ø Los percentiles P25
y P75 se corresponden con el primer y tercer cuartil,
respectivamente.
Deciles
Es
la segunda clase de cuantiles. Si se divide toda la serie en diez partes
iguales tendremos los deciles.
D1, el decil 1,
deja el 10% de los valores de la serie por debajo de él.
Análogamente ocurre con los
deciles D2, D3,.......D9. El decil 8, por
ejemplo, deja el 80% de la masa de datos investigada por debajo de él.
Las fórmulas para
calcularlos son también análogas a las de la mediana.
“1.7 GRÁFICOS”
Las representaciones gráficas deben conseguir que un simple
análisis visual ofrezca la mayor información posible.
Según el tipo de carácter que estemos estudiando,
usuraremos un grafico u otro.
Según
sea la variable, los gráficos más utilizados son:
-
Diagramas de barra.
-
Diagramas de sectores
-
Histogramas
Diagrama de barras
Es
un tipo de gráfico estadístico que se utiliza para variables cualitativas y
discretas.
En el eje X se sitúan:
§ Las
modalidades de la variable cualitativa.
§ Los
valores de la variable cualitativa discreta.
Y sobre ellos se levantan
barras cuya altura sea proporcional a sus frecuencias.
Histogramas
Se
utilizan con variables continuas, o agrupadas en intervalos, representando en
el eje X los intervalos de clase y levantando rectángulos de base la longitud
de los distintos intervalos y de altura tal que el área sea proporcional a las
frecuencias representativas.
El polígono de frecuencias se obtiene uniendo los puntos medios de las bases
superiores de los rectángulos.
Los histogramas permiten compara datos de una forma rápida (basta mirar la
gráfica).
Pirámides de población
Cuando se realizan representaciones correspondientes a edades de población,
cambiamos el eje Y por el eje X para obtener las llamadas pirámides de
población, que no son más que 2 histogramas a izquierda y derecha, para
hombres y mujeres.
Diagramas de sectores
Es
un gráfico empleado fundamental mente para variables cualitativas. Las
modalidades se representan en un círculo dividido en sectores.
La
amplitud de cada sector, en grados, se obtiene multiplicando la frecuencia
relativa de cada modalidad o valor por 360°
“1.8 CAJAS Y ALAMBRES”
Un
diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se
visualiza un conjunto de datos. Está compuesto por un rectángulo, la
"caja", y dos brazos, los "bigotes".
Es
un gráfico que suministra información sobre los valores mínimo y máximo, los
cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la
simetría de la distribución. Primero es necesario encontrar la mediana para
luego encontrar los 2 cuartiles restantes
Cómo
expresarlo gráficamente:
+-----+-+
*
o |-------| | |---|
+-----+-+
+---+---+---+---+---+---+---+---+---+---+---+---+
0 5 10 12
Ordenar los datos y obtener el
valor mínimo, el máximo, los cuartiles Q1, Q2 y Q3 y el Rango Inter Cuartilico
(RIC)
En el
ejemplo:
·
Valor 7: es el Q1 (25% de los
datos)
·
Valor 8.5: es el Q2 o mediana
(el 50% de los datos)
·
Valor 9: es el Q3 (75% de los
datos)
·
Rango Inter Cuartilico RIC
(Q3-Q1)=2
Para dibujar los bigotes, las
líneas que se extienden desde la caja, hay que calcular los límites superiores
e inferiores, Li y Ls, que identifiquen a los valores atípicos.
Para ello se calcula cuándo se consideran atípicos los valores. Son
aquellos inferiores a Q1-1.5*RIC o superiores a Q3+1.5*RIC.
En el ejemplo:
·
inferior: 7-1.5*2=4
·
superior: 9+1.5*2=12
Ahora se buscan los últimos valores que NO son
atípicos, que serán los extremos de los bigotes.
·
En el ejemplo: 5 y 10
Marcar como atípicos todos los
datos que están fuera del intervalo (Li, Ls).
·
En el ejemplo: 0.5 y 3.5
Además, se pueden considerar
valores extremadamente atípicos aquellos que exceden Q1-3*RIC o Q3+3*RIC. De
modo que, en el ejemplo:
·
inferior: 7-3*2=1
·
superior: 9+3*2=15
“1.9. DIAGRAMA DE PARETO”
El diagrama de Pareto, también llamado curva 80-20 o Distribución C-A-B, es una gráfica para organizar datos de forma
que estos queden en orden descendente, de izquierda a derecha y separados por
barras. Permite, pues, asignar un orden de prioridades.
El diagrama permite mostrar
gráficamente el principio de Pareto (pocos
vitales, muchos triviales), es decir, que hay muchos problemas sin importancia
frente a unos pocos graves. Mediante la gráfica colocamos los "pocos
vitales" a la izquierda y los "muchos triviales" a la derecha.
El diagrama facilita el estudio de las
fallas en las industrias o empresas comerciales, así como fenómenos sociales o
naturales psicosomáticos, como se puede ver en el ejemplo de la gráfica al
principio del artículo.
Hay que tener en cuenta que tanto la
distribución de los efectos como sus posibles causas no es un proceso lineal
sino que el 20% de las causas totales hace que sean originados el 80% de los
efectos.
El principal uso que tiene el elaborar
este tipo de diagrama es para poder establecer un orden de prioridades en la toma de decisiones dentro de una organización. Evaluar
todas las fallas, saber si se pueden resolver o mejor evitarlas.
Se recomienda el uso del diagrama de Pareto:
-
Para
identificar oportunidades para mejorar
- Para identificar un producto o servicio para el
análisis de mejora de la calidad.
- Cuando existe la necesidad de
llamar la atención a los problemas o causas de una forma sistemática.
- Para analizar las diferentes
agrupaciones de datos.
- Al buscar las causas principales
de los problemas y establecer la prioridad de las soluciones.
- Para evaluar los resultados de
los campos efectuados a un proceso comparando sucesivos diagramas.
- Obtenidos en momentos diferentes,
(antes y después).
- Cuando los datos puedan clasificarse
en categorías.
- Cuando el rango de cada categoría
es importante.
-
Para
comunicar fácilmente a otros miembros de la organización las conclusiones sobre
causas, efectos y costes de los errores.
Los propósitos generales del diagrama de Pareto:
-
Analizar las
causas.
- Estudiar los resultados.
-
Planear
una mejora continua.
La Gráfica de Pareto es una
herramienta sencilla pero poderosa al permitir identificar visualmente en una
sola revisión las minorías de características vitales a las que es importante prestar
atención y de esta manera utilizar todos los recursos necesarios para llevar a
cabo una acción de mejora sin malgastar esfuerzos ya que con el análisis
descartamos las mayorías triviales.
Algunos ejemplos de tales minorías vitales serían:
-
La minoría
de clientes que representen la mayoría de las ventas.
- La minoría de productos,
procesos, o características de la calidad causantes del grueso de desperdicio o
de los costos de re trabajos.
- La minoría de rechazos que
representa la mayoría de quejas de los clientes.
- La minoría de vendedores que está
vinculada a la mayoría de partes rechazadas.
- La minoría de problemas causantes
del grueso del retraso de un proceso.
- La minoría de productos que
representan la mayoría de las ganancias obtenidas.
-
La
minoría de elementos que representan la mayor parte del costo de un inventario etc.
“1.10. USO DE SOFTWARE”
El uso de ordenadores
y calculadoras facilita el que los alumnos comprendan mejor temas complejos de
matemáticas. Es evidente que en muchos casos la tecnología agiliza y supera, la
capacidad de cálculo de la mente humana, con ayuda de la tecnología, los
alumnos tienen más tiempo para concentrarse en enriquecer su aprendizaje
matemático.
Las nuevas
tecnologías han venido a cambiar por completo el panorama tradicional de cómo
se hacían, se veían y se enseñaban las matemáticas. Introducirse en este nuevo
panorama implica realizar profundos cambios en nuestros programas educativos.
Es muy amplia la variedad de aplicaciones informáticas disponibles para estadística y probabilidad:
Es muy amplia la variedad de aplicaciones informáticas disponibles para estadística y probabilidad:
Excel o Calc
Javascript
Applet de Java, Geogebra
Proyecto Descartes
Software Libre
Otros Software
Ejercicio: Estadística Bidimensional
Se observaron las edades
de cinco niños y sus pesos respectivos y se consiguieron los resultados
siguientes:
Edad
|
2
|
4,5
|
6
|
7,2
|
8
|
Peso
|
15
|
19
|
25
|
33
|
34
|
a) Hallar las medias y desviaciones marginales.
Introducimos los datos en las
celdas: en la columna A la edad y la B el peso.
A continuación podemos
hacer clic con el ratón en "Función fx", del menú "Insertar”,
apareciendo la ventana de diálogo "Pegar función", donde podemos
seleccionar las funciones estadísticas y las funciones que queramos calcular; o
bien directamente, si conocemos la sintaxis de las funciones estadísticas,
editamos dichas funciones. Situamos el puntero en la columna D y vamos
tecleando cada una de las funciones estadísticas en la barra de fórmulas,
situando el puntero cada vez en una celda distinta para ir conservando los
datos. De esta forma, las medias y desviaciones marginales
se calculan:
=PROMEDIO (A2:A6), obtenemos la media de
la edad.
=PROMEDIO (B2:B6), obtenemos la media del
peso.
=DESVESTP (A2:A6), obtenemos la desviación
típica de la edad.
=DESVESTP (B2:B6), obtenemos la desviación
típica del peso.
Para calcular el coeficiente de
correlación, tecleamos en la barra de fórmulas
=COEF.DE.CORREL (A1:A6, B2:B6), una vez situados en la celda que queramos.
=COEF.DE.CORREL (A1:A6, B2:B6), una vez situados en la celda que queramos.
=PENDIENTE (B2:B6, A2:A6) nos informa
sobre la pendiente de la recta de regresión del
peso sobre la edad, en la celda donde queramos.
Por tanto, usando
nuestros conocimientos estadísticos, tenemos que la recta de regresión es:
y - 25,2 = 3,4049(x - 5,54).
También podemos calcular
la recta de regresión haciendo clic en "Función fx",
del menú "Insertar" y seleccionando la función ESTIMACION.LINEAL de
las funciones estadísticas.
En la pantalla aparecen
los valores de "a" y b", siendo y = bx + a, recta de
regresión de Y sobre X. Por tanto la recta de regresión es: y = 3,4049x +
6,33678.
Excel incorpora dos
funciones que nos permiten predecir el valor de una variable, conocido el valor
de la otra, por ejemplo, tecleando: =TENDENCIA (B2:B6, A2:A6, 5)
obtenemos el peso esperado para una edad de cinco años. La otra función nos mide el error estimado de una variable al ser estimado su valor por la recta de regresión. Su forma es: =ERROR.TÍPICO.XY. (B2:B6, A2:A6), devuelve el error típico del valor de Y previsto para cada X.
obtenemos el peso esperado para una edad de cinco años. La otra función nos mide el error estimado de una variable al ser estimado su valor por la recta de regresión. Su forma es: =ERROR.TÍPICO.XY. (B2:B6, A2:A6), devuelve el error típico del valor de Y previsto para cada X.
También podemos hacer
la nube de puntos. Marcando los datos introducidos, pulsamos el
botón de gráficos, seleccionamos diagrama de dispersión y a través de las
ventanas de diálogos damos nombre a los ejes, hacemos la división en los
mismos.
lunes, 4 de febrero de 2013
Suscribirse a:
Entradas (Atom)