equipo
sábado, 3 de marzo de 2012
ÍNDICE
ESTADÍSTICA
Definición: f. rama de las matemáticas que
aborda el tema de la recolección, presentación, análisis e interpretación de
grupos de datos numéricos. Abarca muchos terrenos (le concierne e la forma en
que se obtienen los datos, como se manipulan y como se ponen en práctica).
INTRODUCCIÓN
Es la ciencia que trata sobre la toma,
organización, recopilación, presentación y análisis de datos para reducir
conclusiones sobre de ellos y tomar decisiones que estén de acuerdo con los
análisis efectuados.
En la estadística se acostumbra estudiar una parte
del total que recibe el nombre de muestra, mientras la totalidad del conjunto
estudiado se denomina población. Cuando se obtiene una serie de datos sobre las
características de un conjunto de personas o cosas, tales como edades, pesos, y
estatutarias de los habitantes de una determinada ciudad o en el numero de
relojes defectuosos o no defectuosos producidos por una fabrica en un tiempo
determinado, resulta poco menos que imposible estudiar todas las personas o
cosas.
FRECUENCIAS
Se llama frecuencia a la cantidad de
veces que se repite un determinado valor de la variable.
Se suelen representar con histogramas y con diagramas
de paretto.
Consiste en ordenar los datos en
una tabla donde se anota el número de veces que se repite un dato y
posteriormente se calcula la frecuencia relativa, acumulada, medidas de
tendencia central y medidas de dispersión.
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS.
Consiste en ordenar los datos en
una tabla donde se anota el número de veces que se repite un dato y
posteriormente se calcula la frecuencia relativa, acumulada, medidas de
tendencia central y medidas de dispersión.
TIPOS DE FRECUENCIA.
Una de los primeros pasos que se realizan en
cualquier estudio estadístico es la tabulación de resultados, es decir, recoger
la información de la muestra resumida en una tabla en la que a cada valor de la
variable se le asocian determinados números que representan el número de veces
que ha aparecido, su proporción con respecto a otros valores de la variable,
etc. Estos números se denominan frecuencias a sí tenemos los
siguientes tipos de frecuencia:
·
Frecuencia
absoluta
·
Frecuencia
relativa
·
Porcentaje
·
Frecuencia
absoluta acumulada
·
Frecuencia
relativa acumulada
·
Porcentaje
acumulado
FRECUENCIA ABSOLUTA
Frecuencia absoluta (ni) de una variable
estadística Xi, es el número de veces que este valor aparece en el estudio. A
mayor tamaño de la muestra, aumentará el tamaño de la frecuencia absoluta; es
decir, la suma total de todas las frecuencias absolutas debe dar el total de la
muestra estudiada (N).
La frecuencia absoluta de una variable estadística
es el número de veces que aparece en la muestra dicho valor de la variable, la
representaremos por ni
Para indicar resumidamente estas
sumas se utiliza la letra griega Σ(sigma mayúscula) que se lee suma
o sumatoria.
Ejemplo:
Durante
el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29,
30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29
En
la primera columna de la tabla colocamos la variable ordenada de menor a mayor
y en la segunda anotamos la frecuencia absoluta.
FRECUENCIA ABSOLUTA ACUMULADA.
(Ni),
es el número de veces ni en la muestra N con
un valor
igual o menor al
de la variable. La última frecuencia absoluta acumulada deberá ser igual
a N.
Ejemplo:
Dada la tabla: Xi es
el valor de la variable, ni es la frecuencia
absoluta
correspondiente y Ni es la frecuencia absoluta acumulada.
Xi-------ni------Ni
1--------5-------5
2--------7-------5+7=12
3--------6-------12+6=18
4--------2-------18+2=20
5--------1-------20+1=21
Las Ni son las frecuencias absolutas acumuladas y se obtienen
N1=n1
N2=N1+n2
N3=N2+n3
O sea, la primera es igual a la frecuencia absoluta
correspondiente al
primer valor y las siguientes se obtienen
FRECUENCIA RELATIVA.
La frecuencia absoluta, es una medida que está
influida por el tamaño de la muestra, al aumentar el tamaño de la muestra
aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una
medida útil para poder comparar. Para esto es necesario introducir el concepto
de frecuencia relativa, que es el cociente entre la frecuencia absoluta
y el tamaño de la muestra. La denotaremos por fi
Donde N =
Tamaño de la muestra
EJEMPLO:
Se lanza una moneda 100 veces el águila salió 45
veces, Calcular la Frecuencia Relativa de dicho evento.
Fa= 45/100 = 0.45
PORCENTAJE:
Es la frecuencia relativa multiplicada por 100 y se
da en %
y punto medio es cuando calculas intervalos de frecuencia. se calcula como el promedia entre el intervalo de frecuencia por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por pi.
y punto medio es cuando calculas intervalos de frecuencia. se calcula como el promedia entre el intervalo de frecuencia por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por pi.
Ejemplo:
Se lanza una moneda 100 veces el águila salió 45
veces, Calcular la Frecuencia de porcentaje de dicho evento.
45x100 = 450
FRECUENCIA RELATIVA ACUMULADA:
(Fi), es el cociente entre la
frecuencia absoluta acumulada y el número total de datos, N. Es decir,
Con la frecuencia relativa acumulada por 100 se obtiene el porcentaje acumulado (Pi)), que al igual que Fi deberá de resultar al final el 100% de N.
La representación gráfica de la
distribución de frecuencias acumuladas se denomina ojiva. En ella el eje de las abscisas
corresponde a los límites de clase y el de las ordenadas a los porcentajes
acumulados.
PORCENTAJE ACUMULADO.
Análogamente se define el Porcentaje Acumulado y lo
vamos a denotar por Pi como la frecuencia relativa
acumulada por 100.
Pi, de n valor xi es la suma de las
frecuencias porcentuales que se corresponden a los valores anteriores a Xi y
a la suya propia.
EJERCICIO
Se toma una muestra de 75 alumnos de un curso de
inglés para saber cuáles son sus edades y se encuentra que:
DISTRIBUCIÓN DE FRECUENCIAS DE CLASES.
Es
aquella distribución en la que la disposición tabular de los datos estadisticos
se encuentra ordenada en clases y con la frecuencia de cada clase; es decir,
los datos originales de varios valores adyacentes del conjuntos se combinan
para formar un intervalo de clase.No existen normas establecidas para
determinar cuando es apropiado utilizar datos agrupados o datos no agrupados;
sin embargo se sugiere que cuando el número total de datos (N) es igual o
superior a 50 y ademas el rango o recorrido de la seria de datos es mayor de
20, entonces se utilizara la distribución de frecuencias para datos agrupados,
también se utilizara este tipo de distribución de frecuencia para datos
agrupados, también se utilizara este tipo de distribución cuando se requiera
elaborar gráficos lineales como el histograma, poligono de frecuencias o la
ojiva.
La
distribucion de frecuencias agrupadas o tabla con datos agrupados se emplea si
las variables forman un numero grande de valores o la variable es continua(se
le puede asociar con numeros racionales o irracionales).
La
construcción de una tabla de distribución de frecuencias requiere en primer
lugar la selección de los intervalos de clase.
Aun
cuando la selección de los intervalos de clase es unarte y depende de los datos
involucrados, los siguientes pasos resultan útiles.
Paso 1
Ordenar
los datos de mayor a menos para su clasificación
Paso 2
Calcular
el rango (R) de los datos,es decir, la longitud del intervalo (l) que los
contiene.
R=
Xmáx-Xmin l=[Xmin.Xmáx]
R=rango
Xmáx=
Dato de mayor valor numérico
Xmin=
Dato de menor valor numérico
I= Intervalo
numérico
Paso 3
Definir
el número de clase (Nc) , el cual no deberá ser tan pequeño (menos de 6) o tan
grande (más de 20) que la verdadera naturaleza de la distribución sea imposible
de visualizar.
INTERVALOS DE CLASE.
Los
intervalos de clase nos permiten trazar un histograma con datos agrupados, es
decir; cuando los datos son muchos es necesario emplear procedimientos que reduzcan
el trabajo integrando los datos en grupos.
Estos
datos reciben el nombre de intervalos de clase. En ellos consideramos un límite
inferior, el punto medio, y el límite superior: el dato de menor valor en una
clase, el de mayor y el promedio de ellos.
La
selección de intervalos de clase exige que todos ellos tengan la misma amplitud
en la distribución. Para obtener lo anterior debemos considerar el concepto de
rango.
El rango
en una distribución de frecuencias es igual a la diferencia entre el dato mayor
menos el menor más 1.
Ejemplo:
Supongamos
que en una distribución de calificaciones la mayor es 9 y la menor es 4; el
rango seria:
9-4=5 ; 5 + 1 = 6; rango = 6
Los
intervalos de clase deben tener la misma amplitud. Para lograrlo debemos
dividir el rango entre el número de clases que consideramos el más adecuado.
Supongamos
que escogemos tres clases, entonces:
rango
------------------------ = 6/3 = 2
Número de clases
Este
número 2 indica la amplitud de cada intervalo. Debemos empezar con un múltiplo
de él, como límite inferior y proceder en la misma manera en cada intervalo:
múltiplos del intervalo.
8-9 6-7 6-5
Número de clases.
MARCA DE CLASE.
El punto
medio de un intervalo de clase recibe el nombre de marca de clase y se obtiene
dividiendo por 2, la suma de los límites inferior y superior del intervalo de
clase.
En
general, para obtener distribuciones de frecuencia se acostumbra seguir los
siguientes pasos:
a)
Determinar el mayor y el menor de los datos registrados, para encontrar el
rango, es decir, la diferencia entre el mayor y el menor de los datos.
b)
Dividir el rango en un número adecuado de intervalos de clase del mismo tamaño,
que generalmente oscila entre 5 y 15.
c) Determina
las frecuencias de clase, es decir, el número de datos que corresponden a cada
intervalo de clase.
MEDIDAS DE TENDENCIA CENTRAL
La
medidas de tendencia central pueden describirse rígidamente como
"promedios" en el sentido de que son indicativas del centro mitad o
lo más común de un conjunto de datos, la medida de tendencia central más
popular es lo que comúnmente se llama "promedio".
MEDIA.
Es el
conjunto de N números
x1,x2,x3........ xn se representa por muestra X.
y se
define como:
Donde el símbolo Xi representa cualquiera de los N valores
x1,x2,x3.............. xn puede tomar la variable de x.La letra i en xi, se
denomina su índice y puede representar cualquiera de los numéros
1,2,3...........n.
n
Por su
parte en simbolo ∑ xi se utiliza para indicar la suma de i=1 n
todas
las xi, desde i=1 hasta i=n es decir ∑
i=1
Ejemplo:
Hallar la
media aritmética de 6,4,3,7 y 8
Solución:
=
6+4+3+7+8= 28 = 5.6
-------------------------------------- -------------
5 5
MEDIANA.
La
mediana de una serie de datos de magnitud es el valor medio si el número de
datos es impar o bien la media aritmética de los dos valores medios sí el
número de datos es par.
Ejemplo:
Hallar la mediana de los números
2,3,3,4,5.7,7,7,9
La
solución seria ; Como los números están ordenados en orden creciente de
magnitud y hay un número impar de números, la mediana sera el valor medio
osea 5
Hallar la
mediana de los números 2,2,3,4,6,6,6,8
Solución:
Como los números están ordenados en orden creciente de magnitud y hay numero
par de números la mediana sera la media aritmética de los dos valores medios
osea (4+6)
____ = 5
2
MODA.
La moda
de una serie de números es el valor que se representa con mayor frecuencia.
La moda
puede no ser única e incluso no existir.
Ejemplo:
Hallar la moda de los números 2,2,3,4,5,5,5,5,6,6,7
Solución:
el número que más veces se repite es 5. Por consigiente 5 es la moda.
MEDIDAS DE DISPERSIÓN:
Dan idea
de la separación de datos númericos alrededor de un valor medio.
Las
medidas de dispersión más utilizadas:
Son el
rango o recorrido, la desviación media, la varianza y la desviación típica.
RANGO O RECORRIDO.
Es la diferencia
entre dos valores entre los dos valores extremos máximo y mínimo.
Evidentemente,
la dispersión de los datos será tanto mayor, cuando mayor sea el recorrido.
El rango
recorrido no es una buena medida de dispersión, puesto que basta que un dato se
aleje mucho de la media para que el rango recorrido resulte muy afectado, ya
que únicamente depende de dos valores, sin que influyan para nada los datos
distantes
Ejemplo:
Hallar el rango de la siguiente serie de números:
4,5,7,9,10,12,15
Solución:
el rango será la diferencia entre los valores extremos. Es
decir,
15-4 = 11.
DESVIACIÓN MEDIA:
Denominada también como desviación promedio, mide
el promedio de las distancias de una muestra o población respecto a su media
aritmética y la podemos definir como "El promedio de todas las distancias
absolutas,medidas con respecto a la media aritmética y se calcula con la
siguiente fórmula:
Donde:
DM: Es la desviación media.
xi es el valor de cada observación
X es la media
aritmética
n es el número de observaciones
l
l es el valor absoluto
VARIANZA.
La
varianza es el promedio de las dispersiones cuádraticas con respecto a la media
aritmética, la varianza se determina de la siguiente manera:
Si se trata de una muestra.
Si n es grande los resultados son similares a los de la varianza
poblacional, pero si n es pequeña conviene utilizar entre n-1 para obtener
mejor acercamiento a los datos de la varianza muestral:
Si se trata de una población:
Donde: μ es la media aritmética es la media de poblacion
N es el tamaño de la población
n es el tamaño de la muestra
xi es el valor de la observación
X es igual a la media aritmética de la muestra.
GRÁFICAS GRÁFICA DE BARRA:
Consiste
en levantar sobre cada valor de la variable una barra cuya longitud coincida
con su frecuencia.
GRÁFICA DE POLÍGONO DE FRECUENCIA:
Se señala en los extremos de los segmentos cuya altura
coinciden con la frecuencia y se unen mediante una línea quebrada.
DIAGRAMA DE FRECUENCIA ACUMULADA
Se utilizan cuando se interesa conocer
el número de individuos que hay antes de un cierto valor de la variable.
DIAGRAMA DE FRECUENCIAS RELATIVAS
Resulta imprescindibles cuando
interesa comparar varias poblaciones pero con distinto número de individuos.
DIAGRAMA DE SECTORES
Consiste en repartir los 360° del círculo proporcionalmente a las frecuencias a la oblación estudiadas.
GRÁFICA DE CARTOGRAMAS
Consiste en hacer resaltar
con distintos colores o rayas diversas zonas de un mapa según un motivo
determinado.
GRÁFICA PICTOGRAMA:
Se utilizan fundamentalmente
para representar índices de producción empleando un símbolo del artículo que se
produce.
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
Pueden ser representados de manera simultánea, esto se hace a partir del histograma, en la base superior de los rectángulos se colocará en el punto correspondiente a la marca de clase para formar en el polígono de frecuencias.
GRÁFICA DE OJIVA:
En ella se permite ver
cuántas observaciones se encuentran encima o de bajo de ciertos valores, en
lugar de solo exhibir los números asignados a cada intervalo.
GLOSARIO:
Estadística: rama
de la matemática que establece procesos sistematices y con base en un grupo de
datos permite organizarlos, representarlos y organizarlos para obtener
información.
Frecuencia: Es
cuando un dato se repite en un grupo determinado
Gráfica de barras: Representación
mediante dos ejes verticales en los que se dibuja las secuencias para cada
dato.
Histograma:
Representación gráfica con barras; éstas se presenta sin separación.
Polígono de frecuencias: Al unir los puntos medios superiores de las barras, se
obtiene una poligonal que recibe este nombre.
Gráfica circular:
Representación de un círculo. A cada grupo de datos le corresponde un número de
grados de un sector circular. También se puede expresar como sectores
circulares que representa a tanto por ciento.
Población: Conjunto
de datos con los que se realiza una investigación parte de una población.
Muestra:
Parte de una población.
Frecuencia absoluta: Número
de veces que un dato se presenta una población o en una muestra de ella.
Frecuencia relativa:
Consiente obtenido al dividir la frecuencia absoluta entre el número total de
datos.
Intervalos: Clasificación
de los datos en grupos determinados a los que se llama intervalos de clase. En
un intervalo de clases se deben considerar los puntos límite inferior, límite
superior y el punto medio.
Rango: Los
intervalos de clase deben tener la misma amplitud a la que llamamos rango. La
amplitud se logra al dividir el rango entre el número de clases.
BIBLIOGRAFÍAS.
Estadística 4ta edición.
AUTORES:
La biblia de las matemáticas (estadística y probabilidad) equipo editorial.
AUTORES:
Matemáticas (estadística) guía de tareas y métodos de estudio.
AUTOR:
AUTORES:
- JOHN E. FREUND.
- ARIZONA STATE UNIVERSITY.
- RICHARD MANNING SMITH.
- BRYANT COLLEGE.
Edición en español editor supervisor de traducción y corrección de estilo.
Pág. 46-58.
Medidas de tendencia central: media 3.2
Medidas de tendencia central: moda 3.5
Medidas de dispersión: rango 3.6
Medidas de dispersión: desviación estándar 3.7
La biblia de las matemáticas (estadística y probabilidad) equipo editorial.
AUTORES:
- CARMEN CHÁVEZ REYEZ.
- ADRIANA LEÓN QUINTANAR.
Pág. 1001- 1012-
Introducción rango medidas de dispersión desviación media, varianza, desviación típica.
Matemáticas (estadística) guía de tareas y métodos de estudio.
AUTOR:
- ANDRÉS LEÓN QUINTANAR.
Editorial
letrarte, C.A edición 2004
Pág.
241-244
Que
es la estadística, frecuencia absoluta, frecuencia relativa, intervalo de
clases, medidas centrales o de posición.
Estadística
y probabilidad autor LUIS MANUEL GARCIA URIBE.
TRILOGÍA.
Wealpole, M. probabilidad
para ingeniería octava edición, México, prentice hall Hispanoamérica, 2007.
Suscribirse a:
Entradas (Atom)