Distribución de frecuencias

En estadística, se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría.¹ Esto proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase.Tipos de frecuencias

Frecuencia completa

La frecuencia completa por su denominación es el número de veces que aparece un determinado valor en un valor estadístico. Se representa por fila. La suma de la frecuencia completa es igual al número total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee sumatoria.

Frecuencia relativa

Se dice que la frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento y se representa por h_i. La suma de las frecuencias relativas es igual a 1

Frecuencia relativa (h_i) es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N). Es decir:

    $h_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}$

siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribución de frecuencias.

Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi).

Frecuencia acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

La frecuencia acumulada es la frecuencia estadística F(XXr) con que el valor de un variable aleatoria (X) es menor que o igual a un valor de referencia (Xr).

La frecuencia acumulada relativa se deja escribir como Fc(X≤Xr), o en breve(Xr), y se calcula de

   Fc (Hr)  = HXr / N

donde MXr es el número de datos X con un valor menor que o igual a Xr, y N es número total de los datos. En breve se escribe:

   Fc = M / N

Cuando Xr=Xmin, donde Xmin es el valor mínimo observado, se ve que Fc=1/N, porque M=1. Por otro lado, cuando Xr=Xmax, donde Xmax es el valor máximo observado, se ve que Fc=1, porque M=N.

En porcentaje la ecuación es:

   Fc(%) = 100 M / N

Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento. Ejemplo:

Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 44

Distribución de frecuencias agrupadas

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Límites de la clase. Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.

La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros. En caso de que el primer intervalo sea de la forma (-∞,k], o bien [k,+∞) donde k es un número cualquiera, en el caso de (-∞,k], para calcular la marca de clase se tomará la amplitud del intervalo adyacente a el (ai+1), y la marca de clase será ((k-ai+1) +k)/2. En el caso del intervalo [k,+∞) también se tomará la amplitud del intervalo adyacente a el (ai-1) siendo la marca de clase ((k+ai-1)+k)/2.

Construcción de una tabla de datos agrupados:

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos que queramos establecer.

Es conveniente que el número de intervalos oscile entre 6 y 15.

En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos.

Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece al intervalo, se cuenta en el siguiente intervalo.

Intervalo	ci	ni	Ni	fi	Fi
[0, 5)	2.5	1	1	0.025	0.025
[5, 10)	7.5	1	2	0.025	0.050
[10, 15)	12.5	3	5	0.075	0.125
[15, 20)	17.5	3	8	0.075	0.200
[20, 25)	22.5	3	11	0.075	0.275
[25, 30)	27.5	6	17	0.150	0.425
[30, 35)	32.5	7	24	0.175	0.600
[35, 40)	37.5	10	34	0.250	0.850
[40, 45)	42.5	4	38	0.100	0.950
[45, 50)	47.5	2	40	0.050	1
Total:		40		1

https://www.tdx.cat/bitstream/handle/10803/8917/CapituloIVAnalisisdelosResultados.pdf?sequence=5&isAllowed=y

Media, moda, mediana, rango

Octavo básico - Actividad Nº 790

1- Media aritmética

Es la suma de todos los datos dividida entre el número total de datos. Se calculan dependiendo de cómo vengan ordenados los datos.

Ejemplo:

¿Cuál es la media de las edades de Andrea y sus primos?

La media aritmética de un grupo de datos se calcula así:

Se debe multiplicar cada dato con su respectiva frecuencia, sumar todos estos productos, y el resultado dividirlo por la suma de los datos.

Ejemplo:

Se ha anotado el número de hermanos que tiene un grupo de amigos. Los datos obtenidos son los siguientes:

Hermanos: 1, 1, 1, 1, 2, 2, 2, 3, 3, 4

Si hacemos el recuento de los datos y seguimos los pasos anteriormente descritos, tenemos:

2- Moda

La moda de un conjunto de datos es el dato que más veces se repite, es decir, aquel que tiene mayor frecuencia absoluta. Se denota por Mo. En caso de existir dos valores de la variable que tengan la mayor frecuencia absoluta, habría dos modas. Si no se repite ningún valor, no existe moda.

- Ejemplo1:

¿Cuál es el dato que más se repite en el ejemplo anterior?

El dato que más se repite es el 1, es el que tiene mayor frecuencia absoluta (4 veces).

La moda del número de hermanos es 1

- Ejemplo 2:

2, 3, 4, 5 , 6 , 9

En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de valores no tiene moda.

- Ejemplo 3:

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 M_o= 1, 5, 9

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.

- Ejemplo 4:

0, 1, 3, 3, 5, 5, 7, 8 M_o = 4

Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.

3- La mediana

La mediana es el valor que ocupa el lugar central entre todos los valores del conjunto de datos, cuando estos están ordenados en forma creciente o decreciente.

La mediana se representa por Me.

Calculo de la mediana:

1° Ordenamos los datos de menor a mayor.

- La mediana de un conjunto con un número impar de datos es, una vez ordenados los datos, el dato que ocupa el lugar central.

Ejemplo:

Calcular la mediana del conjunto de datos:

- También podemos usar la siguiente fórmula para determinar la posición del dato central:

(n + 1) /2 = mediana datos impares.

- La mediana de un conjunto con un número par de datos es, una vez ordenados, la media de los dos datos centrales.

Ejemplo:

Calcular la mediana del conjunto de datos:

4- Rango

El rango da la idea de proximidad de los datos a la media. Se calcula restando el dato menor al dato mayor.

Este dato permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos están los datos de un conjunto.

Ejemplo:

Se preguntó a 9 familias cuántas bicicletas tenían en total, dieron las respuestas ordenadas en la siguiente tabla:

- ¿Cómo hallarías el rango?

Se resta el dato mayor al dato menor: 3 - 0 = 3; Por lo tanto el rango sería 3 en este caso.

Si el conjunto de datos que se recolecta es muy numeroso, o bien, si el rango es muy amplio, es conveniente agruparlos y ordenarlos en intervalos o clases.

La amplitud o tamaño de cada intervalo se puede calcular dividiendo el valor del rango por la cantidad de intervalos que se desean obtener.

4- Ejercicios:

1- Se le pregunta a un grupo de personas acerca de la cantidad de libros que leyó durante el año 2015, y las respuestas son: 4; 3; 2; 7; 10; 8; 2; 9; 3; 6; 8; 1; 1; 9; 2. La moda de la muestra es:

a) 2 b) 3 c) 4 d) 5 e) 9

2- Halla la mediana de las siguientes series estadísticas.

a) 1, 7, 3, 2, 4, 6, 2, 5, 6

b) 4, 2, 1, 3, 8, 5, 3, 1, 6, 7

3- Se tienen dos distribuciones cuyos datos son los siguientes:

Distribución A: 9, 5, 3, 2, 1, 2, 6, 4, 9, 8, 1, 3, 5, 4, 2, 6, 3, 2, 5, 6, 7

Distribución B: 1, 1, 3, 2, 5, 6, 7, 2, 5, 4, 3, 1, 2, 1, 5, 7, 8, 9, 9, 2, 1

a) Halla el rango de ambas distribuciones.

4- Se tiene el siguiente conjunto de datos:

10, 13, 4, 7, 8, 11, 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18

a) Obtén la mediana

Respuestas:

1- a

2- a) 1, 2, 2, 3, 4, 5, 6, 6, 7 M = 4

b) 1, 1, 2, 3, 3, 4, 5, 6, 7, 8; La mediana es la media aritmética de los dos valores centrales, M = 3,5.

3- Rango de A: 9 - 1 = 8

Rango de B: 9 - 1 = 8

4- a) Ordenamos los datos de menor a mayor:

3, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 10, 10, 10, 10, 11, 12, 13, 13, 14, 16, 16, 17, 18, 18, 20

Como hay 26 valores, la mediana es la media de los dos valores centrales: M= 10 + 10 / 2 = 10

Interpretación de tablas de frecuencias

Octavo básico - Actividad Nº 786

1- Interpretación de tablas de frecuencias
Una tabla de frecuencias resume la información acerca de la cantidad de veces que una variable toma un valor determinado. Además permite Organizar e interpretar de manera más rápida y eficiente.

1.1- La frecuencia absoluta
Corresponde a la cantidad de veces que se repite un dato. Denotamos este valor por f_i.
La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.
Por Ejemplo:
Si hacemos una encuesta a 20 personas para saber cuál es su color favorito obtenemos lo siguiente:
[Tabla 1]
tablas_frecuencia1.png (626Ã—297)

1.2- La Frecuencia Absoluta Acumulada
Se obtiene sumando sucesivamente las frecuencias absolutas. Denotamos este valor por F_i.
[Tabla 2]

1.3- La Frecuencia Relativa
Es la probabilidad de obtener cierto dato, se obtiene calculando la razón entre la frecuencia absoluta de un dato con el total. Se puede expresar como fracción, decimal o porcentaje. Denotamos este valor por h_i.
[Tabla3]
tablas_frecuencia3.png (970Ã—319)