Distribución de frecuencias

Tipos de variables.

Las variables estadísticas pueden ser de dos tipos:

  • Cualitativas: son aquellas en la que los resultados posibles no son valores numéricos. Por ejemplo: color del pelo, tipo de ropa preferida, lugar de veraneo, etc.
  • Cuantitativas: aquellas cuyo resultado es un número. A su vez, las hay de dos tipos:
    • Cuantitativas discretas: cuando se toman valores aislados. Por ejemplo: número de amigos de tu pandilla, número de veces que vas al cine al mes, número de coches que tiene tu familia.
    • Cuantitativas continuas: cuando, entre dos valores cualesquiera, puede haber valores intermedios. Es decir, se toman todos los valores de un determinado intervalo. Por ejemplo: peso de las personas, nivel sobre el mar en que se encuentra tu ciudad, medida del perímetro torácico.

Medidas de tendencia central.

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: mediamediana y moda

A continuación, veamos las principales medidas de tendencia central, así como las distintas fórmulas que permiten calcular dichas medidas en cualquier caso.

Media

La media es el valor promedio de un conjunto de datos numéricos, calculada como la suma del conjunto de valores dividida entre el número total de valores. A continuación se muestra la fórmula de la media aritmética: 


Mediana            

La mediana es un estadístico de posición central que parte la distribución en dos, es decir, deja la misma cantidad de valores a un lado que a otro. Las fórmulas propuestas no nos darán el valor de la mediana, lo que nos darán será la posición en la que está dentro del conjunto de datos. 

Moda

La moda es el valor que más se repite en una muestra estadística o población. No tiene fórmula en sí mismo. Lo que habría que realizar es la suma de las repeticiones de cada valor. 



Distribución de frecuencias 

La distribución de frecuencias es la forma en la que un conjunto de datos se clasifica en distintos grupos excluyentes entre sí. Es decir, si un dato pertenece a un grupo no puede pertenecer a otro.

Tipos de distribuciones de frecuencia

Los tipos de distribuciones de frecuencia son los siguientes:

·         Frecuencia absoluta: Es la cantidad de observaciones que pertenecen a cada grupo. También, se interpreta como la cantidad de veces que se repite un suceso. Por ejemplo, continuando con el caso anterior, puede ser que de un grupo de 100 personas, 20 de ellos tengan entre 26 y 40 años.

·         Frecuencia relativa: Se calcula dividiendo la frecuencia absoluta entre el número de datos, por ejemplo, volviendo a la situación planteada líneas arriba, 20/100 es igual a 0,2 o 20%.

·         Frecuencia absoluta acumulada: Resulta de sumar las frecuencias absolutas de una clase o grupo de la muestra (o población) con la anterior o las anteriores. Por ejemplo, para calcular la frecuencia absoluta acumulada del tercer grupo se suman las frecuencias absolutas del primer, segundo y tercer grupo.

·         Frecuencia relativa acumulada: Es el resultado de sumar las frecuencias relativas, tal y como explicamos para la frecuencia absoluta acumulada. Por ejemplo, para calcular la frecuencia relativa acumulada del cuarto grupo, se suman las frecuencias relativas del primer, segundo, tercer y cuarto grupo.





Diagrama de tallo y hojas.

Un diagrama de tallo y hoja es una organización de los datos numéricos en categorías basadas en un valor posicional. El diagrama de tallo y hoja es un gráfico similar a un histograma, pero muestra más información. En un diagrama de tallo y hoja, cada número se dividirá en dos partes usando el valor posicional.

El tallo es la columna izquierda y contendrá los dígitos en la posición más grande. La columna de la derecha, será la hoja y contendrá los dígitos de la posición más pequeña.

Ejemplo A

En un estudio reciente de estudiantes hombres en una escuela, se les preguntó a estos cuánto dineros gestaban en la graduación. Los siguientes números representan la cantidad de dólares de un grupo al azar de 40 estudiantes hombres.  

25

60

120

64

65

28

110

60

70

34

35

70

58

100

55

95

55

95

93

50

75

35

40

75

90

40

50

80

85

50

80

47

50

80

90

42

49

84

35

70


Representa estos datos en un diagrama de tallo y hoja. 

Solución:

Los tallos se ordenarán verticalmente en orden ascendente (más pequeño a más grande) y cada hoja se escribirá a la derecha de su tallo de forma horizontal, de menor a mayor.

 

Tallo

Hojas

 

2

5

8

 

 

 

 

 

3

4

5

5

5

 

 

 

4

0

0

2

7

9

 

 

5

0

0

0

0

5

5

8

6

0

0

4

5

 

 

 

7

0

0

0

5

5

 

 

8

0

0

0

4

5

 

 

9

0

0

3

5

5

 

 

10

0

 

 

 

 

 

 

11

0

 

 

 

 

 

 

12

0

 

 

 

 

 

 

 Este diagrama de tallo y hoja se puede interpretar fácilmente. Al observar el tallo 6, puedes ver que 4 alumnos gastaron "alrededor" de 60 dólares en la graduación. Al contar el número de hojas, sabes que 40 alumnos respondieron a la pregunta que se les hizo. Los valores de los datos más pequeños y más grandes se pueden saber mirando al primer y último tallo y hoja. El diagrama de tallo y hoja es una carta de "vista rápida" que puede entregar información de los datos en forma rápida. También sirve como un método fácil para ordenar los números manualmente.

Comentarios