Estratificación o muestreo estratificado
Estratificación es clasificar o agrupar los datos con características coincidentes en grupos o estratos. Sirve para facilitar el trabajo antes de usar otras herramientas como pueden ser los histogramas o los diagramas de dispersión.
Cuando hay muchos datos, por ejemplo, en un diagrama de dispersión, su interpretación puede hacerse bastante complicada y se pueden enmascarar los problemas a detectar. Esta técnica separa los datos para que podamos encontrar patrones que de otra manera no se podrían ver.
Cuándo utilizar la estratificación
- Antes de recopilar datos: A veces contamos con muchísimos datos y resulta conveniente intentar clasificarlos antes de lanzarnos a usar otro tipo de herramienta como diagramas de Pareto o Histogramas.
- Cuando tenemos datos de varias fuentes o condiciones: turnos, días de la semana, proveedores o grupos de población.
- Cuando el análisis de datos requiere la separación de diferentes fuentes o condiciones: por ejemplo separar por diferentes equipos.
Tipos de muestreo estratificado
Dependiendo del tamaño de los estratos, podemos encontrar 3 tipos de muestreo estratificado:
1. Muestreo estratificado proporcionado o proporcional
La muestra deberá tener estratos que guarden las mismas proporciones observadas en la población.
Por ejemplo: Estamos analizando la cantidad de autónomos en España que trabajan desde casa y hay 1.000.000 de personas en este segmento: 70% de mujeres y 30% de hombres (estos son datos totalmente ficticios).
Si decidimos que la muestra sea de 1000 personas, la proporción debe ser la siguiente:
Estrato de mujeres: 700 (70%)
Estrato de hombres: 300 (30%)
2. Muestreo estratificado uniforme
Cuando se asigna el mismo tamaño de muestra a todos los estratos definidos, sin importar el peso que tienen en la población. Si seguimos con el ejemplo anterior, un muestreo estratificado uniforme quedaría de la siguiente manera:
Estrato de mujeres: 500
Estrato de hombres:500
3. Muestreo estratificado óptimo (respecto a la desviación estándar)
En este caso, el tamaño de los estratos en la muestra no guarda proporcionalidad con la población. Se define el tamaño de los estratos proporcionalmente a la desviación estándar de las variables objeto de estudio. Es decir, se toman estratos de mayor tamaño en los estratos con mayor variabilidad interna para representar mejor en el total de la muestra los grupos poblacionales más difíciles de estudiar.
Fuente: Blog de Netquest
¿Qué tipo de muestreo es el más conveniente?
Según nos dice Carlos Ochoa en este artículo:
- El muestreo estratificado proporcional produce siempre menor o igual error muestral que el muestreo aleatorio simple
- El muestreo estratificado óptimo es siempre igual o más preciso que el muestreo estratificado proporcional.
Procedimiento de estratificación
✏️ Antes de recopilar datos, se debe considerar qué información sobre las fuentes de los datos puede tener un efecto en los resultados. ¿Qué vas a analizar?
✏️ Recopila los datos.
✏️ Determina los factores de estratificación a emplear.
✏️ Haz los cálculos necesarios para dividir los estratos.
✏️ Grafica los datos recopilados en un diagrama de dispersión, gráfico de control, histograma u otra herramienta de análisis. Utiliza marcas o colores diferentes para distinguir los datos de varias fuentes.
✏️ Observa y analiza los resultados.
Ejemplo
Como siempre vamos a verlo con un ejemplo. Tomaremos como ejemplo una fábrica de jabón (se nota que trabajé en una ;-) )
Una empresa de fabricación de jabón detecta que el % de humedad de la viruta de jabón presenta valores anómalos cuando se relaciona con el ph. Tras hacer un diagrama de dispersión, los datos que se obtienen no parecen arrojar luz sobre el problema. La tecnóloga de la planta propone segmentar los datos obtenidos teniendo en cuenta que se usan 3 vacuosecadoras distintas para secar el jabón.
* Los datos mostrados son totalmente ficticios. Tienen carácter meramente ilustrativo y no forman parte de ningún proceso real de fabricación de jabón.
Vacuosecadora 1 | Vacuosecadora 2 | Vacuosecadora 3 | |||||
% humedad | pH | % humedad | pH | % humedad | pH | ||
30 | 7 | 20 | 7 | 30 | 6 | ||
40 | 8 | 25 | 6 | 31 | 7 | ||
35 | 9 | 23 | 7 | 32 | 6 | ||
20 | 7 | 30 | 6 | 31 | 7 | ||
68 | 5 | 26 | 8 | 35 | 6,5 | ||
36 | 7 | 31 | 5 | 31 | 5,5 | ||
89 | 6 | 25 | 6 | 34 | 7,2 | ||
78 | 9 | 28 | 7 | 30 | 7,4 | ||
35 | 6 | 30 | 6 | 30 | 7 | ||
78 | 5 | 28 | 6 | 28 | 6,5 |
A partir de estos datos, podemos confeccionar el siguiente gráfico, donde se observa claramente que la vacuosecadora 1 puede tener un problema que a priori no se había detectado:
El siguiente paso sería seguir investigando a través de otras herramientas más complejas, cuál puede ser el problema de la vacuosecadora 1. ¿Mantenimiento? ¿Operarios?
Plantilla excel
Te dejo por aquí la plantilla de excel que he usado para el ejemplo, puedes adaptarla a tus necesidades. Recuerda elegir bien las categorías o estratos que vas a utilizar.
Para saber más
Aquí puedes ver otros ejemplos (usando diagrama de Pareto o histograma). Recuerda que mi objetivo es brindarte el máximo de información posible ;-)
Ejemplo con diagrama de Pareto
Y hasta aquí el post de hoy. ¿Conocías la estratificación? La habías usado alguna vez? Cuéntamelo en los comentarios :)
¿Quieres tener toda la serie de post en formato e-book?
- ISO 31000:2018 Capítulo 6 (Parte I) - 7 abril, 2022
- El informe anual del Consejero de Seguridad - 3 junio, 2021
- ISO 31000:2018 Capítulo 5 (Parte II) - 2 junio, 2021
¡Muy buen artículo!
Información clara y concisa, quizá los tecnicismos son complejos para gente que no entienda del tema, pero en general es un excelente trabajo.
Gracias por la información, entendible y saca de dudas