Muestreo

  1. Muestreos aleatorios
  2. Muestreos no aleatorios
  3. Tamaño de la muestra
In English   In Finnish   Indice

La población o "población objetivo" es ese grupo entero de elementos de los que queremos recoger datos. Los acercamientos en definirlo se discuten en una página separada: Delimitar la población de estudio.

En un estudio empírico, este grupo puede consistir de gente, animales u otros objetos. En un estudio de caso contiene apenas un objeto o acontecimiento, pero en una investigación teóricamente orientada puede ser infinita, es decir usted desea saber algo que es verdad para cada objeto o acontecimiento del tipo dado en el universo.

En algunos proyectos cada espécimen o acontecimiento de la población será medido o registrado realmente. Tal un estudio total da una descripción excelente de la población, pero es posible solamente si la población no es demasiado grande y si todos los objetos están disponibles para el estudio.

El estudio total es un método relativamente costoso, porque el trabajo empírico toma tiempo e implica a menudo aparato, recorridos y otros costes. Los objetivos de un proyecto de investigación no requieren siempre una cuenta absolutamente exacta de la población entera. Una aproximación confiable sería suficiente a menudo. Por lo tanto es común que usted mide o registra solamente tan muchas unidades de la población a que usted puede permitirse y que sean necesarias para alcanzar las metas del proyecto. A este fin, varias estrategias están disponibles. Algunos se listan abajo.

En la investigación de muestreo estamos interesados por igual en todos los elementos de la población y querríamos estudiarlos todos. Pero por razones prácticas, tendremos que escoger solo una muestra. Tal vez tenemos una población de millones de objetos y es imposible abarcar incluso una mayoría de entre ellos. También en aquellos casos (con poblaciones, digamos, de 10.000) en que podríamos escoger estudiar cada objeto, el estudio de muestreo puede ser una elección prudente, porque ahorra tiempo y podemos usar el tiempo ahorrado para estudiar los elementos más cuidadosamente. Todos estos son buenos casos para un estudio de muestreo. Los distintos métodos de selección de la muestra se tratan más abajo.

Más arriba vimos que en la investigación de muestreo en lo que estamos siempre interesados no es en la muestra sino en la población; más exactamente, en las propiedades de los elementos de la población. Cuando estamos estudiando los elementos del ejemplo querríamos escoger elementos que tengan los mismos atributos que la media de la población. Si ese es el caso, nuestra muestra es representativa.

Hay dos principios alternativos que pueden seguirse cuando se elige una muestra:
Muestra aleatoria

El acto del muestreo sí mismo genera dos tipos de desacuerdo entre la población y la muestra:

¿Usted puede preguntar por qué utilizar el muestreo no-aleatorio en todos, porque implica el riesgo del sesgo, una fuente aparentemente innecesaria del desacuerdo con la población? Hay varias motivaciones posibles:

Muestras aleatorias

Si una muestra aleatoria se hace correctamente, contiene no tendencia sistematica y es por lo tanto relativamente representante de la población. Por supuesto, en un estudio de muestreo, nunca podemos estar seguros al 100% de que los resultados medidos a partir de la muestra sean también ciertos en la población. No obstante, a efectos prácticos suele ser suficiente si podemos afirmar que el riesgo de una desviación de la población es, digamos, un 1%. Seremos capaces de hacer tales afirmaciones que están basadas en cálculo de probabilidades si hemos usado una muestra aleatoria.

El principio de la selección de los elementos en una muestra aleatoria es el mismo que cuando se reparten la baraja. Todos los objetos de la población tienen iguales probabilidades de ser seleccionados en la muestra. Esta probabilidad es llamada razón de muestreo (sampling ratio en inglés), y es igual al número de elementos de la muestra dividido por el número de la población.

Muestra aleatoria simpleHay métodos alternativos para crear una muestra aleatoria (en otras palabras, una "muestra de probabilidad"). En los diagramas siguientes, los casos de la población original se presentan como puntos u otros símbolos pequeños, y los casos seleccionados en la muestra se demuestran como símbolos en negrita.

1. Muestra aleatoria simple. La muestra se extrae a suertes, por ejemplo cogiendo papeletas numeradas de un sombrero. Si tenemos un fichero de ordenador sobre la población, la computadora hará la selección al azar. Cuando la población es muy grande y ya consiste en grupos naturales, los miembros de los cuales se enumeran en un archivo, puede ser práctico hacer el muestreo en etapas (cluster sampling), seleccionando primero algunos grupos y entonces seleccionando la muestra final sólo desde los miembros de estos grupos seleccionados. Por ejemplo, si la población consiste en toda la gente en un país, usted puede primero seleccionar al azar algunas subdivisiones del país y después seleccionar la muestra final entre la gente en estas subdivisiones. Si usted se prepone entrevistarse con esta gente en sus hogares, usted ahorrará así mucha hora de viajar.

Muestra sistemática 2. Muestra sistemática. Si la razón que se pretende es 1/n, empezamos escogiendo el primer elemento al azar entre los primeros n objetos de la población, y tras ello extraemos cada n-avo objeto. Si tenemos una lista de objetos de la población el procedimiento será muy fácil incluso sin una computadora, y el resultado será así representativo, excepto en la situación inusual que una característica importante de los casos sucede a la repetición en cada n casos.

Muestra aleatoria ponderada 3. Muestra aleatoria ponderada. Cuando la población incluye un grupo muy pequeño pero esencial, hay el riesgo de que ningún miembro de ese grupo quede dentro de una muestra aleatoria. Tales grupos claves de usuarios de productos son, entre otros, gente corto de vista, duro de oído o con la capacidad reducida del movimiento, véase una lista de tal gente. Otras minorías a menudo significativas originan de religiones, de nacionalidades y de lenguas.

Para asegurar por lo menos algunos de una minoría clave (marcada con x en el diagrama a la derecha) en la muestra, podemos incrementar deliberadamente la razón de la muestra sobre este grupo de especial importancia. Por supuesto que esto generará un desequilibrio en las mediciones que se obtengan a partir de la muestra ponderada, pero será fácil restaurar el equilibro original. Esto se hace así cuando se combinan los resultados; por ejemplo, al calcular la media de todas las mediciones daremos a las mediciones de cada grupo su peso apropiado correspondiente a los porcentajes genuinos en la población.

Muestras no aleatorias

Las muestras no aleatorias (o "no probabilísticas") { son seleccionadas por cualquier procedimiento que no da todos casos en la población las oportunidades iguales de caer en la muestra. A veces el contexto del estudio permite o facilita un cierto método de muestreo, a veces el investigador tiene la posibilidad de escoger el método. Varios tales procedimientos serán discutidos abajo.

Cualquier es el procedimiento, es siempre posible que favorecerá ciertos tipos de casos en la población más que los otros, es decir producirá una muestra sesgada.

En estudios descriptivos la presencia de sesgo es una desventaja grave que usted encontrará más adelante en su proyecto, en cuándo valorar el muestreo y en cuándo escribir el capítulo final de su informe. Por lo tanto puede ser prudente pensar de él por adelantado, cuándo escoger el método de muestreo.

Al valorar una muestra no-aleatorio que usted debe preguntar usted mismo: ¿Serán los resultados de la muestra el mismo que usted conseguiría de la población? ¿Es cierto que el criterio que usted ha utilizado en seleccionar la muestra (e.g. la buena voluntad de la gente de participar) no tiene ninguna correlación con esas variables que usted desee registrar de la muestra? Si hay correlación, su muestra está sesgada y usted debe considerar el construir de una muestra nueva con menos correlación.

Como contraste, muestras no aleatorias se pueden utilizar en proyectos de investigación y del desarrollo, a condición de que el sesgo sistemático posible sea compensado más adelante. Por ejemplo, es común usar al muestreo de conveniencia cuándo escoger clientes potenciales a un grupo de trabajo para desarrollar un concepto del producto preliminar. La selección de personas será probablemente sesgada, tan bien como las propuestas del grupo de trabajo, pero las propuestas serán rectificadas ulteriormente cuando son evaluadas de nuevo por un otro grupo de gente más grande.

Muestra de conveniencia Entre los tipos comunes de muestras no aleatorias se incluyen:

1. Muestra de conveniencia. Un grupo existente, por ejemplo la gente en una reunión, podría ser designado como muestra. Este es un método fácil y barato, pero el sesgo suele ser imposible de estimar. El método es popular en las demostraciones de cursos sobre métodos, donde los datos obtenidos de la muestra no se usarán. Asimismo, esto es un método posible cuando usted necesita a algunos clientes potenciales asistir al desarrollo de producto, a condición de que los resultados obtenidos sean probados más adelante con una muestra mejor escogida de la clientela-objetivo.

2. Muestra de voluntarios es creada cuando todos los miembros de la población tienen la oportunidad de participar en la muestra. Si usted inserta una forma de cuestionario en un periódico o en una página del Internet y pide que la gente dé sus opiniones sobre un asunto, usted conseguirá una muestra de voluntarios. Un otro ejemplo es la respuesta de los clientes que llega a una empresa.

Una muestra de voluntarios puede ser una alternativa práctica cuando no hay lista de los miembros de la población de quien una muestra aleatoria se podría escoger, o cuando es difícil de contactar a la gente en una muestra porque sus direcciones no se saben. La desventaja es que es difícil determinar la presencia del sesgo, es decir si las opiniones u otras características interesantes de los voluntarios se desvían de ésos de la población. Cuando en vista de esta pregunta, hay dos cuestiones que plantearse:

Si usted, por ejemplo, quiere obtener una muestra de gente que ha comprado su último producto, usted puede incluir en el paquete del producto un formulario franqueo-pagada donde la gente puede dar sus nombres y direcciones. ¿Qué sucedería si usted pidió además que los respondedores dieran sus opiniones del producto? Usted conseguiría probablemente respuestas sobre todo de la gente que tiene una opinión fuerte de su producto, positiva o negativa. La gente sin opinión definida de su producto quizás no incomodaría contestar. La muestra sería así sesgada, y usted tendría que considerar si tal tendencia podría ser aceptable para sus fines.

Muestra - bola de nieve 3. Muestra - bola de nieve. Cuando se entrevista a miembros de un grupo, podemos pedir a las personas que nos indiquen otros individuos en ese grupo que podrían dar información sobre ese tema; podríamos también pedirles que nos indicasen personas que compartan sus puntos de vista y también otras que sean de opinión opuesta. Entonces entrevistaremos a nuevos individuos y continuaremos del mismo modo hasta que no obtengamos nuevos puntos de vista de nuevos entrevistados. Este es un buen método por ejemplo para recoger los distintos puntos de vista existentes en un grupo, pero su inconveniente es que no obtenemos una idea exacta de la distribución de las opiniones.

4. Una muestra que consiste en todos los casos disponibles. A veces el investigador es interesado en una población de que sólo unos pocos casos o especímenes están disponibles para el estudio, y estos entonces deben servir como una muestra de la población. Tales muestras típicas son:

Los casos restantes entre el material histórico o arqueológico, cuando ha desaparecido una parte grande de material relevante antes de que reciben los investigadores, se pueden mirar como una clase de muestra de conveniencia incluso cuando es la realidad histórica y no la conveniencia que selecciona la muestra. Si la destrucción del material, durante el tiempo hasta el estudio, no ha sido al azar ni proporcional pero en lugar de alguna manera parcial o selectivo, el material sobreviviente será sesgado y el investigador debe valorar el sesgo probable. Usted debe preguntarse si cualquiera de los factores siguientes ha afectado diferentemente en la preservación de tipos diferentes de la materia:

Los casos permitidos. Al estudiar las empresas privadas sucede a menudo que la gerencia no permitirá colectar información desde ciertas unidades en la organización. La decisión de la administración es motivada quizás por su juicio sobre los objetivos del estudio, pero del punto de vista científico tal muestra a menudo parecerá gravemente sesgada.

Métodos de muestreo inadecuados

Sobrepasar los límites de la población. No tenemos que incluir elementos que no sean miembros de la población en nuestra muestra. Por ejemplo, en muestreo bola-de-nieve sucede a menudo que alguna gente entrevistada nomina a candidatos que no pertenecen a la misma población. Por supuesto, usted tiene a menudo la opción de alterar sus delimitaciones originales.

Muestra de casos típicos Muestra de casos típicos. La meta de estudiar un grupo heterogéneo es a menudo encontrar cuál es común y típico de la mayoría de los casos en el grupo. A este efecto loable, el muestreo se ha utilizado a veces para seleccionar los casos más típicos en la muestra, y todos los casos extraordinarios son dejados fuera. En la figura en el derecho, los casos típicos se marcan con puntos, y los casos excepcionales están marcados con los símbolos + y x.

Sin embargo, seleccionar una muestra de casos típicos no es muy recomendable porque cuándo escoger los casos "típicos" los prejuicios del investigador (que pueden ser erróneos) influencian demasiado los resultados de la investigación. El investigador puede, sin notarlo, seleccionar sobre todo tales casos que corroboren sus preconcepciones o hipótesis. Para resumir, si usted desea precisar los especímenes medios o los casos más comunes de la población, un método mejor es clasificar todos los artículos de la población, o una muestra escogida al azar, y encuentra el tipo más frecuente. Cuando es necesario, usted puede entonces continuar el estudio de esta clase, que en adelante se convierte en la población nueva del estudio.

Muestra de especialistas. Puede ser que parezca una idea sensible de preguntar directamente ésos, a menudo pocos, personas que saben mucho sobre el asunto, en vez de preguntar una muestra grande de legos escogidos al azar cuyo conocimiento puede ser esporádico y cuyos opiniones pueden divergir. Así, podríamos por ejemplo:

La ventaja a entrevistar a especialistas es que usted necesita entrevistar apenas unas pocas personas y en la discusión usted consigue rápidamente al punto. Sin embargo, usted no debe pensar que los "especialistas" puedan ser tomados como muestra de "no especialistas". Son dos poblaciones diferentes. No debiéramos generalizar los resultados de "especialistas" a ninguna otra población.

Si usted entonces desea además recolectar las opiniones de los consumidores medios, usted debe definir éstos como una población segunda y seleccionar una muestra adecuada de ella, también. Una alternativa deberá hacer dos proyectos distintos de estos dos exámenes. Una posibilidad es hacer estos dos exámenes en sucesión. Podríamos tal vez continuar transformando los resultados a partir de los especialistas en hipótesis que más tarde verificaríamos con una muestra apropiada de la población "real" o de no especialistas, que serían en los ejemplos citados, respectivamente, los consumidores y los arrendatarios. En otras palabras, podríamos usar la entrevista de los especialistas como un estudio preliminar sólo.

Muestreo normativo. El aspecto normativo es aceptable en los proyectos del desarrollo que apuntan a mejorar objetos similares en el futuro, pero es mejor guardarlo fuera del muestreo porque no es compatible con los principios de la representatividad y de la generalización.

Muestra de los mejores casosEl estudio normativo de una "muestra de los mejores obras" es algo bastante tradicional en historia del arte. La idea es que éstos representan lo más auténtico de su época. Tal selección deliberada por parte del investigador tiene no obstante riesgos serios. Es evidente que no son típicos de la era y no representan las obras de arte medias. Esto no sugiere que usted no los debe estudiar, pero si usted lo hace, no le llama una "muestra" si usted quiere decir que los grandes amos o sus obras son la población de su estudio. Cf. Delimitar la población de estudio.

Más tarde en la fase de análisis de sus datos que usted puede mantener fácilmente el aspecto normativo, usando los métodos de estudio de caso normativo , comparación normativa , clasificación normativa , y estudio pedagógico del desarrollo, de modo que no es necesidad de mezclar el procedimiento de muestreo con consideraciones normativas.

Tamaño de la muestra

El propósito principal del muestreo es reducir la necesidad de las operaciones empíricas que exigen el trabajo y el coste. ¿Cómo pequeña puede una muestra entonces estar sin perder su utilidad? ¿Es decir cuál es el número más pequeño de los casos que todavía nos dan bastante confiables datos sobre la población?

Muestras aleatorias

Los datos que podemos conseguir de la muestra son normalmente levemente diferentes de los datos de la población. La razón es que la selección al azar ha traído a la muestra no solamente artículos medios de la población, pero también algunos artículos más o menos excepcionales. Cuántos de ellos, puede ser anticipado usando la teoría de probabilidades. Puede también decirnos cómo grande es el riesgo de conseguir datos erróneos debido a estos casos excepcionales. El riesgo es aproximadamente proporcional a la variación de las variables y en la relación inversa al tamaño de muestra.

Si utilizamos la fórmula inversamente, y sabe el nivel deseado de la representatividad estadística de los datos que vamos a registrar de la muestra, podemos calcular el tamaño de muestra requerido en base del número de variables, y de sus variaciones. No se saben a menudo por adelantado, pero una aproximación se puede usar en su lugar.

Usted, por ejemplo, ha medido dos variables de una muestra pequeña y ha encontrado que su correlación es 0,26. Es siempre posible que tal correlación se haya creado en la muestra apenas accidentalmente y no es verdad en la población. Usted desea que la probabilidad de tal accidente sea menos de 1%. Si usted consulta la tabla que se presenta en t-test, usted encontrará que una muestra de 100 casos se necesita antes de que la probabilidad de conseguir accidentalmente una 0.26 correlación disminuya a 1%.

Otro ejemplo. Usted estudia porcentajes y usted desea ser 95% cierto que el porcentaje que usted ha medido de una muestra es verdad en la población también. Aquí usted puede utilizar la fórmula del intervalo de confianza:

donde

p = el porcentaje como se calcula de una muestra
n = tamaño de la muestra.

Si el intervalo de confianza, según la fórmula, es demasiado ancho, usted puede cortarlo usando una muestra más grande. De la fórmula usted puede deducir que si usted multiplica el tamaño de muestra por cuatro, el intervalo de la confianza se contraerá en la mitad. La fórmula es independiente del tamaño de la población.

Las formulas para el cálculo son exactas pero algo engorrosas de usar por las muchas alternativas que intervienen; por ese motivo no se presentan aquí. Una regla que no falla muy aproximada dice que para hacer un análisis de varianza necesitará 30 casos, para análisis de regresión 40 casos multiplicados por el número de variables, y para una prueba Chi por lo menos cinco casos en cada célula en la tabla de la distribución. En proyectos importantes con amplios recursos se suele consultar a un estadístico para calcular el tamaño de la muestra. En un proyecto de investigación con recursos limitados, la regla general es: usar una muestra tan amplia como nos podemos permitir.

Muestras no aleatorias

No hay fórmula para determinar el tamaño de una muestra no aleatoria. Con frecuencia, especialmente en investigación cualitativa, podemos simplemente ampliar gradualmente nuestra muestra y analizar los resultados según llegan. Cuando en casos nuevos ya no se presenta información nueva, podemos concluir que nuestra muestra está saturada, y terminaremos el trabajo. Este método es, sin embargo, muy vulnerable al muestreo sesgado, con lo que tenemos que ser muy cuidadosos y asegurarnos que no omitimos a ningún grupo de nuestra población.

Recuérdese también que es inútil incrementar el tamaño de la muestra si el principio de muestreo está sesgado. La muestra añadida simplemente estará igual de sesgada si usted utiliza el mismo método de selección que para la primera muestra.

Si usted puede permitirse hacer una segunda muestra, intente crearla con otro método de selección. Guarde inicialmente separado los datos de cada uno de las muestras. Comparándolas usted tiene un medio excelente de juzgar la presencia del sesgo en cualquiera de ellos.

Antes de decidir el tamaño de una muestra no aleatoria, tal vez queramos leer cómo debe ser evaluada la representatividad de los resultados a partir de una muestra no aleatoria. De otro modo podríamos sufrir una sorpresa bastante desagradable cuando estemos intentando, demasiado tarde, definir la población en que nuestros resultados puedan ser declarados válidos.

Casos que fallan

Sucede a menudo que algunos casos en la muestra resultan infructuosos porque no pueden ser alcanzados, o las medidas fallan, o los entrevistados rechazan cooperar etc. El método normal es entonces sobredimensionar la muestra levemente, y después se olvida simplemente los casos que fallan.

Si usted, no obstante, desea haga el muestreo muy cuidadosamente, usted debe preguntarse: ¿Es probable o posible que los casos que fallan diferencian los acertados en cualquier respecto que interesa en su proyecto? Solamente cuando la respuesta estará no, la ausencia de estos casos no introducirá sesgo en los resultados. Si usted, al contrario, piensa que los casos que fallan diferencian sistemáticamente del resto, usted puede intentar compensar el sesgo dando pesas diferentes a los datos que vienen inmediamente y los que vienen sólo tras solicitarlas de nuevo. El método se explica en El problema de la no-respuesta.

In English   In Finnish   Indice

3.ago.2007. Enviar los comentarios al autor:

Versión en español: con aumentos por Pentti Routio
Ubicación original: http://www2.uiah.fi/projects/metodi/