Clasificación

  1. Clasificación Exploratoria
  2. Clasificación a clases dadas
In English   In Finnish   Indice

Cuando va a ser estudiado un gran número de objetos, puede ser útil estructurar la agrupación material de los objetos en clases. La base de la agrupación es proporcionada normalmente por el punto de partida teórico, y suele ser uno de los atributos importantes de los objetos. Todos los miembros en una clase tienen este atributo nombrado, o lo tienen en mayor grado que otros objetos.
Libros
en inglés:
Libros
en español:
Otros
libros:
Número de
libros: 168
Número de
libros: 151
Número de
libros: 6
Usted podría, por ejemplo, arreglar sus libros en base de su lenguaje, como en la tabla a la derecha.

¿De dónde usted consigue una base para la clasificación?

Las clasificaciones se presentan generalmente como tablas. En lo alto de la tabla, en el encabezamiento de la tabla, se muestran los nombres de las variables, las unidades de medida y los posibles límites de las clases. Una columna es un conjunto vertical de valores de una variable. La correspondiente línea horizontal es una fila. Algunas abreviaturas usadas convencionalmente en tablas se presentan a la derecha.

Símbolos habituales en tablas
(caja vacía) = la tabla no ha sido completada
. . = no se ha obtenido la información
* = datos preliminares
- = 0.000 (exactamente cero)
0 = redondeado a cero
En el encabezamiento de la tabla usted define la base de la clasificación. En delimitar las clases, usted puede emplear escalas acostumbradas y otros lenguajes de la descripción como la descripción verbal, la forma visual, la codificación, o usted pueden inventar una nueva clasificación sus el propios.

El resto de su cuadro consiste en las células donde usted pone los especímenes o los casos que usted desea clasificar. Cada célula contiene generalmente un número que muestre cuántos especímenes o casos satisfacen las condiciones definidas en el título de la columna. El número de individuos en cada categoría es llamado frecuencia. Si se divide por el número total del conjunto de la muestra, se obtiene la frecuencia relativa. La frecuencia relativa puede indicarse como un porcentaje o una fracción. Todas estas estadísticas son variables de la  escala aritmética sin que importe el tipo de escala de las mediciones originales. De este modo se abre un camino para transformar descripciones cualitativas en variables cuantitativas que en ese momento pueden ser analizadas con todos los métodos estadísticos (si eso es lo que el investigador quiere).

Por otra parte, usted puede poner datos adicionales en las células e también dibujos de los especímenes, si no toma demasiado espacio.

La clasificación de acuerdo con solo un atributo es raras veces muy gratificante. Bien distinta es la situación cuando tenemos dos o más propiedades que nos interesan de los objetos o casos: entonces podemos construir una tabulación cruzada que es una herramienta muy efectiva si queremos revelar una asociación entre estos factores.

Qué atributo es "interesante", es algo que será definido por el problema inicial del estudio y por el modelo teórico que se usa como punto de partida. Más adelante se explican algunos principios habituales de clasificación.
  Libros en
inglés:
Libros en
español:
Otros
libros:
Total:
Libros sobre música: 100 11 4 115
Libros sobre yoga: 60 91 2 153
Otros temas: 8 49 - 57
Total: 168 151 6 325
Si usted tabuló a cruz sus libros de esta manera, según su lengua y tema, usted quizás consiga una tabla como la que está a la derecha. Observe que tablas incluyen a menudo una columna adicional para los totales de la fila y una última línea para sumas de columna.

Una tabla de dos dimensiones es perfecta para presentar una clasificación con dos criterios, pero es un poco torpe si usted necesita más de dos dimensiones. Los métodos posibles para este propósito son:

Clasificación Exploratoria

Cuando usted tiene material de muchos objetos o casos y usted quisiera arreglarlos en un orden sensato, su primera herramienta no es necesariamente clasificación, porque es difícil comenzar a clasificar el material, si usted no tiene ningún nombre para las categorías. Sin embargo, también en tal investigación exploratoria, es posible experimentar con diversas clasificaciones. Tal experimentación es fácil una vez que el material se haya cargado en una computadora. Sucede a menudo que usted encuentra útil reagrupar su material y redefinir los límites de clases muchas veces cuando su conocimiento del objeto aumenta. El número inicial de clases quizás sea, por ejemplo, iguala a la raíz cúbica del número de la población, hasta que usted encuentre una clasificación más justificada. Es práctico comenzar con un mayor número de clases que usted piensa utilizar finalmente, porque durante análisis es mucho más fácil combinar algunas clases que dividir una clase.

La meta en la clasificación es siempre igual: para revelar la estructura o la invariante sistemática, eso existe en todos los casos que usted estudia. Esta meta se alcanza completamente solamente si todos los casos cabidos en clases. Si usted tiene que agregar una categoría nombrada " otras " se parece mostrar que los criterios para su clasificación son de alguna manera deficientes. Por otra parte, toda clasificación trabaja mejor cuando los límites entre las categorías son tajantes y hay pocos casos intermedios. Podemos siempre añadir una categoría llamada "otros", pero eso complica el análisis.

Usted comenzaría normalmente por la estudio de literatura, si hay cualquiera. Si esto le deja sin la clasificación conveniente, usted puede intentar encontrar la estructura del material sí mismo. Las categorías autóctonas son nombres de grupos tradicionalmente usados, por ejemplo: americanos, Los impresionistas.

La gente tiene a veces ya nombres para varios grupos de productos, como muebles y herramientas. Los marineros, por ejemplo, habitualmente clasifican todos los barcos existentes innumerables en un número pequeño de los tipos del barco, algunos de los cuales se muestran a la derecha. Las diferencias significativas entre los tipos del yate se refieren al número de mástiles, a la posición del palo de mesana, y al número de velas de formas diferentes. Para los propósitos de la investigación, los tipos se pueden definir como contornos trazados como en la tabla, o alternativamente como explicaciones verbales, por ejemplo, "una goleta es un buque de dos mástiles con el aparejo formado por velas de cuchillo" (según es.Wikipedia, Goleta).

Más común en la investigación, sin embargo, es que el investigador tiene que definir todos los grupos que él necesita crear. Típico de la investigación exploratoria es que usted no tendrá ninguna clasificación inicialmente preparada. Usted tiene que examinar su material e intentar arreglarlo en los grupos de casos similares.
Si usted tiene la suerte, cada espécimen o caso que usted está estudiando ajustes en una y solamente una célula de su clasificación. Tal se parece ser el caso de los nudos de alfombra. Sólo hay un número limitado de nudos, y cada nudo es inequívocamente discernible de los otros, como se puede ver en la ilustración hecha por Geijer en el libro A History of Textile Art. En lo que respecta a la mayor parte de los demás productos, hay un número ilimitado de variaciones y por tanto de posibles clasificaciones o tipologías.

Mirando la mayoría de los productos, hay un número sin fin de variaciones. A menudo, solamente algunos casos son exactamente semejantes, y una vez que usted las haya colocado en las clases apropiadas la mayoría todavía se cae mientras tanto. A menudo los objetos o los casos se asemejan a una serie continua donde está único cada caso, incluso si diferencia levemente de sus vecinos. Por otra parte, a menudo hay varios atributos de los casos, que se parecen ser significativos para clasificar, no obstante nadie de éstos son de tal importancia suprema que podría ser utilizada como criterio exclusivo en clasificar. En una situación "tan borrosa" usted puede probar uno de los métodos siguientes.

Clasificaciones difusas. Si el investigador no puede definir ningún atributo único que determine la clase, puede, en lugar de ello, intentar clasificar los objetos sobre la base de una semejanza de familia. Esto significa que no hay ningún rasgo único que deba ser común a todos los miembros de una clase; en lugar de ello, hay una lista de rasgos potenciales. Cada miembro de la clase tiene la mayor parte de ellos, pero no necesariamente todos ellos.

La tipología es un método de clasificación donde cada clase es formada en torno a un  ejemplar "típico" o "puro" predefinido. Cada objeto de estudio es comparado entonces a este conjunto de ejemplares, y asignado a la clase más acorde con el ejemplar.

Hay dos alternativas en seleccionar los núcleos de una tipología:

1. Cuando usted tiene la posibilidad de empezar de un modelo o teoría anterior, usted puede utilizar por lo menos tentativamente los núcleos definidos en estos estudios anteriores. Usted después tiene que comparar cada caso en su material empírico a estos núcleos y asignarlo a la clase donde él se asemeja más a núcleo. Si hay muchos casos difíciles en su material que no caben bien en ninguna clase, usted tiene que considerar modificar uno o más núcleos.

2. En un estudio exploratorio usted tiene que seleccionar núcleos convenientes entre los especimenes que se estudian, o alternativamente usted los puede definir como una aglomeración de características típicas de la "familia". Al refinar la definición, usted puede quizás utilizar los métodos de encontrar el caso medio, descritos arriba.

Puede ser difícil hacer una tipología de artefactos grandes y detallados como edificios. Un ejemplo acertado se encuentra en el libro Suomen kirkot (Iglesias en Finlandia) por Carolus Lindberg. Él definió 38 tipos tradicionales de la iglesia usando pinturas simples y una caracterización verbal. Debajo están tres ejemplos de sus definiciones.

Clase Xxix. Iglesias de madera en la forma de una cruz griega. El espacio central es ensanchado por las extensiones ortogonales que son generalmente más bajas que el resto de la iglesia. Este tipo era popular en Finlandia del este durante el siglo 18.

Clase Xxx. Iglesias de madera en la forma de una cruz griega. Hay extensiones ortogonales en las cuatro esquinas del espacio central. El tejado mediano tienda-formado se leva más alto que las alas y se adorna con un pináculo. Estas iglesias centrales fueron construidas en Finlandia del este, a partir del último siglo 18 al siglo temprano 19.

La clase XXXI es una variación del tipo XXX, con la diferencia que un segmento vertical interrumpe el tejado tienda-formado central.

Estilo de la decoración es a menudo utilizado para clasificar arquitectura y algunos otros productos, aunque no es fácil definir y hay un gran riesgo de la interpretación subjetiva cuando lo usa. Véase el dibujo de Regole generali di architettura, por Sebastiano Serlio, 16 c.

En la antigüedad los estilos se denominaron sobre una base geográfica como típicos de las naciones o regiones dóricas, jónicas, corintias, romanas etc., pero estilos posteriores a menudo fueron nombrados después de reyes o simplemente como nombres descriptivos tales como el arte Deco.

Debilidades de tipologías. Muchas veces es imposible medir la adecuación de la concordancia con la clase; con lo que la clasificación final de los objetos resulta más bien subjetiva.

La subjetividad del método tipológico se intensifica cuando una misma persona, es decir, el investigador, es quien define los tipos-clases y coloca los objetos en ellos. Se vuelve entonces muy fácil para él el demostrar la validez de su tipología favorita. Esto es -¡ay!- bastante común en investigadores que sencillamente desprecian (como "no típicos") todos los objetos o casos que no son acordes con la clasificación prefabricada, en lugar de corregir la misma clasificación caduca. La corrección obvia, por supuesto, es que la clasificación final debiera ser hecha por otra persona neutral.

Para reducir subjetividad los núcleos se deben definir tan explícitamente como sea posible y preferiblemente en la presentación tanto verbal como visual (de modo que en el estudio de Lindberg, arriba) y también con la ayuda de medidas, si es aplicable.

El método correcto para precisar el caso medio o los casos típicos en la población, es primero definir claramente la población, entonces seleccionar una muestra apropiada de ella, clasificar todos los artículos de la muestra, y finalmente notar los tipos más frecuentes.

En el método del análisis de grupos (cluster analysis) se tiene en cuenta simultáneamente un gran número de variables. Se usa para encontrar tales grupos de casos individuales de la muestra que, de acuerdo con los valores de las variables, se asemejan entre sí en el mayor grado.
Por ejemplo, en la figura de la derecha han sido analizados 30 casos. El programa de análisis de grupos estudia, para cada caso de la muestra, su conjunto de valores para todas las variables dadas, y resuelve qué casos de la muestra tienen el conjunto de valores más similar.
En este caso particular resulta que los que se parecen más entre sí son los casos 8 y 29, y también 6 y 22 etc.
Después de que se haya encontrado la mejor manera de agrupar los casos, el siguiente estadio en el análisis es descubrir grupos cada vez más amplios, siendo el principio de agrupación que cada caso en un grupo se parece más a los demás casos de ese grupo que a los casos de fuera del mismo.
Corresponde al investigador el decidir cuántos grupos acabará al final el programa. En la figura hay tres grupos finales: A, B y C. Cada investigador tiene que tomar la decisión sobre la base de su teoría, como es habitual en todo análisis estadístico. Para tomar la decisión, debemos considerar el significado e interpretación teóricos de cada grupo.

Tabulación Cruzada. Como fue observado sobre, en estudio exploratorio es a menudo bastante difícil encontrar la base para una sola clasificación, y todavía más difícil la base para una tabulación cruzada de dos o más características. Sin embargo, con los ordenadores modernos es fácil experimentar incluso con las tabulaciones cruzadas tentativas en base de todos los atributos diferentes que usted ha registrado para los casos o los objetos. A veces uno de estos experimentos pudo divulgar asociaciones entre estas características.

Una clasificación meticulosa fue hecha por Rostislav Holthoer (1977, 56). Clasificó más de 3000 ejemplares de cerámica antigua de acuerdo con su ornamentación. Definió las clases a través de las pinturas y también verbalmente:

  1. Línea
  2. Línea ondulada
  3. Línea punteada
  4. Líneas cruzadas
  5. Fila de rectángulos
  6. Fila de triángulos

Además, Holthoer hizo otra clasificación sobre la base de las líneas que el artista de la antigüedad había dibujado sobre los motivos:

  1. Sin línea
  2. Líneas a ambos lados de los motivos
  3. Línea a lo largo del motivo
  4. Líneas a través y a ambos lados

Considerando la variación en los 3000 recipientes de Holthoer, su clasificación era admirablemente explícita y el número de ejemplares no acorde con alguna de estas clases era mínimo. En base de este cuadro exploratorio el autor, Holthoer, continuado su estudio registrando el número de especímenes en cada clase y reconociendo la región y el período de ellos. De esta manera él podría construir gradualmente una estructura teórica de todo el material.

El método más usual de descubrir una estructura en datos cruz-tabulados es buscar una asociación entre dos características de los objetos, que es indicada a menudo por una frecuencia inusualmente alta (o bajo) de los casos donde ocurre una cierta combinación de características.

Tabla nº 1 Silla A Silla B
Dolores
de espalda
10 5
No dolores 90 45
Como un ejemplo miremos la tabla (inventada) a la derecha donde se han clasificado los empleados en una oficina, en base de si habían experimentado dolores de espalda ocasionales o no. Las sillas usadas en la oficina estaban de dos tipos diferentes ("A" y "B") y el propósito del análisis era descubrir si los dolores de espalda tenían alguna relación con el tipo de asiento que la persona utilizaba.

En la tabla nº 1 el porcentaje de dolores es igual (10%) para ambas sillas, que no indica ninguna conexión entre los dolores de espalda y el tipo de asiento.

Tabla nº 2 Silla A Silla B
Dolores
de espalda
20 5
No dolores 80 45
Si, en lugar, el resultado de la tabulación había sido igual a la tabla nº 2, las diferencias en porcentajes de queja (20% y 10%) habían demostrado una asociación definida entre la frecuencia de dolores y tipo de asiento.

¿Las diferencias cómo grandes de frecuencia entonces son estadísticamente significativas? Hay los algoritmos que pueden dar una respuesta a esta pregunta, notablemente la prueba Chi que se explica en otra página.

Cuando una asociación estadística sea encontrada, el estudio se continua a menudo intentando determinar la estructura exacta de esta invariante y quizás encontrar su explicación.

Por supuesto, la correlación mera entre dos variables no prueba que existe la causalidad, porque la correlación puede ser debido a otras explicaciones posibles.. Por lo tanto usted debe complementar la tabulación con otros métodos como entrevista (si gente está implicada en la actividad que se estudiará) o experimento. Con el último método usted puede estudiar las causalidades exactamente porque usted puede excluir todos los factores no-deseables.

Los ejemplos de clasificación exploratoria, dados arriba, demuestran que las clases que finalmente se escogerán, emergerán raramente puramente de datos empíricos. Tendrán normalmente alguna justificación teórica, también, que se ha pedido prestada en alguna parte. No hay así contraste agudo entre los acercamientos de usar, o de no usar, las clases que se han definido anteriormente. Cómo utilizarlas, sea el tema del párrafo siguiente.

Clasificación a clases dadas

A menudo la blanco del estudio, es decir la pregunta que se estudia o el uso previsto de los resultados, definirá a la población que se estudiará y definirá hasta un cierto grado también las clases en las cuales la población o la muestra se deben dividir. Dos ambiciones de investigación que dan a menudo los argumentos para definir la población y su clasificación son:

  1. Si la puntería es solamente ampliar el alcance de validez de la teoría existente, será a menudo posible utilizar las clasificaciones de estudios anteriores y llenar la tabla con datos de una nueva población agrandada. Si, en lugar, su proyecto se propone añadir un nuevo aspecto a la erudición existente, este nuevo aspecto llega a ser una dimensión novedosa en su tabla, mientras que muchas otras dimensiones de la clasificación pueden seguir siendo iguales que en estudios anteriores.
  2. En investigación normativa, donde el tema surge de necesidades prácticas, éstos dictan a menudo la población y los criterios de la clasificación.

Comienzo de la fase Fase de Familia
Matrimonio, etc. Establecimiento de la familia
Nacimiento del primer hijo Crecimiento de la familia
Nacimiento del último hijo Periodo estático
El primer hijo deja el hogar Contracción de la familia
El último hijo deja el hogar Fase postparental 
El primer progenitor fallece Desintegración de la familia
El segundo progenitor fallece -
Clasificacion de gente. Al estudiar a los usuarios de productos: gente, las familias y las organizaciones, es a menudo práctica pedir prestada la clasificación de la sociología, la ciencia que estudia tradicionalmente a grupos humanos. Las definiciones bien establecidas de grupos están disponibles sobre la base de la profesión, educación, renta, atributos demográficos, etc. Las familias son muchas veces clasificadas de acuerdo con la "fase" de la familia, como en la tabla a la derecha:

En la vida diaria, las personas se caracterizan y clasifican habitualmente escogiendo un atributo conveniente de un par de contrarios, como viejo/joven o urbano/rural. Una lógica similar se ha utilizado en muchas clasificaciones de la gente científicas, también. La clasificación ha sido a veces tan exitosa que se ha adoptado aún en el lenguaje común, como ha sucedido con la clase "yuppie" (desde YUP = Young Urban Person, es decir persona urbana joven, como contraste a personas que son viejas o rurales, o ambas.).

Grupos imaginarios. Debe siempre tener presente que el poder de definir algunas clases no garantiza que esas clases existen en realidad.

Por ejemplo, al estudiar a los usuarios y compradores potenciales de productos industriales, usted quizás desee dividir a esta gente en algunos grupos en base de su gusto, a fin de que su compañía pudiera entonces diseñar un específico "estilizado" de productos para cada uno de estos grupos. Una división hipotética en cuatro "grupos del gusto" se ha bosquejado tentativamente en el esquema superior a la derecha. Cada persona está allí representada por un punto.

Probar una hipótesis acerca de grupos del gusto es bastante fácil usando un cuestionario con veinte o treinta preguntas que midan el estilo de la vida, la posesión de ropas que van a la moda, revistas de modas preferidas etc., y analizando los resultados con el análisis factorial.

Si usted prueba la hipótesis antedicha con cualquier población natural de gente, usted encontrará muy probablemente que las opiniones están distribuidas más o menos como el diagrama más bajo a la derecha, y torcería definitivamente la verdad presentar la población consistiendo de cuatro grupos.

La razón es que las opiniones, como la mayoría de las características de gente, siguen casi siempre la distribución representada en el diagrama superior a la izquierda, que los investigadores por lo tanto han comenzado a llamar "distribución normal". Las distribuciones tales como el diagrama más bajo a la izquierda son absolutamente excepcionales.

Averages of the four clustersLa credibilidad del estudio antedicho no mejoraría - al contrario - si el investigador intentó probar la existencia de sus racimos con la ayuda de los promedios de cada grupo, como se ha hecho en el tercer diagrama. Los promedios diferenciarían ciertamente, pero es un resultado de la clasificación del investigador - no diría nada de los datos empíricos sí mismo.

Tampoco mejoraría el resultado si el investigador agregó un grupo más al centro del diagrama, representando a la gente "media" con las opiniones ordinarias. Las personas medias existen, bueno, y ellos pueden ser tomados como grupo apropiado en una tipología, pero no daría ninguna razón de considerar que existen también los cuatro grupos extremos.

El ejemplo antedicho contiene una tipología de cuatro grupos, pero es evidente que el mismo razonamiento es también válido para cualquier número de grupos.

¿Hay una diferencia significativa entre las clases? Después de que usted ha definido las clases y los llenados con casos empíricos, usted quizás tiene dudas todavía, si hay tanta diferencia entre las clases que es razonable tratarlas como clases separadas. Si todos los casos comparten una o más características importantes que se ha medido en cada caso, hay métodos matemáticos para medir la diferencia entre las clases y para evaluar si esta diferencia es tan grande que es improbable que solamente casualidad hubiera causado la diferencia en las medidas. Algunos métodos usuales para esto son la prueba Chi, la prueba t de los medios de las clases, y el análisis de la variación.

Clasificación Normativa

  El producto A El producto B El producto C
Bueno 81 % 34 % 9 %
Pasable 4 % 36 % 60 %
Inútil 15 % 30 % 31 %
Generalmente, normativa es cualquier tabulación cruzada donde una de las dimensiones expresa una evaluación, como en la tabla a la derecha. Los hechos se pueden reunir, por ejemplo, con la ayuda de una encuesta entre los consumidores o con un sistema de respuesta de los clientes.

Porque toda evaluación es subjetiva es importante considerar y definir exactamente cuyo punto de vista se utiliza en la evaluación; este aspecto se discute en Subjetividad del observador y Punto de vista normativo. Las opiniones más interesantes vienen a menudo de gente que ha utilizado el producto que ahora se mejorará, a veces de la clientes futuros, no olvidándose de la gente con requisitos especiales como los ancianos, personas con deficiencia visual, etc.

In English   In Finnish   Indice

3.ago.2007. Enviar los comentarios al autor:

Versión en español: con aumentos por Pentti Routio
Ubicación original: http://www2.uiah.fi/projects/metodi/