viernes, 2 de enero de 2009

datos no-numéricos

INTRODUCCIÓN
prácticamente, casi cualquier dato puede ser incluido dentro de esta categoría
- datos de tipo social
[todos los relacionados de una forma u otra con encuestas, estudios de opinión, bases de datos de recusos humanos...]
- datos categorizados (escalas inherentes)
[de tipo sensorial (caliente, grave...), colores, escalas basadas en opiniones (mejor, preferible...)]
- datos categorizables (pueden ser incardinados dentro de escalas arbitrarias)
[lugares, razas, sexo, religión...]


TRENDINGBOT
antes de usar el programa con datos pertenecientes a este grupo, es necesario llevar a cabo una transformación a valores numéricos
reglas
* valores suficientemente bajos
[la típica escala 0-10 funciona bien en la mayor parte de los casos]
* suficientemente lógicos
[para colores de ojos 0=marrón y 10=verde no tiene sentido; marrón-verde-azul sigue la evolución lógica]
* max. y min. tienen que venir dados en los datos originales (evite extrapolaciones)
[para colores de ojos y sólo marrón y verde en los datos originales, las predicciones no deberían aplicarse al azul]