sábado, 24 de enero de 2009

estadística trad [b-]

[- métodos predictivos]
b-3) REGRESIÓN PLS
NOTA: wikipedia.com no recoge ningún artículo en español (al contrario de lo q sucede en la versión inglesa) que trate sobre la regresión PLS - este hecho, unido a la ausencia de alternativas aceptables, ha desaconsejado la inclusión de una definición introductoria
este método está recomendado para casos donde las regresiones estándar muestran un comportamiento inestable [por ejemplo: más predictores que mediciones o multicolinealidad entre los predictores]

desventajas
* soluciones parciales - resultados basados en variables matemáticas [variables latentes], en vez de ser directamente aplicables [ecuaciones]
* sin capacidades predictivas - resultados cualitativos [predictor que más influye sobre las mediciones, dependencia entre predictores...], en vez de cuantitativos [ecuaciones]


interpretación de trendingBot

en cuanto el número de variables independientes aumenta más allá de cierto límite [las limitaciones dimensionales de los métodos regresivos convencionales serán tratados en futuras entradas - 3D (2 independientes vs. 1 independiente) podría tomarse como una buena estimación], los métodos regresivos estándar no son suficientemente fiables y la estadística tradicional ha preferido considerar estimaciones aproximativas, antes que plantearse una forma diferente de afrontar el problema

ejemplo sencillo
40 valores para 5 variables independientes [X_a, X_b, X_c, X_d, X_e], que afectan a una dependiente [Y_1] (y, eventualmente, a dos más)

1. regresión PLS [modelaje vía PLS]
- X_c es la variable que más influye sobre Y_1
- todas las variables, excepto X_a y X_e, se correlacionan de manera positiva con Y_1
- a partir de Y_1, Y_2 e Y_3, que cualquier fluctuación en X_b es compensada por la suma de X_a y X_c (¿tiene algún interés tal evolución (entre diferentes fenómenos (Y))?)

2. trendingBot
NOTA: mejores tendencias = las que muestran menor error tras ser aplicadas a los datos originales
Y_1 = X_a^0.42+5.21*X_c-X_e - error esp. = 5%
Y_2 = X_c^-1.3*X_c-X_a - error esp. = 3.6%
Y_3 = X_c-X_e/2 - error esp. = 8.1%