[- métodos predictivos]
b-3) REGRESIÓN PLSNOTA: wikipedia.com no recoge ningún artículo en español (al contrario de lo q sucede en la versión inglesa) que trate sobre la regresión PLS - este hecho, unido a la ausencia de alternativas aceptables, ha desaconsejado la inclusión de una definición introductoria
este método está recomendado para casos donde las regresiones estándar muestran un comportamiento inestable [por ejemplo: más predictores que mediciones o multicolinealidad entre los predictores]
desventajas
* soluciones parciales - resultados basados en variables matemáticas [variables latentes], en vez de ser directamente aplicables [ecuaciones]
* sin capacidades predictivas - resultados cualitativos [predictor que más influye sobre las mediciones, dependencia entre predictores...], en vez de cuantitativos [ecuaciones]
en cuanto el número de variables independientes aumenta más allá de cierto límite [las limitaciones dimensionales de los métodos regresivos convencionales serán tratados en futuras entradas - 3D (2 independientes vs. 1 independiente) podría tomarse como una buena estimación], los métodos regresivos estándar no son suficientemente fiables y la estadística tradicional ha preferido considerar estimaciones aproximativas, antes que plantearse una forma diferente de afrontar el problema
ejemplo sencillo
40 valores para 5 variables independientes [X_a, X_b, X_c, X_d, X_e], que afectan a una dependiente [Y_1] (y, eventualmente, a dos más)
1. regresión PLS [modelaje vía PLS]
- X_c es la variable que más influye sobre Y_1
- todas las variables, excepto X_a y X_e, se correlacionan de manera positiva con Y_1
- a partir de Y_1, Y_2 e Y_3, que cualquier fluctuación en X_b es compensada por la suma de X_a y X_c (¿tiene algún interés tal evolución (entre diferentes fenómenos (Y))?)
2. trendingBot
Y_1 = X_a^0.42+5.21*X_c-X_e - error esp. = 5%desventajas
* soluciones parciales - resultados basados en variables matemáticas [variables latentes], en vez de ser directamente aplicables [ecuaciones]
* sin capacidades predictivas - resultados cualitativos [predictor que más influye sobre las mediciones, dependencia entre predictores...], en vez de cuantitativos [ecuaciones]
interpretación de trendingBot
en cuanto el número de variables independientes aumenta más allá de cierto límite [las limitaciones dimensionales de los métodos regresivos convencionales serán tratados en futuras entradas - 3D (2 independientes vs. 1 independiente) podría tomarse como una buena estimación], los métodos regresivos estándar no son suficientemente fiables y la estadística tradicional ha preferido considerar estimaciones aproximativas, antes que plantearse una forma diferente de afrontar el problema
ejemplo sencillo
40 valores para 5 variables independientes [X_a, X_b, X_c, X_d, X_e], que afectan a una dependiente [Y_1] (y, eventualmente, a dos más)
1. regresión PLS [modelaje vía PLS]
- X_c es la variable que más influye sobre Y_1
- todas las variables, excepto X_a y X_e, se correlacionan de manera positiva con Y_1
- a partir de Y_1, Y_2 e Y_3, que cualquier fluctuación en X_b es compensada por la suma de X_a y X_c (¿tiene algún interés tal evolución (entre diferentes fenómenos (Y))?)
2. trendingBot
NOTA: mejores tendencias = las que muestran menor error tras ser aplicadas a los datos originales
Y_2 = X_c^-1.3*X_c-X_a - error esp. = 3.6%
Y_3 = X_c-X_e/2 - error esp. = 8.1%