18
ÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelan

GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

Embed Size (px)

Citation preview

Page 1: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

Page 2: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

En el módulo NIPALS Algorithm

Si la respuesta es categórica

Para hacer crossvalidations; cambiamos los valores V-fold: V value: indicando el número de particiones (folds) Seed: ese número para seleccionar diferentes grupos de muestras al azar

… lo demás, mejor lo dejamos tal y como está por defecto

Page 3: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

Solapa Quick

Resultado de la crossvalidación. NS indica que esa componente (la última) ya no es significativa.La podemos quitar con el botón rectangular “Remove last”.

Para la cuantificación de cómo de “ruidosas” son las diferentes unidades muestrales (separación de los patrones de covariación definidos por el PLS)

Page 4: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

Solapa Advanced

Para interpretar el significado de las componentes elegidas atendiendo a las variables X’s e Y’s (si hay varias variables respuesta)

Para una estima de ‘outliers’ en las variables X’s e Y’s

Para estimar las posiciones de las muestras (casos) en cada componente

Para obtener las predicciones (¡ojo! escaladas partiendo de las Y’s originales a media=0 y sd=1) del modelo teniendo en cuenta las componentes seleccionadas arriba. El cuadrado de la desviación estándard de las predicciones coincide con la R2Y acumulada del modelo.

Page 5: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

GUÍA PRÁCTICA PARA REALIZAR PLS’s EN TANAGRA

Primero …Seleccionamos nuestro conjunto de datos dentro de una hoja de MS-Excel.Incluimos en la primera fila el nomber de las variables

Segundo …Vamos a la solapa de complementos dentro de una hoja de MS-Excel.Seleccionamos TANAGRA y Execute

Page 6: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

Al abrirse TANAGRA en una ventana independiente de programa …

Damos click en este icono ... y aparecerá debajo de Dataset

Simultáneamente emergerá esta ventana.

Seleccionaremos las variables predictoras en el panel izquierdo y con la flecha roja las pasamos al panel derecho INPUT.

Hacemos lo mismo para la(s) respuesta(s) que pasamos a TARGET.

click en OK.

Page 7: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

Seleccionamos el componente PLS …y dentro de éste la opción PLSR.

A continuación damos click con el botón derecho sobre PLSR 1 y seleccionamos Parameters…

Aparecerá una ventana emergente con las solapas: Parameters Output Report

Page 8: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

Seleccionamos el número de componente PLS que queremos obtener

Marcamos las tresopciones

Marcamos las cincoopciones

…y damos click en OK

Volvemos a dar click con el botón derecho del ratón

sobre PLSR 1…

y pulsamos Execute

¡¡ HECHO !!

Page 9: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

Explicación de la variable respuesta Y por las sucesivas componentes o Latent Factors Current: por esa componente Cumulative: acumulado (1, 1+2, 1+2+3, …)

Retención de información de las variables predictoras X’s por las sucesivas componentes o Latent Factors Current: por esa componente Cumulative: acumulado (1, 1+2, 1+2+3, …)

… y los RESULTADOS SON:

En Component podemos seleccionarCopy results

para copiar todos los resultados y pegarlos en MS-Excel o el programa de texto que queramos

Page 10: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

… y los RESULTADOS SON:

Con Wh tenemos los pesos

Cuyos cuadrados dentro de cada componente suman 1y nos indican su contenido informativo en esa componente afectando a la respuesta Y

Con VIP tenemos una indicación de cómo varía la importancia de cada variable en la secuencia de componentesFactor 1 … solo considera F1Factor 2 … considera el conjunto de F1 y F2Factor 3 … considera el conjunto de F1, F2 y F3…..

Page 11: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

… y los RESULTADOS SON:Volvemos a dar al icono de Define statuspara abrir otra opción de selección de datosaplicable a PLSR 1

Seleccionamos con el botón derechoParameters

… y a continuación veremos las variables continuas (C) que se refieren a las componentes Y (Utilde) o de las X’s (las t).

Luego nos vamos al componente Data visualizationy seleccionamos el módulo View dataset…que arrastramos sin soltarlo hasta colgarlo deDefine status 2

Para acabar damos doble click en View dataset

Page 12: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

… y los RESULTADOS SON:

Nos sale una ventana azul cobalto con los datos

Que podemos de nuevo copiar para pegarlos en MS-Excel o el programa de texto que queramos

Page 13: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

… y los RESULTADOS SON:

Seleccionamos otra opción de análisis dentro del componente PLS llamadaPLS Selección que arrastramos sin soltar hasta colgarla del análisis PLSR 1

Page 14: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

… y los RESULTADOS SON:

Con el botón derecho sobre PLS Selection 1 entramos en Parameters

Page 15: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

… y los RESULTADOS SON:

Seleccionamos el número de grupos (#folds) para la

crosvalidación5, 10, …

Seleccionamos la regla de parada Q2 para elegir las componentes

significativas teniendo en cuenta su robustez y reproducibilidad

Page 16: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

… y los RESULTADOS SON:

Damos doble click … y sale …

Page 17: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

… y los RESULTADOS SON:

El número de componentes significativas es …

Sólo una (la primera) esSignificativa atendiendo a la robustez del significado de las componentes construidas con las variables X’s.

Pero por si acaso …podemos quedarnos con las dos primeras y valorar como de significativas son las relaciones U1 con T1 U2 con T2

Page 18: GUÍA PRÁCTICA PARA REALIZAR PLS’s EN STATISTICA (versiones 7 en adelante)

… y los RESULTADOS SON:

Una regresión múltiple con la respuesta Y y las dos componentes X’s t1 y t2puede efectuarse con el módulo “Multiple linear regression” dentro del componente Regression.

Ambas componentes son muy significativas