Cómo: Referencia: |
El método REGRESS extrae una ecuación lineal que mejor se encaja a un conjunto de puntos de datos numéricos y utiliza esta ecuación para generar una columna nueva en la salida del informe. La ecuación se puede basar en entre una y tres variables independientes.
Este método estima valores al asumir que la variable dependiente (y, los nuevos valores calculados) y las variables independientes (x1, x2, x3) están relacionados mediante la siguiente ecuación lineal:
y = a1*x1 [+ a2*x2 [+ a3*x3]] + b
Cuando hay una variable independiente, la ecuación representa una línea recta. Esto produce los mismos valores como FORECAST utilizando el método REGRESS. Cuando hay dos variables independientes, la ecuación representa un plano y con tres variables independientes, representa un hiperplano. Debe utilizar esta técnica cuando crea que se puede aproximar a la variable dependiente mediante una combinación lineal de variables independientes.
REGRESS utiliza la técnica de mínimos cuadrados ordinarios para calcular valores para los coeficientes (a1, a2, a3, y b) que minimizan la suma de las diferencias al cuadrado entre los datos y la línea, plano o hiperplano resultante.
ON {sortfield} RECAP y[/fmt] = REGRESS(n, x1, [x2, [x3,]] z);
donde:
Es un campo en el origen de datos. No puede ser el mismo campo como cualquier parámetro para REGRESS. Cada vez que el valor del campo de clasificación cambia, se deriva una nueva ecuación de regresión lineal.
Es la nueva columna numérica calculada al aplicar la ecuación de regresión. No puede ejecutar las funciones DEFINE o COMPUTE sobre un campo con este nombre.
Es el formato de visualización para y. Si queda omitido, el formato por defecto es D12.2.
Es un número entero del 1 al 3 que indica el número de variables independientes.
Son los nombres de campo que se utilizarán como los variables independientes. Todos estos variables deben ser numéricos y deben ser independientes los unos de los otros.
Es un campo numérico existente que se asume ser aproximadamente dependiente en términos lineares en los variables independientes y se utiliza para extraer la ecuación de regresión.
La solicitud a continuación utiliza el origen de datos GGSALES para calcular una columna DOLLARS estimada. Los campos BUDUNITS, UNITS y BUDDOLLARS son los variables independientes. El campo DOLLARS proporciona los valores actuales a estimarse:
DEFINE FILE GGSALES YEAR/Y = DATE; MONTH/M = DATE; PERIOD/I2 = MONTH; END
TABLE FILE GGSALES PRINT BUDUNITS UNITS BUDDOLLARS DOLLARS BY PERIOD ON PERIOD RECAP EST_DOLLARS/F8 = REGRESS(3, BUDUNITS, UNITS, BUDDOLLARS, DOLLARS); WHERE CATEGORY EQ 'Coffee' WHERE REGION EQ 'West' WHERE UNITS GT 1600 AND UNITS LT 1700 END
La salida es:
WebFOCUS |