Wednesday, November 2, 2016

Exponencial Algoritmo Adaptativo De Media Móvil

Adaptativo de media móvil adaptativa de media móvil (AMA) Indicador técnica se utiliza para la construcción de una media móvil con baja sensibilidad al precio de los ruidos de la serie y se caracteriza por el retraso mínimo para la detección de tendencias. Este indicador fue desarrollado y descrito por Perry Kaufman en su libro quotSmarter Tradingquot. Uno de los inconvenientes de los diferentes algoritmos de suavizado para las series de precios es que los saltos de precios accidentales pueden dar lugar a la aparición de señales falsas de tendencia. Por otro lado, el suavizado conduce al retraso inevitable de una señal de parada de tendencia o cambio. Este indicador fue desarrollado para la eliminación de estos dos inconvenientes. Puede probar las señales de comercio de este indicador mediante la creación de un Asesor Experto en MQL5 Wizard. Cálculo para definir el estado actual del mercado Kaufman introdujo el concepto de Índice de Eficiencia (ER), que se calcula mediante la siguiente fórmula: ER (i) el valor actual de la señal ABS Índice de Eficiencia (i) (Precio (i) - Precio (i - N)) el valor actual de la señal, el valor absoluto de la diferencia entre el precio actual y el periodo N precio de hace ruido (i) suma (ABS (Precio (i) - Precio (i-1)), N) valor actual del ruido, suma de los valores absolutos de la diferencia entre el precio del período actual y el precio del período anterior para N períodos. En una fuerte tendencia del Índice de Eficiencia (ER) tenderá a 1 si no hay un movimiento dirigido, que será un poco más que 0. El valor obtenido de ER se utiliza en la fórmula de suavizado exponencial: EMA (i) Precio (i ) SC EMA (i-1) (1 - SC) SC 2 / (n1) EMA constante de alisamiento, n período de la EMA móvil exponencial (i-1) valor anterior de EMA. La relación de suavizado para el mercado de rápido debe ser como para EMA con un período de 2 (SC rápido 2 / (21) 0,6667), y durante el período de no período tendencia EMA debe ser igual a 30 (lento SC 2 / (301) 0.06452) . Así, el nuevo cambio constante de alisamiento se introduce (escalado constante de alisamiento) SSC: SSC (i) (ER (i) (rápido SC - lenta SC) SSC lentos SC (i) ER (i) 0.60215 0.06425 Para una influencia más eficiente de la obtenido constante de alisamiento en el período de promedio Kaufman recomienda elevarlo al cuadrado fórmula de cálculo final:. AMA (i) Precio (i) (SSC (i) 2) AMA (i-1) (1-SSC (i) 2) o (después de reordenamiento ): AMA (i) AMA (i-1) (SSC (i) 2) (Precio (i) - AMA (i-1)) AMA (i) el valor actual de la AMA AMA (i1) valor anterior de AMA SSC ( i) el valor actual del suavizado reducido constant. Fractal adaptativo de media móvil adaptativa del fractal en movimiento indicador técnica media (FRAMA) fue desarrollado por John Ehlers. Este indicador se construye basado en el algoritmo de la media móvil exponencial. en la que se calcula el factor de alisamiento sobre la base de la dimensión fractal actual de la serie de precios. la ventaja de FRAMA es la posibilidad de seguir los movimientos fuertes tendencias y para reducir la velocidad lo suficientemente abajo en los momentos de consolidación de precios. Todos los tipos de análisis utilizados para las medias móviles se pueden aplicar a este indicador. Puede probar las señales de comercio de este indicador mediante la creación de un Asesor Experto en MQL5 Wizard. FRAMA cálculo (i) A (i) Precio (i) (1 - A (i)) FRAMA (i-1) FRAMA (i) el valor actual de FRAMA Precio (i) FRAMA precio actual (i-1) valor anterior de FRAMA A (i) factor de corriente de suavizado exponencial. factor de suavizado exponencial se calcula según la fórmula siguiente: A (i) EXP (-4.6 (D (i) - 1)) D (i) actual EXP dimensión fractal () función matemática del exponente. dimensión fractal de una línea recta es igual a uno. Se ve a partir de la fórmula que si D 1, entonces A EXP (-4,6 (1-1)) EXP (0) 1. Así, si los cambios de precios en líneas rectas, de suavizado exponencial no se utiliza, ya que en tal caso la fórmula Se ve como esto. FRAMA (i) 1 Precio (i) (1 1) FRAMA (i1) Precio (i), es decir el indicador sigue exactamente el precio. La dimensión fractal de un avión es igual a dos. De la fórmula obtenemos que si D 2, entonces el factor de alisado A EXP (-4,6 (2-1)) EXP (-4,6) 0,01. Tal un pequeño valor del factor de suavizado exponencial se obtiene en momentos en que el precio hace un fuerte movimiento de dientes de sierra. Tal una fuerte desaceleración corresponde a aproximadamente el 200 período de media móvil simple. Fórmula de la dimensión fractal: D (LOG (N1 N2) - log (N3)) / LOG (2) Se calcula en base a la fórmula adicional: N (longitud, i) (HighestPrice (i) - LowestPrice (i)) / longitud HighestPrice (i) el valor máximo de corriente por períodos de longitud LowestPrice (i) el valor mínimo de corriente en ejercicios de cuerpo entero Valores N1, N2 y N3 son respectivamente iguales a: N2 (i) N (longitud, i longitud) N3 (i) N (2 longitud, i) Kaufman039s adaptativo de media móvil (KAMA) Kaufman039s adaptativo de media móvil (KAMA) Introducción Desarrollado por Perry Kaufman, Kaufman039s adaptativo de media móvil (KAMA) es una media móvil diseñado para tener en cuenta el ruido del mercado o de la volatilidad. KAMA lo siguen de cerca los precios cuando las oscilaciones de los precios son relativamente pequeñas y el ruido es bajo. KAMA se ajustará cuando las oscilaciones de los precios se ensanchan y seguir los precios desde una distancia mayor. Este indicador de seguimiento de tendencia se puede utilizar para identificar la tendencia general, los puntos de inflexión de tiempo y movimientos de los precios del filtro. Cálculo Hay varios pasos que se requieren para el cálculo de la media móvil adaptativa Kaufman039s. Let039s primera a empezar con la configuración recomendada por Perry Kaufman, que son KAMA (10,2,30). 10 es el número de periodos para el Índice de Eficiencia (ER). 2 es el número de periodos para la constante de más rápido EMA. 30 es el número de periodos para la constante EMA más lento. Antes de calcular la KAMA, tenemos que calcular el Índice de Eficiencia (ER) y la constante de alisamiento (SC). El desglose de la fórmula en pepitas de tamaño de bocado hace que sea más fácil de entender la metodología detrás del indicador. Tenga en cuenta que el ABS es sinónimo de valor absoluto. Índice de Eficiencia (ER) La ER es básicamente el cambio de precio ajustado por la volatilidad diaria. En términos estadísticos, el ratio de eficiencia nos dice la eficiencia fractal de los cambios de precios. ER fluctúa entre 1 y 0, pero estos extremos son la excepción, no la norma. ER sería de 1 si los precios se movieron hasta 10 períodos consecutivos o plumón 10 períodos consecutivos. ER sería cero si el precio es sin cambios durante los 10 periodos. Constante de alisamiento (SC) La constante de alisamiento utiliza la sala de emergencia y dos constantes de suavizado basado en un promedio móvil exponencial. Como se habrán dado cuenta, la constante de alisamiento es el uso de las constantes de suavizado para un promedio móvil exponencial en su fórmula. (2/301) es la constante de alisamiento para una EMA de 30 periodos. El SC más rápida es la constante de suavizado para más corto (EMA-2 períodos). El SC más lenta es la constante de alisamiento para la EMA más lento (30 períodos). Tenga en cuenta que el 2 al final es elevar al cuadrado la ecuación. KAMA el índice de eficiencia (ER) y la constante de alisamiento (SC), que ahora está listo para calcular Kaufman039s adaptativo de media móvil (KAMA). Puesto que necesitamos un valor inicial para iniciar el cálculo, la primera KAMA es sólo una media móvil simple. Los siguientes cálculos se basan en la siguiente fórmula. Ejemplo de cálculo / Gráfico Las siguientes imágenes muestran una captura de pantalla de una hoja de cálculo de Excel se utiliza para calcular la KAMA y la correspondiente tabla de QQQ. Señales de uso y cartistas pueden utilizar KAMA como cualquier otro indicador de seguimiento de tendencia, como una media móvil. Chartistas pueden buscar cruces de precios, cambios de dirección y señales filtradas. En primer lugar, una cruz encima o por debajo KAMA indica los cambios de dirección de los precios. Al igual que con cualquier media móvil, un sistema de cruce sencilla generará una gran cantidad de señales y un montón de señales falsas. Cartistas señales falsas pueden reducir mediante la aplicación de un precio o un filtro de tiempo para los cruces. Uno podría requerir precio para sostener la cruz por número determinado de días o requerir la cruz del KAMA superan por porcentaje establecido. En segundo lugar, los chartistas puede utilizar la dirección de la KAMA para definir la tendencia general de la seguridad. Esto puede requerir un ajuste de parámetros para suavizar el indicador aún más. Chartistas pueden cambiar el parámetro media, que es la constante de EMA más rápido, para suavizar la KAMA y buscar cambios de dirección. La tendencia es hacia abajo, siempre y cuando KAMA está cayendo y el establecimiento de mínimos más bajos. La tendencia es alcista, siempre y cuando KAMA va en aumento y el establecimiento de máximos más altos. El ejemplo siguiente muestra Kroger KAMA (10,5,30) con una tendencia alcista pronunciada de diciembre a marzo y una tendencia alcista menos pronunciada desde mayo hasta agosto. Y, por último, los chartistas pueden combinar señales y técnicas. Chartistas pueden utilizar una KAMA a más largo plazo para definir la tendencia más grande y un KAMA corto plazo para las señales de comercio. Por ejemplo, KAMA (10,5,30) podría ser utilizado como un filtro de tendencia y se considerará alcista al levantarse. Una vez alcista, chartistas podrían entonces buscar cruces alcista cuando el precio se mueve por encima de la KAMA (10,2,30). El siguiente ejemplo muestra MMM con un aumento a largo plazo KAMA y cruces alcista en diciembre, enero y febrero. A largo plazo KAMA rechazó en abril y había cruces bajistas en mayo, junio y julio. SharpCharts KAMA se puede encontrar como una superposición indicador en el banco de trabajo SharpCharts. Los ajustes predeterminados aparecerán automáticamente en el cuadro de parámetros, una vez que se ha seleccionado y chartistas pueden cambiar estos parámetros para adaptarse a sus necesidades analíticas. El primer parámetro es el Índice de Eficiencia y chartistas debe abstenerse de aumentar este número. En cambio, los chartistas pueden disminuirlo para aumentar la sensibilidad. Chartistas buscan suavizar KAMA para el análisis de tendencias a más largo plazo pueden aumentar el parámetro medio de forma incremental. A pesar de que la diferencia es de sólo 3, KAMA (10,5,30) es significativamente más suave que la KAMA (10,2,30). Para Estudiar Del creador, el libro más adelante ofrece información detallada sobre los indicadores, programas, algoritmos y sistemas, incluyendo detalles sobre la KAMA y otros sistemas de media móvil. Sistemas de Trading y Métodos modelos de suavizado exponencial media y Perry KaufmanMoving Como un primer paso para ir más allá de los modelos de medias, modelos de paseo aleatorio, y los modelos de tendencia lineal, los patrones y las tendencias no estacionales pueden ser extrapolados utilizando un modelo de media móvil o alisado. El supuesto básico detrás de promediado y modelos de suavizado es que la serie de tiempo es estacionaria localmente con una media de variación lenta. Por lo tanto, tomamos una media móvil (local) para estimar el valor actual de la media y luego usar eso como el pronóstico para el futuro próximo. Esto puede ser considerado como un compromiso entre el modelo de la media y la deriva en el modelo del paseo aleatorio, sin. La misma estrategia se puede utilizar para estimar y extrapolar una tendencia local. Un promedio móvil a menudo se llama una versión quotsmoothedquot de la serie original porque los promedios de corto plazo tiene el efecto de suavizar los baches en la serie original. Al ajustar el grado de suavizado (el ancho de la media móvil), que podemos esperar para golpear algún tipo de equilibrio óptimo entre el rendimiento de los modelos de medias y caminar al azar. El tipo más simple de promedio de modelos es el. Sencilla (igualmente ponderados) Media Móvil: El pronóstico para el valor de Y en el tiempo t1 que se hace en el tiempo t es igual a la media aritmética de las observaciones más recientes M: (Aquí y en otros lugares que va a utilizar el símbolo 8220Y-hat8221 reposar para obtener la previsión de las series temporales Y hecha en la fecha previa temprano posible de un modelo dado.) Este promedio se centra en el periodo t (m1) / 2, lo que implica que la estimación de la media local tenderá a la zaga del verdadero valor de la media local por cerca de (m1) / 2 períodos. Por lo tanto, decimos que la edad promedio de los datos de la media móvil simple (m1) / 2 con respecto al período para el que se calcula el pronóstico: esta es la cantidad de tiempo en que las previsiones tienden a la zaga de los puntos de inflexión en el datos. Por ejemplo, si son un promedio de los últimos 5 valores, las previsiones será de unos 3 periodos tarde en la respuesta a los puntos de inflexión. Tenga en cuenta que si m1, el modelo de media móvil simple (SMA) es equivalente al modelo de paseo aleatorio (sin crecimiento). Si m es muy grande (comparable a la longitud del período de estimación), el modelo de SMA es equivalente al modelo de la media. Como con cualquier parámetro de un modelo de predicción, es costumbre para ajustar el valor de k con el fin de obtener el mejor quotfitquot a los datos, es decir, los errores de pronóstico más pequeños en promedio. Aquí está un ejemplo de una serie que parece mostrar fluctuaciones aleatorias alrededor de una media que varía lentamente. En primer lugar, permite tratar de encajar con un modelo de paseo aleatorio, lo que equivale a una media móvil simple de 1 plazo: El modelo de paseo aleatorio responde muy rápidamente a los cambios en la serie, pero al hacerlo se recoge gran parte de la quotnoisequot en el datos (las fluctuaciones aleatorias), así como la quotsignalquot (la media local). Si en lugar de probar una media móvil simple de 5 términos, obtenemos una puesta a punto más suave en busca de los pronósticos: El 5 plazo promedio móvil simple rendimientos significativamente más pequeños que los errores del modelo de paseo aleatorio en este caso. La edad promedio de los datos de esta previsión es de 3 ((51) / 2), de modo que tiende a la zaga de los puntos de inflexión en aproximadamente tres períodos. (Por ejemplo, una recesión parece haber ocurrido en el período de 21 años, pero las previsiones no dar la vuelta hasta varios períodos más tarde.) Tenga en cuenta que las previsiones a largo plazo del modelo de SMA son una línea recta horizontal, al igual que en el paseo aleatorio modelo. Por lo tanto, el modelo de SMA asume que no hay una tendencia en los datos. Sin embargo, mientras que las previsiones del modelo de paseo aleatorio son simplemente igual al último valor observado, las predicciones del modelo de SMA son iguales a una media ponderada de los valores recientes. Los límites de confianza calculados por Statgraphics para las previsiones a largo plazo de la media móvil simple no se ensanchan a medida que aumenta la previsión horizonte. Esto obviamente no es correcta Desafortunadamente, no existe una teoría estadística subyacente que nos dice cómo los intervalos de confianza debe ampliar para este modelo. Sin embargo, no es demasiado difícil de calcular estimaciones empíricas de los límites de confianza para los pronósticos a más largo horizonte. Por ejemplo, podría configurar una hoja de cálculo en la que el modelo de SMA sería utilizado para pronosticar 2 pasos por delante, 3 pasos por delante, etc., dentro de la muestra de datos históricos. A continuación, podría calcular las desviaciones estándar de la muestra de los errores en cada horizonte de pronóstico, y luego construir intervalos de confianza para los pronósticos a más largo plazo sumando y restando múltiplos de la desviación estándar correspondiente. Si tratamos una media móvil simple de 9 plazo, obtenemos previsiones aún más suaves y más de un efecto rezagado: La edad media es ahora de 5 puntos ((91) / 2). Si tomamos una media móvil de 19 plazo, el promedio de edad aumenta a 10: Tenga en cuenta que, de hecho, las previsiones están quedando atrás los puntos de inflexión en alrededor de 10 periodos. ¿Qué cantidad de suavizado que es mejor para esta serie Aquí se presenta una tabla que compara sus estadísticas de errores, incluyendo también una 3-plazo promedio: Modelo C, la media móvil de 5 plazo, se obtiene el valor más bajo de RMSE por un pequeño margen sobre el 3 - term y 9 plazo promedios, y sus otras estadísticas son casi idénticos. Así, entre los modelos con las estadísticas de errores muy similares, podemos elegir si preferimos un poco más la capacidad de respuesta o un poco más de suavidad en los pronósticos. (Volver al comienzo de la página.) Browns suavizado exponencial simple (promedio móvil ponderado exponencialmente) El modelo de media móvil simple descrito anteriormente tiene la propiedad indeseable que trata los últimos k observaciones por igual y completamente ignora todas las observaciones precedentes. Intuitivamente, los datos del pasado deben ser descontados de forma más gradual - por ejemplo, la observación más reciente debería ser un poco más de peso que 2 más reciente, y el segundo más reciente debería ser un poco más peso que la 3 más reciente, y pronto. El modelo de suavizamiento exponencial simple (SES) logra esto. Vamos a 945 denotan un constantquot quotsmoothing (un número entre 0 y 1). Una forma de escribir el modelo es definir una serie L que representa el nivel actual (es decir, valor medio local) de la serie como se estima a partir de datos hasta el presente. El valor de L en el tiempo t se calcula de forma recursiva a partir de su propio valor anterior así: Por lo tanto, el valor suavizado actual es una interpolación entre el valor suavizado anterior y la observación actual, donde los 945 controles de la proximidad entre el valor interpolado a la más reciente observación. La previsión para el próximo período es simplemente el valor suavizado actual: De manera equivalente, podemos expresar el pronóstico siguiente directamente en función de las previsiones anteriores y observaciones anteriores, en cualquiera de las siguientes versiones equivalentes. En la primera versión, la previsión es una interpolación entre pronóstico anterior y observación anterior: En la segunda versión, el siguiente pronóstico se obtiene mediante el ajuste de la previsión anterior en la dirección del error anterior por una cantidad fraccionaria 945. está el error cometido en el tiempo t. En la tercera versión, el pronóstico es un ponderado exponencialmente (es decir, descontado) de media móvil con el factor de descuento 1- 945: La versión de interpolación de la fórmula de predicción es el más simple de usar si está implementando el modelo en una hoja de cálculo: se ajusta en una sola célula y contiene referencias a celdas que apuntan a la previsión anterior, la observación anterior, y la célula donde se almacena el valor de 945. Tenga en cuenta que si 945 1, el modelo SES es equivalente a un modelo de paseo aleatorio (sin crecimiento). Si 945 0, el modelo SES es equivalente al modelo de la media, suponiendo que el primer valor de suavizado se establece igual a la media. (Volver al comienzo de la página.) La edad promedio de los datos en el pronóstico a simple alisado exponencial es 1/945 con respecto al período para el que se calcula el pronóstico. (Esto no se supone que es obvio, pero se puede demostrar fácilmente mediante la evaluación de una serie infinita.) Por lo tanto, el simple previsión de media móvil tiende a la zaga de los puntos de inflexión en alrededor de 1/945 períodos. Por ejemplo, cuando 945 0.5 el retraso es de 2 945 periodos en los que el retraso es 0,2 5 0,1 945 periodos en los que el retraso es de 10 períodos, y así sucesivamente. Para una edad media determinada (es decir, cantidad de lag), el suavizamiento exponencial simple (SES) Pronóstico es algo superior a la previsión media móvil simple (SMA) porque pone relativamente más peso en la más reciente --i. e observación. es ligeramente más quotresponsivequot a los cambios que ocurren en el pasado reciente. Por ejemplo, un modelo de SMA con 9 términos y un modelo de SES con 945 0.2 ambos tienen una edad promedio de 5 para los datos en sus previsiones, pero el modelo SES pone más peso en los últimos 3 valores que lo hace el modelo de SMA y en el mismo tiempo doesn8217t totalmente 8220forget8221 sobre los valores de más de 9 períodos de edad, como se muestra en esta tabla: Otra ventaja importante del modelo SES sobre el modelo SMA es que el modelo SES utiliza un parámetro de suavizado que es continuamente variable, por lo que puede fácilmente optimizada mediante el uso de un algoritmo de quotsolverquot para minimizar el error cuadrático medio. El valor óptimo de 945 en el modelo SES para esta serie resulta ser 0.2961, como se muestra aquí: La edad promedio de los datos de esta previsión es de 1 / 0,2961 3,4 periodos, que es similar a la de un móvil simple 6 plazo promedio. Las previsiones a largo plazo del modelo de SES son una línea recta horizontal. como en el modelo de SMA y el modelo de paseo aleatorio sin crecimiento. Sin embargo, tenga en cuenta que los intervalos de confianza calculados por Statgraphics ahora divergen de un modo de aspecto razonable, y que son sustancialmente más estrecha que los intervalos de confianza para el modelo de paseo aleatorio. El modelo SES asume que la serie es un poco predictablequot quotmore que lo hace el modelo de paseo aleatorio. Un modelo SES es en realidad un caso especial de un modelo ARIMA. por lo que la teoría estadística de los modelos ARIMA proporciona una buena base para el cálculo de los intervalos de confianza para el modelo SES. En particular, un modelo SES es un modelo ARIMA con una diferencia no estacional, un MA (1) plazo, y sin término constante. también conocido como un modelo quotARIMA (0,1,1) sin constantquot. El MA (1) coeficiente en el modelo ARIMA corresponde a la cantidad 1- 945 en el modelo de SES. Por ejemplo, si encaja en un modelo ARIMA (0,1,1) sin el temor constante a la serie analizada aquí, el MA estimado (1) coeficiente resulta ser 0.7029, que es casi exactamente uno menos 0,2961. Es posible añadir el supuesto de un no-cero tendencia constante lineal a un modelo de SES. Para ello, sólo tiene que especificar un modelo ARIMA con una diferencia no estacional y un (1) término MA con una constante, es decir, un modelo ARIMA (0,1,1) con constante. Las previsiones a largo plazo tendrán entonces una tendencia que es igual a la tendencia promedio observado durante todo el período de estimación. No se puede hacer esto en conjunto con ajuste estacional, ya que las opciones de ajuste estacional se desactivan cuando el tipo de modelo se establece en ARIMA. Sin embargo, se puede añadir una tendencia exponencial constante a largo plazo a un simple modelo de suavizado exponencial (con o sin ajuste estacional) mediante el uso de la opción de ajuste de la inflación en el procedimiento de pronóstico. La tasa de quotinflationquot apropiado (porcentaje de crecimiento) por período se puede calcular como el coeficiente de la pendiente en un modelo de tendencia lineal ajustada a los datos en conjunción con una transformación logaritmo natural, o puede basarse en otra información, independiente sobre las perspectivas de crecimiento a largo plazo . (Volver a la parte superior de la página.) Browns lineales (es decir, dobles) modelos de suavizado exponencial de la media móvil y modelos SES asumen que no hay una tendencia de cualquier tipo en los datos (que es por lo general OK o al menos no muy malo para 1- previsiones paso por delante cuando los datos son relativamente ruidoso), y que pueden ser modificados para incorporar una tendencia lineal constante como se muestra arriba. ¿Qué hay de tendencias a corto plazo Si una serie muestra una tasa variable de crecimiento o un patrón cíclico que se destaca claramente contra el ruido, y si hay una necesidad de pronosticar más de 1 periodo por delante, a continuación, la estimación de una tendencia local también puede ser un problema. El modelo simple de suavizado exponencial se puede generalizar para obtener un modelo lineal de suavizado exponencial (LES) que calcula las estimaciones locales de tanto nivel y la tendencia. El modelo de tendencia variable en el tiempo más simple es Browns lineales exponencial modelo de suavizado, que utiliza dos series diferentes alisado que se centran en diferentes puntos en el tiempo. La fórmula de predicción se basa en una extrapolación de una línea a través de los dos centros. (Una versión más sofisticada de este modelo, Holt8217s, se discute a continuación.) La forma algebraica de Brown8217s lineal modelo de suavizado exponencial, al igual que la del modelo simple de suavizado exponencial, se puede expresar en un número de formas diferentes pero equivalentes. La forma quotstandardquot de este modelo se suele expresar como sigue: Sea S la serie suavizada por enlaces sencillos, obtenido mediante la aplicación de suavizado exponencial simple de la serie Y. Es decir, el valor de S en el período t viene dada por: (Hay que recordar que, en virtud de simples suavizado exponencial, esto sería el pronóstico para Y en el periodo t1), entonces Squot denotan la serie suavizada doblemente obtenido mediante la aplicación de suavizado exponencial simple (utilizando la misma 945) de la serie S:. por último, el pronóstico para tk Y. para cualquier kgt1, viene dada por: Esto produce e 1 0 (es decir, engañar un poco, y dejar que el primer pronóstico es igual a la primera observación real), y e 2 Y2 Y1 8211. después de lo cual las previsiones se generan utilizando la ecuación anterior. Esto produce los mismos valores ajustados según la fórmula basada en S y S si éstas se puso en marcha el uso de S 1 S 1 Y 1. Esta versión del modelo se utiliza en la siguiente página que ilustra una combinación de suavizado exponencial con ajuste estacional. modelo Holt8217s lineal de suavizado exponencial Brown8217s LES calcula estimaciones locales de nivel y la tendencia al suavizar los datos recientes, pero el hecho de que lo hace con un único parámetro de suavizado un factor limitante para los patrones de datos que es capaz de encajar: el nivel y la tendencia no se les permite variar a frecuencias independientes. modelo Holt8217s LES resuelve este problema mediante la inclusión de dos constantes de suavizado, una para el nivel y uno para la tendencia. En cualquier momento t, como en el modelo Brown8217s, el no es una estimación L t del nivel local y una estimación T t de la tendencia local. Aquí se computan de forma recursiva a partir del valor de Y observó en el tiempo t, y las estimaciones anteriores del nivel y la tendencia por dos ecuaciones que se aplican suavizado exponencial a ellos por separado. Si el nivel estimado y la tendencia en el tiempo t-1 son L y T t82091 t-1. respectivamente, entonces el pronóstico para Y tshy que se habrían hecho en el momento t-1 es igual a L-1 t t t-1. Cuando se observa el valor real, la estimación actualizada del nivel se calcula de forma recursiva mediante la interpolación entre Y tshy y su pronóstico, L-1 t t t-1, usando pesos de 945 y 945. 1- El cambio en el nivel estimado, es decir, L t L 8209 t82091. puede interpretarse como una medición de ruido de la tendencia en el tiempo t. La estimación actualizada de la tendencia se calcula entonces de forma recursiva mediante la interpolación entre L T 8209 L t82091 y la estimación anterior de la tendencia, T t-1. usando pesos de 946 y 1-946: La interpretación de la tendencia constante de alisamiento 946 es análoga a la de los de nivel constante de alisamiento 945. Los modelos con valores pequeños de 946 asume que la tendencia cambia sólo muy lentamente con el tiempo, mientras que los modelos con 946 más grande asumen que está cambiando más rápidamente. Un modelo con un gran 946 cree que el futuro lejano es muy incierto, ya que los errores en la estimación de la tendencia-llegar a ser bastante importante cuando la previsión de más de un período que se avecina. (Volver al principio de la página.) El suavizado constantes de 945 y 946 se puede estimar de la forma habitual mediante la minimización del error cuadrático medio de las previsiones 1-paso-a continuación. Cuando esto se haga en Statgraphics, las estimaciones resultan ser 945 0,3048 y 946 0.008. El valor muy pequeño de 946 significa que el modelo supone muy poco cambio en la tendencia de un período a otro, por lo que, básicamente, este modelo está tratando de estimar una tendencia a largo plazo. Por analogía con la noción de que la edad promedio de los datos que se utiliza para estimar el nivel local de la serie, la edad media de los datos que se utiliza para estimar la tendencia local es proporcional a 1/946, aunque no exactamente igual a eso. En este caso que resulta ser 1 / 0.006 125. Esta isn8217t un número muy preciso ya que la precisión de la estimación de 946 isn8217t realmente 3 cifras decimales, pero es del mismo orden general de magnitud que el tamaño de muestra de 100 , por lo que este modelo tiene un promedio de más de un buen montón de historia para estimar la tendencia. La trama de previsión a continuación muestra que el modelo de LES estima una tendencia local de un poco más grande en el extremo de la serie de la tendencia constante estimado en el modelo SEStrend. Además, el valor estimado de 945 es casi idéntica a la obtenida ajustando el modelo SES con o sin tendencia, por lo que este es casi el mismo modelo. Ahora, hacen éstos se parecen a las previsiones razonables para un modelo que se supone que es la estimación de la tendencia local Si 8220eyeball8221 esta trama, parece que la tendencia local se ha convertido a la baja al final de la serie Lo que ha sucedido Los parámetros de este modelo se han estimado mediante la minimización del error al cuadrado de las previsiones de 1-paso adelante, no pronósticos a más largo plazo, en cuyo caso la tendencia doesn8217t hacen una gran diferencia. Si todo lo que está viendo son los errores 1-paso-a continuación, usted no está viendo el panorama general de las tendencias en (digamos) 10 o 20 períodos. Con el fin de conseguir este modelo más acorde con nuestra extrapolación de los datos de globo ocular, podemos ajustar manualmente la tendencia constante de alisamiento para que utilice una línea de base más corta para la estimación de tendencia. Por ejemplo, si elegimos para establecer 946 0.1, a continuación, la edad media de los datos utilizados en la estimación de la tendencia local es de 10 períodos, lo que significa que estamos promediando la tendencia de que los últimos 20 períodos más o menos. Here8217s lo que la trama de previsión parece si ponemos 946 0,1 945 0,3 mientras se mantiene. Esto parece intuitivamente razonable para esta serie, aunque es probable que sea peligroso extrapolar esta tendencia alguna más de 10 periodos en el futuro. ¿Qué pasa con las estadísticas de error Aquí está una comparación de modelos para los dos modelos que se muestran arriba, así como tres modelos SES. El valor óptimo de 945.para el modelo SES es de aproximadamente 0,3, pero resultados similares (con poco más o menos capacidad de respuesta, respectivamente) se obtienen con 0,5 y 0,2. exp lineal (A) Holt. suavizado con alfa y beta 0,3048 0,008 (B) Holts exp lineal. suavizado con alfa 0,3 y beta 0.1 (C) de suavizado exponencial simple con alfa 0,5 (D) de suavizado exponencial simple con alfa 0,3 (E) de suavizado exponencial simple con alfa 0,2 Sus estadísticas son casi idénticos, por lo que realmente can8217t tomar la decisión sobre la base de los errores de pronóstico 1 paso por delante dentro de la muestra de datos. Tenemos que recurrir a otras consideraciones. Si estamos convencidos de que tiene sentido basar la estimación actual tendencia en lo que ha ocurrido en los últimos 20 períodos más o menos, podemos hacer un caso para el modelo con LES y 945 0,3 946 0,1. Si queremos ser agnóstico sobre si existe una tendencia local, entonces uno de los modelos SLS podría ser más fácil de explicar y también daría más pronósticos media-of-the-road para los próximos 5 o 10 períodos. (Volver al principio de la página.) ¿Qué tipo de tendencia-extrapolación es mejor: La evidencia empírica horizontal o lineal sugiere que, si ya se han ajustado los datos (si es necesario) para la inflación, entonces puede ser imprudente extrapolar lineal a corto plazo tendencias muy lejos en el futuro. Tendencias hoy evidentes podrían crecer más en el futuro debido a causas variadas como la obsolescencia de los productos, el aumento de la competencia, y las depresiones cíclicas o repuntes en una industria. Por esta razón, suavizamiento exponencial simple menudo funciona mejor fuera de la muestra de lo que se podría esperar de otro modo, a pesar de su quotnaivequot horizontal extrapolación de tendencias. Amortiguadas modificaciones tendencia del modelo de suavizado exponencial lineal también se utilizan a menudo en la práctica de introducir una nota de cautela en sus proyecciones de tendencias. El modelo LES-tendencia amortiguada puede ser implementado como un caso especial de un modelo ARIMA, en particular, una (1,1,2) modelo ARIMA. Es posible calcular intervalos de confianza alrededor de las predicciones a largo plazo producidos por los modelos de suavizado exponencial, al considerarlos como casos especiales de los modelos ARIMA. (Cuidado: no todo el software calcula correctamente los intervalos de confianza para estos modelos.) La anchura de los intervalos de confianza depende de (i) el error RMS del modelo, (ii) el tipo de suavizado (simple o lineal) (iii) el valor (s) de la constante (s) de suavizado y (iv) el número de períodos por delante que se pronostica. En general, los intervalos se extienden más rápido a medida 945 se hace más grande en el modelo SES y se extienden mucho más rápido cuando se utiliza en lugar de lineal de suavizado simple. En este tema se tratará más adelante en la sección de modelos ARIMA de las notas. (Volver al comienzo de la página.) Móvil exponencial de refuerzo multiagente algoritmos de aprendizaje basados ​​en medios de primera línea: 19 Octubre el año 2015 Citar este artículo como: Awheda, M. D. Schwartz, H. M. Artif Intell Rev (2016) 45: 299. doi: 10.1007 / s10462-015-9447-5 Dos multiagente algoritmos de aprendizaje iteración política abstractas se proponen en este trabajo. Los dos algoritmos propuestos utilizan el enfoque de media móvil exponencial, junto con el algoritmo Q-learning como una base para actualizar la política para el agente de aprendizaje, de modo que la política agentes converge a una política de equilibrio de Nash. El primer algoritmo propuesto utiliza una tasa de aprendizaje constante en la actualización de la política del agente de aprendizaje, mientras que el segundo algoritmo propuesto utiliza dos diferentes ritmos de aprendizaje en descomposición. Estos dos ritmos de aprendizaje en descomposición se actualizan en función ya sea el o Aprende-Fast Win-mecanismo (Wolf) o el mecanismo (WOLS) Aprender-lento-Win-o. El mecanismo WOLS se introduce en este artículo para hacer que el algoritmo de aprendizaje rápido cuando se está ganando y aprender lentamente cuando se está perdiendo. El segundo algoritmo propuesto utiliza las recompensas recibidas por el agente de aprendizaje para decidir qué mecanismo (mecanismo de lobo o mecanismo WOLS) que se utilizará para el juego se está aprendiendo. Los algoritmos propuestos se han analizado teóricamente y se proporciona una prueba matemática de la convergencia al equilibrio de Nash puro para cada algoritmo. En el caso de juegos con equilibrio de Nash mixto, nuestro análisis matemático muestra que el segundo algoritmo propuesto converge a un equilibrio. Aunque nuestro análisis matemático no explícitamente muestran que el segundo algoritmo propuesto converge a un equilibrio de Nash, nuestros resultados de la simulación indican que el segundo algoritmo propuesto converge al equilibrio de Nash. Los algoritmos propuestos son examinados en una variedad de matriz y estocásticos juegos. Los resultados de simulación muestran que el segundo algoritmo propuesto converge en una variedad más amplia de situaciones que multiagente algoritmos de aprendizaje de refuerzo del estado de la técnica. Palabras clave sistemas de aprendizaje multi-agente de aprendizaje por refuerzo de decisión de Markov procesa el equilibrio de Nash Referencias Abdallah S, Lesser V (2008) Un algoritmo de aprendizaje por refuerzo multiagente con la dinámica no lineal. J Artif Intell Res 33: 521549 MathSciNet MATH Awheda MD, Schwartz SM (2013) móvil exponencial algoritmo de promedio de Q-aprendizaje. En: Programación adaptativa dinámica y aprendizaje por refuerzo (ADPRL), IEEE 2013 simposio sobre, IEEE, pp 3138. IEEE Awheda MD, Schwartz SM (2015) El algoritmo FACL gradiente residual para los juegos diferenciales. En la ingeniería eléctrica e informática (CCECE). 2015 IEEE 28ª Conferencia Canadiense sobre, IEEE, pp 10061011. IEEE Banerjee B, Peng J (2007) Generalizada multiagente aprendizaje con un rendimiento ligado. Agentes Auton Multi-Agente Syst 15 (3): 281312 CrossRef Bellman R (1957) La programación dinámica. Princeton University Press, Princeton MATH Bowling M (2005) y Convergencia de resultados garantizados en el aprendizaje multiagente. Adv Neural Inf Syst Proceso 17: 209216 Bowling M, M Veloso (2001a) La convergencia de la dinámica del gradiente con una tasa de aprendizaje variable. En: ICML, pp 2734 Bowling M, M Veloso (2001b) el aprendizaje racional y convergente en los juegos estocásticos. En: conferencia conjunta internacional sobre inteligencia artificial, vol. 17. Lawrence Erlbaum Associates Ltd, pp 10211026 Bowling M, M Veloso (2002) multiagente aprendizaje utilizando una tasa de aprendizaje variable. Artif Intell 136 (2): 215250 CrossRef MathSciNet MATH Burkov A, B Chaib-Draa (2009) El aprendizaje efectivo en presencia de homólogos de adaptación. Algoritmos J 64 (4): 127138 CrossRef MathSciNet MATH Busoniu L, R Babuska, De Schutter B (2006) Multi-agente de aprendizaje por refuerzo: Una encuesta. En: control, automatización, robótica y visión, 2006. ICARCV06. 9ª Conferencia Internacional de IEEE, pp 16. IEEE Busoniu L, R Babuska, De Schutter B (2008) Un estudio exhaustivo de aprendizaje por refuerzo multiagente. Syst hombre Cybern Parte C: Appl Rev, IEEE Trans 38 (2): 156172 CrossRef Claus C, Boutilier C (1998) La dinámica de refuerzo de aprendizaje en sistemas multiagente de cooperación. En: AAAI / IAAI, pp 746 752 Conitzer V, Sandholm T (2007) impresionante: Un algoritmo de aprendizaje multiagente general, que converge en la auto-play y aprende una mejor respuesta contra oponentes estacionarias. Mach información 67 (12): 2343 CrossRef Dai X, Li C-K, Rad AB (2005) Un enfoque para sintonizar controladores borrosos basados ​​en el aprendizaje por refuerzo para el control del vehículo autónomo. Intell Transp Syst, IEEE Trans 6 (3): sistemas lineales variantes en el tiempo 285.293 CrossRef DAngelo H (1970): análisis y síntesis. Allyn amp Bacon, Newton MATH DeCarlo RA (1989) Sistemas lineales: un enfoque variable de estado con la implementación numérica. Prentice-Hall Inc., Upper Saddle River Dixon W (2014) adaptativas óptimas de control y diferenciales juegos por los principios de aprendizaje de refuerzo. J Control de Guid Dyn 37 (3): 10481049 CrossRef Fulda N, D Ventura (2007) La predicción y la prevención de los problemas de coordinación en los sistemas Q-aprendizaje cooperativo. En: IJCAI, vol. 2007, pp 780 785 Gutnisky DA, Zanutto BS (2004) evitación de obstáculos de aprendizaje con un modelo de conducta operante. Artif Vida 10 (1): 6581 W CrossRef Hinojosa, Nefti S, T Kaymak (2011) Sistemas de control con aprendizaje difuso-probabilístico refuerzo generalizado. Syst difusa, IEEE Trans 19 (1): los procesos de Markov 5164 CrossRef Howard RA (1960) La programación dinámica y. MIT Press, Cambridge, Hu J, Wellman MP (2003) Nash Q-learning para juegos estocásticos de suma general. J Mach información Res 4: 10391069 MathSciNet Hu J, Wellman MP, et al (1998) multiagente refuerzo de aprendizaje: marco teórico y un algoritmo. En: ICML, vol. 98, Citeseer, pp 242250 Kaelbling LP, Littman ML, Moore AW (1996) Aprendizaje por refuerzo: una encuesta. J Artif Intell Res 4: 237.285 Kondo T, Ito K (2004) Un aprendizaje por refuerzo con la estrategia de reclutamiento estado evolutivo para el control de robots móviles autónomos. Robot Auton Syst 46 (2): 111124 CrossRef Luo B, Wu H-N, H Li-X (2014A) de control neuro-diseño óptimo a base de datos con el aprendizaje por refuerzo para disipativas procesos distribuidos espacialmente. Ind Eng Chem Res 53 (19): 81068119 CrossRef Luo B, Wu H-N, Huang T, Liu D a base de datos (2014b) iteración política aproximado para el diseño no lineal de control óptimo de tiempo continuo. Automatica 50 (12): 32813290 CrossRef MathSciNet Luo B, Wu H-N, Huang T (2015A) el aprendizaje de diseño de control (H) de refuerzo fuera de la política. Cybern, IEEE Trans 45 (1): 6576 CrossRef Luo B, Wu H-N, H Li-X (2015b) Adaptativo control óptimo de los procesos no lineales distribuidos espacialmente altamente disipativas con la programación neuro-dinámico. Neural s Dentro información Syst, IEEE Trans 26 (4): 684 696 CrossRef Luo B, Huang T, Wu H-N, Yang X (2015c) controlada por datos de control (H) para sistemas no lineales de parámetros distribuidos. Neural s Dentro información Syst, IEEE Trans 26 (11): 29492961 Luo B, Wu H-N, Huang T, Liu D (2015d) Refuerzo solución de aprendizaje para la ecuación HJB que surge en un problema de control óptimo restringido. Neural Serv 71: 150.158 CrossRef Modares H, FL Lewis, Naghibi-Sistani M-B (2014) el aprendizaje por refuerzo integral y la experiencia de reproducción para un control óptimo de adaptación de los sistemas de tiempo continuo de entrada restringida parcialmente desconocidos. Automatica 50 (1): 193202 CrossRef MathSciNet MATH Rodríguez M, R Iglesias, Regueiro CV, Correa J, S Barro (2007) Autónoma y el aprendizaje a través de la motivación robot rápido. Robot Auton Syst 55 (9): 735.740 CrossRef Schwartz SM (2014) Multi-Agente Machine Learning: Un enfoque de refuerzo. Wiley, Nueva York CrossRef Sen S, Sekaran H, J Hale (1994) Aprender a coordinar sin compartir información. En: AAAI, pp 426431 Singh S, M Kearns, Mansour Y (2000) convergencia Nash de la dinámica de gradiente en juegos de suma general. En: Actas de la XVI Conferencia sobre la incertidumbre en la inteligencia artificial, Morgan Kaufmann Publishers Inc. pp 541548 inteligente WD, Kaelbling LP (2002) refuerzo eficaz de aprendizaje para robots móviles. En: La robótica y la automatización. Actas. ICRA02. IEEE Conferencia Internacional sobre, vol. 4, IEEE, 2002, pp 34043410. IEEE RS Sutton, Barto AG (1998) Aprendizaje por refuerzo:. Una introducción. The MIT Press, Cambridge Tan M (1993) Multi-agente de refuerzo del aprendizaje: Independiente vs. agentes de cooperación. En: Actas de la conferencia internacional de la décima posición de la máquina de aprendizaje, pp 330 337 Tesauro G (2004) La extensión de Q-learning a los sistemas generales multi-agente de adaptación. En: Avances en la información neuronal se procesan sistemas, vol. 16. prensa del MIT, pp 871 878 Thathachar MA, Sastry PS (2011) Redes de aprendizaje autómatas: técnicas de optimización estocástica en línea. Springer, Boston Watkins CJ, Dayan P (1992) Q-aprendizaje. Aprender Mach 8 (34): 279292 MATH Watkins CJCH (1989) Aprender de las recompensas retrasadas, Ph. D. Tesis, Universidad de Cambridge sistemas multiagente Inglaterra Weiss G (1999): un enfoque moderno de la inteligencia artificial distribuida. MIT Press Wu H-N, Luo B basado algoritmo de actualización (2012) de redes neuronales línea política simultánea para resolver la ecuación HJI de control no lineal. Neural s Dentro información Syst, IEEE Trans 23 (12): 18841895 CrossRef MathSciNet YE C, Yung NH, Wang D (2003) Un controlador difuso con aprendizaje supervisado refuerzo asistida algoritmo de aprendizaje de evitación de obstáculos. Syst hombre Cybern Parte B: Cybern, IEEE Trans 33 (1): 1727 CrossRef Zhang C, Lesser VR (2010) el aprendizaje con la predicción de la política multi-agente. En: Información de Derechos de Autor AAAI Springer ScienceBusiness Medios Dordrecht 2015 Autores y afiliaciones Mostafa D. Awheda 1 Email Autor Howard M. Schwartz 1 1. Departamento de Sistemas e Ingeniería Informática de la Universidad de Carleton de Ottawa Canadá Acerca de este artículo


No comments:

Post a Comment