uanl logo
fime logo
pisis logo
uanl vision logo

CICLO DE SEMINARIOS AGOSTO - DICIEMBRE 2020


Incentivos en la teoría de control

 6/nov/2020  Seminario PISIS-UANL 2020      Asistencia : 26

Etiquetas: Investigación, teoría de juegos


Posgrado en Ingeniería de Sistemas

Semblanza

Dr. Manuel Jimenez Lizarraga

Universidad Autónoma de Nuevo León
           

Obtuvo su grado de doctor en control automático por el Centro de Investigación y de Estudios Avanzados del Instituto Politécnico Nacional (CINVESTAV) en 2006. A la fecha ha publicado más de 20 trabajos en revistas indexadas y ha graduado a tres alumnos de doctorado, dos de maestría, uno de especialidad y 12 de licenciatura. Actualmente es profesor investigador en la Facultad de Ciencias Físico Matemáticas de la Universidad Autónoma de Nuevo León. Dentro de sus intereses de investigación se encuentran juegos diferenciales, control por modos deslizantes y aplicaciones de control.







Introducción

En esta charla el doctor Manuel Jimenez nos introdujo al tema de los incentivos desde el contexto de la teoría de juegos y de la teoría de control óptimo. Se entiende por incentivo como aquel mecanismo para persuadir a los participantes a comportarse de cierta manera durante un juego con niveles de jerarquía entre ellos, el estudio de estos incentivos fue introducidos por Heinrich von Stackelberg en 1952.

Resumen

Supongamos que tenemos un juego no-cooperativo en el que cada jugador busca minimizar su propio costo y se tienen al menos dos jugadores, uno llamado líder y otro seguidor, el jugador líder tiene alguna ventaja sobre el otro jugador (por ejemplo, el conocimiento del costo del otro jugador), el jugador seguidor optimiza su función objetivo en dependencia de la estrategia anunciada por el líder.
Existen diferentes maneras en las que puede jugar el líder. La primera consiste en la más básica que es comunicar su estrategia al seguidor y con base en ella elegir aquella que minimice sus costos, el resultado de este juego secuencial llevará al equilibrio de Stackelberg. La segunda manera en la que puede jugar un líder es diseñar un incentivo que induzca al seguidor a elegir de las estrategias aquella que sea lo más favorable para el líder. Por ejemplo, el diseño de una función de estrategia dependiente de la estrategia del seguidor que minimice los costos del líder, esta función es anunciada por el líder y recibe una retroalimentación permitiendo ajustar su estrategia a un punto mejor.
Otro tipo de incentivo es aquel que busca formar una optimalidad de Pareto (cooperativo) es decir se plantea una estrategia que busca el modelo de incentivo donde se refleja la mejor situación para la organización en general de modo que se encuentre una solución donde se esté en equilibrio de Nash.
La segunda parte de la plática, el doctor nos introdujo en los diferentes campos de estudio que son convergentes entre la teoría de juegos, la teoría de control y la optimización matemática, por ejemplo, utilizamos programación matemática para resolver problemas de juegos estáticos de un jugador, si en nuestro problema tuviéramos varios jugadores emplearemos la teoría de juegos. Ahora bien, en un entorno dinámico donde tenemos un jugador aplicamos la teoría de control óptimo o programación dinámica. Sin embargo, cuando se tienen varios jugadores en un entorno dinámico se utilizará la teoría de juegos dinámica, es en este último conjunto de problemas cuando se intercepta la teoría de control con la teoría de juegos.
Cuando hablamos en el caso dinámico: si se tienen dos jugadores, y cada uno desea minimizar su esfuerzo de control y modificar su variable de estado y deseamos diseñar un incentivo, procederemos de manera análoga al caso estático, primero se tendría que resolver un problema de control óptimo en que se busca minimizar los costos de todos los jugadores, este valor será la cota más baja de costos del líder. Ahora, el incentivo se diseña como una función de desviación del estado deseado o la trayectoria que el líder quiere que siga. Esta función de incentivos se sustituye en la función de costo del seguidor con el objetivo de determinar las estrategias que aseguren que el líder y el seguidor están jugando con las estrategias de equipo óptimas.

Conclusiones

En esta plática se enfocó en el concepto del diseño de incentivos primero en la teoría de juegos estáticos con un ejemplo de dos jugadores donde el líder busca su mínimo global y luego diseña el incentivo, para que el seguidor se sienta incentivado a jugar con esa estrategia, posteriormente se dio un panorama general de los distintos campos de estudio que se utilizan para resolver problemas de optimización estáticos, dinámicos y con uno o varios jugadores. Después de una breve introducción a la teoría de control dinámico y se dio un ejemplo sobre un diseño de incentivos en un juego dinámico.


Últimas reseñas

Detección de pre-microARNs con CNNs

Marca de agua digital.

Gestión de equipos como ingeniero de software

Vida después del posgrado



Contáctanos:
Universidad Autónoma de Nuevo León
Facultad de Ingeniería Mecánica y Eléctrica
Posgrado de Ingeniería en Sistemas
   


Dirección:

Universidad Autónoma de Nuevo León, Ciudad Universitaria, Pedro de Alba s/n San Nicolás de los Garza, Nuevo León C.P. 66451