Dr. Guillermo Santamaria Bonfil

El doctor Guillermo Santamaría Bonfil es doctor por la ITESM campus Cuernavaca. Además realizó un posdoctorado en el IIMAS. Actualmente es cátedra CONACYT en el Instituto Nacional de Electricidad y Energías Limpias y es SNI. Entre sus intereses de investigación se encuentran las series de tiempo, aprendizaje de máquina e inteligencia artificial. Sus contribuciones han sido publicadas en revistas del JCR y revistas internacionales arbitradas.

 

Modelos de imputación equivalentes para el manejo de datos faltantes en bases de datos

  11/febrero/2022  Seminario PISIS-UANL 2022      Asistencia : *

Introducción

La energía geotérmica es una energía renovable que al pasar de los años se ha hecho cada vez más presente. Para llevar a cabo la exploración y uso de los sistemas geotérmicos, se necesitan obtener modelos hidrogeoquímicos, que describen las capacidades principales de un campo geotérmico en particular. Para realizar la construcción de dichos modelos es necesario primero la recopilación de datos de fluidos geotérmicos, es decir, muestras de líquidos o gases que ayudan a determinar la composición química del campo geotérmico.
Sin embargo, por diversos motivos técnicos o logísticos las bases de datos pueden presentar huecos o datos faltantes, por lo tanto, es necesario encontrar métodos que estimen esos datos faltantes.
En esta charla el Doctor Guillermo Santamaría Bonfil nos presenta un método para la imputación equivalente de datos faltantes de las bases de datos en campos.

Resumen

Para poder llevar a cabo la imputación de datos a bases de datos faltantes se lleva a cabo una metodología de varios componentes que empieza recopilando información a nivel global formando una base de datos de fluidos geotérmicos; posteriormente se realiza un análisis de los mecanismos de datos faltantes; después se lleva a cabo un preprocesamiento de los datos usando unas funciones logarítmica y de mínimos y máximos para escalar los datos. Posteriormente se hace el rellenado de datos, en el que se prueban varias técnicas con enfoque estadístico como el método estadístico, imputaciones de tipo único y de imputación múltiple. Es importante diferenciar entre imputaciones de tipo datos únicos, e imputación de múltiples datos; una vez terminado el proceso de rellenado de datos evaluamos la calidad de los mismos, usando pruebas estadísticas de equivalencia. Por último se hace una evaluación geoquímica, la cual consiste en garantizar el error de balance de cargas, analizar las firmas de los sitios en estudio y al final hacer estimaciones geo-termométricas.
Con este proceso se logra que las imputaciones sean equivalentes estadísticamente y tengan validez geoquímica.
Un dato importante que se encontró dentro de esta investigación es que existe una monotonía dentro de los datos geotérmicos faltantes en los resultados.

Conclusiones

Se logró diseñar un método estadístico que hace de uso comparación de datos y pruebas de equivalencia estadística para lograr la imputación de datos faltantes en bases de datos incompletas, esto hace posible realizar estimaciones geotermométricas de alta calidad.
Sin embargo, todavía pueden realizarse mejoras como el replanteamiento del problema a uno de optimización multiobjetivo, así como encontrar un intervalo de equivalencia mínimo requerido para lograr una buena imputación.

Reseñas anteriores