uanl logo
fime logo
pisis logo
uanl vision logo

CICLO DE SEMINARIOS AGOSTO - DICIEMBRE 2020


Sesgos en la web

 11/sep/2020  Seminario PISIS-UANL 2020      Asistencia : 24

Etiquetas: Minería de datos, noticias falsas.


Posgrado en Ingeniería de Sistemas

Semblanza

Dr. Ricardo Baeza-Yates

Northeastern University
           

Ricardo Baeza-Yates es actualmente director de ciencia de datos de Northeastern University en el Silicon Valley. Es también catedrático a tiempo parcial en los Departamentos de Tecnologías de la Información y de las Comunicaciones de la Universitat Pompeu Fabra (UPF) en Barcelona y Ciencia de la Computación de la Universidad de Chile en Santiago. Anteriormente, entre 2006 y 2016, fue vicepresidente de investigación de Yahoo Labs, primero dirigiendo el laboratorio de investigación para Europa en Barcelona y más tarde, en 2014, llegando a ser Chief Research Scientist en Sunnyvale, California. En el 2009 fue nombrado ACM Fellow y en 2011 IEEE Fellow. Sus intereses de investigación incluyen algoritmos y estructuras de datos, recuperación de información, búsquedas web y minería de datos, y ciencia de datos y visualización.





Introducción

La Web es el medio de comunicación más poderoso y el repositorio público de datos más grande que la humanidad ha creado, sin embargo, la calidad de éstos es incierta en ocasiones. En esta charla el Dr. Ricardo Baeza-Yates habla acerca de los diferentes tipos de sesgos, como lo es el estadístico, cultural y cognitivo, y cómo estos afectan la desigualdad del contenido que hay en la Web, además del impacto que pueden tener en los sistemas de búsqueda de información y sobre todo en el contenido que pudiera considerarse falso y que hoy en día es muy común encontrar en internet.

Resumen

De la conferencia podemos destacar que, en la opinión del Dr. Ricardo Baeza-Yates, es importante recordar que no se garantiza el éxito de las decisiones solo porque se basen en datos, pues los resultados y su análisis se pueden malinterpretar deliberada o involuntariamente. Esto puede llevar a que el resultado del análisis sea tratado erróneamente como verdad, y las decisiones tomadas sobre la base de tal verdad pueden resultar incorrectas. El sesgo es entendido como la interferencia en los resultados de la investigación por ideas predeterminadas, prejuicios o influencias en una determinada dirección; es la principal causa de la toma de decisiones equivocadas. Además, no solo los datos pueden estar sesgados, también las personas que los analizan. Cuando los datos están sesgados, implica que la muestra no es representativa de toda la población; cuando las personas que analizan datos están sesgadas, quieren que los resultados de su análisis vayan en una dirección determinada previamente. Actualmente se procesan cantidades masivas de datos recopilados de usuarios humanos a través de algoritmos creados para imitar el proceso de aprendizaje y elaboración de conclusiones identificado patrones y usándolos para hacer cosas como encontrar preferencias comunes o incluso imitar comportamientos humanos. Sin embargo, el sesgo es un componente del proceso de pensamiento humano, por ellos sus datos tienen un sesgo inherente, esto hace que sea increíblemente difícil recopilar y ajustar datos para que omitan un sesgo y, al mismo tiempo, conserven su precisión. Como investigadores es importante asegurarnos que los datos utilizados pueden llegar a tener un sesgo, y es nuestro trabajo identificarlo y mitigarlo. Individualmente debemos evitar posturas que nos orillen a conclusiones manipuladas, así como no navegar en una burbuja formada por información similar a lo que ya conocemos y nos gusta, sin estar conscientes de toda la información disponible.

Conclusiones

El sesgo es todo aquello que desvíe sistemáticamente los resultados de lo real, ya sea por estereotipos, ideas predeterminadas, distorsión de valores, errores en la recopilación de datos o hacer una mala interpretación de éstos. Los datos en la Web son un espejo de nosotros como humanidad, necesitamos ser conscientes de nuestro propio sesgo para detener este círculo vicioso; debido a que el sesgo genera más sesgo, es importante su reducción para romper el efecto burbuja.

Ligas de interés


Últimas reseñas

Comunicación de la Ciencia.



Contáctanos:
Universidad Autónoma de Nuevo León
Facultad de Ingeniería Mecánica y Eléctrica
Posgrado de Ingeniería en Sistemas
   


Dirección:

Universidad Autónoma de Nuevo León, Ciudad Universitaria, Pedro de Alba s/n San Nicolás de los Garza, Nuevo León C.P. 66451