Las reglas de oro para un uso ético de los datos – Universidad Complutense de Madrid

By Universidad Complutense de Madrid

▷ ¿Qué es Data Science? | Universidad Complutense de Madrid (masterdatascienceucm.com)

¿Sabes cuál es la cantidad de datos que se comparten en un minuto, tan sólo en internet? Cada minuto se envían casi 42 millones de mensajes de WhatsApp, se instalan 2.704 veces la aplicación TikTok, se suben 500 horas de vídeo a YouTube, se publican casi 348.000 post en Instagram y Facebook suma más de 147.000 fotografías. Y esto sin contar los millones de contenidos que se vuelcan a las bases de datos de las páginas web y foros.

Toda esa oleada de datos conforman el Big Data. Si se gestiona adecuadamente, los macrodatos aportan (y poseen) un gran valor. Ahí es donde entra en juego la Ciencia de los Datos (Data Science).

Esta disciplina es la que limpia los datos para su posterior análisis y presentación como conocimiento útil de cara a la toma de decisiones. Para ello se vale de modelos de procesamiento de información masiva inteligente como el Machine Learning.

Pero llegar a ese punto no es sencillo: se requiere formación, capacidad crítica, inversión en herramientas y dedicar tiempo a las curvas de aprendizaje que imponen estas.

Ahora bien, esta inversión, como se ha comprobado con la pandemia, merece la pena. El dato es el nuevo oro; y la colaboración entre departamentos y empresas, el maná que generará esa economía del dato.

Cómo funciona el Big Data

Para comprender la importancia (y el futuro) del Big Data y el Data Science se hace imprescindible, apuntan los expertos, conocer cómo funciona el análisis de la información.

En un primer estadio, se generan los macrodatos. Estos provienen de fuentes muy diversas: desde las propias personas cuando hacen uso de la red de conexiones a las máquinas que utilizan estas.

Todo ello se convierte en estadísticas y datos: biométricas, de marketing, de transacciones de datos. Pueden ser estructurados (con un formato definido como puede ser una base de datos), no estructurados (en bruto, sin organización ni clasificación) o semiestructurados, la combinación de los dos anteriores.

Una vez generados, se procesan con diversas herramientas para su análisis.

Dado que no toda la información es apta para cada área, se clasifica, etiqueta y jerarquiza para facilitar tanto a la herramienta como a los equipos el procesamiento y asimilación de datos de calidad.

¿Cómo se hace este análisis? La inteligencia artificial no es la única herramienta al alcance de las organizaciones. La minería de datos, por ejemplo, es adecuada para buscar patrones y relaciones en grandes conjuntos de datos.

Las analíticas predictivas están más enfocadas a la interpretación de comportamientos, riesgos y oportunidades.

En el caso de la minería de textos, en vez de aplicar el análisis y rastreo de la información a grandes volúmenes de información lo hace con datos específicos textuales. En cualquier soporte.

Big Data y Business Intelligence

Cuando se habla de Big Data es muy común confundirlo con otro concepto empresarial: Business Intelligence. Aunque se necesitan mutuamente, no son sustitutivos.

El Big Data no tiene sentido sin el Data Science; el Business Intelligence depende directamente de los dos precedentes.

Pero si en ellos el protagonismo y peso del trabajo con los macrodatos recae sobre herramientas y modelos, en el BI son los expertos en estrategia empresarial y la cúpula directiva quien asume el protagonismo.

Límites del Big Data

Big Data e IA permiten que el sistema sugiera propuestas hiperpersonalizadas. ¿Hasta qué punto es lo adecuado para la empresa y para el usuario? ¿Condicionan nuestra respuesta y necesidades a futuro?

La evolución de la tecnologías de la información no es un elemento negativo per se. Pero ¿dónde están los límites del uso del Big Data? ¿Qué ocurre cuando se pasa al lado oscuro?

Cambridge Analytica

Lo ocurrido con la consultor Cambridge Analytica es un buen paradigma para comprender los límites del Big Data y por qué es importante que los elementos claves de cualquier organización que trabaje con macrodatos tenga una formación especializada en la materia.

La empresa optó por dar una vuelta de tuerca al trabajo tradicional con los datos: ¿por qué quedarse en la extracción y el análisis de la información? Si se manipulan los algoritmos se puede influir en el comportamiento de las personas y generar cambios en la opinión pública.

Y, lo mejor de todo: las bombas de información no tienen porqué ser fake news. Basta con focalizar la atención de cada grupo en una parte de la realidad, manipulada en el sentido negativo o no, para generar ese cambio (y la radicalización de las posturas consecuentes).

Cambridge Analytica influyó en 44 campañas políticas en Estados Unidos incluida la campaña del expresidente Donald Trump, y también en la campaña del Brexit en Reino Unido, entre otras ‘responsabilidades’ de esta peligrosa operativa.

Reglas para hacer un uso ético y moral de los mismos

Casos como el de Cambridge Analytica ponen de manifiesto la necesidad de implementar una serie de reglas y valores éticos y morales respecto al tratamiento de esa información.

No en vano, existen potentes riesgos de vulneración de la seguridad de los datos, en muchos casos sensibles. Estos ataques cibernéticos forman parte ya de la realidad de las empresas y las organizaciones.

Pero también existe un riesgo latente de priorizar la cantidad frente a la calidad, y generar unas proyecciones poco fidedignas.

Ahora bien, lo más urgente es contar con un marco normativo que se ajuste a los riesgos y a la evolución futura. La regulación actual es escasa y poco adaptada a la realidad.

Y, sin embargo, el Big Data va camino de convertirse en un nuevo modelo político y económico en sí mismo. Frente a esta realidad, se confronta el riesgo real y ya experimentado de la falta de transparencia y control sobre la información privada, y sus consecuencias: manipulación de la opinión pública y el consumo.

La ética de los datos es cada vez más crítica. Las empresas, y la Administración Pública, necesitan navegar hacia la transformación digital con la inteligencia artificial, pero sin caer en trampas éticas en el camino como ocurrió con Cambridge Analytica.

En definitiva, las organizaciones y los profesionales se enfrentan a un campo prometedor, pero no exento de dualidades difíciles de calibrar, explican desde la dirección académica del Máster Data Science UCM. La formación sólida y la actualización permanente son ya una necesidad imperiosa.

Uncategorized

Deja una respuesta