Los datos en el contexto de la Inteligencia Artificial y el rol del Estado

El desarrollo de la Inteligencia Artificial (IA) contemporánea es indisociable del paradigma digital que da soporte a la disrupción tecnológica que transformó la forma en que se captura, transmite, procesa y almacena la información.

El cambio de paradigma motorizado por la revolución del tratamiento de grandes volúmenes de datos (Big Data) y los métodos matemáticos implementados en el modelo de aprendizaje automático (Machine Learning) permiten nuevos modos de producción en la captura y análisis de datos para producir información digital, es un factor relevante.

Las empresas como Amazon, Alibaba, Alphabet, Mercado Libre, que operan plataformas basadas en software, están reorganizando la cadena de creación de valor mediante la aplicación de IA para la logística y esto hace que el funcionamiento de los mercados se haya redefinido de forma radical.

Esta reorganización dirigida por la IA está alterando también la lógica y la estructura de producción en todos los sectores, así como el proceso de toma de decisiones a todos los niveles: desde la gobernanza nacional al desarrollo urbanístico, la aplicación de la ley, la concesión de créditos y la inversión en educación y en salud.

En el documento “la gobernanza de los datos y la Inteligencia Artificial”, Cecilia Alemany y Anita Gurumurthy afirman: “La forma en que se usa información estructurada extraída de los datos generados por las interacciones sociales (de persona y de objetos, todos interconectados en un mundo de datos) genera beneficios económicos supone un giro en las estructuras basales de la sociedad y la economía que requiere un nuevo modelo de gobernanza”.

Uno de los principales aspectos que ha impulsado los avances de la IA de las últimas décadas y las técnicas de aprendizaje automatizado (Machine Learning) ha sido la posibilidad de contar con anchos de banda crecientes en la red internet y la capacidad de procesamiento paralelo de alta velocidad que posibilitan transferir, procesar y almacenar grandes volúmenes de datos.

El modelo de negocio, concentrado en corporaciones digitales, basado en plataformas de software y aplicaciones, ha generalizado la captura y el tratamiento de los datos con fines comerciales y corporativos. Por lo cual, la mirada sobre gobernanza de los datos en el contexto del desarrollo de la Inteligencia Artificial (IA), es parcial.

Está orientada por la mirada de los Sistemas de Información y la Ciencia de Datos. Solo abarca temas como el acceso, la estructura y organización, el análisis y la explotación de los datos. Si bien constituyen una de las dimensiones centrales en relación a la infraestructura de tecnologías de la información, la noción de gobernanza de datos tiene mayor amplitud, ya que las implicancias en la organización requieren de un abordaje completo y transversal entre los diferentes niveles de gestión y decisión basado en evidencias.

Su valor es estratégico, ya que la propiedad y el cuidado de los datos son condiciones básicas para una política pública orientada a la soberanía de conocimientos.

Es necesario para el abordaje de esta temática digital la formulación de planes nacionales con estrategia y agenda para los temas de IA y el valor de los datos públicos y privados, formulados como política de estado.

Estas acciones permiten identificar los principales desafíos, necesidades y brechas digitales que deben atenderse para la adopción y la implementación de la IA en un contexto nacional, así como la toma de posición del país y su forma de abordarlo.

Argentina es un productor incipiente de productos y servicios basados en tecnologías digitales, el contrapeso con los productores mundiales de tecnologías de IA es muy desigual y nos enfrenta a múltiples desafíos.

Los responsables políticos y los ciudadanos debemos comprender los diferentes usos de las tecnologías basadas en IA, que van mucho más allá de la publicidad dirigida y de la micro segmentación, como la adopción de tecnologías de IA en la atención médica, en la agricultura, en la educación, en la prestación de servicios gubernamentales y en el sector empresarial.

El Plan Nacional de Inteligencia Artificial ([ii]) desarrollado entre mediados del 2018 y 2019 por la gestión de Cambiemos, ha dejado articulada una orientación sobre la gobernanza de los datos en el sector público. En el mismo se ensucian las siguientes ideas fuerza:

  • Maximizar el potencial económico y de crecimiento para el país con la adopción de la IA tanto por parte del sector privado como público
  • Minimizar los riesgos inherentes a la IA en términos de impacto social, alineados con principios éticos y legales
  • Favorecer el desarrollo del talento orientado a la IA y las capacidades técnicas y científicas
  • Promover la vinculación en torno a la IA entre distintos sectores y actores para desarrollar un ecosistema nacional.

Es de vital importancia, revisar y adecuar el Plan referido, para conducirlo en función de los intereses nacionales, acorde a las políticas de soberanía digital definidas por la gestión del presidente Alberto Fernández. La demora de políticas en la administración de los datos del estado posibilita soluciones “llave en mano y a tiempo” que promueve la fuga de estos recursos públicos estratégicos hacia el sector privado globalizado.

Los objetivos específicos que se pueden ver en el Plan Nacional de IA, están centrados en los datos. Se promueve la generación y la demanda de datos estandarizados y adecuados para las distintas técnicas de IA, fortaleciendo los mecanismos de apertura en el sector público, privado y académico. La identificación y la generación de los mecanismos para hacer disponibles los activos de datos públicos y privados críticos para el desarrollo de la IA en sectores estratégicos; y garantizar la calidad y el cumplimiento normativo de las bases de datos.

El informe considera que el sector público tiene un reto particular en la explotación de los datos recolectados, sin amenazar la privacidad de las personas, y menciona cómo el RGPD y el concepto de Privacidad por Diseño deben ser considerados para mitigar riesgos a la privacidad y seguridad de la información.

El Reglamento General de Protección de Datos (RGPD) es el reglamento europeo relativo a la protección de las personas físicas en lo que respecta al tratamiento de sus datos personales y a la libre circulación de estos datos. Entró en vigencia el 25 de mayo de 2016 y comenzó su aplicación el 25 de mayo de 2018, dos años durante los cuales las empresas, las organizaciones, los organismos y las instituciones se fueron adaptando para su cumplimiento. Es una normativa a nivel de la Unión Europea, por lo que cualquier empresa de la unión, o aquellas empresas que tengan negocios en la Unión Europea, que manejen información personal de cualquier tipo, deberán acogerse a ella. El RGPD es el resultado de acuerdos con las corporaciones que concentran las operatorias o transacciones de las plataformas de software de la economía digital como las de comercio electrónico.

Además, el Plan destaca la política de datos abiertos y de acceso a la información pública como ejemplos positivos en esta materia sobre la cual se debería desarrollar la IA, marco en el cual la gobernanza de datos debe avanzar sobre la dimensión estratégica organizacional-corporativa.

Reconoce el papel fundamental que tiene el Estado para hacer disponibles los datos para el sector privado, ya que en la actualidad es la principal fuente para la recolección y para el armado de bases de datos. El documento prevé una circulación de datos entre sector privado, público y científico tecnológico, pero encontrando balances que respeten la seguridad y la privacidad. Para ello, el trabajo aclara que esta circulación se realizará en el marco de “convenios de cooperación” entre los sectores como columna vertebral para la apertura de datos sobre la base de sectores de aplicación predefinidos.




MAPA DE PAÍSES QUE CUENTAN CON ESTRATEGIAS NACIONALES DE INTELIGENCIA ARTIFICIAL

Las consideraciones de la gobernanza de datos no solo comprenden el desarrollo de técnicas algorítmicas más robustas en la base, sino que además son parte constitutiva de los dilemas que se plantean en la capa ética y en la capa social y legal.

La gobernanza de datos no es un fenómeno que se restringe a la dimensión corporativa vinculada a la seguridad y a la eficiencia en su gestión. Entonces, este problema se convierte en un tema transversal a toda la gobernanza de la IA en el sector público, ya que, por un lado, los datos son materia prima esencial para el desarrollo de sistemas de IA, pero su tratamiento es un factor que condiciona las garantías y los pactos sociales en materia de privacidad, de disponibilidad, de apertura y de interoperabilidad que se encuentran en las capas superiores del modelo modular de gobernanza.

Necesitamos profundizar los desafíos conceptuales, políticos y prácticos para mantener la visión de complejidad necesaria y a la vez la capacidad de respuesta en la gestión del Estado.

Lo que queremos alertar es que, desde un punto de vista técnico algorítmico, el anonimato no pueda ser garantizado con técnicas de aprendizaje profundo (Deep Learning), por lo tanto, en los casos en los que se opera con datos deben considerarse la definición y la implementación de protocolos conducidos por políticas públicas con agendas enunciadas desde el Estado y no desde el sector privado.

El énfasis puesto en las distintas estrategias en el desarrollo de bases de datos, en su interoperabilidad, en la capacidad de compartir datos y bases de datos entre actores y sectores, impulsan a considerar una serie de instrumentos que desafían desde su práctica e implementación principios legales y normativos presentes en las organizaciones públicas nacionales. Este desajuste entre normas y prácticas en materia de gobernanza de datos y los múltiples niveles que la atraviesan se presenta como uno de los desafíos más cruciales y debe ser conducido por profesionales que valoren la importancia política sobre la autonomía y el cuidado de las fuentes.

La interoperabilidad no puede ser orientada a un único proveedor privado de productos de software como Oracle, Red Hat/IBM, Microsoft, entre otros. Los productos con los cuales se construyen bases de datos y herramientas de análisis de datos (software) deben integrar un diseño que garantice la pluralidad de proveedores y la administración soberana de los datos.

Es necesario para contar con una infraestructura de datos (Middleware) donde distintas empresas proveedores de motores de base de datos y herramientas de ciencia de datos puedan conectar sus productos para ser operados y explotados por los agentes del sector público.

Los protocolos que estipulan los procesos operativos de la gobernanza de los datos, deben contribuir a la lógica de intercambio de información entre aplicaciones de la IA.

Los Middleware o Agente Intermediarios de software permiten la gestión sobre los datos que asisten al desarrollo de la IA contemporánea sobre la base de las preguntas centrales: ¿Quién?, ¿cómo?, ¿para qué?, como también, garantizan la definición e implementación de políticas orientadas a la soberanía de los datos como recurso estratégico del Estado Nacional y la seguridad sobre su utilización para los casos de uso con datos privados de los ciudadanos.

Como señalamos la Gobernanza de los datos en el contexto de la IA no es solamente una cuestión de informáticos; los datos de un país son recursos por los cuales se conoce a la población, se definen programas de políticas públicas y nutren la evaluación y evolución de las mismas. Son temas centrales para el desarrollo del Estado en la redefinición digital de la vida.

Creemos necesario abordar cuatro temas claves, que no pueden quedar afuera de un marco regulatorio, ya que son transversales a las distintas áreas específicas donde el Estado utiliza esta tecnología. Estos son la “caja negra” o apertura del procesamiento de la información, los sesgos de los algoritmos, la ética de la selección de los datos, y el manejo de la información, con especial énfasis en la protección de los derechos de privacidad y de datos personales.

El Estado y sus políticas públicas deben garantizar la soberanía de los datos como se garantiza la soberanía de las riquezas en el territorio nacional.

*Alfredo Moreno. Computador Científico. Profesor TIC en Universidad Nacional de Moreno. @ticdata2