Aunque sus orígenes datan de 1970, no fue hasta cerca de 1990 cuando, con el auge de internet, comenzó a popularizarse. Hablamos de la Ingeniería de datos, una disciplina que está ampliamente extendida en el mundo, incluso en Argentina, y de la cual cada vez más empresas y corporaciones de diferentes rubros se nutren para llevar adelante las más adecuadas tomas de decisiones.

Comprende lo relativo al desarrollo, la implementación y el mantenimiento de los sistemas. Está altamente ligada a la ciencia de datos y aplica a cualquier empresa que quiera trabajar con datos.

Respecto de esta disciplina opinó Aldo Escobar, ingeniero en datos. El especialista enumeró las ventajas de su uso y alentó a las empresas que no la usan a hacerlo ya que, de acuerdo a su experiencia y conocimiento, “les permitirá ser más competitivas”.

“Todo proceso de Ingeniería de datos implica la toma de datos ‘crudos’ (sin procesar), los cuales van a producir información consistente que va a permitir la toma de decisiones (análisis de datos) y también la generación de modelos de machine learning (ciencia de desarrollo de algoritmos y modelos estadísticos que utilizan los sistemas de computación con el fin de llevar a cabo tareas sin instrucciones explícitas)”, explicó Escobar.

De acuerdo a lo expresado por el ingeniero, “la disciplina sirve para diferentes propósitos, pero especialmente para enriquecer, mejorar los modelos de machine learning existentes, que se ajusten mejor a la realidad, y también permite mejores tomas de decisiones”.

La ingeniería de datos aplica a cualquier empresa que quiera trabajar con datos, desde bancos hasta aplicaciones. “En cualquier empresa que genere datos uno ya puede en mayor o menor escala, hacer ingeniería de datos”, comentó, y añadió: “Es infinita la cantidad de casos de usos de la ingeniería de datos en relación a la industria y a tecnologías que generan información”.

Un poco de historia

El nacimiento de la disciplina se remonta a 1970, cuando empezaron a aparecer los primeros formatos de almacenamiento. Ya hacia la década del 80 comienzan a adquirir un formato más industrial, lo que da lugar a la aparición del término “almacenes de datos”. “El lenguaje que se utiliza, SQL, sigue siendo hasta hoy la lengua nativa de los datos y es la forma de pedirles a los motores de base de datos información respecto a los almacenes de datos”, indicó Esobar.

Este gráfico expresa los bajos costos de almacenar en cloud. Fuente: https://ourworldindata.org/grapher/historical-cost-of-computer-memory-and-storage

Posteriormente, recordó: “Con el paso del tiempo surgieron empresas como Oracle, hacia los 90, que empezó a popularizar este tipo de tecnología. Más tarde, con el auge de internet, comienza a hablarse de procesamiento de datos a gran escala. Desde ese momento, el crecimiento comenzó a ser exponencial, lo que llevo a la necesidad de contar con tecnologías más sofisticadas, es decir, los sistemas ya no solamente van a correr en una máquina, sino que van a empezar a necesitar cluster de máquinas y ahí es donde prima la importancia de lo que es el cloud (ofrecen recursos de computación, de almacenamiento y de red por Internet, lo que permite a las empresas acceder a recursos bajo demanda compartidos en función de sus requisitos únicos y de sus objetivos empresariales)”.

Según Escobar, el surgimiento del cloud fue altamente positivo “porque desde sus comienzos facilitó enormemente el trabajo de hacer procesamientos a gran escala y que la ingeniería de datos sea una disciplina más fácil que en años anteriores”.

Qué aportes hace la Ingeniería de datos

En este sentido, el profesional explicó que “puede generar organización en la estructura de datos, desde los más crudos hasta los más procesados; permite la validación de los datos en cada pasaje. Todo aquello que tenga que ver con principios de ingeniería de software que puedan aplicarse a soluciones de datos es algo que ayuda a que los sistemas sean más fáciles de mantener en el tiempo y que pueda escalar a las necesidades de los clientes de manera más fácil que sin seguir ‘las buenas prácticas’”.

Al respecto, añadió que contratar un ingeniero de datos tiene que ver con que las soluciones de datos puedan escalar, sean más fáciles de mantener y atender las necesidades de los clientes de manera más íntegra. “Esto facilita la visibilidad a la gerencia respecto de cómo los datos viajan a través de las distintas etapas hasta convertirse en información que luego es usada para la toma de decisiones o también información que usan los científicos de datos para la generación de los modelos de machine leargning”, resaltó.  

Su aplicación en Argentina

Para concluir, Escobar destacó que su uso está “ampliamente extendido”. Y valoró: “Hay muchas empresas haciendo ingenieria de datos, sean consultoras o no. Las grandes empresas lo están haciendo porque adoptaron este tipo de cultura en su core y luego cada start up empieza con una aplicacio funcional y luego surge la necesidad de contar con una plataforma de datos que permita la toma de deciones, como también la incorporación de modelos de machine learning en el core de sus aplicaciones