Blog

Empresas

Roles que puedes desempeñar en Ciencia de Datos

Roles que puedes desempeñar en Ciencia de Datos (o Data Science)

Términos como Data Science, Inteligencia Artificial, redes neuronales, Big Data, Machine Learning y demás han estado en boca de todos los segmentos económicos durante últimos años. Y no es para menos, actualmente economías muy diversas tienen en común el uso de los datos para traer beneficios ya sean económicos o estratégicos.

Aunque para algunos las ciencias de datos suenan a ciencia ficción, la realidad es que su aplicación es más común de lo que crees. Por ejemplo en la industria de alimentos, se usan las ciencias de datos para optimizar el manejo de insumo en el procesamiento de alimentos. La industria cinematográfica tiene un gran aliado con los datos porque conocen nuestros gustos y pueden crear contenidos similares. Por su lado los bancos y la empresas de seguros crean modelos de evaluación de riesgos, detección de fraude o creación de nuevos productos financieros orientados a mercados específicos; y por supuesto, la industria tecnológica, en donde distintas startups dejan su crecimiento en manos de los datos.

Ahora bien, si el Data Science es la disciplina encargada de crear valor con los datos, el data scientist (científico de datos) es la persona encargada de llevar esto a cabo con fuertes conocimientos en programación, conocimiento del negocio y habilidades matemáticas.

A menudo se dice que un data scientist debe tener conocimientos en SQL, Python, R, estadística, álgebra, cálculo multivariable, web scraping, docker, computación en la nube, machine learning, deep learning, visualización de datos, pensamiento estrategico, etc. En resumen, si un data scientist luchara contra el crimen, sería algo asi como Batman.

batman4.jpg

A medida que crecía la demanda, las industrias empezaron a notar que conseguir una persona con fuertes conocimientos en matematicas, programación y negocio era una tarea demasiado complicada. ¿Dónde conseguir un perfil con estas características? Primero, conozcamos los roles y características de los perfiles en ciencias de datos.

Roles de un data scientist

Está bien saber todo lo que mencionamos anteriormente pero la realidad en el campo laboral es que las empresas empezaron a aprender que se necesitan personas que sepan solo una parte. Como consecuencia se han ido consolidando distintas disciplinas o roles para solucionar los problemas a la medida.

Estos roles están ligados a las 3 grandes ramas que trabaja el data scientist:

Matemáticas, Programación y Manejo de negocio (Encontrarás al menos 50 versiones de este diagrama de venn)

venn.png

Data Analysts o Analistas de Datos

Un analista de datos es la persona que a través del entendimiento e interpretación de datos optimiza la toma de decisiones y estrategias de una empresa.

Consideramos que el perfil de business intelligence (inteligencia de negocios) está sobrepuesto en el perfil del analista. Las personas más afines con este perfil provienen de carreras como economía y ciencias puras como estadística o matemáticas.

Los analistas de datos tienen las habilidades suficientes para extraer y consultar datos. Suelen usar lenguajes tipo SQL y python para procesar y tabular datos. Sus bases en matemáticas y estadística son muy sólidas, esto permite que sus análisis exploratorios y predictivos sean muy asertivos, incluso mejor que aquellos perfiles especializados solo en inteligencia de negocios.

Los analistas de datos dominan diferentes metodologías de análisis y minado de datos incluyendo métodos básicos de ML (Machine Learning) para extraer insights (ideas importantes) y usarlos en toma de decisiones.

La presentación de los resultados encontrados es una área dónde la capacidad creativa y de visualización es extremadamente valorada; en general la visualización abarca un área densa en dónde simplificar las conclusiones e interpretarlas para crear reportes se vuelve esencial para la toma de decisiones de cualquier compañía.

En esta línea profesional la máxima habilidad es aquella de transformar la información para hacerla comprensible y fácil de entender, en sí ser un excelente “storyteller”. De esta forma en negocios los datos se transforman en la mayor autoridad a la hora de tomar decisiones, para muchos analistas el storytelling se considera un arte de la persuasión en época de la transformación digital.

Data Engineers o Ingenieros de Datos

Un perfil afín para aquellas personas que tienen disciplinas base como ingeniería informática o de software es el de data engineer. El ingeniero de datos es una persona con fuertes conocimientos en arquitectura de datos, programación estructurada, programación orientada a objetos, manejo de bases de datos SQL y NoSQL, BI, manejo de cloud computing (PaaS,SaaS), modelamiento en bases de datos transaccionales o data warehouse, manejo de ETL, y procesamiento de grandes volúmenes de datos con big data.Esta persona es la encargada de la recolección, filtrado, limpieza, persistencia y presentación de los distintos repositorios de datos útiles para la organización.

Usando distintas técnicas el data engineer garantiza el acceso a la información para otros perfiles como ML engineer o data analyst o incluso para alimentar dashboards o distintos canales de presentación de datos y así entregar valor a la organización.

Uno de los retos más grandes de este rol es poder recibir, procesar , almacenar y entregar la basta cantidad de datos que se procesan actualmente en esta economía, cabe resaltar que esta cantidad tiene un crecimiento exponencial año tras año y para ello el data engineer debe recurrir a técnicas de procesamiento de Big data y modelos como map reduce para sacarle el mayor provecho a los datos.

La tarea de un data engineer en el mundo de data science es vital, en cualquier modelo de datos o análisis existe un dicho, “Si basura entra, basura sale” y es el trabajo del data engineer garantizar que el insumo de datos para cualquier análisis tenga desde su origen el mayor valor posible; mejorar día a día los modelos de procesamiento de datos es una tarea de inmenso valor para la humanidad. Ejemplo de ello son las redes neuronales, este concepto data de los años 50, pero no fue hasta que la capacidad de procesamiento llegó a niveles como los que conocemos actualmente que se logró aprovechar el valor de esta tecnología y aplicarlo en diversas áreas de la sociedad.

Machine Learning Engineers (también conocidos como ML Engineers)

Este es probablemente el perfil más afín para personas que vienen de la academia (especialmente de las ciencias naturales como Matemáticas y Física o de carreras como Ciencias de la computación) y que tienen un conocimiento sólido tanto en matemáticas como en programación, de esta manera tiene la capacidad no solo de consumir modelos de Machine Learning pre-construidos sino también de entender la manera como el modelo funciona por dentro.

Los profesionales más avanzados dentro de este perfil eventualmente tienen la capacidad de proponer sus propios modelos y crear nuevos paradigmas de modelamiento y algoritmos de aprendizaje.

En la industria existen muchos profesionales que son buenos implementando modelos y entrenando redes neuronales para tareas específicas, pero caen en el problema de que no siempre tienen claro porque funciona un modelo para situaciones específicas, esto ha creado una creciente preocupación en la industria porque no se pueden interpretar los resultados de un modelo con el detalle que una decisión de negocio requiere.

Es por eso, que este perfil debe ser para alguien que tiene tanto la capacidad de implementar como de entender un modelo de Machine Learning. Un Machine Learning engineer avanzado tiene un conocimiento suficiente de Deep Learning o aprendizaje profundo que es un conjunto de algoritmos de Machine Learning que están basados en arquitecturas de Redes Neuronales.

¿Que puede hacer un ML Engineer en la industria? En general, un profesional con este perfil puede diseñar y construir algoritmos con la capacidad de identificar patrones a partir de ciertos conjuntos de datos, patrones que pueden ser usados para generar recomendaciones como sucede con Netflix o Spotify, para clasificar objetos en imágenes cómo se usa en los sistemas de vigilancia de hoy en día, o incluso para identificar ideas principales o significados en cadenas de texto, como sucede con los chatbots o asistentes virtuales tipo Siri o Alexa.

Dentro de este perfil, el Deep Learning es una de las áreas de conocimiento más atractivas por los recientes avances que se han logrado en materia de investigación dirigida a inteligencia artificial. Los avances en esta área han permitido construir sistemas de navegación para autos autónomos, modelos de predicción en Economía y finanzas mucho más precisos y versátiles, algoritmos que pueden identificar tumores malignos en imágenes diagnósticas, sistemas de traducción automáticos o que convierten voz a texto y viceversa.

Aún más, las arquitecturas de redes neuronales más sofisticadas y recientes son capaces de crear música, texto, imágenes y videos que parecen reales, a un nivel que incluso ha generado preocupaciones respecto a las implicaciones éticas de estos desarrollos.

Nota de @alarcon7a para Platzi

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *