Existe una gran confusión con estos dos puestos de trabajo. No hay dos páginas en Google que coincidan en la comparativa de estas dos profesiones. Es algo normal, pues el Data Scientist en su momento fue la única profesión dedicada al tratamiento de los datos, y actualmente se ha subdividido su trabajo en tantas profesiones, que es difícil distinguir quién hace qué.
Los roles del Data Scientist y el Data Analyst (o Analista Big Data) han evolucionado, por lo que vamos a ver qué impacto tienen estos cambios. Realizaremos una comparativa, donde no sólo veremos las diferencias genéricas entre ambos puestos, sino que también profundizaremos en puntos concretos como el laboral, las skills, tecnologías o capacidades analíticas.
Data Scientist vs Data Analyst. ¿Es una profesión mejor que la otra? ¿En cuál se cobra mejor? ¿Qué responsabilidades tienen? ¿Con qué herramientas trabajan? Te lo contamos
Si desconoces cómo son las profesiones de Data Scientist y de Data Analyst, te recomendamos primero que acudas a nuestros artículos donde te describimos cada profesión, qué funciones tiene, habilidades y responsabilidades:
¡Comenzamos!
Comparativa general
Como lo último que queremos es que pierdas el tiempo, en este primer apartado tienes resumidos los puntos más relevantes de la comparativa total, para que te hagas una idea de la diferencia entre ambas profesiones. Y en apartados posteriores desmigaremos más estos conceptos.
Lo primero que podemos apreciar gracias las áreas del diagrama es que el Científico de Datos tiene un perfil más completo que el del Analista de Datos. Tiene sentido pues el Data Analyst nació como una especialización del Data Scientist, más focalizada en la extracción de información útil, KPIs, y reporting.
El Data Scientist abarca una mayor cantidad de tecnologías a diferencia del Data Analyst, además de que posee también amplios conocimientos de Machine Learning. Laboralmente el Data Scientist cuenta con una pequeña ventaja, se trata de un perfil muy complejo y difícil de cubrir con la cantidad de ofertas de trabajo publicadas en la actualidad. Aun así, son dos profesiones con unas tasas de paro muy bajas.
¿Qué destacaríamos del Analista de Datos con respecto del Científico de Datos? Su conocimiento de negocio, capacidad analítica y de síntesis de información. El Analista de Datos se encarga de responder preguntas de negocio, de cara a poder tomar decisiones basadas en datos. Por ello tiene que dedicarle mucho tiempo a las unidades de negocio para entender sus necesidades y plasmar en un KPI, un reporte o un dashboard las respuestas e insights que obtiene de los datos, previamente tratados y organizados por un Data Engineer.
En cuanto a lo que es el trabajo con datos (Data Management), se han equiparado bastante ambas profesiones. Antes el Data Scientist era el que programaba y el Data Analyst el que trabajaba con Excel y SQL. Pero a día de hoy los dos necesitan dominar bien la limpieza de datos con Python y SQL y herramientas de visualización de datos. Lo mismo ocurre con las tecnologías Big Data, que siendo más técnicas y complejas que programar en Python o utilizar un Excel, las van a tener que manejar los dos (al mejos a nivel usuario), para poder acceder a datos masivos, que a día de hoy, los encontraremos en todas las empresas.
Aspecto | Data Scientist | Data Analyst |
---|---|---|
Salario | 40.000 € media en España* | 34.000 € media en España* |
Hard Skills | SQL, EDA, NoSQL, Programación, Visualización, Estadística, Big Data, Machine Learning | Business Intelligence, SQL, EDA, NoSQL, Programación, Visualización, Estadística, Big Data |
Soft Skills | Analítico, creativo, adaptabilidad tecnológica, innovador, coder | Comunicativo, analítico, creativo, inquisitivo, minucioso |
Responsabilidades | Modelos, optimización de procesos, puestas en producción, arquitectura de datos | Analíticas, dashboards, búsqueda de respuestas de negocio, calidad del dato. |
Herramientas | Python, pandas, sklearn, tensorflow, cloud, git, pycharm, VSCode, Spark, Hadoop | Power BI, Tableau, Python, pandas, Spark, SQL Server, MySQL, Jupyter Notebook, Hadoop |
Veamos ahora cada aspecto un poquito más en profundidad
NOTA sobre el diagrama de radar o de araña
El diagrama de Radar sirve para realizar una comparativa de dos ítems (Data Scientist y Data Analyst) respecto a varios aspectos (ejes de la gráfica), como por ejemplo el salario o conocimiento en matemáticas. Cuanto más alejado del eje se encuentra un aspecto a analizar, más potente será ese aspecto. Si el salario está cerca del eje quiere decir que el salario es bajo y si está alejado, todo lo contrario. A más salario, más distancia.
Ahora bien, hay aspectos que se leen al revés, como por ejemplo el nivel de entrada en el mercado laboral. Cuanto mayor sea el nivel, peor para el puesto de trabajo, pues más difícil será incorporarse al mercado laboral. Por tanto, en ese caso se leería al revés en el gráfico de radar. Cuanto más bajo el nivel de entrada, más alejado del eje en el gráfico, pues mejor es para el ítem.
De esta forma destacamos las fortalezas de cada aspecto. En conjunto se representa un área de un ítem respecto al otro, y visualmente se aprecie mejor la comparativa.
Aspecto Laboral
En este apartado vamos a analizar qué diferencia hay en las condiciones laborales de ambos empleos. Cómo es su salario, cuántos puestos se ofertan en el mercado, cuántas personas optan por esos puestos, condiciones generales (teletrabajo, horario flexible) y porcentaje de tiempo dedicado al desarrollo y a trabajar con datos vs tiempo dedicado al negocio.
En temas laborales lo cierto es que son dos perfiles de lo más similares. Las condiciones generales no cambian mucho. Son dos puestos técnicos, por lo que en general se suele dejar algo de teletrabajo, e incluso teletrabajo 100% pues para llevar a cabo su actividad no es estrictamente necesario acudir a una oficina. Aunque en ciertos momentos de los proyectos, como en la definición, ayuda bastante. La flexibilidad de horarios también suele ser lo normal pues no es un puesto con hoarrios fijos, como puede ser un profesor. Aunque como todo, dependerá de la empresa.
En cuanto al salario, no hay mucha diferencia, rondan los 30-40k. El Data Scientist suele ser algo superior debido a que tiene mayor conocimiento técnico, y la oferta de Data Scientist en el mercado es algo más reducida que la de Data Analyst. Esto también es debido a el alto nivel de entrada a mercado de un Científico de Datos en comparación con un Data Analyst. Lo que favorece que se incorporen más Data Analyst al mercado. Esto es bueno porque es más sencillo entrar, pero también malo a la vez ya que la competencia es superior. No obstante, de momento ambos son puestos muy demandados y lo seguirán siendo en el medio plazo, por lo que no es algo preocupante.
Normalmente ambos se van a pasar más tiempo desarrollando, que acudiendo a reuniones o definiendo procesos de negocio. El Data Analyst suele estar más pegado a la parte de negocio, obteniendo respuestas basándose en los datos. No es algo bueno, ni malo. Simplemente hemos cuantificado el ratio Tiempo dedicado al desarrollo vs tiempo dedicado al negocio.
Analítica
En este apartado vamos a ver qué tal se defienden el Data Scientist y el Data Analyst en matemáticas, estadística, predicción, visualización y técnicas avanzadas de analítica de datos. Estos conocimientos junto con unas buenas capacidades creativas, van a ser determinantes a la hora de buscar en los datos y desarrollar modelos e inferencias estadísticas robustas.
Aquí hay una gran diferencia entre ambos perfiles, y es que el Analista de Datos no necesita tener unos conocimientos en matemáticas muy avanzados, pues no va a trabajar con modelos de Machine Learning al mismo nivel que un Científico de Datos. Ahora bien, eso no quita para que el Data Analyst no tenga conocimientos sobre modelos, particularmente modelos de caja blanca como las regresiones lineales, ya que son muy útiles en la detección de patrones en los datos, así como con en predicciones.
Respecto a la estadística, ambos tienen un conocimiento parejo, siendo capaces de calcular estadísticos básicos como medias y varianzas, desarrollar un análisis exploratorio de datos y test de hipótesis, entre otros conceptos estadísticos.
En cuanto a las visualizaciones, el Data Analyst tendrá que presentar resultados y conclusiones sobre los datos con una mayor frecuencia que el Data Scientist. Por tanto, el Analista de Datos tiene que dominar muy bien la forma de realizar visualizaciones: que sean claras, que siempre sumen y sirvan de apoyo para la comprensión de los datos.
Manejo de Datos
¿Con qué tipo de datos trabaja cada uno? ¿Hay alguna diferencia en cómo trabajan con los datos? Sabemos que los profesionales de data se manejan muy bien con tablas, Excels y datos estructurados. Pero el problema viene cuando las Vs del Big Data entran en juego: volumen, velocidad y variedad.
No hemos incluido en este apartado los datos estructurados porque ya damos por hecho que tanto el Data Analyst como el Data Scientist se manejan bien con tablas. Nos hemos centrado en analizar la dificultad en el tratamiento de datos más complejos como es el caso de los no estructurados o real-time.
Comenzando con los datos semi-estructurados (archivos JSON o XML), formatos que a día de hoy son muy habituales de encontrar, y que por tanto no deberían suponer una dificultad para ninguno de los dos perfiles. Respecto a los datos no estructurados como imágenes o audio, aquí si existen diferencias. Pese a que hay una gran cantidad de información en estas fuentes, por lo general se utilizan en la predicción de modelos de Machine Learning. Por lo que mayormente es el Data Scientist el encargado de trabajar con este formato.
En cuanto a analíticas y EDAs (ya sea de para un modelo o para un dashboard) que hay que poner en producción, tendrán que servir ambos de apoyo a las unidades encargadas de las puestas en producción. Por lo que en ese sentido, tienen que desarrollar códigos de limpieza y tratamiento de datos lo más productivos posible, de forma que en la posterior subida, haya que tocar la menor cantidad de código. Normalmente sirven de apoyo, aunque en ocasiones el Científico de Datos adquiere un rol con mayor implicación debido a su conocimiento técnico.
Por último, en cuanto a datos en tiempo real, tanto el Data Analyst como el Data Scientist tendrán que saber cómo trabajar con esa temporalidad. No es lo normal, pero hay negocios que requieren del real time. Las tareas son casi las mismas, es decir, un dashboard de seguimiento, un modelo, etc… pero en este caso, en vez de tener una ventana temporal de un día o un mes, será de segundos o minutos.
Infraestructura de datos
Normalmente el trabajo de estos perfiles suele ser de desarrollo de software, analítica y presentación de resultados. Sin embargo, no siempre es así, y en ocasiones tienen que lidiar con puestas en producción, automatización de procesos y administración de la cloud, entre otros. Hablamos de tareas más técnicas, propias de un ingeniero de sistemas. Comparemos las diferencias entre ambos:
En la gráfica se aprecia claramente que el Data Scientist tiene un perfil mucho más técnico que el Data Analyst. El Data Analyst está mucho más pegado a negocio, por lo que no le suelen corresponder tareas de puesta en producción, que encajarían más con un perfil de Data Engineer, Cloud Engineer o Data Scientist.
¿Qué tienen en común? En primer lugar, el punto de redes (Networks). Y no es porque vayan a desplegar una VPN precisamente, sino que necesitan unos conocimientos básicos para acceder a las bases de datos, conectarse a un cliente FTP o acceder por SSH a un servidor. Y por otro lado, el punto de Data Pipelines, pues ambos van a tener que desarrollar transformaciones de datos, que acaben en producción. Quizá no les corresponda a ellos la puesta en pro, pero si se necesitará una colaboración estrecha.
Respecto al resto de puntos técnicos, desarrollo de APIs, administración del Cloud, pipelines de DevOps, contenedores y automatización de procesos, aquí si encontramos diferencias. Son tareas que le suelen recaer al Data Scientist, debido a que tiene un perfil más polivalente. Aunque no deberían ser el foco de su trabajo. Va a depender mucho de los miembros del equipo, de si hay un Machine Learning Engineer, Cloud Admin o Data Engineers.
Bases de datos
Para trabajar con los datos habrá que saber de dónde sacarlos. Aquí entra en juego las habilidades de cada perfil para trabajar con las bases de datos. Este punto se pasa muchas veces por alto, pero es fundamental tener unos conocimientos sólidos de bases de datos para evitar cuellos de botella, redundancias, e ineficiencias en los procesos.
El fuerte de estos perfiles es el acceso y consulta de los datos a las bases de datos. De la administración, despliegue y arquitectura se encargan otros perfiles.
Necesitan excelentes conocimientos de acceso a los datos. Y ya no solo SQL, para las bases de datos relacionales, sino NoSQL, trabajando con documentos, grafos, clave-valor o en sistemas de ficheros (muy habitual en algoritmos de IA).
Ni de la administración ni de la arquitectura de datos se deberían encargar. Sin embargo, el Data Analyst es posible que tenga que montar modelos de datos en las herramientas de BI, por lo que sí que va a necesitar ciertos conocimientos de modelado y diseño de bases de datos, aunque no a nivel de un Data Arquitect.
Respecto al despliegue, aquí si encontramos alguna diferencia. Lo normal es que no desplieguen nada, pero cabe la posibilidad de que el Data Scientist tenga que poner en producción alguna base de datos. ¿Por qué el Data Scientist? Como hemos comentado anteriormente, por tener mayor conocimiento técnico, y por la ausencia de un perfil específico para esta tarea como un Database Admin o un Cloud Admin.
Tecnologías y herramientas
Este apartado podría tener tantas características a analizar, que el diagrama de radar nos quedaría como un círculo. Por tanto, hemos seleccionado las más comunes y necesarias para que ambos perfiles puedan llevar a cabo su trabajo.
Como ves, están muy parejos. Ambos se solapan en una gran cantidad de tecnologías. Aun así, se aprecian algunas diferencias.
Tradicionalmente se ha dicho que el Data Analyst trabaja con Excel y analiza datos, mientras que el Data Scientist trabaja con Python, Machine Learning y Spark… Amigo, los tiempos han cambiado. Ahora ambos perfiles manejan herramientas similares, aunque el perfil del Data Scientist es un poco más complejo que el del Data Analyst.
Por ejemplo, con Git se manejan ambos, aunque tendrá un mayor peso en el Data Scientist, pues el Data Analyst trabaja mucho con DBMS y con herramientas de BI. En programación igual. Ambos programan, se manejan principalmente con Python, R o Java, pero el Data Scientist tiene un conocimiento más amplio de los lenguajes, lo que le permite desarrollar otras aplicaciones como modelos, APIS o automatización de procesos.
Respecto a las herramientas Big Data, si en la empresa hay datos masivos, tanto el Data Analyst como el Data Scientist están obligados a trabajar con este tipo de herramientas si quieren utilizar los datos. Por tanto, ambos necesitan conocimientos sólidos de Hadoop y Spark, o de la herramienta para trabajar con datos masivos de la compañía. Ya no existe tanta diferencia en referencia a este aspecto.
En cuanto a entornos de desarrollo (IDE). Es muy probable que el Analista de Datos no toque un entorno como Pycharm o Visual Studio. Trabajarán con herramientas de BI, Excel o notebooks de Jupyter. Es cierto que el Científico de Datos programa mucho también con los notebooks de Jupyter, pero tiene un conocimiento más amplio de Python, lo que le permite el desarrolo de otras aplicaciones como comentábamos anteriormente en IDEs tipo Pycharm/VSCode.
Finalmente, en cuanto a consultas de bases de datos, herramientas de Data Governance y manejo de cloud a nivel usuario, no hay mucha diferencia entre ambos. Los dos necesitan realizar queries, ambos se ocupan en cierta medida de la calidad, redundancia, acceso y seguridad de los datos (servirán de apoyo al Data Governance) y ambos necesitan conocimientos básicos a nivel usuario para manejarse por un portal Cloud.
Machine Learning
Cuando hablamos de Machine Learning, no nos quedemos en Inteligencia Artificial, Chatgpt o “Yo, Robot”. Seamos realistas, las empresas utilizan la estadística inferencial que le aportan los modelos, para apoyar sus decisiones con sus outputs. Y por norma general son modelos sencillos de caja blanca como regresiones lineales, árboles de decisión o algoritmos de ensemble como Random Forest.
Lo cierto es que en este apartado lo tenemos fácil, pues gana el Data Scientist por goleada. Es normal, pues históricamente han sido los encargados de los modelos, aunque con el tiempo y las nuevas especializaciones, a esto se le ha empezado a llamar Machine Learning Engineer. Aunque sobre esta discusión tenemos para otro artículo.
Cabe destacar que el Data Analyst sí necesita ciertos conocimientos en modelos supervisados y no supervisados, que le permiten por un lado realizar predicciones y proyecciones mediante modelos sencillos, y por otro utilizar algoritmos de clustering para segmentar clientes. Aun así, desarrollar modelos no debería ser el foco de su trabajo.
Responsabilidades
Hasta ahora hemos visto con qué va a trabajar el Data Scientist o Data analyst, los conocimientos que necesita y herramientas, pero todavía no hemos comentado cuál es su día a día, sus funciones y objetivos. Veamos una comparación de las responsabilidades de cada uno.
Si analizamos por encima el gráfico, vemos que el Científico de Datos se centra más en la tecnología, matemáticas y modelos, mientras que el Analista de Datos está más enfocado en los datos en sí, en cómo preparalos, responder preguntas, como extraer insights, sintetizarlos y asegurarse de que sean de calidad.
El Data Analyst va a dedicarle una gran cantidad de tiempo a preparar los datos, agregarlos y presentarlos para responder preguntas de negocio. Para ello se apoyará fuertemente en las bases de datos, programación con Python y herramientas de visualización como Power BI. Además, tendrá que asegurarse de que todo el trabajo está hecho correctamente, comprobando que los datos de diferentes fuentes cuadran, y que los procesos automáticos funcionaron bien, de tal forma que se pueda confirmar la veracidad de sus conclusiones.
En cuanto al Data Scientist, tiene un perfil más técnico, más a alto nivel, y no trata tanto con las unidades de negocio. A diferencia con el Data Analyst tendrá que dedicarle un parte de su tiempo a la optimización de procesos, puesta en producción de productos de datos como los modelos y al desarrollo de los propios modelos de Machine Learning. Además, será el responsable del estudio de técnicas y tecnologías para la mejora de los proyectos de data de la empresa.
Skills
Realmente este es un apartado en cierto modo resumen del resto, pero muy clarificador para conocer las competencias de cada uno. Cabe destacar que aquí no hemos incluido las típicas skills de este tipo de puestos como trabajo en equipo, resolución de problemas, resiliencia, creatividad, colaboración, etc. Las damos por sabidas 😉
Como se puede apreciar en el gráfico, no se aprecia gran diferencia en ambos perfiles, solapándose en muchos puntos.
El Data Scientist es por lo general un perfil más complejo, senior, y que habitualmente abarca más conocimiento. ¿Esto significa que tendrá mejores skills que el Data Analyst? Lo cierto es que no. Recuerda que en este apartado hablaremos de las soft skills, no de las hard skills. Son perfiles técnicos, que trabajan con datos y utilizan la programación para optimizar y automatizar sus procesos, por lo que las skills no tienen que ser muy diferentes.
Entonces, ¿en qué los podemos diferenciar? Mientras que el Data Scientist tiene una mente más cuadriculada que le sirve para programar con gran destreza, el Data Analyst tiene unas capacidades de síntesis y comunicativas superiores, al tener que traducir un maremagnum de datos en 1 numero o una gráfica que lo clarifique todo. Por otro lado el Data Scientist tiene un putito más de creatividad respecto al Data Analyst, ya que lo necesita para exprimir los datos, y dar con la técnica adecuada para el desarrollo de los modelos.
En cuanto al conocimiento de campo, ambos tienen que ser expertos. Tanto el Data Analyst para resolver preguntas de negocio, como el Data Scientist para tener criterio con las variables de los modelos. Aún así, le vamos a dar la medalla al Data Analyst, pues es un perfil muy cercano a los equipos de negocio y comprende mejor sus necesidades.
En resumen, son dos profesionales muy cualificados, técnicos, analíticos y ambos encargados se extraer valor de los datos para poder responder preguntas de negocio. El Data Scientist es un perfil algo más senior con respecto al Data Analyst, pues abarca más responsabilidades y tiene un mayor dominio de la tecnología y el Machine Learning. Por fortuna son dos puestos de trabajo con un salario correcto, bastante demandados en el mercado y que de momento la competencia es relativamente moderada, aunque tenderá a aumentar con los años, particularmente en el caso del Data Analyst. ¡Sin duda muy buenas opciones para trabajar en proyectos punteros de datos!
FAQ
*Salario según Glassdor en España