¿Cómo es un día típico en el trabajo para un científico de datos de nivel básico?

Supongo que, como la mayoría de los trabajos en el mundo, hay una cantidad abrumadora de cosas que aprender como Data Scientist en el nivel de entrada. Cuando comencé mi trabajo como DS, lo primero que hice fue aprender R. Luego comencé a implementar los algoritmos para mi proyecto y las cosas parecieron ir bien. Sin embargo, rápidamente me di cuenta de que no es suficiente que un DS conozca algunos algoritmos y cómo implementarlos. Debe aprender y desarrollar una comprensión profunda del negocio de su empresa, y convertirse en un buen narrador de los datos que obtiene. Los resultados de su algoritmo son inútiles si no pueden dar a las personas información sobre cómo están sucediendo las cosas y qué se debe hacer a continuación. Aprender cómo funciona la infraestructura de datos de mi empresa también fue un gran desafío para mí.

Como muchas personas ya han dicho, la ciencia de datos sigue siendo un concepto nuevo y relativamente vago. Los requisitos para el trabajo de Data Scientist pueden variar mucho en diferentes compañías. Es importante aprender cosas que puedan servir al propósito de su empresa.

En cualquier día, se puede requerir que un científico de datos:

  • Realizar investigaciones no dirigidas y formular preguntas abiertas a la industria
  • Extrae grandes volúmenes de datos de múltiples fuentes internas y externas.
  • Emplee sofisticados programas de análisis, aprendizaje automático y métodos estadísticos para preparar datos para su uso en modelos predictivos y prescriptivos.
  • Limpie y pode a fondo los datos para descartar información irrelevante
  • Explore y examine datos desde una variedad de ángulos para determinar las debilidades, tendencias y / u oportunidades ocultas.
  • Diseñe soluciones basadas en datos para los desafíos más apremiantes.
  • Inventar nuevos algoritmos para resolver problemas y crear nuevas herramientas para automatizar el trabajo.
  • Comunique predicciones y hallazgos a los departamentos de administración y TI a través de visualizaciones e informes efectivos
  • Recomendar cambios rentables en los procedimientos y estrategias existentes.

Cada empresa tendrá una visión diferente de las tareas laborales. Algunos tratan a sus científicos de datos como analistas de datos glorificados o combinan sus deberes con ingenieros de datos; otros necesitan expertos en análisis de alto nivel capacitados en aprendizaje automático intenso y visualizaciones de datos.

A medida que los científicos de datos alcanzan nuevos niveles de experiencia o cambian de trabajo, sus responsabilidades cambian invariablemente. Por ejemplo, una persona que trabaja sola en una empresa mediana puede pasar una buena parte del día en la limpieza de datos y munging. Se le puede pedir a un empleado de alto nivel en una empresa que ofrece servicios basados ​​en datos que estructurar proyectos de big data o crear nuevos productos.

La ciencia de datos es una amalgama de comprensión empresarial adecuada, matemáticas, estadísticas, programación y habilidades de comunicación. Por lo tanto, se espera que uno muestre todas las habilidades mencionadas anteriormente en el papel de un científico de datos.

Se espera que un científico de datos comprenda el problema comercial, construya una hipótesis, comprenda el tipo de datos requeridos, realice la limpieza de datos y el análisis preliminar de datos, construya modelos estadísticos para dar solución y finalmente comunicar de manera efectiva las ideas al cliente. Por lo tanto, el trabajo de un científico de datos abarca varios roles y funciones.

En la escuela GreyAtom, alineamos la educación con la realidad . GreyAtom se enfoca en crear ingenieros de ciencia de datos de Full Stack y le brinda todas las herramientas, técnicas y conceptos básicos necesarios para generar un impacto. En solo 14 semanas, aplicará la resolución de problemas y el pensamiento creativo a conjuntos de datos del mundo real, ganando experiencia en toda la pila de ciencia de datos.

Tendrá un historial de contribuciones de código abierto y ayudará a la comunidad más amplia de ingeniería de software (a través de Github, StackOverflow, un blog o similar).

Puede consultar los detalles del curso haciendo clic en este enlace Full Stack Data Science Engineering | Greyatom

Los datos realmente impulsan todo lo que hacemos. Si le apasiona la ciencia de datos y desea redefinir su carrera, visítenos en el programa en el sitio de GreyAtom: ciencia de datos, aprendizaje automático, Big Data

Creemos en “Datos reales – Industria real – Socios de reclutamiento reales – Real Office (Classroom)”

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudar a las personas a encontrar carreras sostenibles en Data Science es mi pasión.

Esta no es una posición bien definida en sí misma, sino más bien un título que describe un conjunto de habilidades. La mayoría de las personas que encontrará con el título de científico de datos se auto-titulan, se definen como una palabra de moda, o simplemente son un ingeniero de software experimentado de alto nivel u otro empleado de nivel de fuerza laboral con una comprensión e intersección de habilidades mucho mayor. Alguien con el conjunto de habilidades de un científico de datos cruza 4 límites principales: perspicacia de programación / ingeniería, conocimiento de dominio, estadísticas y arquitectura de datos.

Un “científico de datos” es un nuevo trabajo que se ha inventado desde la revolución de “Big Data”. Tuvimos una presentación de una conocida empresa de análisis y el profesor que trabajó con Data, que fue muy exitoso, explicó cómo el 90% de los trabajos de “Data Scientist” había visto publicidad para un Data Scientist que no cumplía con los requisitos, ya que variado.

El problema es que todos tienen su propia interacción de un “Científico de datos”. Por su parte, Analista de negocios, Desarrollador técnico, Dev Ops, Estadístico, Matemático, idealmente una mezcla de roles en un equipo para cubrir la “Ciencia de datos”.

Tan desafortunadamente como el papel es ambiguo, no puedo dar una respuesta sólida, tal vez cuál es el día típico para un estadístico … pero incluso así las respuestas serían muy variadas …

Me preguntaste sobre un día típico, así que intentaré describir uno de los míos.

Deberá dedicar al menos el 40% de su tiempo a mejorarse y aprender o adquirir nuevas habilidades. Algunos de ellos son programación, estadísticas y conocimiento de dominio. Puedes usar Coursera, Edx o Udacity para ello y también leer algunos libros.

No olvides que no hay un “yo” en Data Science. Es un trabajo en equipo. Por lo tanto, sugiero gastar también del 10 al 15% de su programa diario en proyectos de código abierto o ser voluntario en otras organizaciones. Esto mejorará tus habilidades para trabajar en equipo y alcanzar fechas límite.

Luego, dividiría la mitad del resto en los sitios de StackaExchange, como el desbordamiento de la pila y la ciencia de los datos al leer y responder preguntas. La otra mitad estaría en Kaggle, tratando de mejorar mis presentaciones en competiciones.

En caso de que encuentre un trabajo diario o de medio tiempo más tarde, no dejaría algo de arriba, pero lo haría a todos a un ritmo menor.