¿Cómo deberían comenzar los estudiantes de primer año como científicos de datos?

El aprendizaje:-

La base de la ciencia de datos

Soy un firme creyente del dicho. “Más profundas las raíces, más altos crecen los árboles”. Matemáticas, estadísticas y programación forman la base de la ciencia de datos. Por lo tanto, a menudo se recomienda conocer estos temas en profundidad para formar una base sólida. Los temas que debe cubrir en la fundación se enumeran a continuación:

Fundación

  • Python Básico, Intermedio y Avanzado
  • Estadística, probabilidad y álgebra lineal
  • Regresión lineal, series de tiempo y función de costo
  • Tipos de datos y análisis exploratorio de datos
  • Recopilación, extracción, consulta, limpieza y agregación de datos para análisis
  • Fuentes de datos, limpieza y disputas
  • Trabajando con API
  • Raspado web

Esto lo ayudará a aprender los temas avanzados de la ciencia de datos más rápido y en profundidad. Una vez que tenga un conocimiento profundo de estos temas, su comprensión de los conceptos se vuelve flexible. Le recomendaría que eche un vistazo a los temas avanzados.

Avanzado

  • Árboles de decisión, árboles condicionales
  • Técnicas de conjunto
  • Big Data y Hadoop Ecosystem y Spark
  • Arquitectura HDFS
  • Colmena QL
  • Cerdo
  • Cuentacuentos con datos
  • Cuadro
  • Bayes ingenuos
  • PNL / Agrupación de texto / NLTK
  • Implementación de productos de Data Science

Siempre recomendaría a los aspirantes de ciencia de datos que asistan a un programa basado en el aula, dirigido por un instructor y orientado a la práctica. Te encontrarás con muchas instituciones, cursos y programas que te ayudarán a aprender ciencia de datos. Algunos son muy caros, mientras que otros son razonables. Pero, una cosa muy importante a tener en cuenta mientras se inscribe en dichos cursos es saber su valor en términos de conocimiento y lo que al final del curso está desarrollando dentro de usted mismo.

Y en mi opinión, las certificaciones son una prueba de que ha completado un curso o un programa y no una prueba de lo que ha hecho. ¡Debes haber leído muchos artículos sobre desempleo educado o incluso haber encontrado algunas experiencias personales en las que muchos estudiantes tienen una maestría pero aún no tienen trabajo!

Algunos puntos a considerar al elegir una institución / curso

  • El énfasis está más en la práctica y no solo en la teoría.
  • El proyecto se basa en enunciados de problemas relevantes de la industria y no en las tareas antiguas
  • Los Aprendizajes y Proyectos son colaborativos y se realizan en equipos.
  • Obtiene herramientas reales de la industria y se enfoca en el desarrollo basado en pruebas

Búsqueda de trabajo:-

La mayoría de las veces me encuentro con preguntas de los jóvenes sobre el empleo. Especialmente en el campo de la ciencia de datos. Bueno, personalmente, no es tan difícil. Dado que hay una escasez de Data Scientist en el campo, veo más trabajos disponibles pronto. Creo que la mayoría de las cosas buenas nos suceden cuando estamos en el lugar correcto en el momento correcto. Hay muchas reuniones de ciencia de datos que le brindan la oportunidad de interactuar y establecer relaciones con otros profesionales de la ciencia de datos. Estos pueden ser útiles para usted, ya que tienen más experiencia y un consejo práctico. No confíes demasiado en la educación formal. Solicita una pasantía mientras estudias, podría darte una buena exposición.

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes crearon proyectos a partir de conjuntos de datos REALES y declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y está fuertemente orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.

Algunos enlaces rápidos

  • Programa – http://www.greyatom.com/full-sta…
  • Chatee con un consejero académico: le invitamos a compartir todas sus dudas e inseguridades, a las que haremos todo lo posible para guiarlo hacia su camino profesional hacia el éxito. https://calendly.com/greyatom/co…

Tienes que estudiar mucho para comenzar tu carrera como científico de datos, pero no es imposible.

A partir de ahora, haga una rutina y sígala diariamente. Lea al menos 3 a 4 horas diarias durante 6 meses y lea sobre Data Scientist, sus requisitos de habilidades y responsabilidades para que pueda tener una idea sobre ellos y comenzar a seguir el camino en el que trabaja Data Scientist.

Comience a aprender Machine learning, R, Python, etc.

Un científico de datos plantea preguntas y agrega valor, así que comience a pensar como ellos. Siempre trata de pensar diferente.

Ahora leamos sobre el científico de datos, sus roles y habilidades, etc.

Un científico de datos es el trabajo más sexy del siglo XXI. Un científico de datos es mejor estadístico que cualquier ingeniero de software y mejor ingeniero en comparación con cualquier estadístico.

Veamos una infografía a continuación para desmitificar a Data Scientist:

Así que veamos las habilidades más valiosas para aprender para un científico de datos.

  • Conocimiento profundo de la codificación Python. Es el lenguaje más común, incluido Perl, Ruby, etc.
  • Conocimiento sólido de SAS / R Es necesario que el científico de datos pueda trabajar con datos no estructurados. Ya sea que provenga de videos, redes sociales, etc.
  • Habilidad de sonido en la codificación de bases de datos SQL.
  • Data Scientist debe tener una buena comprensión de varias funciones analíticas. Por ejemplo rango, mediana, etc.
  • Se requiere un conocimiento profundo del aprendizaje automático.
  • Un científico de datos debe estar familiarizado con Hive , mahout, redes bayesianas , etc. En ciencia de datos, el conocimiento de MySQL es como una ventaja adicional.

Ahora veamos las responsabilidades de Data Scientist, de acuerdo con las responsabilidades que puede juzgar usted mismo que puede administrar esos roles o no, y si no, intente agregar esas habilidades en usted mismo.

Responsabilidades de un científico de datos

  • Limpieza y procesamiento de datos.
  • Predicción del problema empresarial.
  • Sus roles son dar resultados futuros de ese negocio.
  • Desarrollar modelos de aprendizaje automático y métodos analíticos.
  • Encuentre nuevas preguntas comerciales que luego puedan agregar valor al negocio. Minería de datos utilizando métodos de vanguardia.
  • Presentar resultados de manera clara y hacer el análisis ad-hoc.

Para saber más sobre las habilidades y roles de Data Scientist, consulte el siguiente enlace: Habilidades necesarias para convertirse en Data Scientist

Data Science es la combinación de estadísticas, matemáticas, programación, resolución de problemas, captura de datos de manera creativa, la capacidad de ver las cosas de manera diferente y la actividad de limpiar, preparar y alinear los datos.

Para los graduados más avanzados en ingeniería o matemáticas / estadísticas, el enfoque se centra más en la resolución de problemas analíticos y la exposición a algún lenguaje de programación. Y luego pueden postularse a las empresas de análisis, ya sea a través de ubicaciones en el campus o unidades de colocación fuera del campus, y tratar de acertar en su proceso de entrevista.

La capacitación en ciencia de datos de habilidades de TI se ha estructurado para aquellos que desean desarrollar los conocimientos y habilidades avanzados necesarios para trabajar como científicos de datos. Obtenga su certificación de ciencia de datos y destaque, ya sea que esté buscando cambiar de trabajo, obtener una promoción o mejorar sus habilidades actuales.

En el programa de certificación de ciencia de datos, obtendrá habilidades en gestión de big data, análisis avanzado, aprendizaje automático y visualización de datos, junto con las habilidades de comunicación esenciales que necesitan los científicos de datos de hoy.

El papel de un científico de datos ya se ha ganado el apodo de “el trabajo más sexy del siglo XXI”. Según un informe del Instituto Global Mckinsey [, habrá una escasez de 140,000 a 190,000 profesionales de la ciencia de datos para 2018 solo en EE. UU.

En lo que respecta a la India, hay algunos estudios que creen que la industria de análisis / ciencia de datos en la India se encuentra en una fase en la que TI estuvo hace unos 10-15 años y, por lo tanto, se puede esperar un auge en la externalización de análisis a la India.

También creo que India con su grupo de talentos de ciencia de datos / análisis puede muy bien ser el líder en esta industria. Ya hay algunas historias de éxito como Mu Sigma y Fractal analytics. Además, ahora estamos viviendo oficialmente en la era del “Big Data”.