¿Cómo me convierto en un científico de datos? ¿Cuál es la capacitación necesaria?

En mi experiencia con los aspirantes de Data Science en los últimos meses, me he dado cuenta de que no hay un método específico o una hoja de ruta para convertirse en un científico de datos. Data Science es un vasto campo. He visto un rango dinámico de personas que provienen de diferentes antecedentes, con diferentes experiencias y diferentes conjuntos de habilidades que se convierten en científicos de datos exitosos. Quiero decir que hay un estudiante que conocí que abandonó la universidad y, por otro lado, también había un vicepresidente de ventas con 18 años de experiencia.

Sin embargo, hay algunas cosas que querrás tener en cuenta, no te daría una lista de verificación, pero sí, algunos de mis aprendizajes de mi experiencia al entrenar a mis estudiantes.

“Más profundas las raíces, más altos crecen los árboles”

Creo firmemente en esto. Entonces, primero tenemos que descubrir cuál es la base de Data Science. Una vez que fortalezcamos nuestros conceptos básicos, creo que habremos logrado el 40% de nuestro viaje. ¿Cuáles son los principios básicos de la ciencia de datos? La programación, el álgebra lineal y la estadística son la base de la ciencia de datos. Su nivel de comodidad con estos temas determina su elegibilidad para convertirse en Data Scientist. Por supuesto, esto no significa que implique un título formal en estas materias, sino qué tan bueno es con eso.

Siempre admiro a Anand Jain, quien fue cofundador y CTO de Burrp, que fue adquirido por Network18 en abril de 2009 y ahora es el cofundador de CleverTap, que ofrece análisis de comportamiento, potente segmentación en tiempo real, mensajería multicanal y personalización en uno plataforma unificada Anand Jain no tiene experiencia en ingeniería y sigue siendo tan exitoso como cualquier otra persona.

¿Qué cubrir en Programación y Estadística?

Cuando se trata de lenguaje de programación, hay mucho debate sobre Python vs R. Ambos lenguajes tienen sus propios pros y contras. Personalmente, recomendaría Python ya que es un lenguaje multipropósito general y tiene muchas bibliotecas de visualización como Bokeh, Seaborn y Pygal.

  • Importar datos en Python
  • Fundación Pandas
  • Caja de herramientas de ciencia de datos de Python
  • Bases de datos en Python
  • Visualización de datos con Python
  • Visualización interactiva de datos con Bokeh
  • Fusionar marcos de datos con pandas

Para estadísticas

  • Distribuciones estadísticas y teoría de la probabilidad (Cálculo de MGF, CGF, media, mediana, modo, varianza Máxima probabilidad de expectativa, teoremas del límite central, ANOVA)
  • Montaje de una distribución.
  • Muestreo y prueba de una hipótesis
  • Modelado Bayesiano
  • Regresión y series de tiempo

Y por lo tanto, es de suma importancia reafirmar sus raíces. Estos luego serán sus armas mientras resuelven cualquier problema en Data Science, especialmente la programación. Cuanto más cómodo esté, mejor podrá comprender el problema y el dispositivo será una solución óptima. Una vez que haya construido una base sólida, puede comenzar a profundizar fácilmente en la ciencia de datos.

¿Cómo profundizar en Data Science?

Hay ciertas habilidades que no puede aprender simplemente haciendo algunos cursos en línea, siempre se recomienda asistir a un programa en un modelo de aula con una persona experimentada. Al igual que la ciencia de los datos de la ciencia médica, no puede aprenderla usted mismo. Por ejemplo, dado que todas las fuentes necesarias para convertirse en médico están disponibles en línea, simplemente no puede convertirse en médico al estudiar en línea, de manera similar con la ciencia de datos.

Y, por lo tanto, siempre recomendaría a los aspirantes de ciencia de datos que asistan a un programa basado en el aula, dirigido por un instructor y orientado a la práctica. Te encontrarás con muchas instituciones, cursos y programas que te ayudarán a aprender ciencia de datos. Algunos son muy caros, mientras que otros son razonables. Pero, una cosa muy importante a tener en cuenta mientras se inscribe en dichos cursos es saber su valor en términos de conocimiento y lo que al final del curso está desarrollando dentro de usted mismo. Asegúrese de que el énfasis de su curso esté más en la práctica y no solo en la teoría. Los proyectos en los que trabaja se basan en declaraciones de problemas relevantes de la industria y no en las tareas antiguas. Los aprendizajes y proyectos son colaborativos y se realizan en equipos. Obtiene herramientas reales de la industria y se enfoca en el desarrollo basado en pruebas

¿Será eso suficiente?

Honestamente, no, eso no lo hará, hasta este punto, acaba de incorporar habilidades de ciencia de datos. Pero, ¿cómo sabría eso la gente? Es importante salir a socializar.

Asista a más reuniones: aunque el requisito principal para convertirse en un científico de datos será a través de la práctica y la práctica solamente. Siempre es bueno tener una red social. Debe comenzar a asistir a más y más reuniones sobre ciencia de datos. Tienes la oportunidad de aprender mucho sobre ciencia de datos.

Comience con pasantías: también puede intentar trabajar junto con el aprendizaje. Puede optar por pasantías en algunas de las empresas de ciencia de datos. Obtendrá la experiencia de la industria con el conocimiento académico que cubrirá al estudiar estos temas. La mayoría de las grandes compañías tecnológicas usan Data Science. Todas estas empresas deberían tener puestos de pasantías en Data Science. Te recomendaría ir a Internshala, Linkedin, Glassdoor, Monster y buscar pasantías de ciencia de datos.

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes crearon proyectos a partir de conjuntos de datos REALES y declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y está fuertemente orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.

Algunos enlaces rápidos

  • Programa – http://www.greyatom.com/full-sta…
  • Chatee con un consejero académico : le invitamos a compartir todas sus dudas e inseguridades, a las que haremos todo lo posible para guiarlo hacia su camino profesional hacia el éxito. https://calendly.com/greyatom/co…

Según un estudio, cerca de 50,000 vacantes de trabajo relacionadas con análisis están actualmente disponibles en India. Se espera que esto aumente a 80,000-100,000 en 2018.

Un científico de datos representa una evolución desde el rol comercial o analista de datos. La capacitación formal es similar, con una base sólida típicamente en informática y aplicaciones, modelado, estadísticas, análisis y matemáticas.

El rol de Data Scientist es necesario cuando el volumen y la velocidad de los datos de una empresa exceden un cierto nivel que requiere habilidades más sólidas para clasificar a través de un mar de datos no estructurados (big data) para identificar preguntas y extraer información crítica. Luego, la persona limpia los datos para un análisis adecuado y crea nuevos algoritmos para ejecutar consultas que relacionan datos de fuentes dispares.

  • Responsabilidades del científico de datos: limpieza y procesamiento de datos, modelado predictivo, aprendizaje automático, identificación de preguntas, ejecución de consultas, aplicación de análisis estadístico, correlación de datos dispares, narración de historias y visualización.

En India, el salario inicial promedio de Data Scientist es de alrededor de £ 6 LPA, mientras que en Estados Unidos es de $ 90k.

La publicación general de empleos para Data Scientist ha aumentado enormemente, lo que se puede ver en los sitios web de reclutamiento como Indeed.

Los roles de más rápido crecimiento son los científicos de datos y los analistas avanzados, que se prevé que aumenten la demanda en un 28% para 2020.

La demanda general aumentará de manera constante en los próximos años con la creación diaria de millones de datos en Internet que deben analizarse y pueden utilizarse para negocios en crecimiento en función de los conocimientos.

Ahora, para obtener un trabajo como Data Scientist, uno debe tener un conocimiento profundo y un enfoque práctico de los siguientes temas.

  1. Estadística
  2. Programación R
  3. Modelado predictivo
  4. Algoritmos de aprendizaje automático
  5. Extracción de textos
  6. Pitón

Entonces, para seguir una carrera como científico de datos, debe:

  • Primero, adquiera las habilidades relevantes en las tecnologías mencionadas anteriormente para que pueda comprender el papel básico y el trabajo involucrado.
  • En segundo lugar, necesita practicar sus habilidades y mostrar sus talentos haciendo proyectos relevantes en Data Science. Hay plataformas como kaggle que pueden ayudarte a perfeccionar tus habilidades.
  • Debe encontrar algunas pasantías en las empresas que contratan al científico de datos, ya que necesita familiarizarse con el trabajo que implica el funcionamiento como científico de datos y puede tener algo de práctica en el trabajo entregando millones de datos.
  • Finalmente apareciendo para las entrevistas que pueden ayudarte a ser contratado como Data Scientist.

Ahora viene la verdadera pregunta de cómo va a hacer todo esto. Puede adquirir habilidades de cualquiera de las plataformas o recursos mencionados a continuación:

  • Centros de capacitación : hay muchos centros de capacitación y entrenamiento que ofrecen cursos en estas tecnologías. Pero no hay confiabilidad del contenido del curso y de los maestros, ya que carecen de experiencia en la industria y el escenario actual.
  • Edureka, Udemy, Simplilearn : hay muchas plataformas en línea que proporcionan capacitación y certificaciones para Data Science. Pero recuerde que al final del día su objetivo es ser contratado como Científico de Datos, no solo obtener certificados.
  • edWisor.com es una de esas plataformas que no solo lo capacita en las tecnologías requeridas por la industria, sino que también lo contrata como científico de datos. Hay más de 100 compañías que están contratando candidatos calificados de edWisor como pasantes / a tiempo completo.

Por lo tanto, puede optar por cualquier plataforma mencionada anteriormente que se adapte mejor a sus necesidades.

¡Todo lo mejor!