¿Qué necesito aprender o leer para seguir una carrera en análisis de big data?

“Un científico de datos es alguien que es mejor en estadística que cualquier ingeniero de software y mejor en ingeniería de software que cualquier estadístico”.

En los últimos meses tuve la oportunidad de interactuar con talentos de ingeniería que comenzaron su viaje como ingeniero de ciencia de datos o planeaban hacerlo. Basado en mi aprendizaje, tengo las siguientes ideas para ti.

Habilidades técnicas:

  • Matemáticas (por ejemplo, álgebra lineal, cálculo y probabilidad)
  • Estadísticas (por ejemplo, pruebas de hipótesis y estadísticas resumidas)
  • Pitón
  • Bases de datos SQL y lenguajes de consulta de bases de datos
  • Python (más común), C / C ++ Java, Perl
  • Herramientas y técnicas de aprendizaje automático (p. Ej., Vecinos más cercanos, bosques aleatorios, métodos de conjunto, etc.)

Esta lista siempre está sujeta a cambios. Creo que las habilidades genéricas de programación son mucho más importantes que ser el experto de un lenguaje de programación en particular.

Habilidades para los negocios:

  • Solución analítica de problemas: abordar desafíos de alto nivel con un ojo claro sobre lo que es importante; empleando el enfoque / métodos correctos para aprovechar al máximo el tiempo y los recursos humanos.
  • Comunicación efectiva: Detallando sus técnicas y descubrimientos a audiencias técnicas y no técnicas en un lenguaje que puedan entender.

Puede aprender Data Science en línea con los diversos cursos que se ofrecen, pero creo que un curso más reciente siempre debe ir a un curso combinado que brinde capacitación en el aula para adquirir el conocimiento adecuado, la exposición de la industria para aprender las habilidades y construir una red y aprendizaje práctico en línea. En GreyAtom ofrecemos una verdadera experiencia de aprendizaje inmersivo combinado. Además, trabajará en Commit Live, un IDE personalizado desarrollado para ser incluido en el plan de estudios del curso.

En la actualidad, solo hay entre 10 000 y 15 000 expertos en análisis y datos en la India y habrá una escasez de 2 científicos de datos lakh en la India en los próximos años.

En las ciencias de datos de la escuela GreyAtom, equiparamos la educación con la Realidad. Aprendemos y practicamos tecnologías futuras con datos REALES. Nuestro programa es desarrollado por académicos de clase mundial en colaboración con profesionales de la industria. Nuestros instructores y desarrolladores de planes de estudio se encuentran entre los mejores institutos a nivel mundial y en India, a saber, IIT, IIM, la Universidad Estatal de Nueva York en Buffalo

Instituto Max-Planck de Informática en Alemania y muchos más.

Nuestro programa permite a un alumno aplicar técnicas de resolución de problemas y pensamiento creativo a conjuntos de datos del mundo real, ganando experiencia en toda la pila de ciencia de datos. Desarrollará un perfil sólido de contribuciones de código abierto que ayudarán a la comunidad más amplia de ingeniería de software a través de Github, StackOverflow y Kaggle.

Puede consultar los detalles del programa haciendo clic en este enlace: –

Programa in situ de GreyAtom: ciencia de datos, aprendizaje automático, Big Data

Le invitamos a compartir todas sus dudas e inseguridades prestando atención a lo que haremos nuestro mejor esfuerzo para guiarlo hacia su camino profesional hacia el éxito. Programe una sesión de asesoramiento con GreyAtom School of Data Sciences en-

Calendly – GreyAtom

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudar a las personas a encontrar carreras sostenibles en Data Science es mi pasión.

Para seguir una carrera en análisis de big data, debe estar familiarizado con el proceso de minería de datos.

Exploración de datos : comienza con esto. Debe conocer el conjunto de datos con el que está trabajando y debe poder identificar qué es importante y qué no.

Limpieza de datos : una vez que conozca su conjunto de datos, debe limpiarlo y prepararlo para el análisis. Este proceso generalmente toma el tiempo más largo. Cuanto mejor limpie sus datos, más fácil será para el análisis.

Análisis de datos : debe conocer los diferentes tipos de análisis que puede realizar en su conjunto de datos para obtener los resultados deseados. La mayoría de los analistas de datos están familiarizados con el análisis descriptivo, que es el análisis con datos actuales o históricos.

Almacenamiento de datos : los datos grandes tienen 3 partes grandes: volumen, velocidad, variedad. Necesitará saber cómo juegan estos 3 factores en el almacenamiento de datos. Hoy en día, es mucho más difícil mantener los datos almacenados de manera eficiente con las cantidades masivas de datos que llegan a altas velocidades en muchas formas diferentes.

Visualización de datos : después de realizar un análisis, deberá comunicar sus hallazgos a alguien. Al crear paneles y cuadros personalizados, podrá presentar sus hallazgos de manera efectiva. Esto es muy crucial y a menudo se pasa por alto, pero si no puede comunicar sus hallazgos a otros, en última instancia no tiene sentido.

Aquí hay un par de buenos libros, aunque podría ser un poco avanzado si recién está comenzando.

Datos inteligentes: uso de la ciencia de datos para transformar la información en información: John W. Foreman: 8601234609483: Amazon.com: libros

Análisis de datos usando SQL y Excel: Gordon S. Linoff: 9781119021438: Amazon.com: Libros

Aquí hay una lista de herramientas con las que debería sentirse cómodo:

Herramientas que todo analista de datos debe saber

En K2 Data Science , enseñamos a los estudiantes a convertirse en analistas de datos profesionales en nuestro campamento de análisis de datos . Es un curso en línea dirigido por un mentor que utiliza datos del mundo real y viene con soporte completo para el trabajo. ¡Echale un vistazo!

De todos modos, ¡espero que esto ayude!

Experfy está a punto de lanzar una plataforma de capacitación a pedido para Big Data. Las clases serán impartidas por expertos en datos de clase mundial. Mantén tus ojos en el próximo mes mientras Experfy lanza clases.

Entrenamiento de Big Data | Entrenamiento Hadoop | Certificación Hadoop Boston | Entrenamiento en línea de Hadoop | Cursos de Big Data | Cursos de análisis de datos | Curso de ciencia de datos | Instituto de formación analítica dirigido por un instructor | Certificación Analítica | Aprender Hadoop

Primero es comprender y apreciar los patrones y la utilidad de los datos en nuestra vida cotidiana. En segundo lugar, leer un libro que trata sobre la comprensión de los datos sería: ‘Freaknomics’, ya que es interesante de entender y luego puede ir a: ‘Mantenerse al día con Quants’. Tercero, repase sus conceptos estadísticos como Correlación y Regresión, que se utilizarán ampliamente cuando ingrese a este campo. Cuarto, mire los paquetes analíticos que se ofrecen.

Gracias por A2A.

Lo siento, no soy experto en big data. Entonces, no puedo sugerirle el camino exacto. Pero, me encantaría sugerirte lo que sé.

Necesita aprender cosas como la programación R, Hadoop, etc. para aprender más sobre big data.

Y no te preocupes por tu experiencia en Java. La vida está llena de experiencias. Y confía en mí en esto, no se desperdicia ninguna experiencia. Y esta experiencia está relacionada con la informática en sí. Por lo tanto, se considerará seguro.

La mejor de las suertes.