Soy un estudiante de ingeniería eléctrica y electrónica. También estoy interesado en big data y machine learning. Tengo conocimiento de R, MATLAB, Python y Oracle-SQL. Como no soy un estudiante de informática o informática, ¿qué tan beneficiosas son estas cosas para mí?

¡Ya casi estás ahí!

R y MATLAB tienen bibliotecas de aprendizaje automático antes de que se crearan Spark MLib y Mahout.

Tener conocimientos previos en Python y SQL ayudará a su programa fácilmente en Spark y Spark SQL (también Steaming y Mlib).


Incluso si su objetivo es ser un científico de datos, no afectará a cómo funcionan Hadoop y sus derivados, especialmente MapReduce, HDFS, Hive y Hbase, y cómo la chispa es mejor que estos.

Solo toma un par de semanas comprender HDFS, Hive, HBase y MapReduce (Pig, Sqoop, Oozie son irrelevantes desde la perspectiva de DataScientist, pero es bueno saberlo para Data Engineer)

Luego aprenda RDD, Transformación y Acciones en spark (trabajo en pyspark o en scala spark-shell, prefiero python)

A continuación, comprenda DataFrames y practique SparkSQL, tiene una sintaxis similar a SQL o Hive

Luego, comprenda el proceso DStreams y Spark Streaming, una alternativa a esto es Storm

Como complemento, aprenda Kafka (una cola de mensajería de editor-cunsumer como ActiveMQ pero con un alto rendimiento y una arquitectura tolerante a fallas)


Esto completa el proceso de aprendizaje y luego puede aplicar algoritmos de aprendizaje automático similares en python o scala o R (a través de spark.pipe). Aunque los conceptos centrales de los algoritmos de ML son los mismos, Spark Mlib manejará datos más grandes y calculará más rápido utilizando un clúster escalable.


Como ingeniero eléctrico, puede resolver problemas de BigData relacionados con su campo, le sugiero que trabaje en un proyecto en su último año en este que muestre sus habilidades a las universidades / empresas principales / empresas de TI para resolver problemas de Bigdata más interesantes.

Todo lo mejor !!

More Interesting

¿Puedo trabajar como ingeniero de software o desarrollador web sin título o diploma después de SSC?

¿Cuál es la demanda de los ingenieros biomédicos? ¿Qué flujo es mejor biomédico o biotecnológico?

Solo puedo resolver 3 problemas en un concurso largo de CodeChef y 1-2 problemas en las competiciones. ¿Qué debo hacer para poder resolver más? Siempre me atasqué en el cuarto problema más o menos en un desafío largo. ¿Cómo debo prepararme para continuar?

¿Hay trabajos para los graduados de CSE btech en ISRO o DRDO?

¿Cuánto tiempo necesitaría un sitio web para estar terminado?

¿Cuáles son los factores que rigen la decisión de establecerse en el extranjero o en India post master de una universidad extranjera?

¿Qué puedo aprender acerca de comenzar a trabajar independientemente?

Completaré mi graduación en btech en 2015, pero no quiero continuar en el campo. Y quiero cambiar a una carrera en literatura inglesa / lectura / escritura. ¿Qué tan bien crees que puedo hacerlo en el campo y si tendré suficientes oportunidades y una buena paga?

¿Los académicos del gobierno de Singapur en los Estados Unidos y el Reino Unido generalmente emergen con un As directo para sus cursos?

¿Por qué el ITC tiene una alta tasa de deserción?

¿Cuáles son mis oportunidades de salida después de hacer consultoría de estrategia de salud?

Si tiene una gran pasión por la tecnología (y lo demuestra), ¿cuáles son las probabilidades de recibir una llamada telefónica para programar una entrevista después de postularse en Google, Facebook, Apple o Dropbox?

¿Cuáles son los mejores trabajos en línea en la India?

¿Cuánto nivel de comprensión en programación debería tener para ingresar en el campo de la ciencia de datos?

Cómo encontrar un trabajo de TI en EE. UU.