Big data es un dominio y, como cualquier otro dominio, hay una variedad de idiomas que se utilizan para tratar diferentes enunciados de problemas. En general, en el desarrollo de Big Data, todo el mundo es generalmente de Java y tiene un conocimiento básico de Linux.
Los siguientes son algunos puntos en los que he tratado de enumerar las tecnologías con las que debería estar familiarizado antes de usar la herramienta de big data dada.
- Para instalación y configuraciones : si se siente cómodo con Linux, no necesita preocuparse por esta parte.
- Acceso a HDFS : pruebe algunos comandos básicos de script de shell de Linux como, -copyFromLocal, -copyToLocal, -put, etc.
- Para Mapreduce , debe tener un conocimiento básico de Java y algo de experiencia práctica con él.
- Si planea usar Hive, aprender declaraciones SQL básicas puede ser útil .
- Para Spark , existe la opción de usar scala o python. Puede elegir y aprender uno de ellos antes de pasar a la chispa.
- Para usar oozie para la programación de trabajos de bigdata, debe estar familiarizado con los XML.
- Otras bases de datos NoSQL generalmente siguen una sintaxis basada en Java o una sintaxis similar a SQL para facilitar su aprendizaje.
- Estoy explorando la opción de una carrera en periodismo, ¿cómo hago para que mi pie atraviese la puerta de la sala de redacción?
- ¿Qué puede hacer un graduado de ECE este verano que ayude a su experiencia?
- ¿Cuáles son los beneficios y las perspectivas profesionales únicas para un candidato a trabajo con una doble licenciatura en ciencias de la computación e ingeniería biomédica?
- ¿Qué hace la gente en su período de Aviso para el trabajo de la compañía de TI después de renunciar a su puesto actual?
- ¿Quería saber cuál es más valioso en una entrevista, certificación de un curso en particular o un proyecto sin certificación de ese curso?