Soy un desarrollador de Java con 3 años de experiencia. Estoy planeando unirme al entrenamiento de Hadoop en Bangalore. ¿Dónde puedo encontrar a alguien que pueda brindar capacitación a nivel industrial, proyectos POC y asistencia para la colocación?

Big Data no es nuevo. Durante los últimos 25 años ha habido numerosos períodos de gran interés en almacenar y analizar grandes conjuntos de datos. En 1983, Teradata instaló a Wells Fargo como su primer sitio beta. En 1986, este software fue el “Producto del año” de la revista Fortune. Fue emocionante porque fue pionero en la capacidad de analizar conjuntos de datos del tamaño de un terabyte. A principios de los años 90, los bancos más grandes tenían todos sus datos en un almacén de datos de algún tipo, y se estaba trabajando mucho para tratar de averiguar cómo usar realmente esos datos.

El siguiente fue la gran moda OLAP. Cognos, Holos, Microsoft Big Data, Ciencia de datos – Clases de capacitación de cursos combinados en línea | Big Data, Data Science – Cursos combinados de cursos en línea Los servicios OLAP (como se llamaba entonces), etc., eran de lo que todos los chicos geniales hablaban. Todavía era costoso almacenar conjuntos de datos muy grandes, por lo que durante gran parte de los años 90, Big Data todavía estaba restringido a empresas más grandes, especialmente en servicios financieros, donde se recopilaban muchos datos. (Estas empresas tuvieron que almacenar registros transaccionales completos por razones operativas y legales, por lo que ya estaban recopilando y almacenando los datos; esa es otra razón por la que fueron de los primeros en aprovechar estos enfoques).

También importante en los años 90 fue el desarrollo de redes neuronales. Por primera vez, las empresas pudieron utilizar modelos flexibles, sin estar sujetos a las restricciones de los modelos paramétricos, como los GLM. Debido a que las CPU estándar no podían procesar datos lo suficientemente rápido como para entrenar redes neuronales en grandes conjuntos de datos, empresas como HNC produjeron placas de complemento que usaban silicio personalizado para acelerar en gran medida el procesamiento. Los árboles de decisión como CHAID también eran grandes en este momento.

Entonces, para cuando llegó el nuevo milenio, muchas de las compañías más grandes habían estado trabajando mucho para resumir (OLAP) y modelar datos (redes neuronales / árboles de decisión). Las habilidades para hacer estas cosas aún no estaban ampliamente disponibles, por lo que obtener ayuda costó mucho dinero, y el software todavía era en gran medida propietario y costoso.

Asesoramientoasesoramiento sobre programación JavaJavaOrientación laboralPregunta personalsobre programación informática