Yo también he comenzado este viaje.
Pero, creo que terminar la certificación en un mes será mucho pedir. El examen evalúa muchos aspectos, que incluyen conocimientos teóricos sobre diferentes enfoques estadísticos, técnicas de aprendizaje automático y otros lenguajes de scripting, Python / R, etc. y, por supuesto, conceptos de Hadoop.
La página CCP: DS cita muchas fuentes para prepararse para este examen, lo que me hace pensar que solo tener conocimiento en Hadoop no será suficiente.
Científico de datos del PCCh
- ¿Qué debo considerar para seleccionar una escuela de arquitectura?
- ¿Cuál debería elegir, Arun Sharma o RS Agrawal?
- ¿Conocer Python es suficiente para comenzar a trabajar en la industria tecnológica?
- ¿Es la informática de la salud un campo en auge?
- Me encantaría unirme al ejército, pero soy socialista y no creo en las causas de mi país. ¿A qué otras organizaciones puedo unirme?
Estadística descriptiva e inferencial en Big Data (DS700)
- Usar pruebas estadísticas para determinar la confianza de una hipótesis.
- Calcular estadísticas de resumen comunes, como la media, la varianza y los recuentos
- Ajuste una distribución a un conjunto de datos y use esa distribución para predecir probabilidades de eventos
- Realizar cálculos estadísticos complejos en un gran conjunto de datos
Técnicas analíticas avanzadas en Big Data (DS701)
- Cree un modelo que contenga características relevantes de un gran conjunto de datos
- Definir agrupaciones de datos relevantes, incluyendo número, tamaño y características.
- Asigne registros de datos de un gran conjunto de datos a un conjunto definido de agrupaciones de datos
- Evaluar la bondad de ajuste para un conjunto dado de agrupaciones de datos y un conjunto de datos
- Aplique técnicas analíticas avanzadas, como el análisis de gráficos de red o la detección de valores atípicos.
Aprendizaje automático a escala (DS702)
- Cree un modelo que contenga características relevantes de un gran conjunto de datos
- Predecir etiquetas para un conjunto de datos sin etiquetar utilizando un conjunto de datos etiquetado como referencia
- Seleccione un algoritmo de clasificación que sea apropiado para el conjunto de datos dado
- Ajuste los metaparámetros del algoritmo para maximizar el rendimiento del algoritmo
- Use técnicas de validación para determinar el éxito de un algoritmo dado para el conjunto de datos dado