Teoría:
Hay muchos buenos cursos en línea que puede ver, con videos, materiales de lectura y problemas de práctica.
Eche un vistazo a algunos de los cursos gratuitos de Coursera, como:
https://www.coursera.org/course/…
https://class.coursera.org/ml/le…
https://www.coursera.org/course/…
(Stanford, MIT y Berkeley también tienen notas de clase en línea que puedes leer)
Práctica:
Le recomendaría que lea en MapReduce (un marco para procesar grandes conjuntos de datos en máquinas distribuidas). Como está familiarizado con Python, eche un vistazo a: CS 61A Verano 2012: Laboratorio 16.
- ¿Cómo pasa un consultor de marketing en redes sociales de trabajar como consultor independiente a un puesto de tiempo completo en una agencia o empresa de Internet?
- ¿Cuál sería una mejor opción MTech de un IIT o MS de alguna universidad extranjera decente?
- ¿Cuál es el prospecto de trabajo después de completar una PPC de India en India?
- Fui seleccionado en el programa Wipro WiSTA (4 años). ¿Es fructífero o complicado para mí?
- ¿Cuáles son las herramientas y la tecnología clave para impulsar su carrera en las pruebas de dominio?
De hecho, Python tiene un mapa reducido incorporado.
MapReduce paralelo en Python en diez minutos
Mundo real:
En la industria, probablemente estarás trabajando en implementaciones de MapReduce como Hadoop. Aquí hay una introducción al trabajo en Hadoop con python:
Una guía para los marcos de Python para Hadoop
Escribir un programa Hadoop MapReduce en Python – Michael G. Noll
Extras:
También hay una herramienta gratuita de minería de datos que puede descargar y jugar con varios algoritmos y conjuntos de datos de muestra (la versión GUI no requiere habilidad de programación)
Minería de datos con software de código abierto de Machine Learning en Java
¡Buena suerte!