¿Cuáles son algunos buenos tratamientos avanzados de ciencia de datos, específicamente después de completar la especialización de ciencia de datos en Coursera?

Estaba en una posición similar y encontré una gran cantidad de libros avanzados sobre el tema. Después de graduarse en Matemática Aplicada, no fue difícil elegir nuevos lenguajes de programación o técnicas matemáticas. Aunque los recursos que encontré más útiles fueron los que ofrecían una visión holística y de alto nivel del tema. Una vez que tenga el panorama general y una educación en matemáticas, es sencillo sumergirse en áreas en las que desea un conocimiento más profundo.

Algunos de mis recursos favoritos han sido series de conferencias.

Aprendiendo de los datos – Yaser Abu Mostafa – Caltech
Esta es una gran serie de conferencias porque introduce el aprendizaje automático desde un alto nivel con un objetivo para la aplicación. Andrew Ng tiene otra gran serie de conferencias sobre Machine Learning, pero me encontré persiguiendo muchas lecturas adicionales para comprender el alcance completo de lo que estaba diciendo. Esta serie ofrece una introducción de alto nivel de los conceptos de Aprendizaje automático y te permite desarrollar tu comprensión de las matemáticas y los cálculos subyacentes.

CS267 SP 2014 – YouTube
Aplicaciones de la programación paralela
No creo que sea una exageración llamar a esta serie de conferencias el mejor recurso gratuito disponible para una introducción a la Programación Paralela.

Página en harvard.edu
CSCI E-109 Ciencia de datos
Otra fantástica serie de conferencias sobre ciencia de datos con conferencias invitadas de algunos de los científicos de datos más influyentes de Silicon Valley.

Nuevamente, estos recursos ofrecerán amplitud en el tema. Para profundizar, debes ir después de cada tema individualmente. Aunque dado que mi experiencia es similar a la tuya, esta ruta me pareció la más fructífera.

Una cosa sobre la ciencia de datos que siempre debe tener en mente es que nadie lo sabe todo. Los detalles de lo que progresas principalmente están relacionados con las tareas que tienes entre manos. Mi sensación general es que no tiene tareas que debe abordar de inmediato, por lo que está tratando de crear un camino a seguir hasta llegar allí. El conocimiento del dominio es vital en la ciencia de datos y si no tiene un dominio de interés, mantener el genérico parece una ruta segura.

Bajo esta suposición, mi mejor consejo es mantenerse genérico, enfocándose en las cosas que se beneficiarán al desarrollar habilidades generales que se pueden usar más adelante en áreas específicas. En su caso, la codificación en el contexto de la ciencia de datos.

Dicho esto, recomendaría elegir Elementos de aprendizaje estadístico. Tiene los conocimientos de matemática (si no fuera así, le recomendaría Introducción al aprendizaje estadístico) y lo expone a R. El aprendizaje estadístico tiene muchas similitudes con el aprendizaje automático, por lo que es un buen medio para trabajar y el libro es un referencia para muchos profesionales.

Deberías estar bien con R, pero si no lo estás, da un paso atrás y obtén el libro R que parece introductorio.

Python para el análisis de datos también es una buena opción. Teniendo en cuenta los grandes datos más adelante, Java sería mi tercera opción.

Si estuviera en tu lugar, no elegiría nada específico como Data Science for Business o High Performance Python. Esos pueden ser útiles en algunos dominios, no tanto en otros.

Absolutamente NO recogería C ++. Codifico en C ++ y no lo he ejecutado en años. Me imagino que eventualmente será útil para el aprendizaje automático de alto rendimiento. Java será mucho más útil debido a cualquier cosa del ecosistema Hadoop que necesitará en el futuro y, aun así, existen alternativas más fáciles.

Todo lo demás suena algo intermedio. Demasiado específico por un lado, pero útil por el otro.

Espero que esto ayude y buena suerte!

Participa en competiciones de kaggle de todo tipo. Nada puede ser más instructivo. También puede intentar replicar modelos y resultados de publicaciones.