Estaba en el mismo lugar en algún momento: Learning Analytics por mi cuenta.
El problema que enfrenté no fue el de la escasez de recursos, sino el de elegir los mejores recursos. Hay demasiadas opciones y opiniones disponibles y pasé mucho tiempo cambiando de un recurso a otro, perdiendo el enfoque y aprendiendo cosas que no eran tan urgentes. Además, los requisitos de conocimiento aconsejados por científicos de datos experimentados son generalmente abrumadores: cálculo, álgebra, estadística, programación, bases de datos, habilidades de pirateo de datos, conocimiento de dominio y demás. Estos siguen el camino típico de educación universitaria y pueden no ser aconsejables para profesionales que trabajan / estudiantes de tiempo completo con tiempo limitado disponible.
A continuación hay algunos recursos que lo ayudarán a comenzar. Hay otras herramientas que puede aprender (como Python / SAS / Octave), o de otras maneras (Data Camp / Nano Degree / Coursera / Udemy). Pero esto me ha funcionado, así que comparto mis 2 ¢. La ventaja de este enfoque es que puede comenzar a competir en las competencias de Kaggle / Analytics Vidhya dentro de las dos semanas posteriores al inicio, lo que lo ayudará a mantener la motivación para continuar. Tomará alrededor de 15-20 horas de su tiempo por semana durante 4–6 meses y los recursos son gratuitos.
- Durante una entrevista de trabajo, ¿cómo averiguaría si el candidato es un saltador?
- ¿Es posible aprender Python para un estudiante aprobado 12 que no ha estudiado CS?
- Cómo combinar mi pasión por los autos y la tecnología.
- ¿Qué es bueno para un dolor de muelas?
- ¿Dónde me preparo para una entrevista de redes?
Es más adecuado para alguien con experiencia en ciencias, que tenga alguna idea sobre matemáticas y programación de nivel universitario. Si no lo tiene, aún puede seguirlo y aprenderlo.
1) Suscríbase a Analytics Vidya y escuche datos. Y no solo lea los artículos recientes que llegan a su bandeja de entrada, también revise los enlaces que se publicaron anteriormente. Hay algunos recursos extremadamente buenos. Es posible que no comprenda todos los artículos por completo, pero definitivamente mejorará su comprensión. Debe pasar al menos 3 horas cada semana leyendo los artículos y los tutoriales.
2) Regístrese en el curso Edge de Analytics en EdX. Este es uno de los cursos de Analytics mejor calificados que usa R. Si una sesión actual no se está ejecutando, únase a un curso archivado. Por lo general, tomará de 7 a 8 horas a la semana y le enseñará muchas de las Técnicas de Análisis y Algoritmos en un lenguaje muy simple. Como beneficio adicional, también te enseña R básico en el camino.
3) Regístrese para el análisis de datos para científicos sociales en EdX. Este curso le ayuda a comprender los conceptos de probabilidad y estadística. Te sugiero que te registres después de haber terminado con Analytics Edge. Tomar dos cursos al mismo tiempo puede ser abrumador. Además, también te enseña R en el camino.
4) Aprenda R: los dos cursos anteriores le darán una exposición a la R. básica. Sin embargo, en mi formación en informática con exposición a Java / C ++, encuentro que la base R es bastante confusa y contra intuitiva. Sin embargo, hay algunos paquetes para facilitarle la vida: DPlyr, GGPlot2 y Lubridate. DPlyr lo ayuda a procesar datos fácilmente, lo que representa más de la mitad del trabajo en Analytics. ggPlot2 te ayuda a visualizar datos maravillosamente. Si crea gráficos en Excel, no puede imaginar lo que puede hacer con GGPlot. Lubriate es muy útil para procesar fechas. No es necesario si no maneja Fecha / Hora. Hay muchos más paquetes que son muy útiles, pero estos 3 lo ayudarán a comenzar. Aquí hay algunos recursos
DPlyr
R para ciencia de datos
Tutorial de dplyr (con 50 ejemplos)
GGPlot
R para ciencia de datos
Hadley Wickham, el tipo que escribió el libro mencionado anteriormente, R for Data Science, también es el creador de DPlyr y ggPlot. No olvides agradecerle por hacerte la vida más fácil y seguirlo en Quora.
5) Regístrese para las competiciones Kaggle / Analytics Vidya. Todos los pasos anteriores no lo ayudarán a menos que pase tiempo haciendo esto. Por lo general, me registro para competiciones que tienen conjuntos de datos simples y más pequeños, y se pueden resolver utilizando técnicas que ya conozco. No importa si la competencia ha terminado, aún puedes aprender mucho de ella. Por ejemplo, después de aprender Regresión logística, debe registrarse para la competencia Titanic Survival, presentar una solución rápidamente y luego comenzar a pasar por los foros de discusión para comprender los enfoques adoptados por otros. Confía en mí, la mayor parte de tu aprendizaje vendrá de los foros de discusión.
6) Libro – Aunque no he leído este libro, he encontrado que me lo recomiendan constantemente.
Modelado predictivo aplicado – Max Kuhn y Kjell Johnson. Max Kuhn es el creador de Caret Package, otro paquete muy útil que aprenderás en los cursos. Este libro tiene un poco de matemática pesada a la vez, pero sigue siendo muy útil. Además, creo que usa la función base R en lugar de DPlyr. Puede elegir seguir la base R si se siente cómodo con ella. De lo contrario, puede omitir ciertos códigos y comprender el principio subyacente.
Todavía hay mucho que aprender, pero como dicen, bien empezado a la mitad.
Feliz aprendizaje.