Puede convertirse en un analista de datos sin un título universitario. En mi experiencia de 7 años, he sido testigo de muchas personas con un título de maestría que no lograron hacer una carrera exitosa en ciencia de datos, mientras que algunas personas sin un título especializado en ciencia de datos tienen éxito. En esta era moderna, si tiene las habilidades adecuadas, la determinación y es apasionado, un título no será una barrera para su sueño. Dicho esto, un grado no haría daño solo por estar a salvo.
Yo diría que si tiene las habilidades adecuadas o si puede desarrollar las habilidades y tener pasión por la ciencia de datos, puede convertirse en un científico de datos.
Puedo enumerar algunas de las habilidades que son esenciales para convertirse en un científico de datos.
- ¿Vale la pena hacer una maestría en ingeniería?
- De CSE y ECE, ¿cuál debería preferir para mi carrera en robótica?
- ¿Es un hecho que el abuelo de Maharaja Hari Singh había comprado el estado de Jammu y Cachemira a Maharaja Ranjit Singh por la suma de una rupia lakh solamente?
- ¿Qué puede hacer un estudiante de secundaria para prepararse para un futuro en arquitectura?
- Tengo una brecha de 3 años en mi educación entre el 12 y la graduación. ¿Alguna vez conseguiré un trabajo en empresas de TI?
Habilidades técnicas
- Matemáticas (por ejemplo, álgebra lineal, cálculo y probabilidad)
- Estadísticas (por ejemplo, pruebas de hipótesis y estadísticas resumidas)
- Herramientas y técnicas de aprendizaje automático (p. Ej., Vecinos más cercanos, bosques aleatorios, métodos de conjunto, etc.)
- Habilidades de ingeniería de software (por ejemplo, computación distribuida, algoritmos y estructuras de datos)
- Minería de datos
- Limpieza de datos y munging
- Visualización de datos (por ejemplo, ggplot y d3.js) y técnicas de informes
- Técnicas de datos no estructurados.
- Idiomas R y / o SAS
- Bases de datos SQL y lenguajes de consulta de bases de datos
- Python (más común), C / C ++ Java, Perl
- Grandes plataformas de datos como Hadoop, Hive y Pig
- Herramientas en la nube como Amazon S3
Esta lista siempre está sujeta a cambios. Como sugiere Anmol Rajpurohit, “las habilidades genéricas de programación son mucho más importantes que ser expertos en un lenguaje de programación en particular”.
Habilidades para los negocios
- Solución analítica de problemas: abordar desafíos de alto nivel con un ojo claro sobre lo que es importante; empleando el enfoque / métodos correctos para aprovechar al máximo el tiempo y los recursos humanos.
- Comunicación efectiva: Detallando sus técnicas y descubrimientos a audiencias técnicas y no técnicas en un lenguaje que puedan entender.
- Curiosidad intelectual: explorar nuevos territorios y encontrar formas creativas e inusuales para resolver problemas.
- Conocimiento de la industria: Comprender la forma en que funciona la industria elegida y cómo se recopilan, analizan y utilizan los datos.
Acciones a tomar
Obtenga una maestría (MS / MBA) con especialización en análisis de negocios
Obviamente, esta es la ruta tradicional, es decir, comenzar con una pizarra limpia. Uno puede inscribirse en un programa de posgrado en análisis.
Por ejemplo, IIM Calcutta ha iniciado un PGP en análisis de negocios con ISI Kolkata e IIT Kharagpur hace un par de años y este programa está funcionando bien.
También hay algunos muy buenos programas de maestría en varias universidades de los Estados Unidos. Por ejemplo, North Carolina State University, MIT Sloan, UC Berkeley, Texas A&M, etc.
Incluso se puede obtener un título general de MBA, pero tomar algunas asignaturas optativas relacionadas con el análisis, como el análisis avanzado de datos, el aprendizaje automático, etc.
Construir estadísticas / fundamentos de aprendizaje automático
Se espera que un aspirante a científico de datos esté familiarizado con varias estadísticas o metodologías de aprendizaje automático utilizadas en la industria.
Uno puede comenzar desde lo básico, es decir, distribución normal, teorema del límite central, prueba de hipótesis y luego pasar a técnicas avanzadas, a saber. regresión lineal, regresión logística, árboles de decisión, análisis de conglomerados, modelos aditivos generalizados, etc. Un libro recomendado para esto sería Los elementos del aprendizaje estadístico (por Hastie, Tibshirani y Friedman).
Además de los libros de texto estándar, una forma alternativa pero efectiva de aprendizaje sería utilizar los MOOC. Hay muchos cursos gratuitos de estadísticas / minería de datos disponibles a través de Coursera, edX, MIT open, Stanford en línea, NPTEL, etc.
Adquirir habilidades técnicas en análisis
En lo que respecta a las herramientas en la industria analítica, SAS y SPSS solían ser populares antes de que la revolución del código abierto tomara por asalto a la industria. Las herramientas de código abierto como R y Python son la próxima gran novedad y tendría sentido invertir tiempo en ellas.
Hay suficientes recursos disponibles gratuitamente en la web para aprender tanto R como Python. Para las personas con habilidades de codificación en lenguajes orientados a objetos como Java, Python encontrará intuitivo. Pero R es la mejor herramienta (opinión personal) cuando se trata de modelado estadístico y también es la herramienta preferida en la academia.
Para un principiante absoluto, el curso introductorio en R en Learn R, Python & Data Science Online | DataCamp puede ser un punto de partida. Pero la mejor manera de aprender estos softwares es hacerlo. Por lo tanto, sugeriría que uno debe replicar los códigos disponibles y probarlos en algunos conjuntos de datos ficticios para comprender lo que está sucediendo. Además, un conocimiento práctico de SQL junto con habilidades avanzadas de MS Excel / VBA puede actuar como un diferenciador cuando aparece uno para su entrevista
Lea sobre las aplicaciones comerciales de Data Science
Dado que la ciencia de datos no se trata solo de mumbo jumbo técnico, sería realmente útil si uno comprende las aplicaciones comerciales de la misma y también conoce varios casos de uso exitosos.
Esto lo ayudará a ver el panorama general y también a uno bien equipado para comprender qué tipo de metodología se ajusta a un problema comercial en particular.
Por ejemplo, cómo los minoristas utilizan el análisis de la cesta de la compra para agrupar los productos, cómo se puede utilizar el análisis de conglomerados para la segmentación de clientes para el lanzamiento de un nuevo producto, cómo se puede utilizar la regresión logística para la detección de fraudes en el sector bancario / de seguros, etc.
Participa en varios concursos de ciencia de datos
Lo último pero no menos importante sería: práctica, práctica y práctica. Una forma de hacerlo sería participando en varios concursos de ciencia de datos alojados en sitios como kaggle.com. Incluso analyticsvidhya.com organiza concursos de ciencia de datos.
Pero sugeriría pasar por algunas de las competiciones pasadas en kaggle y replicar algunos de los guiones para comprender el modus-operandi. El nivel de competencias en kaggle es alto y uno puede aprender a manejar conjuntos de datos desafiantes y encontrar soluciones.
Además, la discusión en los foros con entusiastas de la ciencia de datos con ideas afines puede ser útil.
Obtenga más conocimiento práctico y aprendizaje:
- Aprender la teoría está bien, comenzar a implementar prácticamente.
- Cargue su trabajo en GitHub, StackOverflow y aprenda de las personas de la comunidad
- Es muy importante mostrar su conocimiento práctico en Data Science, después de todo no se trata de cuánta teoría conozca, siempre debe respaldarlo con conocimiento práctico.
Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a los talentos de ingeniería a iniciar su carrera en tecnologías emergentes.
El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes crearon proyectos a partir de conjuntos de datos REALES y declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y está fuertemente orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.
Algunos enlaces rápidos
- Programa – http://www.greyatom.com/full-sta…
- Chatee con un consejero académico: le invitamos a compartir todas sus dudas e inseguridades, a las que haremos todo lo posible para guiarlo hacia su camino profesional hacia el éxito. https://calendly.com/greyatom/co…