Data Science es la última tendencia en la industria. Aunque inicialmente muchos fueron rechazados como una manera simple, pero ahora a lo largo de los años varias organizaciones se han dado cuenta del potencial de la ciencia de datos para generar información útil a partir de datos estructurados y no estructurados.
Desde bancos hasta empresas de comercio electrónico e industrias manufactureras, todos entendieron la importancia de la carrera de ciencia de datos y la adoptaron en sus actividades diarias para mejorar su rendimiento.
El papel de un científico de datos ya se ha ganado el nombre de “el trabajo más sexy del siglo XXI”. Según un informe del Instituto Global Mckinsey, habrá una escasez de 140,000 a 190,000 profesionales de la carrera de ciencia de datos para 2018 solo en los Estados Unidos.
Con respecto a India, algunos estudios sugieren que la industria de análisis y análisis de datos en India se encuentra en una etapa en la que tiene entre 10 y 15 años y que podemos esperar un auge en el campo de la tercerización analítica en India.
También creo que India, con su grupo de datos de talentos de ciencia / análisis, puede muy bien ser el líder en esta industria. Ya hay algunas historias de éxito como Mu Sigma y Fractal analytics. Además, ahora vivimos oficialmente en la Era de Big Data.
Por lo tanto, está muy claro que la razón por la cual los investigadores de datos están en demanda y también se crearían muchos empleos nuevos en esta área en un futuro próximo. Por lo tanto, la ciencia de datos puede considerarse una opción profesional lucrativa.
¿Qué hace un científico de datos?
Data Science es una amalgama de comprensión empresarial, matemática, estadística, programación y habilidades de comunicación. Como tal, se espera que todas las habilidades anteriores se presenten como un científico de datos.
Se espera que un científico de datos comprenda el problema comercial, desarrolle una hipótesis, comprenda el tipo de datos requeridos, realice la limpieza de datos y el análisis preliminar de datos, construya modelos estadísticos para la solución y, en última instancia, comunique ideas al cliente de manera efectiva. Por lo tanto, el trabajo de un científico de datos abarca varios roles y funciones.
Entrar en la carrera de ciencia de datos como una persona más fresca y con experiencia
Ahora, para asegurarse de que su currículum llama la atención cuando se postula a un negocio analítico necesita algo de preparación. La preparación sería diferente para una persona más fresca que para alguien que ya tiene algo de experiencia trabajando en su haber a pesar de estar en un área diferente.
Para un graduado en ingeniería o matemática / estadística, el énfasis se pone más en resolver problemas analíticos y la exposición a ciertos lenguajes de programación. Luego pueden ir a las oficinas de analistas a través de inversiones en colegios universitarios o campañas de colocación fuera del campus e intentar acertar en su proceso de entrevista.
Pero para alguien con experiencia laboral sustancial en otra área, digamos un profesional de la informática, es una historia completamente diferente. Un profesional de la computación generalmente es bueno en las habilidades de programación, pero se están quedando cortos en lo que respecta a la intuición matemática o la profundidad en la comprensión empresarial.
Entonces, para un profesional de TI o, de hecho, profesional de cualquier otro sector, es un poco difícil hacer la transición en la ciencia de los datos, pero no imposible. He hecho esta transición y puedo dar testimonio de eso.
Cómo comenzar una carrera en ciencia de datos
Los reclutadores de análisis o ciencia de datos buscan habilidades relevantes y, por lo tanto, el truco es adquirir estas habilidades durante un período de tiempo y explotarlas durante una entrevista. Ahora discutiremos los diversos aspectos que se necesitan para trabajar para hacer una transición exitosa a la industria analítica.
1. Obtenga una maestría (MS / MBA) con especialización en análisis de negocios
Obviamente, esta es la forma tradicional, es decir, comenzar con una pizarra limpia. Uno puede inscribirse en un programa de posgrado en análisis.
Por ejemplo, IIM Calcutta comenzó un PGP en análisis de negocios con ISI Kolkata e IIT Kharagpur hace unos años y este programa está funcionando bien.
También hay muy buenos programas de maestría en varias universidades estadounidenses. Por ejemplo, North Carolina State University, MIT Sloan, UC Berkeley, Texas A&M, etc.
Incluso se puede optar por un MBA general, pero realizar algunos análisis electivos relacionados, como el análisis avanzado de datos, el aprendizaje automático, etc.
Pero esto es algo que podría no ser posible para todos por varias razones. En este caso, se debe hacer hincapié en el autoaprendizaje y el uso efectivo de los recursos de aprendizaje disponibles gratuitamente. Algunos de éstos se discuten a continuación.
2. Construir estadísticas / fundamentos de aprendizaje automático
Se espera que un investigador a cargo de la minería de datos tenga algún conocimiento de los diversos métodos estadísticos o aprendizaje automático en la industria.
Podemos comenzar desde la base, es decir, la distribución normal, el teorema del límite central, la hipótesis de prueba y luego pasar a técnicas avanzadas. Regresión lineal, regresión logística, árboles de decisión, análisis de conglomerados, modelos aditivos generalizados, etc.
3. Adquirir habilidades técnicas en análisis
Con respecto a las herramientas en la industria analítica, SAS y SPSS eran populares antes de que la revolución del código abierto tomara a la industria por sorpresa. Las herramientas de código abierto como R y Python son la próxima gran cosa y tendría sentido invertir tiempo en ellas
Hay suficientes recursos disponibles gratuitamente en la web para aprender tanto R como Python. Para las personas con habilidades de codificación en lenguajes orientados a objetos como Java, Python considerará intuitivo. Pero R es la mejor herramienta (opinión personal) cuando se trata de modelado estadístico y también es la herramienta preferida en la academia.
Para un principiante absoluto, el curso de iniciación en R en Learn R, Python & Data Science Online | DataCamp puede ser un punto de partida. Pero la mejor manera de aprender este software es hacerlo. Por lo tanto, sugiero que se reproduzcan los códigos disponibles y se prueben en algunos conjuntos de datos ficticios para comprender lo que está sucediendo.
Además, un conocimiento práctico de SQL con habilidades avanzadas de MS Excel / VBA puede actuar como un diferenciador cuando aparece uno para su entrevista.
4. Lea sobre las aplicaciones comerciales de Data Science
Dado que la ciencia de los datos no es solo una cuestión técnica, sería realmente útil si uno comprende las aplicaciones comerciales de los mismos y también es consciente de varios casos de uso exitoso.
Esto ayudará a ver la imagen más grande y también a estar bien equipado para comprender qué tipo de metodología se adapta a un problema comercial en particular.
Por ejemplo, cómo se usa el análisis de la cesta de la compra para agrupar productos por minoristas, cómo se puede usar el análisis de conglomerados para la segmentación de clientes para el lanzamiento de un nuevo producto, cómo se puede usar la regresión logística para la detección de fraude en la banca
5. Participa en varios concursos de ciencia de datos
El último pero no menos importante sería: práctica, práctica y práctica. Una forma de hacerlo sería participando en varias competiciones.
Además, la discusión en los foros con entusiastas de la ciencia de datos con ideas afines puede ser útil.
Finalmente, incluso después de que uno tiene un descanso en la industria de la ciencia de datos, uno debe protegerse contra la complacencia. La forma en que avanza la tecnología y el campo de análisis se está desarrollando, ¡hay algo nuevo que aprender todos los días!
¿Necesitas más detalles?
¿Interesado en aprender ciencia de datos? haga clic aquí
¿Está usted en el campo de la ciencia de datos e interesado en enseñar en línea a profesionales de clase mundial? Envíe su perfil por correo electrónico a [correo electrónico protegido]