¿Cuál es un camino para aprender ciencia de datos?

De acuerdo, el científico de datos parece estar realmente de moda en estos días,
Especialmente cuando se promociona como el título de trabajo más sexy.

Ahora he respondido esta pregunta antes, pero esta vez intentaré responderla mejor.

Primero, no será fácil

En segundo lugar, aunque no requiere una codificación pesada, aún necesita saber cómo codificar en R o python.

En tercer lugar, intente seguir el camino, que creo que sería suficiente en su viaje para convertirse en un “científico de datos”.

¡Además de esta página, recomendaría las Preguntas frecuentes sobre ciencia de datos de Quora como su guía completa para la ciencia de datos! Incluye recursos similares a este, así como consejos sobre cómo prepararse para entrevistas de ciencia de datos. ¡Además, siga el tema de Quora Data Science si aún no ha recibido actualizaciones sobre nuevas preguntas y respuestas!

1) Antes de comenzar, necesita Cálculo multivariable, Álgebra lineal y Python. Si su experiencia matemática depende del cálculo multivariable y el álgebra lineal, tendrá suficiente experiencia para comprender casi todas las probabilidades / estadísticas / aprendizaje automático para el trabajo.
Cálculo multivariante : ¿Cuáles son los mejores recursos para dominar el cálculo multivariable?
Álgebra lineal numérica / Álgebra lineal computacional / Álgebra matricial: Álgebra lineal, Coursera

2) Ahora necesitas aprender estadísticas básicas y probabilidad,

  • Aplicaciones R: Introducción al aprendizaje estadístico (pdf gratuito) (MOOC) (enfoque R)
  • Imprima una copia de Probability Cheatsheet

3) Después de esto, comience a aprender varios algoritmos de minería de datos y su aplicación en R o python (por ejemplo, clustering, reglas de asociación, minería de texto, minería web, tress, bosque aleatorio, etc., envíeme un ping si desea un archivo pdf).

4) Obtenga un certificado profesional, preferiblemente de IBM. Para que pueda ir a Aprender habilidades laborales de expertos de la industria en línea | DeZyre para obtener un certificado pagado de IBM, se les enseña a ser profesionales de la industria o ir a Coursera (que también es pagado) y aprender de los profesores. Preferiría el primero.

Para cualquier otra duda, siempre puedes contactarme 🙂

Nos encontramos diariamente con personas que siguen demasiadas cosas y persiguen demasiadas direcciones en su intento de aprender ciencia de datos. Las rutas de aprendizaje están destinadas a proporcionar una dirección cristalina para el viaje de extremo a extremo en diversas herramientas y técnicas. Entonces, si quieres aprender un tema, todo lo que tienes que hacer es seguir un camino de aprendizaje. No solo esto, si ya has comenzado tu aprendizaje, puedes retomarlos en tu próximo paso o ver qué pasos te has perdido. en el pasado, actuarán como casas de luz para las personas que realizan sus viajes de conocimiento sobre ciencia de datos.

SAS Learning path and resources – Analista de negocios en SAS

LeaRning Path on R – Guía paso a paso para aprender ciencia de datos en R

Ruta de aprendizaje integral: ciencia de datos en Python

Qlikview – ¡Ruta de aprendizaje de un principiante a una luminaria QlikView!

Ruta de aprendizaje: su guía para convertirse en un experto de Tableau

Weka: forma de GUI de aprender Machine Learning

Ruta de aprendizaje: la mejor manera de aprender Machine Learning en 6 sencillos pasos

Novato a D3.js Experto: ruta completa para crear visualización interactiva usando D3.js

La respuesta de Akshata Nayak a ¿Qué tipo de análisis hace el científico de datos en tiempo real?

5 pasos para aprender realmente la ciencia de datos

Los maestros de la ciencia de datos de código abierto

¡Hay un único camino para ser un científico de datos! Y eso se conoce como experiencia.

Ser un científico de datos no es diferente a ser un abogado o un médico. No puedes aprender nada de problemas ficticios. Es cuando enfrenta problemas comerciales de la vida real, aprende a usarlo. (puede tomar años dominarlo)

  1. Solo ML (aprendizaje automático) no es suficiente
  2. Solo las habilidades de programación no son suficientes
  3. Solo estadísticas no es suficiente
  4. Solo el análisis descriptivo no es suficiente (comprensión de la parte comercial)
  5. Solo la intuición no es suficiente
  6. Solo el manejo de big data no es suficiente
  7. Solo la maestría no es suficiente (desafortunadamente he perdido interés en los programas de Data Science Master, no sirven de nada. Tienes que sangrar en el campo de batalla, sudar no servirá de nada aquí)

Ser un científico de datos (uno verdadero) lleva años amigo. Los que vemos hoy, los veteranos tienen 20 años.

Y llegando a su problema, probablemente debe comenzar con python. Aprenda python de memoria y aprenda cómo se usa para el análisis de datos. (Aprenda Excel también, aunque no me gusta esta parte, pero es frecuente)

Mejora tu habilidad en Estadística y también en aprendizaje automático.

Estos son los requisitos previos para conseguir un trabajo.

Una vez que ingresa a la industria analítica, comienza su batalla.

No se preocupe, su experiencia es lo suficientemente buena como para ingresar a la ciencia de datos.

Comienza a buscar problemas en kaggle. Son innovadores y activarán su visión de la ciencia de datos.

Espero eso ayude

PS Learning R es tu elección. Yo era de fondo matemático. Por lo tanto, me encantó R más que Python, sin embargo, Python también es lo suficientemente bueno. También vale la pena aprender Java y Scala.

Data Science es una confluencia de diversos estudios y es un sector muy grande. Encontrará personas de diversos sectores a saber. Matemáticas, Ciencias Sociales, Ciencias de la Ingeniería, Medicina para ser parte de esta comunidad. Básicamente, la ciencia de datos consiste en un ciclo. Las personas con diferentes habilidades se ajustan a varias etapas del ciclo.

Aunque, Data Science se usa libremente para el personal que tiene experiencia en Machine Learning y Data Mining, Data Science es algo más grande. Las personas con buenas habilidades de RDBMS y Estructura de datos y algoritmos les resulta más fácil integrarse en la comunidad. Las matemáticas son esenciales, pero no es obligatorio que tengas que ser excelente. Solo conozca los conceptos básicos de estadísticas y álgebra lineal. Con el tiempo, crecerás.

Ahora llegando a su problema de “casi ningún conocimiento” en Python o R. Está perfectamente bien. No estaba cerca de la informática. Solo comienza. Las cosas estarán bien. R y Python son poderosas “herramientas”. Son solo “herramientas” para resolver el problema. Centrarse en la resolución de problemas.

Un buen lugar para comenzar es un libro “Minería de datos y análisis de negocios con R” de Ledolter. En las etapas iniciales, no entre en los detalles de los códigos R. Simplemente siga lo que está sucediendo, cuáles son los problemas, el proceso de pensamiento para resolverlos. Eso es mas importante. A continuación, vaya a las matemáticas internas si lo desea siguiendo libros avanzados. Te ayudará a personalizar tus códigos.

Sigue competiciones como Kaggle también. Son un buen lugar para aprender.

Después de obtener un buen conocimiento en Python y R.

Comience a potenciar sus habilidades estadísticas y obtenga un conocimiento de la base de datos NoSQL como Mongodb, Hbase, etc.

Puedes comenzar con los siguientes cursos MOOC

1. Analytics Edge por Edx

2. Aprendizaje automático por Coursera

3. Aprendizaje estadístico por Stanford Online

Una vez que haya terminado con ellos, puede probar algunos problemas del mundo real en Kaggle, AV Hackathons, etc. Mientras trabaja en los problemas, comenzará a recoger más conceptos en el camino.

Certificado de ciencia de datos

Aprenda a analizar datos para obtener información, desarrollar nuevas estrategias y cultivar inteligencia empresarial procesable en áreas tan diversas como el diseño de productos, el marketing y las finanzas.

RESULTADOS CLAVE DE APRENDIZAJE

Domine las facetas clave de la investigación de datos, incluidas la discusión, limpieza, muestreo, gestión, análisis exploratorio, regresión y clasificación, predicción y comunicación de datos.

Implemente conceptos fundamentales de cómputo de datos, como estructura de datos, algoritmos, computación paralela, simulación y análisis.

Aproveche su conocimiento de áreas temáticas clave, como la teoría de juegos, el control estadístico de la calidad, el suavizado exponencial, el análisis de tendencias ajustado estacionalmente o la visualización de datos.

EMPEZANDO

No se requiere solicitud. Simplemente se registra para cursos de posgrado durante nuestros períodos de inscripción de otoño, primavera o verano.

GANAR EL CERTIFICADO

Para cumplir con los requisitos para el certificado, debe:

Completa cuatro cursos certificados para créditos de posgrado.

Obtenga al menos una calificación B en cada curso.

Completa los cursos dentro de tres años.

Obtenga más información sobre cómo obtener un certificado y el proceso de solicitud de su certificado.

CURSOS DE CERTIFICADO

El certificado de posgrado profesional en Data Science requiere cuatro cursos:

Un curso de estadística (elija uno del grupo seleccionado). Solo puede contar un curso introductorio de estadística (curso numerado STAT E-100 a STAT E-110) y un curso avanzado de estadística (curso numerado STAT E-150 a STAT E-200)

Dos asignaturas optativas (elija dos cursos de un grupo selecto)

Un curso de ciencias de datos requerido (elija uno del grupo seleccionado)

Los estudiantes que comenzaron los cursos en el verano de 2017 o antes pueden optar por usar la nueva configuración (arriba) o pueden continuar con la configuración del certificado anterior (tres asignaturas optativas y un curso obligatorio). Los estudiantes tienen tres años a partir de la fecha de su primer curso para completar el certificado.

Determine la progresión del curso adecuada para usted utilizando nuestras rutas de curso recomendadas.

ENCUENTRE CURSOS DE CERTIFICADO

Se recomiendan conocimientos previos en estadística y programación básica para este certificado. Si no tiene una sólida formación en estadística, comience con un curso introductorio de estadística, como STAT E-100 Introducción a los métodos cuantitativos para la economía y otros campos cuantitativos.

Si no tiene experiencia en programación, primero debe considerar nuestro certificado de programación o, como mínimo, completar CSCI E-7 Introducción a la programación con Python. El Certificado de Ciencia de Datos será difícil para los estudiantes sin conocimiento previo de Python.

Los cursos tomados antes del año académico 2013–14 no se aplican a este certificado.

GRADOS RELACIONADOS

Si también está considerando una maestría y ha obtenido una licenciatura, ciertos cursos certificados también se pueden contar como asignaturas optativas en un campo de grado relacionado.

Licenciatura en Sistemas de Gestión de la Información

Licenciatura en Ingeniería de Software

CERTIFICADOS RELACIONADOS

Certificado de Ingeniería de Software

Certificado de tecnologías web

Por favor lea mi respuesta en una pregunta similar.

La respuesta de Sleeba Paul a Soy editora de adquisiciones y para obtener conocimiento y autoaprendizaje de análisis de datos y habilidades de aprendizaje automático. ¿Alguien podría ayudarme a trazar un plan?