A partir de cero, ¿cuál debería ser mi plan jerárquico sistemático o mi algoritmo para convertirme en un científico de datos?

Gracias por el A2A.

Si está buscando una carrera en análisis de datos, le sugiero que tome un trabajo en una de las compañías de análisis: Mu Sigma, asociados de ZS, Fractal, Tredence, etc. Estas compañías en su mayoría no necesitan ningún requisito previo para ingresar. realizar trabajos de analista de nivel y brindar grandes oportunidades para aprender las habilidades desde cero

Si eso no es posible para usted, le sugiero que tome la siguiente progresión para aprender análisis de datos en cada una de las áreas clave:

Matemáticas

  1. Parámetros básicos de estadísticas y resumen de datos como media, mediana, moda, tendencias centrales, distribuciones, etc.
  2. Integridad de datos, pruebas de comparación y tendencia como prueba t, prueba z, prueba f
  3. Regresión: lineal, logística, GLM, mixta en ese orden
  4. Técnicas avanzadas como modelado predictivo y métodos prescriptivos.

Tecnología

  1. Microsoft Excel: este es el Santo Grial de la analítica. Aprende esto dentro y fuera. Desde fórmulas simples hasta la herramienta de análisis de datos y el tablero, debe aprenderlo todo
  2. VBA: esta es una extensión de Excel y, aunque no se usa mucho, puede ayudar a facilitar muchas tareas en Excel
  3. SQL: esta es la progresión lógica de Excel para manejar volúmenes de datos más grandes y también para estandarizar procesos y crear módulos de código para uso repetido
  4. SAS / R: el siguiente paso será una de estas herramientas, ya que pueden ayudarlo a realizar un procesamiento más complejo como la regresión y el modelado
  5. Tableau: este es casi el estándar en este momento para la visualización de datos y el tablero
  6. Tecnologías avanzadas como Shiny, Hadoop, Hive, etc.

Negocio

  1. Trabajo de diferentes verticales como Tecnología, Farmacia, Salud, Retail, Banca, etc.
  2. Aplicaciones de análisis en cada una de estas verticales.

Algunos recursos útiles y gratuitos:

  1. Libro de estadísticas gratis
  2. Su hogar para la ciencia de datos – Kaggle
  3. Tutorial SQL – W3Schools
  4. SQLZOO – Práctica SQL
  5. SAS Customer Support Knowledge Base and Community – El mejor lugar para aprender sobre muchas de las características
  6. Tableau Training & Tutorials – Videos de capacitación gratuitos de Tableau
  7. Aprenda Excel, trazando en línea – Chandoo
  8. Inicio – Analytics Vidhya – Manténgase actualizado

Espero que esto ayude.

Este es un tema amplio y dependerá de sus antecedentes y cuáles son sus objetivos profesionales. Le sugerimos que nos escriba en detalle sobre sus antecedentes educativos y profesionales, para que podamos ayudarlo con esto.

Sin embargo, en términos generales, se espera que un científico de datos sea un experto en:

  • Obtener los datos relevantes de varias fuentes y luego analizar los datos para resolver problemas comerciales y crear modelos de datos para predecir problemas futuros,
  • Comprender la infraestructura tecnológica requerida para almacenar, administrar y trabajar con grandes cantidades de datos estructurados y no estructurados en tiempo real, y
  • Finalmente, también interprete los datos para crear varias historias visuales, gráficos y tablas para ayudar a una audiencia más amplia a comprender lo que los datos interpretan.

Esto requiere experiencia en análisis, infraestructura tecnológica de datos y habilidades de visualización, pero en última instancia, debe usarse con una buena comprensión de los requisitos comerciales y cómo resolver los problemas comerciales.

Un buen programa en análisis de datos, seguido de módulos más cortos sobre cómo trabajar con la infraestructura tecnológica de Big Data, así como sobre las habilidades de visualización de datos, lo ayudará a convertirse en un científico de datos.

Además, también se espera que comprenda el dominio en el que estaría operando, ya sea finanzas, marketing, petróleo y gas o telecomunicaciones. Antes de comenzar cualquier programa en ciencia de datos, debe tener conocimientos de estadística y matemáticas a nivel de posgrado y también le ayudará una base en codificación.

Espero que esta respuesta haya sido útil. Puede contactarnos en [correo electrónico protegido] para obtener más información.

Una declaración bien conocida que se adapta muy bien a los científicos de datos es que

‘Un científico de datos es alguien que conoce las estadísticas mejor que un programador y que programa mejor que un estadístico. ‘

Por lo tanto, es una mezcla de estadísticas y programación.
Para comenzar desde cero, debe aprender paralelamente tanto Estadísticas como Programación. Hay ciertos lenguajes de programación específicos de dominio como R, que se usa ampliamente como herramienta de ciencia de datos. Es de código abierto.
La siguiente herramienta preferida es Python. Python está recogiendo su impulso.
En lo que respecta a Big Data, no puede usar R y Python para resolver problemas complejos y conjuntos de datos, y ahí es donde Spark juega su comodín.

Apache Spark es una herramienta de procesamiento de grandes datos en memoria que utiliza para aumentar las velocidades de cálculo y las velocidades de manejo de datos.

Estas son las herramientas principales que distinguen a un científico de datos de un estadístico.

Lo anterior son cosas para aprender.

El enfoque paso a paso para convertirse en un científico de datos:

  1. Consulte todas las áreas donde la ciencia de datos se usa de manera eficiente.
  2. Elija el área que le interesa.
  3. Haga una investigación sobre esa área particular de interés.
  4. Busque en Google las técnicas de ciencia de datos utilizadas en esa área en particular.
  5. Aprende cada técnica al día. Practique un problema de caso usando R y Python todos los días.
  6. Aprenda la teoría estadística subyacente detrás de cada técnica.
  7. Busque datos públicos en todas partes en Internet.
  8. Trabaja en ellos.
  9. Trabajar en nuevas técnicas.

Nota: No obtendrá los resultados muy pronto. Debe ser paciente y aprender todos los días / trabajar todos los días.

Tienes dos mejores amigos.

  1. Desbordamiento de pila
  2. Kaggle

Confía en ellos.

También comprenda que usted es el único que desea convertirse en un científico de datos. Hay millones que ya son y quieren ser. Así que trabaja duro.

Todo lo mejor !!

Buena pregunta. Pero la limitación es que no ha revelado sus datos:

  1. ¿Qué es el nivel educativo?
  2. Que haces actualmente
  3. ¿Tienes algún trabajo ex? En caso afirmativo, ¿qué tecnología / plataforma?

Como mi respuesta dependerá de esta información, es importante saber todo esto.

Soy consciente de su tiempo y de mi también, por favor hágamelo saber o llámeme.

Este libro del Manual de Python Data Science realmente lo ayudará y lo guiará hacia el camino correcto para convertirse en un científico de datos desde cero