Es difícil bloquear los límites del ‘campo de análisis predictivo’. Por lo tanto, compartiré algunos pensamientos de alto nivel sobre lo que se necesita para obtener una capacidad de análisis predictivo en funcionamiento en una empresa. Brevemente:
- hay muchos enfoques para la predicción
- hay mucho trabajo antes de la predicción para obtener los datos correctos en la forma correcta y accesibles para las personas adecuadas
- hay mucho trabajo después de la predicción para incorporar la capacidad de predecir en una organización
Entonces esta es en realidad una pregunta muy amplia.
Pero la advertencia es que el trabajo requerido a menudo se extiende a mucha gente. En organizaciones más grandes, normalmente se habla de múltiples unidades de negocio internas y múltiples grupos de proyectos.
- ¿Es aconsejable que un recién graduado se postule a un gran 4 en un país diferente además de Malasia?
- ¿Abandonar la universidad es peor que no ir en primer lugar?
- Cómo convertirse en un escritor inglés más competente
- Cómo obtener recursos para el examen actuarial
- Acabo de graduarme con un BSEE 3.35 GPA y la única oferta que he recibido (6 meses de búsqueda) es de $ 32k. ¿Debo seguir buscando o simplemente aceptarlo?
Analizando un ejemplo de juguete: supongamos que le gustaría predecir las ventas financieras del producto X (nota: casi nunca es tan sencillo). Tiene datos de ventas diarias durante 5 años y una serie de otras características.
Enfoques
Básicamente, lo que tiene son datos que puede abordar como datos de series temporales o datos transversales. E independientemente de cuál de los anteriores, puede adoptar un enfoque de modelado estadístico o un enfoque de aprendizaje automático .
Cada uno requiere su propio conjunto de habilidades (no mutuamente excluyentes) y los detalles se han discutido aquí mismo en Quora, pero en general son habilidades tales como análisis de datos exploratorios, visualización de datos, distribuciones predictivas en estadísticas, programación, modelado de series de tiempo y varios algoritmos de aprendizaje automático.
Así que ahí tienes tus dos primeros conjuntos de habilidades.
Premodelado
Se trata de todo el trabajo requerido para recopilar datos en un formulario listo para el análisis. En nuestro ejemplo, los sistemas operativos de ventas de tiendas minoristas y canales en línea deben consolidarse en un número por día. ¡Y no es una tarea trivial!
Conocido ampliamente como “mezcla de datos”, esto se encuentra en el ámbito de la TI, y analiza las habilidades en ingeniería de datos, ETL y almacenamiento de datos, calidad de datos y gestión de datos maestros . Todos esos términos valen un Google.
La herramienta omnipresente que facilita todas estas actividades es el lenguaje de consulta de estructura o SQL .
Postmodelado
Se trata del trabajo requerido para escalar, poner en funcionamiento e integrar su nueva y brillante predicción en las operaciones diarias. En términos generales, esto se conoce como “implementación de productos analíticos” .
Para aquellos de ustedes que están en la pista de Coursera Data Science, creo que un subconjunto está cubierto en Desarrollo de productos de datos en coursera.org.
Aquí, las herramientas estadísticas complejas deberían dar paso a las reglas comerciales programadas en los sistemas por los desarrolladores de software , generalmente con la gestión de las partes interesadas por analistas comerciales y / o consultores funcionales.
Espero que esto ayude. ¡Todo lo mejor!