¿Qué significa ‘capacidad para extraer información de los datos’ y ‘habilidades analíticas sólidas’ en las ofertas de trabajo de ciencia de datos?

Capacidad para extraer información de los datos.
Cómo Target descubrió que una adolescente estaba embarazada antes que su padre

Habilidades de análisis: la capacidad de tomar grandes volúmenes de datos y luego analizar tendencias y producir un resultado
Tratar con problemas: dar ejemplos de resolución de problemas en el trabajo
Programación: escriba un programa de sistemas con resultados precisos
Informes: un informe escrito sobre la efectividad de un evento en particular, como una campaña política
Manejo eficaz de las tareas: descubrir una forma más eficiente y productiva de completar una tarea laboral en particular.
Proceso: crear un conjunto de pasos para implementar un proceso que podría tener un resultado sí o no.
Manejador de problemas: identificar un problema y luego crear una reparación para evitar que se convierta en un problema importante.
Recopile información , analice los datos de la información recopilada y encuentre una solución a un problema.

Si se le da un gran conjunto de datos (o múltiples) que a menudo son ruidosos, como científico de datos debe poder extraer información útil. Esta información puede ser dirigida, lo que significa que usted sabe para qué está explotando (por ejemplo, la relación entre A&B) o simplemente puede extraer los datos para identificar patrones y luego traducir esos patrones en ideas (una idea es algo realmente útil para su causa) .

La forma de detectar esos patrones es tener un sólido conjunto de herramientas de minería de datos a su disposición. Un ejemplo de una de estas herramientas podría ser PCA (análisis de componentes principales). PCA efectivamente le permitiría determinar qué atributos en sus datos son más relevantes para describir las mayores diferencias en sus puntos de datos.

Al observar su conjunto de datos sin procesar y tener un objetivo, debería poder tener una idea de lo que le gustaría hacer (o al menos intentar) para generar algunas ideas. Por lo general, hay muchos pasos, la mayoría de los cuales decide utilizar su comprensión del contexto de los datos, así como los resultados que está viendo actualmente. Llame a esto la porción de capacidad analítica. Además, para comprender los diversos conceptos de minería de datos, debe ser analítico, ya que algunos son algo complicados.