Al principio parece bastante difícil aumentar tus habilidades como científico de datos, pero no es tan imposible
Por la presente, comparto el conjunto básico de 8 competencias de ciencia de datos que debe desarrollar independientemente de su experiencia y conocimiento:
Herramientas básicas: no importa para qué tipo de empresa se esté entrevistando, es probable que se espere que sepa cómo usar las herramientas del oficio. Esto significa un lenguaje de programación estadística, como R o Python, y un lenguaje de consulta de base de datos como SQL.
Estadísticas básicas: al menos una comprensión básica de las estadísticas es vital como científico de datos. Un entrevistador me dijo una vez que muchas de las personas que entrevistó ni siquiera podían proporcionar la definición correcta de un valor p. Debe estar familiarizado con las pruebas estadísticas, distribuciones, estimadores de máxima verosimilitud, etc. ¡Piense en su clase de estadísticas básicas! Este también será el caso del aprendizaje automático, pero uno de los aspectos más importantes de su conocimiento estadístico será comprender cuándo diferentes técnicas son (o no) un enfoque válido. Las estadísticas son importantes en todos los tipos de empresas, pero especialmente en las empresas basadas en datos donde el producto no se centra en los datos y las partes interesadas del producto dependerán de su ayuda para tomar decisiones y diseñar / evaluar experimentos.
Aprendizaje automático: si está en una gran empresa con grandes cantidades de datos, o trabaja en una compañía en la que el producto en sí está especialmente basado en datos, es posible que desee familiarizarse con los métodos de aprendizaje automático. Esto puede significar cosas como vecinos más cercanos k, bosques aleatorios, métodos de conjunto, todas las palabras de moda del aprendizaje automático. Es cierto que muchas de estas técnicas se pueden implementar utilizando las bibliotecas R o Python; debido a esto, no es necesariamente un factor decisivo si no eres el experto líder mundial en cómo funcionan los algoritmos. Más importante es comprender los trazos amplios y realmente entender cuándo es apropiado usar diferentes técnicas.
Cálculo multivariante y álgebra lineal: de hecho, es posible que se le pida que obtenga algunos de los resultados de aprendizaje automático o estadísticas que emplea en otra parte de su entrevista. Incluso si no lo está, su entrevistador puede hacerle algunas preguntas básicas de cálculo de variables múltiples o preguntas de álgebra lineal, ya que forman la base de muchas de estas técnicas. Quizás se pregunte por qué un científico de datos necesitaría entender estas cosas si hay un montón de implementaciones listas para usar en sklearn o R. La respuesta es que en cierto punto, puede ser útil para un equipo de ciencia de datos construir fuera de sus propias implementaciones en casa. La comprensión de estos conceptos es más importante en las empresas donde el producto se define por los datos y las pequeñas mejoras en el rendimiento predictivo o la optimización de algoritmos pueden generar grandes ganancias para la empresa.
“Científico de datos” se usa a menudo como un título general para describir trabajos que son drásticamente diferentes.
- ¿Cuál es la mejor manera para que un joven adulto recientemente reubicado encuentre una vivienda y un trabajo en Portland Oregon?
- ¿Cómo se une la vida de un ingeniero eléctrico como aprendiz de gerencia en Coal India y cuál es la tasa de crecimiento?
- Cómo conseguir un trabajo en el Reino Unido durante el verano como ciudadano estadounidense
- ¿Cuánto tiempo se tarda en emitir una carta de oferta y se confirma mi trabajo con ICICI o no?
- ¿Cuál es un día típico en la vida de un desarrollador web junior?
Un cordial saludo,
Jay Buddhdev.