¿Necesito un doctorado para convertirme en ingeniero de aprendizaje automático? ¿Necesito aprender R y Python o Scala y Python?

No necesitará un doctorado para convertirse en un ingeniero de ML.

Prefiere experiencia trabajando con datos en un entorno profesional y familiaridad con los conceptos y algoritmos de ML.

Con respecto a los lenguajes de programación, debe aprender los que se utilizan en el trabajo y estar abierto para aprender los que se requerirán más adelante.

Espero que esto ayude


Si desea obtener más información sobre las diferencias entre R y Python y Data Science en general, puede leer las siguientes respuestas:

  • La respuesta de Yassine Alouini a ¿Cuál es mejor para el análisis de datos: R o Python? ¿R sigue siendo un mejor lenguaje de análisis de datos que Python? ¿Alguien más ha usado Python con Pandas, en gran medida, en proyectos de análisis de datos?
  • La respuesta de Yassine Alouini a ¿Hay un esfuerzo en curso para desarrollar un paquete de trazado similar a ggplot2 para python?
  • La respuesta de Yassine Alouini a ¿Por qué los estadísticos no han estado en el centro de atención en la revolución de los grandes datos tanto como los científicos de datos?
  • La respuesta de Yassine Alouini a ¿Por qué Python es un lenguaje de elección para los científicos de datos?
  • La respuesta de Yassine Alouini a En el análisis de big data, ¿cuáles son los lenguajes de programación?

Machine Learning es en sí mismo un gran aprendizaje. El término aprendizaje automático se explica por sí mismo. Las máquinas aprenden a realizar tareas que no están programadas específicamente para hacer.

El aprendizaje automático en un proceso es

  1. Algoritmos que consumen datos enormes
  2. Excavar patrones de los datos
  3. Convertir patrones en acciones

No se sorprenda si se encuentra con un anuncio exactamente similar a sus intereses que deseaba comprar la última vez que estaba comprando en línea. Eso simplemente es aprendizaje automático.

El aprendizaje automático es un campo extenso, saber que Python no es lo suficientemente bueno. Hay muchas otras cosas que debes saber para ser un ingeniero de aprendizaje automático.

Estas son las habilidades que tendrá que desarrollar además de Python para sobresalir en el campo del aprendizaje automático.

Habilidades básicas

Machine Learning es una mezcla de ingeniería de software, matemática y ciencia de datos. Estas tres son las habilidades básicas y uno debe ser competente en ello. Profundizando en esto

Probabilidades y estadísticas

Uno puede aprender sobre algoritmos con la ayuda de teorías de probabilidad y estadística. Algunos modelos como los modelos de mezcla gaussiana, los modelos naive bayes y los modelos ocultos de Markov exigen una comprensión sólida de la probabilidad y las estadísticas. Aprende la teoría de la medida. Las estadísticas ayudan como medida de evaluación del modelo, como curvas receptor-operador, matrices de confusión, valores p, etc.

Modelado de datos

Los ingenieros de aprendizaje automático también tienen que analizar datos no estructurados. Esto se basa principalmente en la ciencia del modelado de datos, el proceso de evaluar la estructura básica de un conjunto de datos, ubicar patrones y cerrar la brecha donde no hay rastros de datos. El modelado de datos es la base del desarrollo de algoritmos firmes que se pueden mejorar con el tiempo.

Habilidades en programación

Sus habilidades de programación y desarrollo de software serán las más importantes, ya que el aprendizaje automático se trata de desarrollar algoritmos productivos.

Programación y fundamentos informáticos

Hay muchos cálculos sobre una cantidad extremadamente grande de datos en el aprendizaje automático. Por lo tanto, uno debe ser claro con

  • Estructuras de datos como colas, matrices multidimensionales, pilas de árboles, gráficos, etc.
  • Complejidad como problemas NP-completos, P vs. NP, notación big-O.
  • Algoritmos como búsqueda, optimización, programación dinámica, clasificación.
  • Constitución informática como caché, puntos muertos, memoria, ancho de banda, procesamiento distribuido.

Una vez que conozca profundamente estos fundamentos, también es responsable de saber cómo aplicarlos y desplegarlos durante la programación.

Diseño de software

¿Qué ofrecen los ingenieros de aprendizaje automático? Entregan “Software”. Si miramos de cerca, el software es un componente muy pequeño, sin embargo, un cambio de juego en una gran comunidad de productos y servicios. Por lo tanto, es importante formar sistemas y algoritmos que puedan integrarse efectivamente con dicho software. Al tener un fuerte dominio de la API, las bibliotecas dinámicas ayudarán en el diseño de software adecuado y el desarrollo efectivo de la interfaz.

Matemáticas Aplicadas y Algoritmos

Se puede acceder fácilmente a las implementaciones universales del aprendizaje automático a través de bibliotecas como Theano, scikit-learn, Spark MLlib, TensorFlow, H2O, etc. Sin embargo, elija un modelo apropiado para implementarlas de manera efectiva como árbol de decisión, vecino más cercano, red neuronal, conjunto de múltiples modelos, admite máquinas de vectores, etc. Debe tener conocimientos sobre optimización convexa, programación cuadrática, gradiente decente, ecuaciones diferenciales parciales, lagrange, etc. Además, es importante tener una idea sobre los méritos y deméritos de diferentes enfoques, como el sobreajuste y la falta de ajuste, la fuga de datos, sesgo y varianza, datos faltantes, fuga de datos.

Lenguajes de programación de aprendizaje automático

El aprendizaje automático no se limita a ningún idioma específico. Encontrará bibliotecas ML en diferentes lenguajes de programación como C, C ++, R y Python. Entre todos estos lenguajes de programación, el mejor lenguaje en mi opinión para seguir adelante es Python.

Los científicos de datos y los ingenieros de aprendizaje automático se enamoran fácilmente del lenguaje python debido a su fácil sintaxis. Python garantiza una eficiente informática científica y procesamiento de datos, gracias a sus útiles bibliotecas como SciPy, NumPy y Pandas. Algunas bibliotecas especializadas de ML como Theano, scikit-learn y TensorFlow desarrollan fácilmente algoritmos con diversas plataformas informáticas.

Con tanto entusiasmo por el aprendizaje automático ya en 2017, estoy seguro de que el aprendizaje automático surgirá más en los próximos años. ML jugará un papel importante en moldear el futuro de las plataformas en línea.

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes crearon proyectos a partir de conjuntos de datos REALES y declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y está fuertemente orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.

Algunos enlaces rápidos

Chatee con un consejero académico: le invitamos a compartir todas sus dudas e inseguridades, a las que haremos todo lo posible para guiarlo hacia su camino profesional hacia el éxito. https://calendly.com/greyatom/co

No necesita un doctorado, pero puede ayudarlo a encontrar un trabajo.
Si revisa las ofertas de trabajo para los científicos de datos, la mayoría requiere al menos un Msc, si no un doctorado. Los trabajos con ingeniero en su título tienen más probabilidades de tener un enfoque de ingeniería y requieren más programación y menos algoritmos.

La educación formal rara vez es un requisito real en toda la industria de la informática y hay muchos ejemplos de quienes se destacan sin una educación formal significativa.

Y, sin embargo, si desea obtener un trabajo, su CV debe pasar el examen. Un doctorado puede ayudar, sin un doctorado y cuando compite contra candidatos con un doctorado, necesita algo más en su CV.

Afortunadamente tenemos http: //Kaggle.com&nbsp ; donde puedes ganar experiencia real y mostrarla al mundo. Recomendaría a cualquier aspirante a profesional de Machine Learning a participar en las competiciones de Kaggle y agregar aspectos destacados a su CV.

En principio, lo único que necesita para llamarse ingeniero de aprendizaje automático es hacer aprendizaje automático. Encuentra algunos datos, define un problema, analiza los datos e implementa el mejor algoritmo.

Para encontrar un trabajo como ingeniero de aprendizaje automático, algunas empresas requieren un doctorado, pero no todas. R, Python, Scala son herramientas populares en esta área, vale la pena aprenderlas, pero debes tener en cuenta que lo más importante no es la herramienta sino lo que haces con ella. Pulsar botones solo lo llevará hasta ahora, nada reemplazará una comprensión profunda de los datos y los modelos matemáticos.

No siempre.

Para puestos de ingeniería, Python, Scala y Java se usan con mucha más frecuencia que R. R se usa principalmente para fines de exploración y experimentación.