Trabajo en Microsoft en un equipo que trabaja con texto, principalmente PNL, mis tareas incluyen conjuntos de datos de texto de minería que son una mezcla entre NLP y minería de datos.
Aquí hay una lista de las cosas más importantes que siempre uso:
- Diccionario y hashset, es decir, tablas hash en todas sus formas. La estructura de datos más importante conocida.
- Patrón de diseño de iterador, en mi opinión, este es uno de los patrones de diseño más importantes, ya que presenta una solución muy fácil para problemas de memoria. Si tiene que leer y procesar archivos 1M desde el disco y no puede leerlos todos en la memoria, debe iterar sobre ellos uno por uno manteniendo solo 1 elemento en la memoria, entonces puede introducir el paralelismo en sus Algoritmos fácilmente.
- Expresiones regulares (expresiones regulares), sea cual sea su trabajo, las necesitará, pero el problema con las expresiones regulares es que si no las conoce, no sabrá que las necesita, ya que siempre puede encontrar una solución. Un día estaba trabajando en sistemas automotrices y solía confiar en ellos para buscar cualquier cosa en la base del código.
- Algoritmos de muestreo (esto puede ser muy específico para mi trabajo), especialmente generando un conjunto aleatorio a partir de una secuencia. Supongamos que queremos seleccionar 10 archivos al azar de los archivos 1M.
Creo que estas son las cosas más importantes que uso a diario.
- Cómo convertirse en un ingeniero eléctrico muy valorado muy temprano, con mucho trabajo en mi carrera
- ¿Cuándo debemos tomar orientación profesional?
- ¿Qué campo debo seguir: médico o comercial?
- Con la demanda laboral actual en ingeniería mecánica, ¿qué debo hacer en el campo de los automóviles?
- Cuando tenías la edad de elegir entre tu pasión y tu carrera, ¿qué elegiste? ¿Y te arrepientes hoy?