¿Qué nivel de conocimiento esperan las empresas de los estudiantes que solicitan pasantías en ciencia de datos?

Soy parte del equipo de Data Science en CleverTap. CleverTap proporciona interacción móvil y análisis de comportamiento. Debe recibir notificaciones en su teléfono directamente o por correo electrónico, SMS, Facebook, etc. Estas notificaciones son entregadas por empresas como la nuestra.

Al mismo tiempo, también permitimos que estas aplicaciones / sitios web registren el comportamiento del usuario en la base de datos CleverTap. Entonces, más tarde, nuestro cliente debe elegir enviar un recordatorio por correo electrónico a, por ejemplo, los clientes que agregaron un producto a su carrito pero no compraron. Para una aplicación de contenido de video, podría estar notificando a sus usuarios sobre una próxima serie de televisión. Para las aplicaciones de entrega de alimentos, podría estar enviando una notificación a las 7 pm preguntándoles si quieren pedir la cena.

Algunos de los problemas muy desafiantes que tienen los propietarios de aplicaciones / sitios web es predecir:

  1. demanda en un área determinada en un período de tiempo determinado
  2. qué clientes desearían comprar un producto en particular o ver un video o reservar un vuelo en las próximas 2 semanas
  3. qué clientes probablemente desinstalarán la aplicación en los próximos 10 días. Usted ve, la adquisición de clientes es muy costosa. Por lo tanto, sería de gran ayuda si los propietarios de aplicaciones pueden predecir de antemano quién está perdiendo interés en su aplicación
  4. para un nuevo cliente, ¿vino con la intención de explorar o comprar?

Tenemos historia de todos los clientes de nuestros clientes. El núcleo de todos los problemas anteriores es determinar qué comportamiento conduce a qué tipo de conversión.

Al mismo tiempo, también nos gustaría saber las razones por las cuales el modelo marca a un cliente “más propenso a desinstalar” o “menos propenso a desinstalar”. Entonces, esto elimina los modelos de caja negra como Neural Networks.

Cuando buscamos pasantes, esperamos que tengan un conocimiento básico de:

  1. Compensación de sesgo vs variación
  2. Maldición de dimensionalidad
  3. Muestreo:
    1. Tipos: Aleatorio, Estratificado
  4. Modelos:
    1. Modelos de árboles: árboles de decisión, bosques aleatorios
    2. Regresión lineal
    3. Regresión logística
    4. SVM
  5. Objetivo de optimización:
    1. Precisión, precisión, recuerdo, AUC
    2. Puntuación F1, entropía de Shannon
  6. Búsqueda de cuadrícula
  7. Matemáticas
    1. Álgebra lineal
    2. Cálculo
    3. Estadística
  8. Los enlaces entre todos los puntos anteriores 🙂