¿Qué significa ser un científico de datos de personalización?

Aproximadamente, esto se traduce en aprovechar el aprendizaje automático y / o las estadísticas para crear algoritmos que aprendan los intereses de una persona y entreguen el contenido de manera adecuada.

Algunos ejemplos de productos que un científico / ingeniero de datos de personalización crearía o informaría:

  1. Recomendaciones de películas de Netflix
  2. Feeds personalizados como Quora’s o Facebook’s
  3. Sugerencias de “personas que quizás conozcas” en LinkedIn o Facebook

Para hacerlo bien, debes ser bueno en:

  • Ingeniería de características y comprensión de las personas : un algoritmo de ML es tan bueno como sus características, por lo que necesita intuición para capturar tantas señales como sea posible.
  • Creación de prototipos : las características de personalización se prueban mejor al construir algo rápido y sucio, tener un valor medible y ponerlo en manos de personas reales lo antes posible.
  • ML puro : algunos algoritmos simplemente separan la señal del ruido mejor que otros, por lo que tener un arsenal profundo es útil.
  • Producción : a veces se te ocurren algoritmos que son buenos pero que no se adaptan a grandes sistemas como un gráfico social de mil millones de nodos y un billón de bordes. Es importante tener un buen sentido de los límites de la informática distribuida y los algoritmos de compilación que pueden devolver resultados útiles en los milisegundos bajos, o calcular previamente y almacenar en caché en consecuencia.
  • Identificar burbujas de filtro : lo difícil con la personalización es que las personas se quedan atrapadas en “burbujas de filtro”, parecen tener una buena experiencia a corto plazo viendo una gran comedia tras otra, pero finalmente se cansan de su servicio porque solo se aprende te recomiendo comedias El mismo trato si Facebook solo alguna vez recomienda a mis amigos de la escuela secundaria que se vuelvan a conectar.

    Hay un poco de arte subjetivo en identificarlos, cuantificar su efecto y proteger su sistema contra ellos.

Estas son a veces habilidades que tiene una persona, generalmente en una startup o pequeña empresa. A veces, estas habilidades se extienden a través de un equipo con personas especializadas en ciertas áreas.

Eso es todo lo que puedo pensar fuera de mi cabeza. Agregaré más si puedo pensar en ello y A2A algunos expertos.

Esto podría significar una variedad de cosas dependiendo de la industria para la que trabaje. Por ejemplo, en salud, puede significar medicina personalizada. Pero el caso de uso más común hoy en día serían los servicios basados ​​en la web que desean proporcionar una experiencia de usuario personalizada; publicidad personalizada; o experiencia de compra personalizada para comercio electrónico.

En ese contexto, el ejemplo más familiar sería el de los sistemas de recomendación que ve en Netflix o Amazon. Su objetivo es aprender las preferencias individuales de su comportamiento pasado y personalizar la experiencia del usuario para satisfacer sus gustos. Tales sistemas de recomendación son la base para todo tipo de personalización, por lo que vale la pena estudiarlo.

Otro aspecto importante de este tipo de sistema es que no puede obtener valor a menos que esté integrado en el sistema de producción general. Construir un aprendizaje automático de producción de este tipo requiere un conjunto muy diferente de habilidades. Acabo de escribir una publicación de blog sobre este tema analizando por qué Netflix no pudo usar en el sistema productio los algoritmos que obtuvieron de la competencia de aprendizaje automático de crowdsourcing llamada Premio Netflix.

http://blogs.mathworks.com/loren