Bueno, su mayor error es que esta red de Bayes, tal como está dibujada, no puede representar el modelo que acaba de describir. Como veremos, un valor de [math] \ Pr (z = T) = 0.64 [/ math] indicaría que, si seleccionó un solicitante de trabajo al azar de su grupo, hay un 64% de posibilidades de que termine contratándola
¿Por qué?
Si interpretamos la red literalmente, entonces todos los nodos representan variables aleatorias cuyos valores posibles son ‘T’ y ‘F’. Las probabilidades que está configurando para los nodos “entrevistador” no son la “salida” de estas variables aleatorias, sino la probabilidad de que una variable aleatoria particular “produzca” una ‘T’ o una ‘F’. En otras palabras, cuando especificó que [math] \ Pr (x_1 = true) = 0.5 [/ math] en su ejemplo, definió inequívocamente un modelo donde el entrevistador [math] x_1 [/ math] recomienda contratar en el 50% de todos casos.
- ¿Qué significa que el gerente de contratación revise su solicitud ahora después de la entrevista?
- ¿Qué especialidades buscan las consultoras en las nuevas contrataciones?
- ¿Por qué demonios los empleadores de Valley entran en silencio por radio después de las etapas avanzadas de contratación (en el sitio, reunión), ¿no queda cortesía profesional?
- ¿Las grandes empresas como Google, Microsoft, alguna vez contratan estudiantes de CUNY (City University of New York)?
- Tengo una idea pero no sé cómo codificar. ¿Cómo contrato a un gran programador?
Eso también trae otro posible punto de confusión: en el modelo que dibujó, ‘T’ y ‘F’ en realidad significan cosas diferentes sobre las diferentes variables. En el caso de [matemática] x_1 [/ matemática], [matemática] x_2 [/ matemática] y [matemática] x_3 [/ matemática], una ‘T’ indica que el entrevistador recomienda que el candidato sea contratado, mientras que en el caso de [math] z [/ math], una ‘T’ indicaría que el candidato es realmente contratado. Como ejemplo, veamos la cuarta columna de su tabla de distribución conjunta (es la más grande, si no lo sabía) bastante sencilla. El encabezado indica que la consulta es [matemática] \ Pr (z = T | x_1, x_2, x_3) [/ matemática]. Básicamente se trata de preguntar, “¿cuál es la probabilidad de que contratemos un candidato arbitrario dado que los entrevistadores [matemáticas] x_1 [/ matemáticas], [matemáticas] x_2 [/ matemáticas] y [matemáticas] x_3 [/ matemáticas] todos recomiendan contratar con una probabilidad del 50%?
Eso es un poco diferente de lo que tenías en mente, ¿no?
Para evitar problemas similares en el futuro, es importante tener en cuenta qué es una red de Bayes: una representación gráfica de una distribución conjunta sobre un conjunto de variables aleatorias. En particular, al observar la red de Bayes, podemos determinar de manera inmediata e inequívoca cuál es la distribución conjunta correspondiente. En este caso:
[matemáticas] \ Pr (x_1, x_2, x_3, z) [/ matemáticas]
[matemáticas] = \ Pr (x_1) \ Pr (x_2) \ Pr (x_3) \ Pr (z | x_1, x_2, x_3) [/ matemáticas]
No explicaré cómo obtener esta distribución específicamente, pero créanme, es obvio. Esta formulación también nos permite representar muchas consultas de manera razonablemente eficiente (esta es la razón principal por la que usamos una red de Bayes en lugar de la distribución conjunta completa). Por ejemplo, la consulta anterior podría calcularse como:
[matemáticas] \ Pr (z = T) = \ sum_ {x_1, x_2, x_3} [\ Pr (x_1) \ Pr (x_2) \ Pr (x_3) [/ matemáticas]
[matemáticas] \ Pr (z = T | x_1, x_2, x_3)] [/ matemáticas]
Si tiene en cuenta que cada nodo es una variable aleatoria que adquiere un valor que ha definido con cierta probabilidad, debería ser bastante fácil evitar hacer cosas como esta en el futuro.