¿Cómo se puede raspar en la web una lista de trabajos / ocupaciones / carreras para su posterior procesamiento (preferiblemente con metadatos si es posible)?

Debería intentar usar Kimono para esto (Convierta los sitios web en API estructuradas desde su navegador en segundos). Es realmente fácil raspar datos con Kimono desde casi cualquier sitio web y actualizar los datos cuando se lo pidas. Muchos reclutadores usan Kimono para raspar detalles de listados de trabajo de sitios de carrera. Puede crear una API de Kimono a partir de una lista de enlaces de publicación de trabajo y luego alimentar esa lista a su API con los detalles de publicación para rastrear. Incluso puede escribir funciones de JavaScript en sus datos para modificar su salida o prepararla para su posterior procesamiento.

Parece que esto podría ser muy útil para lo que estás tratando de hacer. Kimono se ha utilizado para raspar datos para una variedad de sitios y se puede combinar fácilmente con otras herramientas para el procesamiento de datos. Echa un vistazo a esta publicación de blog para ver cómo se utilizó Kimono para raspar las críticas de hoteles y realizar análisis de opinión sobre los datos: http://blog.kimonolabs.com/2014/…

En aras de la transparencia, trabajo para Kimono, ¡pero nuestro producto es realmente increíble y completamente gratis!

Si está buscando datos de trabajo a gran escala a intervalos regulares, debe seguir adelante con el proveedor de datos como servicio. Los proveedores de DaaS ya tienen la configuración de infraestructura para la extracción de datos de alta calidad sin interrupción.

En PromptCloud, trabajamos con numerosos clientes del dominio de Job para extraer el título del trabajo, la compañía, la ubicación, la descripción del trabajo, las habilidades, etc. Nos ocupamos de las necesidades de adquisición de datos de extremo a extremo, de modo que solo se centre en la aplicación de datos. Si está buscando un socio confiable para la extracción de datos, comuníquese con nosotros (sales [at] promptcloud .com) para crear un feed de datos personalizado que sea exactamente adecuado para sus necesidades.

Consulte nuestro próximo producto sobre feeds de datos de trabajos, JobsPikr – Feeds de trabajos frescos de los sitios web de la empresa. Estaremos ofreciendo alimentación de trabajo rastreando y extrayendo datos directamente de la sección de carreras de cientos de empresas (esto se ampliará a miles de sitios para la segunda mitad de 2017).