Scrapear trabajos de LinkedIn
Actualizado hace más de una semana

LinkedIn es una buena base de datos para encontrar información laboral. En este tutorial, vamos a presentar cómo extraer información del trabajo de LinkedIn.com

Para continuar, necesitamos utilizar esta URL en el tutorial:

Extraemos datos como el título del trabajo, la empresa, el nivel, el tipo, la función y la industria en Octoparse.

Antes de eso, asegúrate de haber descargado nuestra última versión 8.1 (consulta esta guía para descargar Noticias: ¡Lanzamiento de Octoparse 8.1 Beta!). LinkedIn ya no es compatible con Octoparse 7.3.0.

El sitio web aplica desplazamiento infinito junto con un "Mostrar más" para cargar más reseñas. Después de desplazar la página hacia la parte inferior como 6 veces, se revelaría un botón "mostrar más" y si queremos seguir cargando trabajos, tenemos que hacer clic en el botón.

Estos son los pasos principales de este tutorial. [Descarga la tarea de demostración de aquí

]

1. "Ir a la Página Web" - abrir la página web de destino

  • Ingresa la URL en la página de inicio y haz clic en Iniciar

mceclip0.png

2. Detectar automáticamente la página web - crear un flujo de trabajo

  • Elige "Detectar automáticamente los datos de la página web".

  • Espera a que se complete la detección

2.1.gif
  • Verifica los campos de datos en la Vista previa de datos, y también puedes eliminar los campos no deseados o cambiar el nombre de los campos si es necesario

2.2.png
  • Haz clic en "Editar" debajo de la opción "Agregar desplazamiento de página" en el panel de Tips.

  • Configura el tiempo de espera en 4-5 segundos (asegúrate de que el tiempo sea lo suficientemente largo para que la página cargue nuevas reseñas)

2.3.gif
  • Haz clic en "Crear flujo de trabajo" en el panel de Tips.

2.3.png

3. Hacer clic en bucle en el botón "Mostrar más" - cargar más trabajos

  • Elige "Hacer clic en un botón 'Cargar más'" en el panel de Tips

  • Selecciona el botón "Ver más trabajos" en la página web.

  • Configura la cantidad de clics según la cantidad de trabajos que necesite

  • Haz clic en "Confirmar"

  • Configura la Carga AJAX como 5 s

3.1.gif

4. Hacer clic en cada enlace para obtener información más detallada

  • Elige "Haga clic en los vínculos para scrapear las páginas vinculadas" en el panel de Tips.

  • Selecciona "Hacer clic en un campo de datos extraídos" y selecciona "resultcard__fullcardlink_URL" en el menú desplegable (puedes confirmar si es el enlace correcto en la Vista Previa de Datos)

  • Haz clic en "Confirmar"

_.gif
  • Haz clic en abrir la configuración de la acción "Hacer clic en las URLs de la lista"

  • Desmarca la opción "Abrir en una nueva pestaña".

  • Marca "Cargar con AJAX" y configura el tiempo de espera de AJAX como 5-7s

  • Haz clic en "Aceptar" para confirmar

4.2.gif

5. Extraer datos - selecciona los datos para la extracción

  • Haz clic en los datos que quieres extraer de la página

  • Selecciona "Extraer el texto del elemento seleccionado" en el panel "Tips"

  • Repite los pasos hasta que obtengas todos los datos necesarios para scrapear

5.gif
  • Edita el nombre de los campos de datos si es necesario

    5.1.png

6. Iniciar extracción - ejecutar la tarea y obtener datos

  • Haz clic en Guardar"

  • Haz clic en "Ejecutar" en la parte superior izquierda

  • Selecciona "Run task on your device" para ejecutar la tarea en tu computadora, o selecciona"Run task in the cloud" para ejecutar la tarea en la nube (solo para usuarios de plan premium)

6.png

Aquí tienes una muestra de datos.

mceclip0.png
¿Ha quedado contestada tu pregunta?