A veces, puede encontrarse con una situación tal que primero debe hacer clic en algunos elementos para mostrar la información oculta detrás. ¿Cómo scrape este tipo de datos?
Tomemos este sitio web como ejemplo: https://www.nastygal.com/black-croc-structured-mini-backpack/AGG77323.html
En este sitio web, si desea ver los datos en los campos "detailed description" , debe hacer clic en las etiquetas respectivamente.
Configura un paso de clic - indica a Octoparse que haga clic para abrir la pestaña de descripción.
Si los datos se pueden encontrar en el código fuente de la página web, puedes extraer los datos directamente
1. Haga clic en la etiqueta para mostrar primero los datos y luego extraiga los datos que desee
Haga clic en la etiqueta "Description"
Seleccione "Clic URL" (podría ser Clic en elemento o Clic en botón)
Abre la configuración de paso
Ve a Opciones
Desmarca la opción Abrir en una nueva pestaña
Configura 'Carga AJAX' en 2s-5s
Haz clic en 'Aplicar' para guardar
Una vez que se muestra el texto de la descripción, podemos obtener el texto
2. Si los datos se pueden encontrar en el código fuente de la página web, puede extraer datos directamente
Haz clic en Modo de Navegar en la esquina superior derecha
Haga clic en "Details and Care" para mostrar el contenido.
Haga clic en el botón de cambio nuevamente Mode de Navegar para volver al modo de edición
Luego, puede seleccionar los datos y hacer clic en "Extraer texto del elemento seleccionado" en el panel "Consejos de acción"
Haga clic en "Aceptar" para guardar.
Este método solo funciona cuando los datos pueden encontrarse en el código fuente, ya sea que hagamos clic para abrirlos o no. Si la información solo se muestra después de hacer clic, aún necesitaremos usar el primer método para obtenerla