¿Qué es el IFrame?
Un IFrame (Inline Frame o marco en línea) es un código HTML incrustado dentro de otro documento HTML en un sitio web. Se utiliza para insertar contenido de otra fuente, por ejemplo, un anuncio o una tabla. Un marco en línea (Inline Frame) se especifica mediante la etiqueta <iframe>.
¿Cómo scrape de un IFrame con Octoparse?
El navegador incorporado de Octoparse puede reconocer IFrame automáticamente, por lo que solo debe seleccionar la información en IFrame y elegir extraerla de los Consejos de acción, como lo que hace al raspar páginas sin IFrame.
Octoparse localiza los elementos en IFrame con la combinación de IFrame Xpath y Matching XPath. Si necesita modificar el XPath de un campo de datos, tenga en cuenta que es posible que necesite modificar tanto el IFrame XPath como Matching XPath (verifique cómo modificar XPath aquí )
¿Qué sucede si Octoparse no puede reconocer el IFrame automáticamente?
Si Octoparse no reconoce los elementos en IFrame, hay dos soluciones para raspar los datos:
1. Primero podemos extraer cualquier elemento fuera del IFrame y luego modificar la XPath del campo de datos.
Nota para ingresar tanto el IFrame XPath como Matching XPath.
2. Podemos obtener la dirección del enlace IFrame del código fuente y usar el enlace IFrame como la URL de inicio para construir una tarea.
Si inspecciona el elemento IFrame en Chrome, puede ver que la etiqueta IFrame contiene un enlace:
Haga clic derecho en la etiqueta en el navegador, elija la opción "Copiar la dirección del enlace" y podrá obtener el enlace.
Usar el enlace IFrame para crear una tarea es tan fácil como raspar una página normal sin IFrame.
¡Consejos! Si hay varios enlaces IFrame en el código fuente, asegúrese de que el enlace se procese con los datos requeridos.
|
¿Puede Octoparse raspar IFrame en IFrame?
No, Octoparse no puede raspar IFrame dentro de IFrame. Sin embargo, también podemos obtener la dirección del enlace IFrame del código fuente, y luego usar ese enlace como la URL de inicio para construir una tarea.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.