Una criptomoneda es una moneda digital o virtual que está protegida por criptografía, lo que hace que sea casi imposible falsificarla o gastarla dos veces. Muchas criptomonedas son redes descentralizadas basadas en la tecnología blockchain, un libro mayor distribuido reforzado por una red dispar de computadoras.
Los jugadores de criptomonedas deben monitorear la fluctuación del precio en las monedas a medida que el precio cambia en segundos. Octoparse puede programar el scraping para que se ejecute instantáneamente para ayudar a actualizar la información a tiempo.
En este tutorial, te mostraremos cómo extraer información de criptomonedas de Yahoo Finance.
Para Yahoo Finance, puedes visitar nuestra "Plantilla de tareas" fácil de usar en la pantalla principal de la herramienta de raspado Octoparse. Todo lo que necesitas es ingresar varios parámetros y la tarea estará lista para comenzar. Para más detalles, puedes consultar: Plantillas de Tarea
Para continuar, necesitamos utilizar esta URL en el tutorial:
Extraeremos datos como el Símbolo y el Nombre del gráfico de criptomonedas con Octoparse.
Estos son los pasos principales de este tutorial: [Descargar archivo de tareas aquí ]
1. Ir a la página web - para abrir la página web de destino
Ingresa la URL de la página en la pantalla de inicio y haz clic en "Iniciar" para crear una nueva tarea
2. Detectar automáticamente los datos de la página web - para cerrar la ventana emergente
Elige "Detectar automáticamente los datos de la página web" y espera a que se complete la detección
Elige "Cerrar una ventana emergente" en el panel de Tips.
Selecciona el botón "Aceptar" y confirme
Haz doble clic en "Hacer clic" o haz clic en
para abrir la configuración de la acción
Extiende el tiempo de espera de AJAX a 7-10 s
3. Detectar automáticamente los datos de la página web - para crear el flujo de trabajo
Vuelve a elegir "Detectar datos de la página web automáticamente" y espera a que se complete la detección.
Haz clic en "Cambiar resultados de detección automática" en el panel de Tips para ubicar el gráfico.
Desmarca "Agregar un desplazamiento de página"
Haz clic en "Crear flujo de trabajo".
Haz clic para abrir la configuración de la acción "Hacer clic para paginar".
Extiende el tiempo de espera de AJAX a 7-10 s
4. Extraer datos - para refinar los campos de datos
Haz clic en abrir la configuración de la acción "Extraer datos"
Elimina los campos no deseados haciendo clic en el icono
Cambia el nombre de los campos haciendo clic en el nombre del campo
Tips!
|
5. Modificar el XPath de Paginación - para corregir el raspado sin fin
Es necesario modificar el XPath of Pagination auto-generado; de lo contrario, no se puede detener el raspado. Octoparse seguirá raspando la última página. Consulta los detalles sobre este problema aquí.
Haz clic en abrir la configuración de Paginación
Ingresa el nuevo XPath //button[not(@disabled)]//span[text()="Next"]
Haz clic en ¨Aceptar¨ para confirmar
6. Iniciar extracción - para ejecutar la tarea y obtener datos
Haz clic en"Guardar"
Haz clic en "Ejecutar" en la parte superior izquierda
Selecciona "Run task on your device" para ejecutar la tarea en tu computadora, o selecciona "Run task in the cloud" para ejecutar la tarea en la nube (solo para usuarios del plan premium). También puedes programar la tarea para actualizar los datos con frecuencia.
Puedes exportar los datos de resultados en formatos proporcionados como EXCEL, CVS, JSON o en tu base de datos.
Aquí tienes una muestra de datos.