Hola! Hoy, Octoparse te mostrará cómo extraer y monitorear los precios de las acciones de Yahoo! Finance. Vale, vamos a comenzar.
Tabla de contenido
Función de detección automática en Octoparse
¿Por qué queremos raspar los precios de las acciones?
4 pasos para raspar y extraer los precios de las acciones
Paso 1: cambiar los resultados de detección automática
Paso 2: cuidar la paginación y generar un workflow
Paso 3: configurar la opción de paginación y revisar el flujo de trabajo
Paso 4: guardar y ejecutar la tarea
Exportar los datos y abrar la hoja de cálculo.
Función de detección automática en Octoparse
La nueva interfaz de Octoparse 8.2 es muy intuitiva. Una vez que copias y pegas una URL en la barra de direcciones, automáticamente comienza a analizar la página web y adivina qué contenido deseas extraer. En este caso, vamos a ingresar la URL de acciones más activa de Yahoo! Finanzas:https://youtu.be/z3FF_J85p0Y.
Después de pegar la URL, haz clic en el botón Inicio y espera un poco mientras se carga.
Antes de continuar con los siguientes pasos, vamos a averiguar las razones por las que se raspan los precios de las acciones.
¿Por qué queremos raspar los precios de las acciones?
Bueno, cuando extraes constantemente el precio de una acción y alimentas continuamente los datos en tu investigación y modelos de datos, puedes entrenar tu algoritmo con tu código de aprendizaje automático que luego te brinda consejos más precisos y rentables en el mercado de inversiones.
Como habrás sabido, una de las aplicaciones de Octoparse es el monitoreo de precios. No solo rastrea y monitorea los precios en una página, sino que también extrae datos sin procesar de tus competidores y extrae datos en tiempo real con unos pocos clics del mouse.
4 pasos para raspar y extraer los precios de las acciones
Con la función de detección automática, se necesitan 4 pasos para raspar y extraer los precios de las acciones.
Paso 1: cambiar los resultados de detección automática
Cuando veas el enlace "Cambiar resultados de detección automática", haz clic en él varias veces hasta que veas resaltada la tabla de acciones más activas en el navegador.
Paso 2: cuidar la paginación y generar un workflow
Debemos cuidar de la opción de paginación. Haz clic en "Editar enlace" y selecciona el botón "Página siguiente" en la página para que Octoparse sepa dónde está exactamente el siguiente botón.
Haz clic en el botón confirmar una vez que hayas seleccionado el siguiente botón. Desmarca "Agregar un desplazamiento de página" y genera un flujo de trabajo.
Paso 3: configurar la opción de paginación y revisar el flujo de trabajo
Como puedes ver, se genera un flujo de trabajo en el lado izquierdo. Lo siguiente que debemos configurar es la opción de paginación. Coloca el cursor del mouse sobre la barra de paginación y haz clic en el ícono de ajustes. Expande el panel "Salir del bucle" e ingresa 2. Esto significa que queremos que el bucle se cierre después de hacer clic dos veces en el siguiente botón de la página web.
Revisemos nuestro flujo de trabajo. Primero, ejecuta "¡Ir a la página web!". A continuación, entra en un ciclo de paginación donde contiene la verdadera extracción. Puedes ver el paso "Extraer datos" que extrae lo que has preseleccionado. Luego, el bucle hará clic en el botón siguiente hasta la condición de salida.
Paso 4: guardar y ejecutar la tarea
Bueno, vamos a guardar la tarea y hacer clic en el botón "Ejecutar" para iniciar nuestra tarea de raspado.
Hay algunas opciones dónde y cuándo deseas ejecutar la tarea. Por el bien de este ejemplo, selecciona "Ejecutar tarea en tu dispositivo".
Ya, podemos ver que los datos extraídos comenzaron a llegar y se detendrán después de que se extraigan 50 líneas de datos.
Exportar los datos y abrar la hoja de cálculo.
Cuando esté completo, haz clic en el botón "Exportar datos".
Ahora abre la hoja de cálculo guardada y compara los datos con los de la vista previa. Asegúrate de que los datos se vean bien. A medida que nos desplazamos por la hoja de cálculo, la última fila es 51, lo que tiene sentido porque la primera fila es el encabezado. 51 menos 1 son 50 filas.
Ahí tienes. En solo unos minutos hemos extraído las acciones más activas de Yahoo! Finance y guardó los datos en una hoja de cálculo.
Tenemos mucho más por venir con respecto a Octoparse y web scraping. Si te gusta nuestro canal, danos un pulgar hacia arriba y suscríbete. ¡Muchas gracias!
Top comments (0)