Вопросы с меткой [scrapy]

Question 1

Такая проблема - мне необходимо приложение на Scrapy-playwright для парсинга некоторых сайтов. В данном случае - ББР банка (Задание учебное, поэтому валюты подсасываются парсингом - задание препода) ...

Question 2

Всем доброго дня! Написал простенький паучек. Код ниже: import scrapy class SpiderProsyr(scrapy.Spider): name = 'SpiderProsyr' starturl = ['https://pro-syr.ru/zakvaski-dlya-syra/'] def ...

Question 3

Решил попробовать со скрапить карточки циан, но при запуске scrapy shell и потом fetch('https://kazan.cian.ru/cat.php?deal_type=sale&engine_version=2&offer_type=flat&p=1&region=4777&...

Question 4

Нужно сделать паука, который будет следующие данные по странам: '#' (Стартовая страница) Страна (Стартовая страница) Население (Стартовая страница) Городское население (Страницы стран) Мировое ...

Question 5

Пытаюсь написать парсер изображений с pinterest используя фреймворк scrapy, сайт подтягивает изображения динамически, методом тыка был найдет json файл в котором хранятся ссылки на изображения, ...

Question 6

Мой код: def start_parce(): process = CrawlerProcess(get_project_settings()) process.crawl(SpiderCardSpider) settings = process.settings settings.set("FEEDS", { "...

Question 7

from typing import Iterable, Any import scrapy from scrapy import Request from scrapy.http import Response class CatalogSpider(scrapy.Spider): name = "catalog" allowed_domains = ["art-...

Question 8

Почему выдает один элемент, если есть цикл ? И как получить текст по всем элементам ? import requests_html import requests from bs4 import BeautifulSoup from selenium import webdriver from ...

Question 9

Есть код парсинга сайта с помощью scrapy crawl import scrapy class OstrovSpider(scrapy.Spider): name = "ostrov" allowed_domains = ['ostrov-shop.by'] start_urls = [ "...

Question 10

Я Новичок еще и до этого момента работал со своим репозиторием. Сейчас пригласили в компанию. Сейчас стала такая проблема: работал локально - результат готовый проект локально в директории по запросу ...

Question 11

Парсер написан на Scrapy. Сайт www.auchan.ru. Не могу понять, как получить свежий параметр qrator_jsid или свежие cookies сразу при запуске. Со старта куки я беру с сайта сам, ложу их в модуль и ...

Question 12

Мне нужно спарсить эту страничку https://www.flashscore.com/match/ETiJbUxd/#/h2h/overall Скачал html сайта но там нет нужных данных ( голы, прошлые игры итд) Вместо них какой то js скрипт пытался ...

Question 13

Решил сделать парсер, вот код парсера. Проблема в том что когда отправляю get запрос, то приходит странный html код, хотя статус код 200. Ещё и ни один тег не ищется почему то. from requests import ...

Question 14

Делал регистрацию через selenium питон и задался вопросом, если способ сделать этот процесс быстрее? Мб другие библиотеки такие как requests или scrapy фрейм?

Question 15

Я новичок в парсинге, сейчас столкнулся с такой проблемой, когда пытаюсь спарсить всю страницу "https://ru.wargaming.net/shop/wot/vehicles/", получаеться вот такое: <html> <head> ...

Вопросы с меткой [scrapy]

scrapy-playwright не работает через celery в проекте django

Scrapy Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min)

Как обойти ошибку 403 через Scrapy?

Парсинг данных столбцов таблицы HTML с помощью scrapy и xpath

Как отправлять get-запрос на получение json файла через фреймворк scrapy?

Не могу перезапустить spider (scrapy) для регулярного парсинга веб-сайта

Scrapy парсит не все товары

Python поиск по элементам

Персинг не переходит на следующую страницу

Как подключиться рабочему репозиторий на GitHub на котором уже есть и запушить свой проект туда?

Kак получить параметр qrator_jsid и cookes сайт www.auchan.ru?

Как спарсить данные если их нет в html? [закрыт]

Не работает парсер, когда посылаю гет запрос

Чем лучше проводить регистрацию на сайте?

Парсинг - не могу спарсить определенный сайт