Вопросы с меткой [beautiful-soup]
Beautiful Soup – это Python библиотека для синтаксического разбора файлов HTML/XML, которая может преобразовать даже неправильную разметку в дерево синтаксического разбора.
1,401 вопрос
- Конкурсные 0
- Неотвеченные
- Цитируемые
- Рейтинг
- Популярные
- За неделю
- За месяц
- Неотвеченные (мои метки)
0
голосов
1
ответ
81
показ
Не парсится сайт epicgames /store/ru/free-games с помощью BeautifulSoup
Я хочу парсить бесплатные игры на epicgames store по ссылке: https://www.epicgames.com/store/us/free-games, но мне вместо этого выдает статус код: 403, что делать?
Код:
import requests
from bs4 import ...
1
голос
0
ответов
39
показов
Как получить ВСЕ карточки на сайте Яндекс Услуги? [закрыт]
Мне необходимо спарсить ВСЕ карточки дизайнеров интерьеров на сайте Яндекс Услуги со ВСЕЙ России (https://uslugi.yandex.ru/213-moscow/category/dizajneryi/dizajner-intererov--258).
Проблема:
На сайте ...
0
голосов
0
ответов
58
показов
Что ещё изучить для парсинга на python?
Я изучил библиотеки requests, bs4, xlsxwriter, selenium, использую fake-useragent.
Что ещё может пригодиться для более сложных (или просто других) проектов?
0
голосов
0
ответов
105
показов
Как создать полную копию сайта Fragment.com через авторизованную сессию
Как создать полную копию сайта Fragment.com через авторизованную сессию, учитывая что:
Fragment.com использует авторизацию через Telegram без публичного API.
Стандартные методы скачивания сайтов не ...
0
голосов
0
ответов
81
показ
Как спарсить значение?
Нужное мне значение находится в блоке browser-lang, который в свою очередь находится в блоке tool_padding. Почему-то именно из этого блока я не могу получить значение. Пробовал получить значение span ...
0
голосов
0
ответов
104
показа
Возникает ошибка при парсинге сайта
from bs4 import BeautifulSoup
import requests
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import time
is_accept = False
while not is_accept:
...
0
голосов
0
ответов
89
показов
Ошибка при парсинге сайта на python
Разобраться с кодом, чтобы работал корректно 24 на 7, в парсере не сильно силен, но не понимаю как исправить эту ошибку(постоянно вылетает) через рандомное время, может отработать как 2 часа, так и 3 ...
0
голосов
0
ответов
37
показов
Парсер BeautifulSoup пропускает некоторые теги отделенные текстовыми содержимым
Привествую, тренируюсь в парсинге на python. Поставил себе задачу спарсить всю информацию из каждого блока с цитатами c сайта Quotes to Scrape. С самой цитатой или ссылкой "(about)" проблем ...
0
голосов
2
ответа
94
показа
Не читается word-файл в коде python
Почему не читается и не выводится на print содержание word-файла в коде python:
import bs4
import time
import random
import requests
import docx
from bs4 import BeautifulSoup
from requests_html import ...
1
голос
0
ответов
57
показов
Как получить id с сайта
Я пытаюсь парсить сайт ozon, код делится на 2 этапа main и funk, в funk есть функция которая открывает страницу определенного объекта, и она должна брать id c этой страницы, но вместо этого он ...
-1
голос
1
ответ
62
показа
не могу полностью спарсить сайт
хотел создать программу, что бы та проходилась по станицам hh ссылка на сайт с запросом и вытаскивала требования с каждой вакансии, после чего отсортировать и вывести в порядке убывания. от части мне ...
0
голосов
1
ответ
91
показ
Перенос данных парсинга в Excel выполняется частично
Спарсил все страницы сайта, но почему-то экспортируется в Excel только первая. Как исправить код, чтобы сохранялись все найденные объявления?
import requests
import pandas as pd
from bs4 import ...
0
голосов
0
ответов
57
показов
Как найти текст в теге td?
Получил такие данные через beatidulsoup
<td class="Value FormTd" id="p_body_fld_c3a5t2r34212155b1f173" z="custom.wgs_широта" zfieldshape="eSingleLine" ...
0
голосов
1
ответ
66
показов
Как найти определенное слово на странице?
Есть табличная страница, Я ее решил спрасить по элементу td и уже вытягивать информацию внутри td таким образом:
for bs in newData4gNokDict:
bs = bs[:2] + "00"+ bs[2:]
print(bs)
...
1
голос
1
ответ
146
показов
Я пытаюсь сделать парсер максимальной цены покупки steam
Я пытаюсь сделать парсер максимальной цены покупки steam для предметов из игры Dont starve, однако я столкнулся с некоторой проблемой, парсер работает, однако периодически происходит ошибка 'NoneType' ...