Вопросы с меткой [xmlparser]

Question 1

Недавно начал изучать xpath, нужно было извлечь данные о времени работы аптеки. Время работы находиться в элементе after, путь к которому я написать не смог. Также заметил что элемент отображается в ...

Question 2

Есть карта сайта: https://www.stussy.com/sitemap_products_1.xml?from=4103557054560&to=6660699586656 Мне нужно спарсить все ссылки на товары. Каким способом лучше сделать?

Question 3

Как отловить и заменить угловые скобки внутри элементов XML-файла? Парсить по закрывающим тегам? Структура XML и названия полей заранее не известны, как и попадающиеся скобки, для примера: <?xml ...

Question 4

Имеется сlob (Oracle) с XML Часть данных "испорчена", т.е. содержит символы <> внутри элементов, например: <Text>Адрес получателя: <[email protected]>; ФИО; почта2 <user2@...

Question 5

Пишу парсер для flashscore на Python. Не видит внутри блочного тега атрибут text (То есть не выводит данные). Пишу код jupyter notebook. Вот мой код: year= '2023' from selenium import webdriver from ...

Question 6

Есть товары в xml <offer id="11111" type="vendor.model" available="false"> <delivery>true</delivery> <model>Model</model> <...

Question 7

Selenium в PyCharm не работает в headless режиме и переходит сразу в ошибку TimeoutException. Драйвер для Chrome актуален и подключен... Когда режим headless отключен, то весь код отрабатывает как ...

Question 8

Есть сайт https://www.gzhel.ru/catalog/ Ввожу код all_a = soup.find("div", class_="grid-4 grid-tablet-3 grid-phablet-3 grid-phone-2 js-nospace").find_all("a") for item ...

Question 9

Всем привет! Буду признателен, если натолкнете меня на мысль, как выполнить это задание. Я новичок в парсинге, поэтому для меня здесь мало что понятно. На ftp сервер проекта раз в сутки выгружается ...

Question 10

Столкнулся с проблемой: почему-то при работе с XML структурами типа <Тэг1:Тэг2> значение </Тэг1:Тэг2> программа перестает находить данные в XML. Например, если взять файл <?xml ...

Question 11

Всем привет. Подскажите, пожалуйста, как я могу добавить в словарь ссылки на картинки без [], чтобы в дальнейшем загрузить все товары с картинками на сайт Вот сам код: import requests #import json ...

Question 12

У меня есть 5 xml файлов, в каждом по 1166 товаров, я их объединяю в один список в нём получается 8532 элементов, когда начинаю запускать, на записи в файл выдаёт ошибку после 1184 элемента Process ...

Question 13

for item in soup.find_all("tr", 'product-row'): print(item.get_text()) Добрый вечер! Суть проблемы - нужно спарсить каталог по категориям, данный код работает например на этой странице ...

Question 14

Есть 3 связанных xml файла, тоесть id из первого есть в других. файлы размером от 100мб до 2-3 гб. Кому интересно это база адресов ГАР. 1й файл названия объектов 2й файл характеристики 3й иерархия - ...

Question 15

Добавил файл haarcascade_frontalface_alt.xml в raw folder и пытаюсь подгрузить его с помощью такого кода: InputStream inputStream = context.getResources().openRawResource(R.raw....

Вопросы с меткой [xmlparser]

Как взаимодействовать с элементом ::after с помощью XPath?

Как спарсить все ссылки с sitemap.xml? Python

Замена угловых скобок внутри элементов XML

Regexp для удаления <> внутри элементов XML

Почему программа не видит данные блочного атрибута 'text'?

Как через xml_parse получить все значение в теге?

Selenium и headless режим

Не получается собрать ссылки на категории и товары

Парсер для XML файла с бд

Парсинг сложного XML формата <xs:тэг> golang

Добавление в словарь списка без скобок

Ошибка призаписи в xml файл Process finished with exit code -1073741571 (0xC00000FD)

beautifulsoup не находит класс при смене страницы сайта

php xml большие связанные файлы как лучше обработать

Не могу подгрузить файл из raw folder через context.getResources().openRawResource(R.raw.haarcascade_frontalface_alt)