Skip to main content
Stack Overflow на русском

Вопросы с меткой [xmlparser]

Анализатор XML просматривает текстовые документы, содержащие XML деревьев, и позволяет использовать информацию в иерархии. Используйте этот тег для задач, реализующих синтаксический анализатор XML или созданных с помощью существующего синтаксического анализатора на данном языке.

Фильтрация
Сортировка
Метки
0 голосов
2 ответа
214 показов

Недавно начал изучать xpath, нужно было извлечь данные о времени работы аптеки. Время работы находиться в элементе after, путь к которому я написать не смог. Также заметил что элемент отображается в ...
bycfa 's user avatar
0 голосов
1 ответ
508 показов

Есть карта сайта: https://www.stussy.com/sitemap_products_1.xml?from=4103557054560&to=6660699586656 Мне нужно спарсить все ссылки на товары. Каким способом лучше сделать?
san1rope's user avatar
0 голосов
1 ответ
208 показов

Как отловить и заменить угловые скобки внутри элементов XML-файла? Парсить по закрывающим тегам? Структура XML и названия полей заранее не известны, как и попадающиеся скобки, для примера: <?xml ...
Ученик's user avatar
0 голосов
0 ответов
117 показов

Имеется сlob (Oracle) с XML Часть данных "испорчена", т.е. содержит символы <> внутри элементов, например: <Text>Адрес получателя: <[email protected]>; ФИО; почта2 <user2@...
0 голосов
1 ответ
78 показов

Пишу парсер для flashscore на Python. Не видит внутри блочного тега атрибут text (То есть не выводит данные). Пишу код jupyter notebook. Вот мой код: year= '2023' from selenium import webdriver from ...
0 голосов
0 ответов
62 показа

Есть товары в xml <offer id="11111" type="vendor.model" available="false"> <delivery>true</delivery> <model>Model</model> <...
FotoCross's user avatar
0 голосов
1 ответ
1k показов

Selenium в PyCharm не работает в headless режиме и переходит сразу в ошибку TimeoutException. Драйвер для Chrome актуален и подключен... Когда режим headless отключен, то весь код отрабатывает как ...
0 голосов
0 ответов
42 показа

Есть сайт https://www.gzhel.ru/catalog/ Ввожу код all_a = soup.find("div", class_="grid-4 grid-tablet-3 grid-phablet-3 grid-phone-2 js-nospace").find_all("a") for item ...
Илья's user avatar
0 голосов
1 ответ
198 показов

Всем привет! Буду признателен, если натолкнете меня на мысль, как выполнить это задание. Я новичок в парсинге, поэтому для меня здесь мало что понятно. На ftp сервер проекта раз в сутки выгружается ...
DDDovi's user avatar
  • 1
1 голос
1 ответ
304 показа

Столкнулся с проблемой: почему-то при работе с XML структурами типа <Тэг1:Тэг2> значение </Тэг1:Тэг2> программа перестает находить данные в XML. Например, если взять файл <?xml ...
ar rr's user avatar
  • 141
0 голосов
1 ответ
104 показа

Всем привет. Подскажите, пожалуйста, как я могу добавить в словарь ссылки на картинки без [], чтобы в дальнейшем загрузить все товары с картинками на сайт Вот сам код: import requests #import json ...
DieFox's user avatar
  • 5
0 голосов
1 ответ
81 показ

У меня есть 5 xml файлов, в каждом по 1166 товаров, я их объединяю в один список в нём получается 8532 элементов, когда начинаю запускать, на записи в файл выдаёт ошибку после 1184 элемента Process ...
lQS_Tolya's user avatar
0 голосов
1 ответ
96 показов

for item in soup.find_all("tr", 'product-row'): print(item.get_text()) Добрый вечер! Суть проблемы - нужно спарсить каталог по категориям, данный код работает например на этой странице ...
0 голосов
0 ответов
171 показ

Есть 3 связанных xml файла, тоесть id из первого есть в других. файлы размером от 100мб до 2-3 гб. Кому интересно это база адресов ГАР. 1й файл названия объектов 2й файл характеристики 3й иерархия - ...
0 голосов
1 ответ
64 показа

Добавил файл haarcascade_frontalface_alt.xml в raw folder и пытаюсь подгрузить его с помощью такого кода: InputStream inputStream = context.getResources().openRawResource(R.raw....
Donut's user avatar
  • 1

15 30 50 на странице
1
2 3 4 5
...
14

AltStyle によって変換されたページ (->オリジナル) /