Вопросы с меткой [xmlparser]
Анализатор XML просматривает текстовые документы, содержащие XML деревьев, и позволяет использовать информацию в иерархии. Используйте этот тег для задач, реализующих синтаксический анализатор XML или созданных с помощью существующего синтаксического анализатора на данном языке.
196 вопросов
- Конкурсные 0
- Неотвеченные
- Цитируемые
- Рейтинг
- Популярные
- За неделю
- За месяц
- Неотвеченные (мои метки)
0
голосов
2
ответа
214
показов
Как взаимодействовать с элементом ::after с помощью XPath?
Недавно начал изучать xpath, нужно было извлечь данные о времени работы аптеки. Время работы находиться в элементе after, путь к которому я написать не смог. Также заметил что элемент отображается в ...
0
голосов
1
ответ
508
показов
Как спарсить все ссылки с sitemap.xml? Python
Есть карта сайта:
https://www.stussy.com/sitemap_products_1.xml?from=4103557054560&to=6660699586656
Мне нужно спарсить все ссылки на товары. Каким способом лучше сделать?
0
голосов
1
ответ
208
показов
Замена угловых скобок внутри элементов XML
Как отловить и заменить угловые скобки внутри элементов XML-файла?
Парсить по закрывающим тегам?
Структура XML и названия полей заранее не известны, как и попадающиеся скобки, для примера:
<?xml ...
0
голосов
0
ответов
117
показов
Regexp для удаления <> внутри элементов XML
Имеется сlob (Oracle) с XML
Часть данных "испорчена", т.е. содержит символы <> внутри элементов, например:
<Text>Адрес получателя: <[email protected]>; ФИО; почта2 <user2@...
0
голосов
1
ответ
78
показов
Почему программа не видит данные блочного атрибута 'text'?
Пишу парсер для flashscore на Python. Не видит внутри блочного тега атрибут text (То есть не выводит данные). Пишу код jupyter notebook.
Вот мой код:
year= '2023'
from selenium import webdriver
from ...
0
голосов
0
ответов
62
показа
Как через xml_parse получить все значение в теге?
Есть товары в xml
<offer id="11111" type="vendor.model" available="false">
<delivery>true</delivery>
<model>Model</model>
<...
0
голосов
1
ответ
1k
показов
Selenium и headless режим
Selenium в PyCharm не работает в headless режиме и переходит сразу в ошибку TimeoutException.
Драйвер для Chrome актуален и подключен...
Когда режим headless отключен, то весь код отрабатывает как ...
0
голосов
0
ответов
42
показа
Не получается собрать ссылки на категории и товары
Есть сайт
https://www.gzhel.ru/catalog/
Ввожу код
all_a = soup.find("div", class_="grid-4 grid-tablet-3 grid-phablet-3 grid-phone-2 js-nospace").find_all("a")
for item ...
0
голосов
1
ответ
198
показов
Парсер для XML файла с бд
Всем привет! Буду признателен, если натолкнете меня на мысль, как выполнить это задание. Я новичок в парсинге, поэтому для меня здесь мало что понятно.
На ftp сервер проекта раз в сутки выгружается ...
1
голос
1
ответ
304
показа
Парсинг сложного XML формата <xs:тэг> golang
Столкнулся с проблемой: почему-то при работе с XML структурами типа
<Тэг1:Тэг2> значение </Тэг1:Тэг2>
программа перестает находить данные в XML. Например, если взять файл
<?xml ...
0
голосов
1
ответ
104
показа
Добавление в словарь списка без скобок
Всем привет. Подскажите, пожалуйста, как я могу добавить в словарь ссылки на картинки без [], чтобы в дальнейшем загрузить все товары с картинками на сайт
Вот сам код:
import requests
#import json
...
0
голосов
1
ответ
81
показ
Ошибка призаписи в xml файл Process finished with exit code -1073741571 (0xC00000FD)
У меня есть 5 xml файлов, в каждом по 1166 товаров, я их объединяю в один список в нём получается 8532 элементов, когда начинаю запускать, на записи в файл выдаёт ошибку после 1184 элемента
Process ...
0
голосов
1
ответ
96
показов
beautifulsoup не находит класс при смене страницы сайта
for item in soup.find_all("tr", 'product-row'):
print(item.get_text())
Добрый вечер! Суть проблемы - нужно спарсить каталог по категориям, данный код работает например на этой странице ...
0
голосов
0
ответов
171
показ
php xml большие связанные файлы как лучше обработать
Есть 3 связанных xml файла, тоесть id из первого есть в других.
файлы размером от 100мб до 2-3 гб. Кому интересно это база адресов ГАР.
1й файл названия объектов
2й файл характеристики
3й иерархия - ...
0
голосов
1
ответ
64
показа
Не могу подгрузить файл из raw folder через context.getResources().openRawResource(R.raw.haarcascade_frontalface_alt)
Добавил файл haarcascade_frontalface_alt.xml в raw folder и пытаюсь подгрузить его с помощью такого кода: InputStream inputStream = context.getResources().openRawResource(R.raw....