BeautifulSoup
Очень часто сервера отдают нужную нам информацию в JSON-формате, и наша задача — найти именно тот сетевой запрос, в котором есть JSON, и распарсить его. Как найти «тот
JSON — (англ. JavaScript Object Notation) — текстовый формат обмена данными, основанный на JavaScript. При этом формат независим от JS и может использоваться в любом языке программирования. JSON
CSV (Comma Separated Values) — один из ключевых форматов, который используется во многих областях, начиная от финансовых отчетов и заканчивая анализом данных. Понимание работы с CSV в Python
В общих чертах парсинг табличных данных не отличается от парсинга других данных с интернет-страниц. Основное отличие – данные лежат в таблице, поэтому будут использоваться другой принцип для навигации.
Технология AJAX (Asynchronous Javascript and XML) дает возможность обновлять блок данных без перезагрузки всей страницы. Это открывает широкие возможности и упрощает работу пользователя. К примеру, посетитель может выбрать
В некоторых случаях все ссылки на страницы не показываются, например, если их очень много. Однако даже если показываются только первые несколько страниц, есть возможность организовать надежный обход. Принято
Пагинация Пагинация (англ. Pagination) играет важную роль для организации удобной навигации по сайту. При этом такая структура позволяет разработчикам быстро определить общее количество страниц. Очевидно, что для обхода
Для получения значения атрибута у определенного HTML-тега используется конструкция:tag.get(key, default=None) Данный метод повышает устойчивость кода, поскольку при отсутствии атрибута возвращается None, ошибка не генерируется. Общий синтаксис: Пример 1.
Одна из распространенных задач в процессе парсинга интернет-страниц – поиск элементов по их классу. Если у элемента несколько классов, необходимо обеспечить правильную обработку таких ситуаций. Особенности извлечения элементов
У библиотеки Beautiful Soup также есть метод soup.select(), который позволяет искать элементы HTML при помощи CSS-селекторов. Возвращается список тегов, соответствующих указанным условиям. Можно использовать разные CSS-селекторы, например, класс,