Блочные элементы



Блочные элементы необходимы для формирования основы веб-страницы.

С позиции организации парсинга можно выделить следующие факторы:

Структурная организация. Блочные элементы часто играют роль контейнеров для строчных элементов или других блоков. Это позволяет использовать их для навигации по коду и извлечения данных.

CSS селекторы. Блочные элементы часто сопровождаются уникальными идентификаторами, что облегчает задачу по поиску нужного участка кода.

Контекстуальная информация. Блочные элементы часто используются для хранения других объектов, поэтому могут передавать контекст для извлекаемых данных.

Количество. Блочных элементов обычно меньше, чем строчных, что упрощает реализацию логики парсера.

Стабильность. Блочные элементы реже меняются на динамически загружаемых страницах, что обеспечивает более стабильный парсинг.

Ключевые особенности:

— блоки располагаются вертикально, друг под другом;
— блоки занимают все доступное место по ширине текущего контейнера;
— высота блока рассчитывается автоматически с учетом содержимого;
— запрещается располагать блочные элементы внутри строчных.

Примеры блочных элементов:

<div> — Универсальный блочный контейнер
<p> — Абзац
<h1>, <h2>, <h3>, <h4>, <h5>, <h6> — Заголовки
<ul> — Ненумерованный список
<ol> — Нумерованный список
<li> — Элемент списка (обычно используется внутри <ul> или <ol>)
<blockquote> — Длинная цитата
<pre> — Форматированный текст
<hr> — Горизонтальная линия (разделитель)
<table> — Таблица
<thead> — Заголовок таблицы
<tbody> — Тело таблицы
<tfoot> — Подвал таблицы
<tr> — Строка таблицы
<th> — Заголовочная ячейка таблицы
<td> — Данные таблицы
<article> — Статья
<section> — Раздел
<header> — Шапка
<footer> — Подвал
<nav> — Навигация
<aside> — Боковая панель
<main> — Основное содержимое
<figure> — Иллюстрация или диаграмма с подписью
<figcaption> — Подпись к <figure>



Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: