Сотую запись в своём блоге мне хотелось посвятить чему-нибудь особенному. В особенном я вижу именно немного необычный, философский взгляд на Web, в частности, на основной язык разметки этой необычной среды.
Многие читатели блога знают мою тягу к графике, но многие и не догадываются, что тяга к графике может привести к анализу чего-либо с помощью графики. Даже говорить не нужно, что мне всегда было интересно видеть Web немного под иным углом, немного с другой точки зрения. Сегодня, в этой статье, мы попробуем осуществить сдвиг нашей точки зрения на другую позицию.
Размышления
Давайте начнём издалека. Посмотрите на любой Web-документ. Что вы видите? Вы видите дерево. Каждый документ обладает своим собственным деревом, своим собственным уникальным кодом. Если бы в сети Интернет считали хеши Web-документов, то совпадений для разных документов не нашлось бы. Даже два идентичных по структуре документа могут различаться по содержимому этих самых элементов: может менятся расположение порядка узлов в документе, а также их непосредственные данные.

Слепок блога The Webmakers Lounge
У ситуации есть и две другие стороны. Два документа могут выглядеть абсолютно одинаково, но их структура может различаться. Это достигается благодаря использованию CSS. Напротив: два документа могут коренным образом отличаться друг от друга, но, заглянув в структуру таких документов, мы сможем убедиться в том, что они являются идентичными. Такой результат достигается также с помощью CSS (вспомните хотя бы всем известный CSS Zen Garden).
Несмотря на CSS, структура документа всегда определяется однозначно. С этой структурой можно производить необходимые нам операции: перебор элементов (DOM), трансформации (XSL/T), выборка отдельных элементов, валидацию. Почему бы не попробовать добавить ещё один путь — визуализацию?
Под визуализацией я представляю себе представление структуры Web-документа. Да, именно его структуры, а не последсвтий её обработки различными браузерами. Достаточно один раз увидеть подобную схему, достаточно одного взгляда на структуру документа чуть выше, чем мы это делаем обычно, и можно разглядеть различные детали наших (и не только) документов. Можно найти какие-то недочёты, ошибки, можно, в конце концов, принимать такую визуализацию за конкретный анализ такого документа, принимая его всерьёз в качестве пособия по оптимизации последнего.
Каждая визуализированная схема документа является наглядным изображением его структуры. Как выразился Денис, такую схему можно считать ДНК документа. И звучит красиво, и выглядит, я думаю, не менее красиво.
Анализ
Анализу подвергались только сайты некоторых моих коллег. Все они, я думаю, не будут против, если их структура появится здесь в виде этакого дерева, «слепка» их собственных документов.
Анализ способен получать либо слепок документа без атрибутов всех элементов, либо с ними. Интересно, что карта с атрибутами показывает более полную картину происходящего в документе, указывая на наиболее часто используемые атрибуты и показывая то, как связаны между собой атрибуты определённых узлов.
Выводы
Может быть, иностранные деятели Web уже давно до этого дошли, но лучше дойти до этого самостоятельно и попробовать всё сделать собственноручно, чем перенимать опыт западных коллег.

Слепок блога Pepelsbey.net
Схемы, которые мы сегодня рассматривали, очень наглядно демонстрируют «заширменную часть» Web-документов в сети; это как бы взгляд изнутри, взгляд в обход браузерам и иным средствам просмотра Web-страниц.
Во всяком случае, исследование было полезным для меня самого. После того, как удаётся повернуть шестерёнки направления мыслей, начинаешь немного иначе смотреть на всё вокруг, в данном случае, на все вокруг документы. Может быть, это не случайность? Может быть, стоит проводить такие эксперименты намного чаще? Кто знает. Зато теперь я со спокойной душой могу сказать, что сотая запись в блоге Веб-Зайн не прошла даром для меня и, надеюсь, для вас. Кто знает, может это побудит читателей исследовать новые мыслимые и (желательно) немыслимые горизонты Web.
По-моему, я гикнулся. Желаю вам гикаться по чаще: оказывается, это приятно и очень полезно!
