Но достоинства web обернулись его недостатками.
для html-сстраниц не поддерживаются метаданные, которые бы описывали их структурные, семантические и другие свойства. Исключением являются введенные в HTML средства (тэги META, LINK) позволяющие ассоциировать с ними ключевые слова или рубрики.
Ограничение (1) является следствием ориентированности языка HTML не на разметку содержания (контента) страниц, а на форматную разметку, служащую для определения способа их представления на экране клиентского компьютера.
инф. ресурсы HTML могут идентифицироваться только по их местонахождению в распределенной среде web (с помощью URL).
к HTML-страницам или их фрагментам возможен только навигационный доступ по гиперссылкам. Нет доступа по свойствам содержимого страниц или их структурных компонентов.
уже сформировался огромный объем инф. ресурсов явным образом не представленных в web, но доступ к которым осуществляется через среду web. Это доступные по протоколу FTP публикации в формате pdf, postscript, Doc, Txt и других форматах. Также базы данных доступ к которым обеспечивает web, как правило с помощью HTML-форм. Эту совокупность инф. ресурсов называют скрытым web, который составляет 70% всех ресурсов доступных в web.
Структура и содержание скрытого web неизвестны пользователям, нет возможности навигационного доступа, доступа нет с помощью поисковых машин веба. Особенно к БД.
HTML является закрытым языком, не позволяющим вводить при необходимости новые собственные тэги для расширения функциональности языка.