Содержание
В этой главе использованы электронные материалы [KAGA06].
Как уже отмечалось, Веб замышлялся его создателями как информационный репозиторий с архитектурой клиент-сервер для широкого сообщества пользователей, легко доступный в неоднородной коммуникационной среде Интернет на различных аппаратно-программных платформах. Для создания такой системы необходимо было стандартизовать:
средства представления поддерживаемых в ней информационных ресурсов;
способ уникальной идентификации этих ресурсов;
процедуры обмена информационными ресурсами между клиентом и сервером.
Такие стандарты для Веб были разработаны. Это - язык гипертекстовой разметки HTML (Hypertext Markup Language), универсальный указатель (локатор) ресурсов URL (Universal Resource Locator) и протокол передачи гипертекста http (Hypertext Transfer Protocol). Кроме того, для того, чтобы обеспечить возможности расширения функций Веб-сервера, был разработан стандарт универсального шлюзового интерфейса CGI (Common Gateway Interface). Рассмотрим кратко эти базовые стандарты технологий Веб.
Язык HTML относится к категории языков, называемых языками разметки. Такие языки позволяют позволяют с помощью специальных помет выделять фрагменты зв заданном текстовом документе и определять различные их свойства. Процедура расстановки помет называется разметкой текста.
Одним из широко известных языков разметки является стандартный обобщенный язык разметки SGML (Standard Generalized Markup Language). Спецификации этого языка, как уже отмечалось выше, имеют статус международного стандарта (ISO 8879:1986) и широко используются за рубежом в различных издательских системах и системах управления документами.
Именно на основе SGML основатель Веб Тим Бернерс-Ли - сотрудник CERN - разработал язык HTML. Этот язык включает набор специальных помет, называемых тегами. Теги языка HTML позволяют размечать исходный текст, определяя способ его представления на экране компьютера, и выполнять некоторые другие функции. Теги, как правило, являются парными - имеется открывающий и закрывающий теги. Открывающий тег может иметь обязательные и/или факультативные параметры (атрибуты).
С помощью пары тегов в размечаемом тексте выделяется некоторый его фрагмент, свойства которого описывает данный тег в соответствии с его функцией и с помощью значений параметров, если они предусматриваются для данного тега в синтаксисе языка. Выделяемые парами тегов фрагменты размечаемого текста могут быть вложенными. Другого рода пересечения фрагментов не допускаются. Таким образом, размеченный тегами HTML текст представляет собой последовательность иерархий выделенных тегами фрагментов.
Теги языка HTML позволяют с помощью разметки исходного текста:
Идентифицировать содержимое данного текстового файла как текстовый ресурс, размеченный средствами языка HTML, называемый HTML-страницей
Снабжать HTML-страницы текстовым заголовком
Указывать некоторые общие свойства представления HTML-страницы на экране клиентского компьютера, например, цвет фона, фоновый рисунок и др.
Определять гиперссылки, которые указывают на фрагменты данной HTML-страницы или на другие страницы, либо их фрагменты
Обозначать начальные точки фрагментов текста (якорные точки), которые могут служить целевыми точками гиперссылок в процессе навигации по структуре текста
Определять способы форматирования фрагментов исходного текста, например, представление их заданным шрифтом, использование указанного шрифтового выделения, представление их как отдельных абзацев текста и т.д.
Определять фрагменты текста, которые в соответствии с их содержательной ролью форматируются в представлении текста на экране наперед заданным образом, например, определения, цитаты
Определять в тексте списки текстуально представленных элементов с их нумерацией или без нумерации
Описывать свойства встроенных в текст таблиц
Определять место вставки изображений в экранное представление текста; при этом встроенные в текст изображения должны храниться в файлах формата GIF или JPEG
Вставлять в HTML-страницы исходные тексты программ на языке JavaScript, называемые скриптами или сценариями (script), исполнение которых инициируется действиями пользователя - кликами мыши, перемещениями курсора в предусмотренные области экрана и т.п.
Включать в размечаемый текст вызовы с сервера небольших программ, написанных на языке Java, называемых Java-аплетами
Помещать в HTML-страницу формы, которые позволяют пользователю при просмотре этой страницы на своем компьютере вводить в их поля данные, возвращаемые на Веб-сервер; эти данные могут использоваться на сервере как входные данные какой-либо программы, которая будет исполняться на стороне сервера, а полученные результаты будут возвращаться на сторону клиента в форме сгенерированной на их основе HTML-страницы; таким образом, например, может осуществляться передача запросов системе базы данных, функционирующей на стороне сервера, и в таких случаях Веб используется как среда, обеспечивающая теледоступ к этой системе базы данных
Включать в текст ссылки, при активизации которых вызывается клиентская программа электронной почты; благодаря этому, не выходя из среды Веб-браузера, можно отправлять сообщения по адресу, указанному в этой ссылке, а также выполнять другие функции.
Текст, размеченный с помощью тегов языка HTML выглядит как обычный текстовый файл. Этот файл по принятому соглашению должен иметь расширение html или htm. Первое из них используется обычно на платформах различных версий UNIX. Сокращенное расширение htm используется на платформах MS Windows.
Следует еще раз подчеркнуть, что разметка текста средствами этого языка осуществляется не для выделения и идентификации фрагментов его содержания, а для форматной разметки, определяющей представление страницы на экране клиентского компьютера.
Язык HTML имеет статус стандарта консорциума W3C. После принятия первоначальной версии этого стандарта он неоднократно модифицировался. Действующая в настоящее время версия стандарта HTML 4.01 была одобрена W3C в декабре 1999 г.