Назначение и требования к подготовке аннотации и ключевых слов регулируются соответствующими ГОСТами:
- ГОСТ 7.9-95 СИБИД «Реферат и аннотация. Общие требования» (Межгосударственный стандарт ИСО 214-76);
- ГОСТ 7.66-92 СИБИД «Индексирование документов. Общие требования к координатному индексированию» (Межгосударственный стандарт ИСО 5963-85);
- ГОСТ 7.25-2001 СИБИД «Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления» (Межгосударственный стандарт).
В соответствии с ними аннотация выполняет следующие функции:
- дает возможность установить основное содержание документа, определить его релевантность и решить, следует ли обращаться к полному тексту документа;
- предоставляет информацию о документе и устраняют необходимость чтения полного текста документа в случае, если документ представляет для читателя второстепенный интерес;
- используются в информационных, в том числе автоматизированных системах для поиска документов и информации.
Аннотация следует сразу после сведений об авторах статьи, выполняет функцию расширенного названия и используется в качестве элемента библиографической записи, элемента выходных сведений и элемента оформления публикуемых материалов. В аннотации указывают, что нового несет в себе данный документ в сравнении с другими, родственными по тематике и целевому назначению.
Аннотация включает характеристику основной темы, проблемы, объекта, цели работы и ее результаты. Аннотация кратко и лаконично характеризует Вашу статью, поэтому не стоит делать краткую версию статьи, надо дать именно ее характеристику. Рекомендуемый средний объем аннотации 500 печатных знаков и за счет их использования необходимо суметь выразить суть написанной статьи. Аннотация может включать сведения об авторе первичного документа и достоинствах произведения, взятые из других документов.
В аннотации не стоит использовать повествование от собственного имени и выражать собственное мнение (фразы «Я думаю», «Я считаю», «По-моему мнению» и т.п.). Избегайте штампов, речевых оборотов, научных терминов и общеизвестных сведений. Обязательно укажите аудиторию, которой описанные в статье результаты могут стать интересными. Соответственно, аннотация показывает, что наиболее ценно и применимо в выполненной автором работе.
Если строго следовать ГОСТу, то формирование списка ключевых слов обеспечивает решение задач автоматизации индексирования, и оно выполняется компьютерной техникой (машиной). То, что подразумевается редакциями научных журналов под подбором ключевых слов автором (человеком), соответствует процессу индексирования, который включает следующие этапы, выполняемые индексатором:
- анализ и определение содержания документа, как объекта индексирования;
- выбор понятий, характеризующих содержание документа;
- выбор терминов индексирования для обозначения понятий;
- формирование поискового образа документа (ПОД) из терминов индексирования.
Анализ документа Индексатору нужно помнить, что индексирование только по заглавиям является неполноценным. При индексировании по рефератам и аннотациям следует следить за адекватностью передачи в них содержания документа.
Выбор понятий, характеризующих содержание документа В ПОД необходимо отразить все понятия (ключевые слова), которые могут иметь ценность для пользователей системы. В документе может быть выявлено более одной темы из сферы интересов пользователей. Следует включать в ПОД также понятия (ключевые слова), связанные с побочными аспектами документа (например, социальные и экономические аспекты научно-технических исследований).
При выборе понятий (ключевых слов) основным критерием является их потенциальная ценность для выражения содержания документа или для его поиска. Для этом необходимо ориентироваться на типичные запросы информационно-поисковой системы (ИПС):
- отбирать понятия, наиболее употребительные в коллективе пользователей ИПС;
- уточнять состав лексики и грамматические правила информационно-поискового языка (ИПЯ) па основе обратной связи с пользователями.
Число терминов (ключевых слов) индексирования, приписываемых одному документу, определяется количеством сведений, содержащихся в документе. Ограничение их числа должно быть основано на содержательном отборе наиболее важных понятий. Замена понятия (ключевого слова) термином (ключевым словом), отражающим более широкое понятие, приводит к потере специфичности.
Более широкие термины допускается использовать в особых случаях:
- если излишне специфичный термин непонятен пользователям, особенно когда соответствующее понятие применяется только в пограничных областях деятельности;
- если в документе понятие раскрыто недостаточно полно или является вспомогательным для изложения содержания документа.
Выбор терминов индексирования
В процессе выбора терминов индексирования понятия, характеризующие содержание документа, представляют:
- предпочтительными лексическими единицами, выбранными по правилам конкретного ИПЯ;
- терминами, отражающими новые понятия, проверив их точность и приемлемость по словарям, энциклопедиям, справочникам, классификационным таблицам, нформационно-поисковым тезаурусам, терминологическим стандартам и другим источникам, признанным авторитетными в данной области.
При использовании тезауруса допускается сокращать число терминов, включаемых в ПОД за счет исключения общих понятий, которые могут быть привлечены на этапе поиска документа или на этапе составления поискового предписания на основании ссылок в статьях тезауруса. Новые понятия представляют наиболее близкими из существующих в ИПЯ лексических единиц, а также оценивают полезность включения новых терминов в словарь с точки зрения поиска.
При индексировании ключевые словами должны быть приведены к канонической форме:
- одиночные слова (существительные, прилагательные, глаголы, наречия);
- именные словосочетания;
- лексически значимые компоненты сложных слов;
- сокращения слов и словосочетаний.
Словосочетания допускаются, если в качестве опорного слова они содержат существительное и если выполнено одно из следующих условий:
- значение словосочетания не выводится из значений его компонентов,
- хотя бы один из компонентов словосочетания не употребляется в составе других сочетаний или употребляется всегда в другом смысле,
- для данного словосочетания существуют полные синонимы,
- данное словосочетание является устойчивым словосочетанием с именем собственным,
- отдельные слова словосочетания имеют слишком широкое значение.
- для данного словосочетания существует общепринятая аббревиатура,
- разбиение словосочетаний на отдельные компоненты приводит к потере важных для поиска семантических связей.
Словосочетания, которые не удовлетворяют перечисленным условиям, разбивают на компоненты.
Падежные формы одиночных существительных следует заменять формой именительного падежа. Падежные формы опорных существительных в словосочетаниях также заменяют формой именительного падежа с одновременным изменением падежной формы согласованных определений. Формы прилагательных и причастий следует приводить к именительному падежу. Прилагательные и причастия в единственном числе приводят к форме мужского рода. Глаголы рекомендуется заменять отглагольными существительными или приводить к форме инфинитива.
Компоненты сложных слов, должны быть широко употребляющимися частями сложных слов, общепринятых в данной специальности. Отсутствующий компонент сложного слова заменяют дефисом. При наличии аббревиатур должны быть включены также соответствующие им полные формы. Сокращения должны соответствовать требованиям стандартов на сокращения слов в библиографических описаниях.
Длину словосочетаний рекомендуется ограничивать двумя-тремя словоформами.
Из выбранных терминов индексирования при помощи грамматических средств информационно-поискового языка (ИПЯ) формируют поисковый образ документа (ПОД).
Формирование поискового образа документа ПОД состоит из выбранных терминов индексирования, организованных с помощью грамматических средств ИПЯ данной ИПС.
Информационный вес термина индексирования отражает в ПОД важность данного понятия для данного документа.
Следует различать:
1) понятия, выражающие главную тему документа;
2) понятия, выражающие побочные темы документа;
3) понятия, использованные в документе как вспомогательные.