Введен в действие
Приказом Ростехрегулирования
от 31 октября 2007 г. N 287-ст
МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ
СИСТЕМА СТАНДАРТОВ ПО ИНФОРМАЦИИ,
БИБЛИОТЕЧНОМУ И ИЗДАТЕЛЬСКОМУ ДЕЛУ
ТЕЗАУРУС ИНФОРМАЦИОННО-ПОИСКОВЫЙ МНОГОЯЗЫЧНЫЙ
СОСТАВ, СТРУКТУРА И ОСНОВНЫЕ ТРЕБОВАНИЯ К ПОСТРОЕНИЮ
System of standards on information, librarianship
and publishing. Multilingual thesaurus for information
retrieval. Composition, structure and basic requirements
for development
ГОСТ 7.24-2007
Группа Т62
Предисловие
Цели, основные принципы и основной порядок проведения работ по межгосударственной стандартизации установлены ГОСТ 1.0-92 "Межгосударственная система стандартизации. Основные положения" и ГОСТ 1.2-97 "Межгосударственная система стандартизации. Стандарты межгосударственные, правила и рекомендации по межгосударственной стандартизации. Порядок разработки, принятия, применения, обновления и отмены".
Сведения о стандарте
1. Разработан Всероссийским институтом научной и технической информации Российской академии наук.
2. Внесен Федеральным агентством по техническому регулированию и метрологии.
3. Принят Межгосударственным советом по стандартизации, метрологии и сертификации (Протокол N 31 от 8 июня 2007 г.).
За принятие проголосовали:
---------------------T--------------------T-------------------------------¬
¦Краткое наименование¦ Код страны по ¦ Сокращенное наименование ¦
¦ страны по ¦МК (ИСО 3166) 004-97¦ национального органа ¦
¦МК (ИСО 3166) 004-97¦ ¦ по стандартизации ¦
+--------------------+--------------------+-------------------------------+
¦Азербайджан ¦ AZ ¦Азстандарт ¦
¦Армения ¦ AM ¦Армстандарт ¦
¦Беларусь ¦ BY ¦Госстандарт Республики Беларусь¦
¦Грузия ¦ GE ¦Грузстандарт ¦
¦Кыргызстан ¦ KG ¦Кыргызстандарт ¦
¦Молдова ¦ MD ¦Молдова-Стандарт ¦
¦Российская Федерация¦ RU ¦Федеральное агентство по ¦
¦ ¦ ¦техническому регулированию ¦
¦ ¦ ¦и метрологии ¦
¦Таджикистан ¦ TJ ¦Таджикстандарт ¦
¦Туркменистан ¦ TM ¦Главгосслужба ¦
¦ ¦ ¦"Туркменстандартлары" ¦
¦Узбекистан ¦ UZ ¦Агентство "Узстандарт" ¦
¦Казахстан ¦ KZ ¦Госстандарт Республики ¦
¦ ¦ ¦Казахстан ¦
L--------------------+--------------------+--------------------------------
4. Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО 5964:1985 "Документация. Руководство по построению и разработке многоязычных тезаурусов" (ISO 5964:1985 "Guidelines for the establishment and development of multilingual thesauri", IDT).
5. Приказом Федерального агентства по техническому регулированию и метрологии от 31 октября 2007 г. N 287-ст межгосударственный стандарт ГОСТ 7.24-2001 введен в действие в качестве национального стандарта Российской Федерации с 1 июля 2008 г.
6. Взамен ГОСТ 7.24-90.
1. Область применения
Настоящий стандарт распространяется на многоязычные информационно-поисковые тезаурусы (далее - МИПТ) и устанавливает состав, структуру и основные требования к построению МИПТ, применяемых в информационно-поисковых системах.
2. Нормативные ссылки
В настоящем стандарте использованы ссылки на следующие межгосударственные стандарты:
ГОСТ 7.25-2001. Система стандартов по информации, библиотечному и издательскому делу. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления
ГОСТ 7.74-96. Система стандартов по информации, библиотечному и издательскому делу. Информационно-поисковые языки. Термины и определения.
Примечание. При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов по указателю "Национальные стандарты", составленному по состоянию на 1 января текущего года, и по соответствующим информационным указателям, опубликованным в текущем году. Если ссылочный стандарт заменен (изменен), то при пользовании настоящим стандартом следует руководствоваться заменяющим (измененным) стандартом. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, применяется в части, не затрагивающей эту ссылку.
3. Термины и определения
В настоящем стандарте применены термины по ГОСТ 7.74, а также следующие термины с соответствующими определениями:
3.1. Многоязычный информационно-поисковый тезаурус: информационно-поисковый тезаурус, содержащий лексические единицы, взятые из нескольких естественных языков и представляющий эквивалентные по смыслу понятия на каждом из этих языков.
Примечание. Предназначен для обработки документов (запросов) и информационного поиска с целью обмена информацией на различных естественных языках.
3.2. Одноязычный информационно-поисковый тезаурус: информационно-поисковый тезаурус, содержащий лексические единицы, взятые из одного естественного языка.
3.3. Язык-компонент МИПТ: язык, на основе которого разработана какая-либо из одноязычных версий.
3.4. Дескриптор МИПТ: основная лексическая единица МИПТ, представляющая собой совокупность эквивалентных дескрипторов одноязычных версий, связанных средствами для указания эквивалентности.
4. Состав и структура тезауруса
4.1. Обязательными составными частями МИПТ являются:
- вводная часть;
- алфавитные лексико-семантические указатели, включающие средства для указания эквивалентности дескрипторов одноязычных версий (см. 4.4). Допускается в состав тезауруса вводить систематические, пермутационные, иерархические и другие указатели и списки специальных категорий лексических единиц, а также приложения, содержащие дополнительные сведения о разработке и использовании МИПТ.
4.2. Вводная часть включает титульный лист и введение, составленные согласно ГОСТ 7.25 и изложенные на одном или нескольких языках-компонентах.
На титульном листе следует указывать все языки-компоненты. Рекомендуется наименование тезауруса на титульном листе формулировать на одном языке, а дополнительно к основному титульному листу включать во вводную часть титульные листы на всех языках-компонентах. Введение должно содержать краткое описание методических принципов установления эквивалентности дескрипторов одноязычных версий, а также указание на то, что тезаурус разработан в соответствии с настоящим стандартом. Рекомендуется в состав вводной части включать полный или сокращенный перевод введения на всех языках-компонентах.
4.3. Алфавитный лексико-семантический указатель в каждой из одноязычных версий содержит перечень тезаурусных статей, расположенных в алфавитном порядке заглавных лексических единиц на соответствующем языке-компоненте. Состав и структура тезаурусных статей в лексико-семантических указателях одноязычных версий - по ГОСТ 7.25.
4.4. Средства для указания эквивалентности дескрипторов одноязычных версий реализуются введением в тезаурусную статью кода эквивалентности дескрипторов (идентификационного кода) и (или) эквивалентных дескрипторов на языках-компонентах.
При использовании идентификационных кодов в дополнение к алфавитному лексико-семантическому указателю МИПТ составляют указатель идентификационных кодов, в котором каждому коду приписывают соответствующие дескрипторы одноязычных версий.
4.5. Систематические, иерархические и пермутационные указатели строятся по ГОСТ 7.25 на языках-компонентах и содержат средства для указания эквивалентности дескрипторов одноязычных версий. Примеры использования средств для указания эквивалентности дескрипторов приведены в Приложении А.
4.6. Состав и структура одноязычных версий должны соответствовать следующим требованиям:
- в каждой одноязычной версии должны содержаться все дескрипторы, необходимые для представления онтологии предметной области с целью поиска и обмена информацией между системами, использующими различные языки;
- классы условной эквивалентности лексических единиц одноязычных версий должны соответствовать друг другу по объему выражаемых понятий;
- соответствующие друг другу дескрипторы отдельных одноязычных версий должны иметь по возможности максимально совпадающие парадигматические отношения.
Одноязычные версии допускается дополнять дескрипторами, не являющимися необходимыми для межъязыкового обмена и отсутствующими в других одноязычных версиях; при этом указывают иерархическую подчиненность их какому-либо дескриптору МИПТ.
Одноязычные версии могут включать парадигматические отношения, отсутствующие в других одноязычных версиях, если они на данном языке-компоненте уточняют понятия, выраженные дескриптором МИПТ, и не противоречат его пониманию в других языках-компонентах.
5. Основные требования к построению многоязычных
информационно-поисковых тезаурусов
5.1. Содержание работ по формированию одноязычных версий определяют наличием или отсутствием одноязычных тезаурусов по данной тематике на языках-компонентах.
5.1.1. При отсутствии одноязычных тезаурусов по данной тематике на языках-компонентах, как правило, сначала создают одну одноязычную версию и на ее основе строят остальные.
Возможна также совместная разработка одновременно всех или нескольких одноязычных версий при взаимном согласовании состава дескрипторов и их парадигматических связей.
5.1.2. При наличии тезауруса по данной тематике на одном из языков-компонентов, как правило, его берут за основу разрабатываемого МИПТ. Другие одноязычные версии формируют подбором эквивалентов дескрипторов этого тезауруса на языках-компонентах. При этом возможны различные степени семантического соответствия эквивалентов дескрипторов на различных языках.
5.1.3. При наличии нескольких исходных тезаурусов по данной тематике на языках-компонентах разработка МИПТ ведется подбором эквивалентных дескрипторов в данных тезаурусах (см. 5.2.1 и 5.2.2). Дескрипторы, не имеющие эквивалентов в отдельных одноязычных версиях, переводят на соответствующие языки и включают в одноязычные версии, в которых этот дескриптор первоначально отсутствовал. При этом следует вносить в исходные тезаурусы изменения, необходимые для согласования одноязычных версий.
Для просмотра документа целиком скачайте его >>>