Утвержден и введен в действие
Приказом Федерального
агентства по техническому
регулированию и метрологии
от 8 ноября 2013 г. N 1389-ст
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
МЕНЕДЖМЕНТ ЯЗЫКОВЫХ РЕСУРСОВ
СТРУКТУРЫ ЭЛЕМЕНТОВ
ЧАСТЬ 2
ДЕКЛАРАЦИЯ СИСТЕМЫ ЭЛЕМЕНТОВ
Language resource management. Feature structures.
Part 2. Feature system declaration
ISO 24610-2:2011
Language resource management - Feature structures -
Part 2: Feature system declaration
(IDT)
ГОСТ Р ИСО 24610-2-2013
ОКС 01.140.20
Дата введения
1 января 2015 года
Предисловие
1. Подготовлен ЗАО "Проспект" на основе собственного аутентичного перевода на русский язык международного стандарта, указанного в пункте 4.
2. Внесен Техническим комитетом по стандартизации ТК 55 "Терминология, элементы данных и документация в бизнес-процессах и электронной торговле".
3. Утвержден и введен в действие Приказом Федерального агентства по техническому регулированию и метрологии от 8 ноября 2013 г. N 1389-ст.
4. Настоящий стандарт идентичен международному стандарту ИСО 24610-2:2011 "Менеджмент языковых ресурсов. Структуры элементов. Часть 2. Декларация системы элементов" (ISO 24610-2:2011 "Language resource management - Feature structures - Part 2: Feature system declaration").
При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты Российской Федерации, сведения о которых приведены в дополнительном Приложении ДА.
5. Введен впервые.
Правила применения настоящего стандарта установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru).
Введение
ИСО 24610 состоит из двух отдельных частей.
- Часть 1. Представление структуры элементов - посвящена описанию структур, обеспечивающих неформальное, но достаточно явное выражение их характеристик, а также описанию представления структур элементов с использованием языка XML вообще и различных типов таких структур в частности. В этой части закладываются основы правильного форматирования конструируемых XML-ссылок, обеспечивающих обмен структурами элементов (возможно с выделением типов) между приложениями.
- Часть 2. Декларация системы элементов - предоставляет стандартный метод реализации различных типов структур элементов в языковой среде XML: сначала путем определения множества типов и их иерархии, затем посредством формулирования ограничений, касающихся различных типов, на множестве элементов и их допустимых значений и, наконец, путем введения множества условий, касающихся надежности структур элементов в аспекте их использования в конкретных приложениях, особенно в целях управления языковыми ресурсами.
Структура элементов - это структура данных общего назначения, которая идентифицирует и группирует отдельные элементы посредством присваивания каждому из них конкретного значения. Благодаря универсальности структур элементов, они могут использоваться для представления самых разных типов информации. Существующие связи между различными "порциями" информации и их реализация в языке разметки образуют некоторый метаязык для представления контента лингвистического характера. Более того, подобная реализация позволяет сформировать описание множества элементов и значений, соответствующих конкретным типам и их ограничениям, посредством декларирования системы элементов или с помощью других механизмов языка XML, обсуждаемых в данной части ИСО 24610.
Некоторые положения данной части заимствованы из ИСО 24610-1:2006 в целях обеспечения полной независимости части 2 от части 1.
1. Область применения
В настоящем стандарте предлагается формат представления, хранения и обмена для структур элементов в прикладных системах, основанных на использовании естественного языка как для аннотирования, так и для формирования лингвистических данных. Основная цель состоит в том, чтобы предложить такой формат машинной обработки, который позволяет определить иерархию типов и декларировать ограничения, накладываемые на множество спецификаций элементов и на операции со структурами элементов, обеспечивая таким образом средства контроля соответствия каждой структуры элементов их базовой спецификации. Структуры элементов - это важнейшая часть многих формализаций в лингвистике и основополагающий механизм представления информации, используемой или порождаемой в приложениях, связанных с построением языковых систем.
2. Нормативные ссылки
В настоящем стандарте использованы нормативные ссылки на следующие стандарты, которые необходимо учитывать при использовании настоящего стандарта. В случае ссылок на документы, у которых указана дата утверждения, необходимо пользоваться только указанной редакцией. В случае, когда дата утверждения не приведена, следует пользоваться последней редакцией ссылочных документов, включая любые поправки и изменения к ним.
ИСО 24610-1:2006 Управление языковыми ресурсами. Структуры элементов. Часть 1. Представление структуры элементов (ISO 24610-1:2006, Language resource management - Feature structures - Part 1: Feature structure representation)
ИСО/МЭК 19757-2:2008 Информационные технологии. Язык определения схемы документа (DSDL). Часть 2. Валидация на основе регулярной грамматики. RELAX NG (ISO/IEC 19757-2:2008, Information technology - Document Schema Definition Language (DSDL) - Part 2: Regulargrammar-based validation - RELAX NG).
3. Термины и определения
Для целей настоящего стандарта используются термины и определения по ИСО 19757-2, а также терминология, приведенная ниже:
3.1. Ограничение по допустимости (admissibility constraint): спецификация множества разрешенных элементов (3.2) и допустимых значений элементов (3.3), ассоциируемая с конкретным типом (3.24).
3.2. Разрешенный элемент (admissible feature): элемент, для которого соответствующая структура элементов (3.14) определенного типа (3.24) может нести в себе конкретное значение (3.17).
Примечание. В некоторых интерпретациях этот термин часто приобретает оттенок обязательности, т.е. считается, что структуры элементов конкретного типа должны содержать в себе значение для каждого разрешенного элемента. Однако в данном случае этот термин не предполагает обязательного присутствия элемента.
3.3. Разрешенное значение элемента (admissible feature value): значение (3.17), которое должно быть отнесено к категории допустимых элементов (3.2) в структурах элементов (3.14) данного типа (3.24).
3.4. Атомарный тип (atomic type): пользовательский тип (3.24), который не имеет декларируемых или наследуемых допустимых элементов (3.2).
3.5. Множество с повторяющимися элементами (bag): триплет, образованный целым числом n, множеством S и функцией отображения целых чисел в диапазоне от 1 до n в элементы S.
Примечание. Множество с повторяющимися элементами - это промежуточный объект между обычным множеством (как совокупностью неупорядоченных элементов) и списком (где отдельные элементы могут встречаться многократно).
3.6. Встроенный элемент (built-in): элемент, не определяемый пользователем, но могущий появиться вместо структуры элементов (3.14), например в качестве значения элемента (3.17).
Примечание. Встроенные элементы могут быть атомарными или составными. К первым относятся численные, строковые, символьные и двоичные элементы; ко вторым - коллекции (3.7) и применяемые логические операторы: например дизъюнкция, отрицание и слияние (см. п. 5.2.4).
3.7. Коллекция (collection): значение элемента (3.17), содержащее совокупность возможных значений, которые представлены в виде списка, обычного множества или множества с повторяющимися элементами (3.5).
3.8. Ограничение (constraint): компонент спецификации, которая идентифицирует некоторую коллекцию структур элементов (3.14) как неадекватную.
Примечание 1. Все ограничения по своей синтаксической форме импликативны, хотя некоторые из них выделяются как ограничения по допустимости. См. адекватность (3.31) и 5.4. Все структуры элементов, которые не исключены явным образом как неадекватные, считаются адекватными.
Примечание 2. Структура элементов, не идентифицированная таким образом как не соответствующая никакому из ограничений в системе элементов, считается адекватной.
3.9. Значение по умолчанию, стандартное значение (default value): значение (3.17), присваиваемое элементу (3.12) в том случае, когда оно не определено.
Пример - В датском языке при отсутствии явного указания грамматического рода ему присваивается значение "мужской".
Примечание. Структура элементов не может содержать элементов, для которых не указано соответствующее значение.
3.10. Пустая структура элементов (empty feature structure): структура элементов (3.14), не содержащая никакой информации.
Примечание. Пустая структура элементов категоризирует все другие структуры элементов.
3.11. Расширение (extension): преобразование типа категоризации (3.21).
Примечание. Структура элементов F расширяет G тогда и только тогда, когда G категоризирует F.
3.12. Элемент (feature): свойство или аспект объекта, формально представляемые как функция, отображающая объект в его соответствующее значение (3.17).
3.13. Спецификация элементов (feature specification): связывание элемента (3.12) с его значением (3.17) в описании структуры элементов.
3.14. Структура элементов (feature structure): структура записей, которая ставит в соответствие каждой коллекции элементов одно значение (3.17).
Примечание 1. Каждое значение представляет собой структуру элементов или более простой встроенный элемент (3.6), такой как строка.
Примечание 2. Структуры элементов частично упорядочены. Минимальными в этом упорядочении являются пустые структуры элементов.
3.15. Система элементов (feature system): иерархия типов (3.26), в которой каждый тип (3.24) ассоциируется с коллекцией ограничений по допустимости (3.1) и импликативными ограничениями (3.18).
Примечание. Сравните: декларация типа (3.25).
3.16. Декларация системы элементов (feature system declaration); FSD: описание конкретной системы элементов (3.15).
3.17. Значение для элемента (feature value): объект или совокупность объектов, характеризующие некоторое свойство другого объекта.
3.18. Импликативное ограничение (implicational constraint): ограничение типа "если G, то H", где G и H - это структуры элементов (3.14).
Для просмотра документа целиком скачайте его >>>