RuNormy.RU
Untitled Page
RuNormy.RU
Untitled Page
"ГОСТ Р ИСО 30042-2016. Национальный стандарт Российской Федерации. Системы управления терминологией, базами знаний и контентом. Обмен терминологическими базами [TermBase eXchange (TBX)]"
Скачать текст бесплатно в формате MS Word
Поделитесь данным материалом с друзьями:

Скачать
Утвержден и введен в действие
Приказом Федерального агентства
по техническому регулированию
и метрологии
от 30 ноября 2016 г. N 1906-ст

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

СИСТЕМЫ УПРАВЛЕНИЯ ТЕРМИНОЛОГИЕЙ, БАЗАМИ ЗНАНИЙ И КОНТЕНТОМ

ОБМЕН ТЕРМИНОЛОГИЧЕСКИМИ БАЗАМИ [TermBase eXchange (TBX)]

Systems to manage terminology, knowledge and content.
TermBase eXchange (TBX)

(ISO 30042:2008, IDT)

ГОСТ Р ИСО 30042-2016

ОКС 01.020
35.240.60

Дата введения
1 сентября 2017 года

Предисловие

1 ПОДГОТОВЛЕН Автономной некоммерческой организацией "Институт безопасности труда" (АНО "ИБТ") на основе собственного перевода на русский язык англоязычной версии международного стандарта, указанного в пункте 4
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 55 "Терминология, элементы данных и документация в бизнес-процессах и электронной торговле"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 30 ноября 2016 г. N 1906-ст
4 Настоящий стандарт идентичен международному стандарту ИСО 30042:2008 "Системы для управления терминологией, знаниями и содержанием. Обмен терминологическими базами [TermBase eXchange (TBX)]" [ISO 30042:2008, "Systems to manage terminology, knowledge and content - TermBase eXchange (TBX)", IDT].
При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты Российской Федерации, сведения о которых приведены в дополнительном приложении ДА
5 ВВЕДЕН ВПЕРВЫЕ

Правила применения настоящего стандарта установлены в статье 26 Федерального закона от 29 июня 2015 г. N 162-ФЗ "О стандартизации в Российской Федерации". Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячном информационном указателе "Национальные стандарты". Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)

Введение

Настоящий стандарт определяет основанную на XML структуру представления структурированных терминологических данных, называемых обменом терминологическими базами [TermBase (TBX)]. В пределах этой структуры может быть определено множество терминологических языков разметки (TMLs). TML, определенный TBX, может облегчить обмен терминологическими данными между пользователями, переводчиками и писателями, использующими инструменты распознавания текста и компьютерного перевода, а также программное обеспечение для авторинга. TML может быть ориентирован как на пользователя, так и на машины - ориентирование на терминологические данные. Таким образом, это может позволить использовать поток терминологической информации всюду по информационному производственному циклу, как внутри организации, так и с внешними поставщиками услуг.
Целевая аудитория этого документа состоит из двух групп: 1) программисты и аналитики, которые хотят развить приложения и которые обрабатывают TBX-послушные файлы с данными; 2) терминологи и другие языковые специалисты, которые хотят проанализировать терминологический сбор данных для представления в TBX или понять файл TBX.
Эта версия TBX представляет собой обновление версии, которая была издана Ассоциацией локализации отраслевых стандартов [Localization Industry Standards Association (LISA)] в 2002 г. Среди других улучшений текущая версия обеспечивает ссылку на интегрированную схему, которая включает модуль основной структуры и ограничения категории данных в объединенных декларациях, используя языки Relax NG и Schematron. Данная версия обеспечивает также ссылку на TBX, совместимый с TML, под названием TBX-Basic.
Пользователям настоящего стандарта необходимо сначала изучить его содержание (разделы 1 - 12). Предложенное использование приложений A - I описано ниже.
1) Модуль основной структуры TBX
Все TMLs в рамках структуры TBX имеют одинаковую основную структуру. Модуль основной структуры описан в разделе 8. DTD для модуля основной структуры описаны в приложении A. Элементы, признаки и типы данных описаны в приложении D и перечислены в алфавитном порядке в приложении I.
2) Модуль XCS
TMLs могут отличаться относительно того, какие категории данных разрешены и на каких уровнях терминологического входа эти категории данных могут произойти. Эти ограничения на основную структуру, которые определяют особый TML, формально представлены в файле XCS. DTD для модуля XCS описана в приложении B. Элементы и признаки описаны в приложении E и перечислены в алфавитном порядке в приложении I.
3) Принимаемый по умолчанию XCS TBX
TBX, принимаемый по умолчанию TML, ограничен принимаемым по умолчанию файлом XCS. Принимаемый по умолчанию TBX XCS описан в разделе 9. Принимаемый по умолчанию XCS представлен в приложении C. Категории данных описаны в приложении D и перечислены в алфавитном порядке в приложении I.
4) Проверка соблюдения случаев документа TBX
После TBX TML определена с помощью XCS, экземпляр TBX-документа может быть проверен на соответствие этому TML. Требования для соблюдения находятся в разделе 7. Можно использовать множество методов и схемы определения языков, чтобы проверить соответствие. В частности, Relax NG, упомянутый в приложении F, может использоваться, чтобы проверить, совместим ли случай документа TBX с TBX, принимаемым по умолчанию TML. В приложении F также указано, где пользователь TBX может найти дополнительные ресурсы для проверки соблюдения. Другой TBX TML, названный TBX-основным, упомянут в приложении G.
5) Изменения, которые были внесены в TBX, начиная с его представления ISO в феврале 2007 г., приведены в приложении H.
Резюме приложений:
A: DTD для модуля основной структуры
B: DTD для модуля XCS
C: XCS по умолчанию, который определяет TBX по умолчанию TML
D: Описания основных элементов структуры и ее признаков
E: Описания элементов XCS и ее признаков
F: Relax NG и другие ресурсы для соблюдения соответствия
G: Ссылка на TBX-Basic
H: Резюме изменений TBX
I: Индексы (алфавитные списки элементов и категорий данных)

1. Область применения

Настоящий стандарт определяет структуру TBX, разработанную для поддержки различных типов обработки терминологических данных, включая анализ, описательное представление, распространение и обмен в различных информационных средах. Основная цель TBX - обмен терминологическими данными. Области применения по назначению включают перевод и создание.
TBX является модульный системой поддержки переменных типов терминологических данных или категорий данных, которые включены в различные терминологические базы данных (терминологические базы). TBX включает в себя два XML-модуля: основная структура и форма для идентификации ряда категорий данных и их ограничений. Термин в TBX относится к структуре, состоящей из этих двух взаимодействующих модулей.
TBX позволяет максимизировать совместимость фактических терминологических данных, а также обеспечить набор категорий данных, которые используются в терминологических базах данных. Подмножества или супернаборы категорий данных по умолчанию могут использоваться в пределах структуры TBX, чтобы поддержать определенные пользовательские требования.

2. Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие международные стандарты. Для датированных ссылок применяют только указанные издания. Для недатированных ссылок применяют самые последние издания (включая любые изменения и поправки).
ISO 8601:2004, Data elements and interchange formats - Information interchange - Representation of dates and times (Элементы данных и форматы для обмена информацией. Обмен информацией. Представление дат и времени)
ISO 12620, Language resource management - Morpho-syntactic annotation framework (MAF) (Терминология, другие языковые ресурсы и ресурсы содержания. Спецификация категорий данных и ведение реестра категорий данных для языковых ресурсов)

3. Термины и определения

В настоящем стандарте применены следующие термины с соответствующими определениями:
3.1 анализ (analysis): Идентификация элементов и структура терминологического сбора данных.
3.2 затемнение (blindness): Собственность формата данных, указывающего на степень, до которой данные достаточно определены, что делает ненужным для импортера устанавливать контакт с создателем данных для того, чтобы интерпретировать их.
Примечание - Термин "затемнение" возникает в технической фразе "передача без подтверждения приема", которая относится к передаче данных, где нет необходимости "видеть", кто отправитель данных, чтобы интерпретировать его. В терминологии понятие затемнения часто используется в контексте слепого обмена (3.3).

3.3 слепой обмен (blind interchange): Способность получить файл терминологии и объединить его в целевую систему, такую как машинный инструмент перевода [Computer-Assisted Translation (CAT)], не имея необходимости связываться с создателем файла, чтобы понять его содержание.
Примечание - Обмен, который является совершенно слепым, не требует никакой связи между отправителем и управляющим данными. Из-за различий между терминологическими сборами данных и форматами повышения совершенно слепой обмен редок. Как правило, некоторые данные в сборе данных слепые (может быть обмен без потери и без связи между сторонами), а некоторые данные требуют связи между сторонами, чтобы быть обмененными.

3.4 дополнительная информация; CI (complementary information): Информация, дополнительная к изложенной в терминологических записях и разделенная через терминологический сбор данных.
[ИСО 16642:2003]
Примечание - В случае документа TBX дополнительная информация содержится в аппарате.

3.5 модуль основной структуры (core-structure module): Спецификация XML элементов и признаков, которые разрешены в файле TBX.
Примечание - Модуль основной структуры определен в DTD, которая используется в тандеме с файлом XCS, который применяет дополнительные ограничения категории данных. Это может также использоваться, чтобы произвести интегрированную схему, такую как "понижение схемы" NG [ИСО 19757-2], которая определяет и модуль основной структуры, и ограничения категории данных в одном файле. См. также ограничение категории данных (3.7).

3.6 категория данных (data-category): Результат спецификации данного поля данных.
[ИСО 1087-2:2000]
Пример - /часть речи/, /грамматическое число/.
Примечание 1 - Набор по умолчанию категорий данных для TBX был прежде всего отобран из ИСО 12620:1999.
Для просмотра документа целиком скачайте его >>>
Нормы из информационного банка "Строительство":
Пожарные нормы:
ГОСТы:
Счетчики:
Политика конфиденциальности
Copyright 2020 - 2022 гг. RuNormy.RU. All rights reserved.
При использовании материалов сайта активная гипер ссылка  обязательна!