Тезаурус

что это такое. Словарь-тезаурус, который больше чем словарь

Все чаще в многочисленных проектах, книгах, брошюрах, интернет-ресурсах можно встретить понятие "тезаурус". Словно таинственное явление, оно пугает своей неизведанностью, ведь куда проще сказать "словарь", нежели использовать странное определение.

Тезаурус: что это? Чем он отличается от обычного словаря? Попытаемся изучить данные вопросы более подробно и доступно.

тезаурус что это

4. Межязыковыми (dog-собака-chien-犬). Данный тип связей является основой
построения машинного переводчика.

Для отдельных приложений могут потребоваться другие типы связей, например
толкования для толковых словарей, транскрипции для переводов. Грамматический движок
никак не ограничивает набор типов связей, по необходимости можно добавлять объявления
новых типой связей в исходные тексты словаря. Набор связей в текущей
версии словаря можно посмотреть в файле sg_net_links.sol
в исходных текстах словаря. Подробные описания некоторых типов связей вынесены на отдельные страницы:

Родовые пары

Синонимы

Отношения обитатель-место обитания

Отношения экземпляр-целое

Отношения субъект-действие

Уменьшительные и увеличительные формы

Дети и детеныши

Деривативы

Нижеследующая таблица содержит примеры различных связей в тезаурусе:

тип связи в исходных текстах словаряцелочисленная константаисходное словорезультат
в_инфTO_INF_linkобъясненныйобъяснить
в_сущTO_NOUN_linkобъяснятьобъяснение
в_инфTO_INF_linkобъясняяобъяснять
в_несовTO_UNPERFECTобъяснитьобъяснять
to_englishTO_ENGLISH_linkобъяснятьto explain
synonymSYNONYM_linkобъяснятьрастолковывать
synonymSYNONYM_linkобъяснятьделать понятным
sex_synonymSEX_SYNONYM_linkучительучительница

Утилиты для работы с тезаурусом

Программа Грамматический Словарь
позволяет просматривать связи слов:

русский тезаурус

С помощью программы SQLex
можно просматривать и редактировать тезаурус, загруженный в SQL БД:

SQL редактор словаря

Многосторонность, системность искусства приводит к неравномерности восприятия произведения в целом: для восприятия одних аспектов стиха тезаурус оптимален, для других-недостаточен или слишком велик.

Так как тезаурус растет и меняется, повторное знакомство с произведением может означать получение новой ценной информации.

тезаурус

Корень: -тезаурус-.

Произношение

Семантические свойства

Значение

  1. тезаурус (аналогично русскому слову) ).рекомендацииНе указан пример употребления (см. ◆ 

Синонимы

         В широком смысле Т. интерпретируют как описание системы знаний о действительности, которыми располагает индивидуальный носитель информации или группа носителей. Этот носитель может выполнять функции приёмника дополнительной информации, вследствие чего изменяется и его Т. Исходный Т. определяет при этом возможности приёмника при получении им семантической информации (См.

теза́урусы,

теза́уруса,

теза́урусов,

теза́урусу,

Функции тезауруса

Словарь-тезаурус несет важные социальные, коммуникационные, научные и другие функции.

Он является:

Кроме очевидного использования межъязыковых связей для переводчика, есть еще
несколько интересных применений тезауруса.

Одно из них - глубокая нормализация слов.

Обычная нормализация - это приведение слова к
базовой форме соответствующей словарной статьи.
Например, собакой после
нормализации превращается в собака.

Если дополнить процесс поиском по тезаурусу
словарных статей, связанных с данной посредством таких связей, как уменьш_ласк,
груб, увелич,
в_предикат, то получаем такие результаты:

кошечкой-кошечка-(уменьш_ласк)-кошка

Петькой-Петька-(груб)-Пётр

ручищами-ручища-(увелич)-рука

играющие-играющий-(в_предикат)-играть-(в_сущ)-игра

Таким образом, включение тезауруса в
процесс нормализации позволяет не только отбросить грамматические признаки типа
падежа, числа, но и пойти дальше - привести слово
к форме существительного (или глагола).

В API грамматического движка
есть вызовы sol_TranslateToBase
и sol_TranslateToNoun,
которые выполняют приведение сначала к базовой форме статьи, а затем к форме существительного.

Тезаурус в переводчике

В переводчике тезаурус является прежде
всего поставщиком переводов отдельных слов. Кроме того, используются и
другие типы связей. Расмотрим это на примере японско-русского
переводчика.

Вот результаты перевода некоторых тестовых предложений:

木の靴  -->  Деревянная обувь
竹のかご  -->  Бамбуковая корзина
日本のコンピューター  -->  Японский компьютер
イタリアの車  -->  Итальянский автомобиль
父の車  -->  Отцовский автомобиль

Все они соответствуют паттерну сущ の сущ, который на
русский язык переводится разными способами в зависимости от контекста. Соответствующее правило трансформации текста
срабатывает на данный паттерн и затем пытается подобрать наиболее
адекватный способ перевода на русский язык. Например, для
словосочетания 木の靴 первое существительное 木 переводится как дерево.
Прежде всего выясняется, что это - материал, с помощью связей типа
класс-член класса (гиперонимы-гипонимы).
Далее берется результат перевода 木 и выполняется адъективация - поиск производного
прилагательного.
В нашем случае это деревянный.
Далее происходит склонение прилагательного для согласования со
вторым существительным. В итоге получается русский
перевод деревянная обувь.

Программа Экранный Переводчик
в некоторых случаях использует специальную упрощенную версию тезауруса.
Этот тезаурус содержит только переводы слов. Его архитектура позволяет
минимизировать расходуемые программой ресурсы оперативной памяти.

Источник: библиотека Максима Мошкова

Наверх