Кросслексика: универсум связи между русскими словами

  • И. Большаков
Ключевые слова: русский язык, компьютерный словарь, связи между словами, политематичность, диалоговый и программный доступ, запросы по-английски

Аннотация

Большаков Игорь Алексеевич – доктор технических наук, профессор, независимый исследователь, Почетный профессор Национального политехнического института Мексики.
Адрес: 127055, Москва, ул. Лесная, 45.  
E-mail: iabolshakov@gmail.com

За последнюю четверть века русский язык претерпел существенные изменения. Накопившиеся в обществе разговорные слова и жаргонизмы выплеснулись на страницы изданий, в рекламу, на телеэкран, в Интернет. Появилось множество новых заимствований, многие слова приобрели новый смысл. Соответственно, изменился и пополнился состав словосочетаний, используемых в русском языке. Поэтому создание словарей, отражающих допустимые и недопустимые связи между словами, стало крайне актуальным.

В работе обсуждаются вопросы разработки сетевой структуры и кросслексических принципов  для словаря, по размерам и структуре не имеющего аналогов. Принципы сетевой структуры заключаются в том, что любой элемент словника всегда сопровождается своими связями. Контент кросслексического массива основан на бумажных словарях, новостях и аналитике Интернета, а также различной рекламе, журналах по персоналиям, модам, туризму и автомобилям. Тематика охватывает экономику, бизнес, социально-политическую сферу, технологии, точные, естественные и гуманитарные науки, медицину, спорт, бытовой язык.

Элементы массива (вокабулы) относятся к четырем главным частям речи: существительным, глаголам, прилагательным (вместе с причастиями) и наречиям (вместе с деепричастиями). Структура кросслексики представляет собой матрицу с ячейками, описывающими конкретные связи. Наиболее многочисленными словосочетаниями оказались «прилагательное – существительное» и «глагол – его дополнение-существительное». Наиболее многочисленными смысловыми связями, помогающими понять смысл вокабул, обладают синонимы и смысловые производные. Кросслексический массив содержит почти триста тысяч вокабул и более восьми миллионов связей между ними.

Проведенный анализ и тесты разработки свидетельствуют, что кросслексика помогает редактировать тексты и изучать русский язык. Кроме того, приложения кросслексики  могут поднять на новый, более высокий уровень автоматическую обработку текстов. 

Скачивания

Данные скачивания пока не доступны.
Опубликован
2013-02-12
Как цитировать
БольшаковИ. (2013). Кросслексика: универсум связи между русскими словами. БИЗНЕС-ИНФОРМАТИКА, 7(3), 19-26. извлечено от https://vo.hse.ru/index.php/bijournal/article/view/26194
Раздел
Анализ данных и интеллектуальные системы