К вопросу о восстановлении символьных последовательностей, кодирующих зашумленные периодические функции

  • Галина Н. Жукова Национальный исследовательский университет «Высшая школа экономики» https://orcid.org/0000-0003-1835-7422
  • Михаил В. Ульянов Московский государственный университет им. М.В. Ломоносова , 119991, г. Москва, Ленинские горы, д. 1; Институт проблем управления им. В.А. Трапезникова Российской академии наук, 117997, г. Москва, ул. Профсоюзная, д. 65 https://orcid.org/0000-0002-5784-9836
Ключевые слова: символьная последовательность, мощность алфавита, периодическая последовательность, зашумленная последовательность, шум вставки, шум удаления, шум замены

Аннотация

В бизнес-информатике, одним из предметов исследования которой является анализ данных о процессах в прикладных предметных областях, возникают задачи качественного анализа. Такого рода задачи возникают, например, при качественном исследовании лог-файлов бизнес-процессов, при анализе и прогнозировании временных рядов, и других процессов различной природы. Достаточно часто для представления информации об исследуемых процессах в методах качественного анализа используется символьное кодирование, позволяющее снять излишнюю детализацию числовых описаний. Актуальность данного исследования связана с тем, что при работе с исходными данными исследователи зачастую сталкиваются с наличием шумов и искажений в исходных данных, что существенно затрудняет решение задач качественного анализа. При работе с символьными представлениями исследуемых процессов, которые достаточно часто имеют периодический характер, мы наблюдаем шумы удаления, вставки и замены символов, усложняющих решение задачи определения и анализа периодичности. В статье рассматривается задача восстановления периодических символьных последовательностей, полученных кодированием по отсчетам периодических функций и искаженных шумами вставки, замены и удаления символов. В качестве конкретного примера синтетических данных временных рядов рассматриваются тригонометрические функции. Для кодирования тригонометрических функций используются алфавиты различных мощностей с различной детализацией интервалов отсчетов по модельному времени. В статье представлено экспериментальное исследование зависимости характеристик качества метода восстановления периода и периодически повторяющегося фрагмента, ранее предложенного авторами и усовершенствованного в данном исследовании. Для алфавитов разной мощности при фиксированных интервалах отсчетов по модельному времени приводятся доля последовательностей с удовлетворительно восстановленным периодом и относительная погрешность определения длины периода. Качество восстановления периодически повторяющегося фрагмента оценивается отношением редакционного расстояния от восстановленной периодической последовательности до исходной последовательности, искаженной шумами.

Скачивания

Данные скачивания пока не доступны.
Опубликован
2021-12-29
Как цитировать
Жукова Г. Н., & Ульянов М. В. (2021). К вопросу о восстановлении символьных последовательностей, кодирующих зашумленные периодические функции. БИЗНЕС-ИНФОРМАТИКА, 15(4), 22-35. https://doi.org/10.17323/2587-814X.2021.4.22.35
Раздел
Без рубрики