04 февраля 2025

Математики МГУ предложили новый подход к машинному обучению для прогнозирования временных рядов

Исследователи факультета ВМК МГУ и Федерального исследовательского центра «Информатика и управление» Российской академии наук (ФИЦ ИУ РАН) разработали новый метод повышения точности прогнозов временных рядов, объединяя вероятностные модели и алгоритмы машинного обучения. Метод уже доказал свою эффективность, улучшив показатели точности прогнозов до 45,7%. Об этом сообщили в пресс-службе вуза.

Результаты работы опубликованы в журнале AI.

Прогнозирование временных рядов играет ключевую роль во многих областях, включая управление энергоресурсами и телекоммуникационным трафиком, анализ климата, медицину и финансы. Они зачастую характеризуются зашумленностью данных и ограниченностью обучающих наборов. Это создает трудности для традиционных моделей, которые могут переобучаться или давать низкую точность прогнозов в прикладных задачах. Новая методика, разработанная учеными ФИЦ ИУ РАН и факультета ВМК МГУ, базируется на совместном использовании вероятностных моделей и алгоритмов машинного обучения для повышения обобщающих способностей моделей искусственного интеллекта с целью выявления нетривиальных закономерностей в данных. Подход ориентирован на повышение качества прогнозирования даже для датасетов небольшого объема.

Предложенный подход развивает принципы вероятностно-информированного машинного обучения — а именно, используются смешанные компоненты связности для генерации новой информации для моделей машинного обучения. Дополнительные признаки формируются с использованием специального алгоритма объединения параметров при обработке временного ряда в режиме скользящего окна. Это позволяет учитывать нелинейные взаимосвязи и стохастические факторы, влияющие на данные. Кроме того, в данном исследовании впервые продемонстрирована эффективность использования смешанных компонент связности как для методов машинного обучения, так и для глубоких нейронных сетей, в частности, представляющих собой ансамбли из рекуррентных сетей LSTM и трансформеров.

Экспериментальное тестирование методики основывалось на двух существенно различающихся по физической природе датасетах. Первый представляет собой данные теплообмена между океаном и атмосферой, например, в районах Гольфстрима и Лабрадорского моря. Эти данные характеризуются сложной пространственно-временной динамикой. Вероятностно-информированные модели, разработанные учеными, способствовали существенному уменьшению значений метрик.

Так, среднеквадратичная ошибка была снижена на 27,7%, а средняя абсолютная процентная ошибка — на 45,7%. Второй набор содержал открытые данные о показателях температуры масла в электрических трансформаторах. Здесь также удалось продемонстрировать существенные улучшения, добившись уменьшения среднеквадратичной ошибки на 10% по сравнению с традиционными методами прогнозирования, в том числе удалось превзойти результаты трансформерной модели Reformer.

«Применение вероятностного информирования в машинном обучении открывает новые горизонты для анализа временных рядов. Даже в условиях ограниченных или зашумленных данных мы можем добиваться значительных улучшений в точности прогнозов. Это особенно важно для задач, где ошибка прогноза может повлечь серьезные последствия, будь то энергетика, климат или медицинские исследования», — пояснил доцент кафедры математической статистики факультета ВМК МГУ Андрей Горшенин.

В дальнейшем ученые планируют уделить особое внимание расширению классов используемых архитектур и методов их вероятностного информирования с помощью разнообразных математических моделей с целью получения высокоточных прогнозов в различных областях науки и промышленности.

Последние обновления: