Новый алгоритм позволяет на ПК прогнозировать погоду не хуже, чем на суперкомпьютере
Насколько мы можем себе представить, точный прогноз погоды сейчас невозможен без обработки данных на суперкомпьютерах. Всего несколько дней назад Великобритания выделила $1,6 млрд на покупку новой суперсистемы для службы прогнозирования погоды. Теперь выясняется, что погоду и многие другие явления можно точно предсказать с помощью нового алгоритма на обычном персональном компьютере.
О разработке сообщила группа исследователей из Университета Йоханнеса Гутенберга в Майнце и Университета Лугано в итальянской части Швейцарии. Группа много лет разрабатывала алгоритм на основе концепции "масштабируемой вероятностной аппроксимации" или SPA (scalable probabilistic approximation). Статья на английском языке опубликована в журнале Science Advances.
Алгоритм способен проанализировать несколько десятков компонентов системы и предсказать будущее поведение системы с высокой точностью. Например, как сказала соавтор разработки Сюзанна Гербер (Susanne Gerber), "Используя алгоритм SPA [на обычном ПК], мы можем сделать прогноз на основе данных о температуре поверхности в Европе на следующий день и иметь ошибку прогнозирования всего 0,75 °C". При расчете на ПК такой показатель как частота ошибок оказывается на 40 % лучше, чем при расчете на суперкомпьютерах современных метеослужб.
Более того, алгоритм SPA оказывается универсальным или широко применимым для анализа данных в других сферах. Он одинаково хорошо работает при обсчете модели Лоренца (описание конвективных потоков воздуха в атмосфере), так и для оценки динамики поведения аминокислот в воде. Методом SPA можно проводить диагностику рака молочной железы, прогнозировать неврологические заболевания и делать другие расчеты с прогнозированием.
Самое приятное в созданном алгоритме, как считают разработчики, что он работает не так, как типичные модели для глубокого машинного обучения. Обработка больших данных в ML представляется типичным "черным ящиком". Что происходит внутри, мало кто понимает и это не всегда возможно. Один набор данных подается на вход, а результат обработки появляется на выходе. Алгоритм SPA не такой. Он позволяет интерпретировать взаимосвязь данных и проследить, как и какие характеристики и параметры использовались для обработки массивов данных. Иначе говоря, понять, каким образом получилось то, что получилось.