Пётр руководит группой ML в Погоде — именно его отдел собирает данные для яндексовской технологии Метеум, на базе которой работает карта осадков. Он рассказывает, как нейронки помогают прогнозировать погоду, почему точность зависит от региона и времени года и для чего нужны репорты пользователей.
Второй уровень — метеорологические радары, которые измеряют количество влаги в атмосфере до высоты в 10 километров. Обычно они расположены в аэропортах и нужны, чтобы корректировать расписание вылетов с учётом погодных условий.
Устроено это так: внутри радара стоит антенна, которая испускает луч. Он отражается от влаги в атмосфере и возвращается с данными о её количестве. Антенна поворачивается, процесс повторяется.
Так мы узнаём, в какой части воздуха есть влага, а значит, скорее всего, выпадут осадки. Минусы такой системы — она может упустить быстрый локальный дождь, который появляется и исчезает, пока антенна совершает оборот. Поэтому данные тут менее точные, чем у метеостанций. Зато площадь покрытия у радаров больше, а информация передаётся чаще. Например, на российских метеостанциях измерения накопленных осадков происходят раз в 6 или 12 часов, а на радарах — раз в 8–10 минут.
Такие противоречия мы склеиваем с помощью специальной формулы.
Спустя два часа у нас включается четвёртая модель, которая даёт прогноз на несколько дней вперёд. В нём осадки описываются кратко: «пасмурно», «небольшой дождь», «дождь со снегом». В периоды, когда атмосфера спокойная, а погода не слишком меняется, модели можно смело верить на ближайшие пять дней. Если атмосфера изменчива — на три. Дальше прогноз уже менее точный, но ориентироваться на него всё равно удобнее, чем на климатическую норму.
Модели постоянно пересчитывают прогноз и обновляют данные в среднем раз в пять минут.
В равнинной местности прогнозировать проще, чем в горной, где атмосфера более изменчива. Так же и с сезонами: в жару испаряется больше влаги, облака формируются быстрее, поэтому летом часто бывают короткие дожди, которые сложнее прогнозировать.
В таких случаях мы ориентируемся на фидбэк от пользователей: корректируем погрешности, постоянно улучшаем модель. Однажды, когда в Москве начался сильный дождь, нам прислали около трёх миллионов репортов за вечер.
Ведущие международные метеорологические институты сейчас делают именно так: прогнозируют погоду с опорой сразу на несколько источников.