Искусственный интеллект на основе данных предсказал вспышки холеры
Климатические данные, полученные со спутников, находящихся на орбите Земли, в сочетании с методами машинного обучения помогают лучше прогнозировать вспышки холеры и потенциально спасать жизни.
Холера - это заболевание, передающееся через воду, которое возникает в результате употребления в пищу воды или пищи, зараженной бактерией Vibrio cholerae, которая встречается во многих прибрежных регионах мира, особенно в густонаселенных тропических районах. Ответственный за это патоген обычно живет при высоких температурах, умеренной солености и мутности, и его может содержать планктон и детрит в воде.
Глобальное потепление и учащение экстремальных погодных явлений вызывают вспышки холеры - болезни, от которой ежегодно страдают от 1,3 до 4 млн человек во всем мире и вызывают до 143 000 смертей. Новое исследование показывает, как вспышки холеры в прибрежных регионах Индии можно предсказать с вероятностью успеха 89%, в первом демонстрации использования солености морской поверхности для прогнозирования холеры.
Исследование, опубликованное в Международном журнале экологических исследований и общественного здравоохранения, направлено на прогнозирование вспышек холеры в северной части Индийского океана, где в период 2010-16 годов было зарегистрировано более половины глобальных случаев заболевания.
Количество вспышек холеры, о которых сообщается в еженедельных эпидемиологических отчетах, публикуемых Интегрированной программой эпиднадзора за заболеваниями Индии (IDSP) в период с января 2010 года по декабрь 2018 года в 40 прибрежных районах Индии, выбранных в исследовании. Показаны только районы, сообщающие данные о заболеваемости холерой, для которых были доступны все семь наборов данных по основным климатическим переменным (ECV). Предоставлено: Кэмпбелл и др., 2020.
Взаимосвязь между экологическими факторами заболеваемости холерой сложна и меняется в зависимости от сезона, с различными запаздывающими эффектами, например, от сезона дождей. Алгоритмы машинного обучения могут помочь преодолеть эти проблемы, научившись распознавать закономерности в больших наборах данных, чтобы делать проверяемые прогнозы.
Исследование проводилось под руководством Эми Кэмпбелл во время ее годичной стажировки в Климатическом бюро Европейского космического агентства ЕКА. Эми вместе со своими соавторами из морской лаборатории Плимута (PML) использовала алгоритм машинного обучения, популярный в приложениях для изучения окружающей среды, который может распознавать закономерности в длинных наборах данных и делать проверяемые прогнозы.
Результаты показателей производительности модели случайного леса в применении к невидимым тестовым данным для отдельных районов в прибрежной Индии, которые сообщили о вспышках холеры. Прибрежные районы, в которых вспышки холеры не зарегистрированы в исследуемый период, и прибрежные районы показаны серым цветом. Предоставлено: Кэмпбелл и др., 2020.
Алгоритм обучен на вспышках заболеваний, о которых сообщалось в прибрежных районах Индии в период с 2010 по 2018 год, и изучил взаимосвязь с шестью климатическими записями, полученными со спутников, созданными в рамках инициативы ЕКА по изменению климата (CCI).
Включая или удаляя экологические переменные и подпараметры для разных сезонов, алгоритм определил ключевые переменные для прогнозирования вспышек холеры, такие как температура поверхности земли, соленость поверхности моря, концентрация хлорофилла и аномалия уровня моря.