IBM: большие данные и аналитика позволяют ускорить выявление источников пищевых инфекций
Ученые подразделения IBM Research — Almaden в Сан-Хосе, штат Калифорния, обнаружили, что обработка данных с кассовых сканеров штрих-кодов в продовольственных магазинах может ускорить обнаружение источника инфекции с учетом географии выявления случаев заболеваний пищеварительного тракта. Согласно данным исследования, ученые могут всего за несколько часов ограничить число потенциально зараженных продуктов до 12 наименований, имея на руках лишь с десяток отчетов о результатах медицинского обследования, сообщили CNews в корпорации IBM.
В рамках исследования сотрудники IBM Research создали методологию обработки информации для сотен категорий пищевых продуктов. Она позволяет рассмотреть пространственно-временные данные, включая географическое положение и ориентировочное время употребления в пищу. Проанализировав каждый продукт и срок его хранения, ученые также выявили место, где он был употреблен в пищу, и вероятность скопления в нем отдельных болезнетворных микроорганизмов. Эта информация была наложена на карту очагов инфекции. Затем система сформировала рейтинг всех продуктов на основе вероятности заражения, из которого врачи смогли выбрать 12 наиболее подозрительных наименований продуктов, протестировать их на наличие инфекции и проинформировать население в случае угрозы.
Стандартная проверка занимает недели и месяцы, что может повлиять на экономические и социальные последствия вспышки заболевания. Обычно процесс включает опрос граждан для отслеживания источника инфекции. Так, в 2011 г. потребовалось 60 дней, чтобы выявить в Европе источник вспышки инфекции, вызванной кишечной палочкой — импортированные семена пажитника, рассказали в компании. К моменту завершения расследования все ростки этих семян были употреблены в пищу. По данным Европейского надзорного органа по безопасности пищевых продуктов European Food Safety Authority, около 4 тыс. человек в 16 странах заболели и более 50 человек умерли до того, как был найден источник инфекции.
«При вспышке инфекционных болезней, распространяющихся через пищеварительный тракт, врачам крайне важно оперативно выявить источник заражения и предупредить население об угрозе, — отметил Кан Ху, исследователь в области здравоохранения IBM Research — Almaden. — Традиционные методы, такие как опросы населения и исследования, по-прежнему необходимы, однако обработка больших данных с кассовых сканеров в продовольственных магазинах может за считанные часы значительно сократить список подозрительных наименований продуктов для дальнейших лабораторных тестирований. Наша работа показывает, что большие данные и аналитика позволяют существенно уменьшить время проверки и влияние человеческого фактора. Такой метод будет иметь большое значение для сферы здравоохранения».
Описанный в исследовании метод ранее применялся при вспышке коли-инфекции в Норвегии. По информации IBM, уже на момент, когда было зарегистрировано всего лишь 17 случаев инфицирования, врачи начали использовать новую методологию для обработки данных с кассовых сканеров в продовольственных магазинах. На основе сведений о более чем 2,6 тыс. продуктов питания они выделили десять наиболее вероятных возбудителей инфекции. Дальнейший лабораторный анализ помог найти источник заражения, определить конкретную партию и серийный номер продукта — им оказалось колбасное изделие.