Главное, что обучение машин, подобных стоящим за IBM Watson и другими системами, позволяет нам идти вширь (N = 7 млрд) и вглубь (N = 1) не просто в поисках знаний, но и в поисках предсказаний и понимания. В отношении каждого человека нам нужно знать пусковые механизмы и сложные взаимосвязи на многочисленных уровнях – геномном, биологическом, физиологическом, средовом, – которые отвечают за предрасположенность к заболеванию или состоянию. Цель – не просто оценить риск в течение жизни человека, а в определенное время или момент. Многое мы узнаем и в результате углубленного исследования максимально возможного количества людей на предмет сигналов, обогащающих наше понимание того, что требуется для проявления болезни или для ее предотвращения. Только сейчас мы можем собрать такие паноромные данные по каждому отдельному человеку и в группах населения, и, обладая способностью управлять и обрабатывать огромные наборы данных, мы оказываемся в завидном положении предсказателей болезни. И, может быть, после того, как мы научимся все это делать хорошо, нам удастся даже предотвращать болезни у некоторых людей.
Предсказание болезни: кто, когда, как, почему и что?
Для начала убедимся в том, что мы различаем понятия «предсказание» и «диагноз». Онлайн-тестеры для проверки симптомов66
пользуются все большей популярностью и вниманием в Интернете и помогают людям проводить «самодиагностику» (с помощью компьютера), но они не предсказывают болезнь. В лучшем случае из набора симптомов, которые вводит человек, предлагается дифференциальная диагностика, и правильный диагноз входит в список вариантов. Это полезно и практично, но это ничего не предсказывает. Точно так же разработчики из Biovideo – которые разрабатывают приложение для суперкомпьютера IBM Watson, чтобы «мать с больным ребенком в четыре утра могла воспользоваться IBM Watson и спросить, что случилось с ее ребенком и получить точный ответ»67а, – могут создать что-то полезное, но это что-то не имеет отношения к прогнозу.У нас очень серьезная проблема с ошибочной диагностикой: диагноз – неправильный или правильный – ставится пациенту слишком поздно, и эта проблема затрагивает 12 млн американцев в год67b, 67c
. Для решения этой проблемы можно обратиться к технологиям и контекстуальным вычислениям. Популярный телесериал «Доктор Хаус» очень поучителен в этом плане. Главный герой, Грегори Хаус, – блестящий диагност, который разбирается с самыми редкими и таинственными случаями, ставящими в тупик других врачей68–71. Для того чтобы этого добиться, он использует байесовский подход, при котором вся информация – история болезни, медосмотр, лабораторные исследования, сканограммы – рассматривается в контексте всей ранее известной, относящейся к делу информации (что известно из теоремы Байеса[49] как клиническая предсказуемость результата испытания). Ответ «да» или «нет» не получается. Скорее, есть вероятность, что у пациента диагноз X или Y. Это можно сравнить с распространенным подходом, предусматривающим «да» или «нет» на основании исключительно статистики вероятности (типа Р < 0,05, где Р – коэффициент вероятности). Модель доктора Хауса идеально подходит для компьютерной автоматизации в медицине, и точно так же работает IBM Watson70, 71. Вероятность предварительного диагноза учитывает всю медицинскую литературу, которая была опубликована до сегодняшнего дня. Когда вы вводите в IBM Watson все имеющиеся данные о конкретном пациенте в поиске диагноза, вы получаете список возможных вариантов. Каждому присваивается вес или вероятность (отношение правдоподобия).Более того, байесовская модель для диагностики с помощью компьютера быстро становится частью клинической практики и может распространиться на рекомендации по лечению. Информационный ресурс в Сети под названием Modernizing Medicine (Модернизация медицины) включает информацию по более чем 15 млн посещений пациентов и 4000 врачей с лечением и результатами по каждому пациенту72
. Так что помимо способности IBM Watson к дифференциальной диагностике может быть генерирован список назначений с взвешенной вероятностью и установлено соответствие данных пациента всем остальным в базе данных. (Кстати, специалистам по обработке и анализу данных, которые работают в здравоохранении, не нравится, когда их информационные ресурсы называют базами данных. Вот так-то!) Все это примеры использования искусственного интеллекта для дифференциальной диагностики и лечения в медицине. Но и это еще не предсказания.