Как программы создают лекарства за чтением газет

В начале двадцатого века совершить научное открытие можно было в одиночку в своем гараже-лаборатории. В конце прошлого столетия на это уже требовались усилия коллектива ученых. Сегодня же сложность прогресса такая, что лаборатории из разных стран объединяют свои усилия и дополнительно прибегают к помощи суперкомпьютеров. Последние, кстати, могут вообще лишить ученых работы в области фармакологии: «умное» программное обеспечение создает новые лекарства, просто читая научные статьи. Исследователи надеются, что такое ПО поможет создать лекарства против рака.

Разработкой подобного программного обеспечения занимаются совместно в IBM и медицинском колледже американского города Бейлора. Созданная ими программа прочитала свыше 60 тыс. научных статей, в которых исследовали протеин p53. Он участвует в росте клеток тела и его обнаруживают в большинстве раковых опухолей. Разбирая и систематизируя написанное в этих статьях, программное обеспечение может помочь понять, как регулировать поведение этого протеина с помощью энзимов вроде киназы. Воздействуя на последнюю, можно частично управлять развитием раковой опухоли.

Программа уже выполнила больше, чем от нее требовалось изначально. Она не только систематизировала сведения о связи киназы и протеина p53, но еще создала список других протеинов, которые могут иметь те же свойства, что и киназа. Предварительные проверки работы программы показали, что ее предсказания правильные.

«Мы протестировали десяток новых энзимов, – говорит участник проекта из колледжа Бейлора Оливьер Личтарг. – Семь из них оказались действительными аналогами киназы».

Прежде чем дать программе возможность предсказывать неизвестное науке, ее проверили на уже исследованных веществах. Сравнивая результаты ее работы с реальными достижениями науки можно было убедиться в качестве работы этого ПО. Тогда программе дали «прочитать» литературу и научные статьи, которые вышли до 2003 года. Система отработала на высоком уровне: она обнаружило семь из девяти киназ, которые открыли после 2003 года.

«Биология протеина р53 является центральной для всех типов болезней, – отмечает Личтарг. – Новые киназы обычно открывают по одной в год. Но программное обеспечение может увеличить значительно скорость». Ученый говорит, что сделанные программой открытия на основе литературных источников могут положить начало новым методам лечения. Результаты работы пока еще ПО нуждаются в проверке на практике, чтобы научное сообщество могло убедиться в корректности ее предсказаний. В будущем, когда система докажет свою успешность на деле, она позволит быстрее осуществлять научные открытия.

Поиск лекарств – профессия для программы

Изначально созданную в IBM и колледже Бейлора программу сконфигурировали только на поиск киназ. Но ее разработчики говорят, что она способна делать и другие открытия. Подобный программный комплекс можно использовать для поиска неизвестных фосфатов, которые являются теми же энзимами, что и киназа, только имеют обратное действие в человеческом организме. Кроме этого, программная система сможет идентифицировать другие типы взаимодействующих с p53 протеинов.

Разработкой колледжа Бейлора и IBM уже заинтересовались фармацевтические компании. Их привлекает возможность «скормить» программе набор научных исследований и получить на выходе идеи по созданию новых лекарств. Например, компания в поиске нового лекарства против малярии может использовать инструмент IBM для поиска молекул лекарств, у которых свойства подобны существующим веществам. Из-за того что ПО проводит более широкий поиск, оно способно в научных публикациях обнаружить молекулы, которые пропустили другие ученые или патентные органы.

«Мы начали работать с колледжем Бейлора для адаптации нашего ПО к подобным возможностям, – говорит ученый IBM Research Almaden Йинг Чен. – Мы хотим расширить ее для того, чтобы ускорить исследовательский процесс относительно биологии протеина p53».

Программы обеспечат скорость науки

Сегодня разработка нового лекарства является очень затратной вещью. Для этого требуется от $500 млн до $1000 млн долларов и 90% потенциальных веществ отсеиваются в процессе исследований. Это одна из причин, почему лекарства сегодня стоят так дорого.

Другие ученые разделяют оптимизм компьютерного поиска лекарств, но предлагают относиться к этому более взвешенно. «Необходимо тщательное эмпирическое подтверждение полученных программой открытий, – говорит директор центра компьютерной фармакологии при Университете Колорадо Лоуренс Хантер. – Однако прогресс в этой области важен и подобные инструменты востребованы».

По словам Хантера, делать новые открытия становится все сложнее, и ученым не помешает помощь программ: объем литературы таков, что прочитать ее уже не реально. За один лишь прошлый год база данных Национальной медицинской библиотеки США пополнилась более чем миллионом статей. Всего же в ней сегодня находится 23 млн материалов.

Программное обеспечение легко может проанализировать подобные массивы данных и сделать открытия там, где это пропустили люди. «Важные биты информации – это часто изолированные факты, которые в статье могут иметь минимальную роль, – отмечает Хантер. – Если вы их найдете, они могут стать очень важными».

Подобный способ развития науки, когда программа анализирует массивы научных работ, может даже привести к изменению всего научного процесса. Из-за того, что люди не могут прочитать все, что касается их исследований, ученые чтобы отобрать источники литературы для своих работ опираются на авторитет других исследователей или учреждений, научные журналы и количество цитирований. В то же время программа может проанализировать все опубликованные на заданную тему работы и предложить новые открытия.

Подобные программные инструменты пригодятся на ранних стадиях научной работы, когда ученый лишь выбирает какую из доступных ему гипотез исследовать. Обеспечив систему IBM необходимым набором опубликованных статей, исследователь сможет узнать, какой из путей является наиболее перспективным.

«Я думаю, что программы помогут науке двигаться быстрее, – отмечает Хантер. – Мы часто тратим много времени в лабораториях из-за того, что невозможно прочитать всю опубликованную информацию».

По материалам: Technology Review

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я