«Метод был проверен на большой выборке данных, собранных из двух крупнейших биологических баз данных, BioIsis и SASBDB. Мы продемонстрировали, что «Pepsi-SAXS» работает от 5 до 50 раз быстрее, чем ранее применяемые методы CRYSOL, FoXS и трёхмерный метод Цернике в SAStbx. При этом «Pepsi-SAXS» не только не уступает им в точности, а даже выигрывает», — поясняет Сергей Грудинин из Московского Физтеха в Долгопрудном, чьи слова приводит пресс-служба МФТИ.
Сложные белковые молекулы в наших организмах состоят из нескольких тысяч аминокислот, чьи цепочки часто бывают закручены в сложную форму благодаря взаимодействиям между отдельными «звеньями» этих пептидных цепей. Пока биологи не до конца раскрыли законы, по которым белки принимают определенную форму, и которые позволяют определять форму молекулы по ее формуле.
Поэтому структуру отдельных белков ученым приходится определять «вручную» – или используя компьютерные симуляции, или же замораживая отдельные молекулы белков при помощи жидкого азота и гелия и «просвечивая» их при помощи сверхмощных рентгеновских лазеров.
Результаты подобного трёхмерного «рентгена», как рассказывает Грудинин, нельзя сразу использовать для научных экспериментов и изучения структуры молекулы – их сначала нужно обработать и понять, как именно отражались пучки рентгена от разных частей молекулы во время получения снимка.
Как правило, анализ этих фотографий требует огромных вычислительных мощностей и большого количества времени, что побуждает отечественных и западных физиков и программистов искать способы упрощения и убыстрения подобного компьютерного «гадания по фотографиям».
Российские физики и их французские коллеги нашли способ ускорить этот процесс в 5-50 раз, используя новую методику получения рентгеновских снимков, при которой рентгеновский «сканер» собирает информацию только о тех частицах света, которые отразились от атомов и молекул в стороны и назад, а не вперед, вместе с основным потоком рентгена.
Подобная методика, как рассказывают ученые, позволяет получать рентгеновские фотографии молекул без особой подготовки и внутри растворов и живых клеток, однако она требует еще больше вычислительных мощностей, чем остальные виды рентгеновских «сканеров». В частности, на обработку данных только одного эксперимента уходило порядка 10 часов.
Грудинин и его единомышленники нашли способ упростить эти расчеты, опираясь на идеи, открытые еще в семидесятые года прошлого века немецким математиком Генрихом Штурманом (Heinrich Stuhrmann). Он обнаружил, что для этого можно использовать особые математические функции, учитывающие то, как расстояние между разными типами атомов в белковой цепочке и характер их связи с молекулами воды влияет на то, как они рассеивают рентгеновское излучение.
Как показали первые эксперименты с этой методикой, данная система «трехмерного рентгена» для белков работает в десятки раз быстрее, чем конкурирующие методики анализа данных, и при этом для достижения высокой скорости не требуется жертвовать качеством вычислений. Подобную программу, как пишут ученые, можно использовать даже на ноутбуках с относительно медленными процессорами, что делает ее более удобной для использования на практике.
Как надеются Грудинин и его коллеги, их разработка поможет нам быстрее создавать лекарства и антибиотики, а также ускорит создание новых органических материалов и поможет биологам начать выращивать искусственные органы.