Биотехнологическая компания BIOCAD запустит собственный Центр обработки данных (ЦОД). Новые вычислительные мощности составят к концу 2016 года 268 TFLOPS. Это очень высокий показатель среди компаний, занимающихся биотехнологическими исследованиями не только в России, но и в мире. Новый ЦОД, прежде всего, необходим для ускорения работы над созданием 30 революционных препаратов в рамках проекта MabNext. Это лекарства нового поколения против тяжелых форм рака, аутоиммунных и других заболеваний. Инвестиции в проект до конца года составят порядка 100 млн руб.
По информации pcweek.ru, новый ЦОД модульный, в чем его большое преимущество: сборка МЦОД на площадке занимает всего около недели.Сами модули производятся на заводе-партнере, а уже сборка происходит на территории BIOCAD. К концу года компания планирует увеличить кластер неспециализированных вычислений в 2 раза до 16-ти узлов и 48 графических ускорителей. Сейчас — 8 узлов и 24 графических ускорителя. При ожидании такой нагрузки BIOCAD принял решение о создании собственного ЦОД.
За 15 лет в компании был накоплен большой объем данных, например, разнообразная информация об антителах более 1000 людей, а также лам — животных, которые никогда не болеют раком. Все эти огромные массивы информации необходимо упорядочить и сделать доступными для легкой и быстрой аналитики компьютером. При таком объеме недостаточно простых алгоритмов, нужны современные методы машинного обучения или другими словами элементы «искусственного интеллекта». И BIOCAD сейчас активно эти техники внедряет.
Всего год назад, когда компания разработала собственную интеллектуальную платформу, соединившую технологии математического моделирования и нового уровня синтеза генов, еще только в планах было развить платформу до уровня искусственного интеллекта. Сейчас постепенно видно как эти планы претворяются в жизнь. И запуск нового ЦОДа — шаг на пути к созданию такой системы.
Безусловно, новые вычислительные мощности направлены, прежде всего, на проведение сложного структурного анализа молекул. Ведь, чтобы создать лекарство, необходимо перебрать более 1 млн природных молекул. Более того свойства искомой молекулы могут быть искусственно доработаны или усовершенствованы, чтоб лекарство стало эффективнее и безопаснее. Сначала анализ проводится на компьютере и лишь потом уходит в лаборатории, что экономит много времени.
«Как обычно происходит поиск молекулы для лекарства? Из огромных природных библиотек, содержащих миллиарды антител, выбирается всего 1-2. Но точно до конца неизвестно, будет ли эффективно лекарство на основе этой молекулы или нет, — объяснил генеральный директор BIOCAD Дмитрий Морозов. — Мы заходим с другого конца — с помощью математического моделирования предсказываем, какими свойствами должна обладать молекула, чтобы превзойти существующие лекарства по показателям эффективности и безопасности. А только потом создаем ее в лаборатории. Чтобы делать такой анализ быстро, необходимы большие вычислительные мощности, которые мы и создаем, открывая собственный ЦОД».
Новые вычислительные мощности позволят в разы ускорить процессы аналитики. Так, если раньше время на сбор информации и краткое описание аминокислотной последовательности целевых антител для лечения заболеваний уходило более 2-х недель, то теперь с помощью новых вычислительных мощностей будет тратится всего несколько десятков минут. Время сократилось в сотни тысяч раз. Значит гораздо быстрее, можно будет создать новые препараты, и россиянепервыми в мире получат лекарства нового поколения.
Также BIOCAD модернизировала архитектуру. Сейчас она строится на основе OpenComputeProject, которую изначально разрабатывал Facebook для собственных нужд. Ее отличают высокая плотность оборудования, энергоэффективность и низкая стоимость в сравнении с классическими решениями.