Благодаря титаническим усилиям исследователей из Стэнфорда удалось запустить модель бактерии Mycoplasma genitalium.
Это бактерия отличается тем, что у нее самый короткий геном из всех свободно живущих организмов. В нем всего 525 генов. У традиционной лабораторной бактерии — Е. coli — 4288 генов. Именно из-за минимализма генома усилия биоинженеров в последнее время были сосредоточены на Mycoplasma genitalium, несмотря на трудности работы с этим паразитом, передающимся половым путем.
Модель построена на более, чем 1900-стах экспериментально наблюдаемых параметрах. Использованы данные из более, чем 900-сот научных работ, чтобы просчитать все молекулярные взаимодействия, актуальные для жизненного цикла данной бактерии.
Исследователи смоделировали отдельные биологические процессы, как 28 отдельных «модулей», каждый из которых руководствуется собственным алгоритмом. Эти модули с каждым шагом во времени обмениваются информацией друг с другом, что позволяет им действовать как единое целое.
Перепроизводство данных в современной биологии
Биология за последние два десятилетия накопила огромное количество информации о клетке. Отсутствие экспериментальных данных больше не является основным ограничивающим фактором. Теперь исследователям важнее понять то, что они уже знают.
Однако до сих пор в большинстве биологических экспериментов используется редукционистской подход к этому огромному массиву данных. Выбивают один ген — и смотрят, что произойдет. Тогда как, чтобы находить ответы на наиболее важные вопросы, необходимо учитывать взаимодействие сотни или даже не одной тысячи генов.
Что такое пространственно-временное моделирование?
Это описание развития процессов одновременно в пространстве и во времени. В более простом случае динамику системы можно описывать только во времени: и такой подход обычно используется в химической кинетике или моделировании метаболических процессов. В настоящее время задача пространственно-временного моделирования биологических процессов решается с применением современных суперкомпьютеров. Существующие высокопроизводительные методики, способные корректно обрабатывать большие объемы данных, также позволяют проводить такие виртуальные (in silico) эксперименты, какие в реальности проделать невозможно. Использование компьютера значительно расширяет пределы, в которых можно изменять параметры и проводить наблюдения. Вычислительные эксперименты помогают узнать больше о системах, слишком сложных для анализа вручную, а также позволяют оперировать временными отрезками и расстояниями, которые не доступны в лабораториях...
В виртуальных экспериментах мы можем отдельно рассматривать сопряжённые процессы, которые в реальных экспериментах разделить невозможно. Также резко уменьшается или совсем исчезает необходимость непрямых контрольных экспериментов, и легче становится интерпретировать полученные данные.
Степени свободы в биологических системах
Чтобы разрешить динамический процесс в пространстве, необходимо значительно увеличить число степеней свободы (переменных), которые нужно отслеживать.
Возьмём, к примеру, биохимическую реакцию гетеродимеризации. Для химическо-кинетической модели будет достаточно только трёх переменных: концентрации димеров и каждого из двух мономеров. Допустим, что мономеры синтезируются в определённых точках в пространстве и свободно диффундируют оттуда в окружающую среду. Следовательно, их концентрация в пространстве изменяется от высокой (рядом с источником) до низкой (вдали от него). Очевидно, что такая детализация значительно увеличивает количество переменных, которое нужно отслеживать в модели. Если при этом нас интересуют локальные концентрации в тысяче точек, то нам придётся отслеживать три тысячи переменных. Более того, реакции, протекающие в разных точках пространства, зависят друг от друга. Каждая локальная реакция может влиять на остальные, так как мономеры и димеры распространяются в пространстве посредством диффузии.
Это приводит к тому, что сложность пространственно-временных моделей быстро возрастает. Не существует рекомендованного теорией максимального числа точек в пространстве, которые надо использовать для описания пространственной структуры концентрационного поля. Если рассматривать непрерывную функцию концентрации от пространственно-временной переменной, возможно описать можно описать модель средствами функционального анализа и дифференциальных уравнений.
В биологических системах большое количество измерений (степеней свободы) обусловлено тем, что у них, как правило, больше частей, компонентов и типов взаимодействий, чем у классических технических средств, использующих электричество или гидромеханику. При использовании прямого численного моделирования необходимо искусственно ограничивать степени свободы, чтобы используемые алгоритмы работали устойчиво.
В непрерывных системах каждая точка в пространстве прибавляет дополнительные степени свободы, что в итоге приводит к бесконечному числу измерений. Такие системы нужно дискретизировать, иными словами, следует уменьшить число степеней свободы до допустимого в компьютерном моделировании с помощью направленного отбора характеристических измерений. Например, мы можем аппроксимировать функции концентрации тригонометрическими рядами, или всплесками. В расчетах будут использованы только выбранные измерения, что позволит экстраполировать полученные результаты на исходную бесконечномерную систему. Дискретизация должна быть самосогласована: при увеличении числа измерений поведение дискретизированной системы должно быстро сходиться к поведению исходной системы.
В дискретных биологических моделях число степеней свободы уже ограничено, поэтому их иногда можно моделировать напрямую. В случае, когда степеней свободы слишком много, как, например, при отслеживании перемещений всех атомов в белке, нам часто снова приходится уменьшить их число степеней свободы, чтобы повысить эффективность моделирования. В этом случае можно объединить несколько степеней свободы в одну и отслеживать поведение всей группы. Такая технология, называемая «увеличением зернистости», значительно уменьшает вычислительные затраты и позволяет моделировать очень большие многомерные системы — например, участки липидных бислоев с белковыми включениями.
stanford biomolecula
Комментариев нет :
Отправить комментарий