La expresión génica vista por un físico II: Introducción al tratamiento estocástico


Otra entrada sobre el tratamiento de la expresión génica por parte de Pedro Fernández (@pedrokb_vr)

En la entrada anterior vimos cómo modelar matemáticamente el mecanismo por el cual un gen se traduce a una proteína basándonos en el enfoque determinista, así como los dos principales errores que se cometen al aplicar ese modelo: el uso de variables continuas y la no consideración de la aleatoriedad propia del proceso.

La expresión génica vista por un físico I

Para solucionar el problema al que habíamos llegado se introduce el cálculo de probabilidades de sucesos aleatorios en el enfoque estocástico. Empecemos desde abajo.

Estadística para andar por casa

Todo lo que vamos a necesitar en esta entrada girará en torno a lo siguiente:

Se define la probabilidad de que ocurra un suceso como la división del número de resultados favorables entre el número total de resultados posibles.

Para entender cómo va esto, empecemos considerando el lanzamiento de un dado. El número de resultados posibles queda claro que es 6, mientras que el número de resultados favorables dependerá del suceso que evaluemos.

Así, la probabilidad de que al tirar el dado salga un número en concreto (sólo un resultado favorable) es siempre igual a 1/6, la probabilidad de obtener un número impar (tres resultados favorables) es de 3/6, o la de obtener un número mayor o igual a tres es 4/6.  Del mismo modo, la probabilidad de que al tirar no nos salga cuatro es igual a (1-1/6)=5/6.

¿Qué pasaría si tiramos el dado dos veces? Bueno, ahora el número de resultados posibles aumenta hasta 36, ya que para cada uno de los seis resultados del primer lanzamiento hay otros seis resultados del segundo lanzamiento 6\times 6=6^2=36. Por tanto la probabilidad de que salgan dos cincos a la vez es 1/36, la misma que de que salga primero un cuatro y luego un uno, porque sólo hay un resultado favorable.

Si lanzamos el dado  veces nos encontraremos que el cálculo de probabilidades se vuelve algo más engorroso. Sin embargo hay un importante resultado matemático que simplifica los cálculos:

La probabilidad de que ocurran n sucesos, representados como A_n, es igual a la multiplicación de sus probabilidades: P(A_1)P(A_2)\cdots P(A_n).

Así, por ejemplo, la probabilidad de sacar un número cualquiera cuatro veces seguidas se calcula como: \frac{6}{6}\frac{1}{6}\frac{1}{6}\frac{1}{6}=\frac{1}{216}. En el caso particular en que todas las probabilidades son iguales, se tiene:

P(n[sucesos])=P(A)^n

 En vez de dados, lancemos moléculas

Calcular probabilidades para dados es muy fácil, ¿pero cómo podemos saber cuál es la probabilidad de que una molécula choque con otra para que se produzca una reacción?

Lo que vamos a presentar a partir de este momento se corresponde con el modelo de simulación estocástico para reacciones químicas acopladas propuesto por Daniel T. Gillespie allá por 1977.

Exact stochastic simulation of coupled chemical reactions

Gillespie demostró que la probabilidad media de que una serie de moléculas choquen y reaccionen entre sí de acuerdo a la reacción  en un intervalo de tiempo diferencial (dt) es:

v_\mu dt

Donde v_\mu representa la velocidad de reacción. Para digerir este resultado podemos pasar a un ejemplo con números que nos clarifique la situación.

Ejemplo:

Un valor v_\mu= 300 significa que el promedio de moléculas que reaccionarán en un segundo es 300, así que en un intervalo de tiempo Δt = 0,01  es esperable que reaccionen v_\mu\Delta t = 3 moléculas.

Si el intervalo de tiempo se hace tan pequeño que pueda considerarse diferencial, obtenemos que esperamosque reaccionen v_\mu dt moléculas.

Llegados a este punto es necesario resaltar lo más importante de lo que se ha dicho hasta ahora:  v_\mu dt es el número de moléculas que esperamos que reaccionen, pero desde luego en todos los intervalos de tiempo no será así.  A veces serán algunas más y a veces algunas menos. El error en los modelos deterministas es dar por hecho que en todo intervalo reaccionan v_\mu dt  moléculas.

Aleatoriedad en la expresión de un gen

Recordemos el modelo de expresión génica, con sus correspondientes expresiones para la velocidad de reacción:

ADN \xrightarrow[]{x} ARN_m

ARN_m \xrightarrow[]{k} ARN_m + P

ARN_m \xrightarrow[]{\delta_m} \emptyset

P \xrightarrow[]{\delta_p} \emptyset

Con las correspondientes velocidades:

v_1=s

v_2=k\left[ARN_m\right]

v_3=\delta_m\left[ARN_m\right]

v_4=\delta_p\left[P\right]

Necesitamos expresar la función que indica la probabilidad de que se produzca el siguiente suceso: reacción concreta \mu (indicando \mu=1,2,3,4 la reacción correspondiente) después de que transcurra un tiempo \tau sin que haya habido ningún tipo de reacción.

Este suceso se puede descomponer en dos requisitos:

1.- Se produce una reacción cualquiera tras un tiempo \tau sin reacciones.

Después de ver cómo calcular la probabilidad de que se produzca una reacción concreta, nos preguntamos ¿cuál es la probabilidad si no nos importa que reacción se produzca? La respuesta es que, para que se produzca una reacción cualquiera, simplemente sumamos las probabilidades de cada reacción individual. Si llamamos v_0 a la suma de las velocidades de todas las reacciones:

v_0=v_1+v_2+v_3+v_4

tenemos que la probabilidad de una reacción cualquiera es:

P(cualquiera)=v_o dt

Necesitamos expresar ahora la probabilidad de que no haya reacción en el intervalo \tau. Para hacer esto dividimos el intervalo \tau en muchos intervalos pequeños de tiempo de duración \Delta t (con lo que tendremos en total \tau/\Delta t intervalos).

La probabilidad de que en el intervalo pequeño no haya reacción es:

P(no \quad reaccion \quad en \quad \Delta t)=(1-v_o \Delta t)

La probabilidad de que no haya reacción en ninguno de los intervalos es, según hemos visto previamente, la probabilidad de un intervalo elevada a el número total de intervalos. Si tomamos el límite para \Delta\rightarrow 0.

P(no \quad reaccion \quad en \quad \Delta t)=lim_{\Delta t\rightarrow 0}(1-v_o \Delta t)^{\frac{\tau}{\Delta t}}

De acuerdo a los apuntes de matemáticas de bachillerato, el resultado del límite es:

P(no \quad reaccion \quad en \quad \Delta t)=e^{-v_0 \tau}

Concluimos entonces que la probabilidad de que se produzca una reacción cualquiera tras un intervalo \tau sin reacciones es la multiplicación de ambas probabilidades:

P_1=v_0 dt e^{-v_0 \tau}

2.- La reacción que se produce tras \tau es \mu

Este segundo requisito es mucho más sencillo de analizar. Si se produce una reacción, ¿qué posibilidades tiene cada una de ellas para ser la afortunada? La probabilidad para cada reacción es:

P_2=\dfrac{v_\mu}{v_0}\dfrac{dt}{dt}=\dfrac{v_\mu}{v_0}

Es decir, que depende de la velocidad de la reacción dada respecto de la velocidad de todas las reacciones a la vez.

Vale, todas las ecuaciones están quedando muy bonitas, pero hasta ahora hemos obviado el más importante de los detalles. ¿Cuál es el significado de P_1 y P_2?. ¿Cómo se trabaja con ellas? La respuesta en la tercera y última parte de la entrega.

Nos seguimos leyendo…

Anuncios

3 Respuestas a “La expresión génica vista por un físico II: Introducción al tratamiento estocástico

  1. Pingback: La expresión génica vista por un físico III: Interpretación de probabilidades. Resultados | Cuentos Cuánticos

  2. Me encanta desgranar un problema siguiendo la máxima de: “De acuerdo a los apuntes de matemáticas de bachillerato…”

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s