Halloween Costume ideas 2015

Cálculo de las probabilidades para el «mejor de los casos» para proteínas con datos reales, y refutación de una predicción del darwinismo

La vida biológica demanda miles de diferentes familias de proteínas, un 70 por ciento de las cuales son proteínas «globulares», con una conformación tridimensional específica para cada familia de proteínas. Se muestra una ilustración al comienzo de este artículo. Esta conformación en 3D es necesaria para una determinada función biológica, y queda determinada por la secuencia de los diferentes aminoácidos que constituyen dicha proteína. En otras palabras, no es la biología lo que determina la forma, sino la física. Las secuencias que producen estructuras en 3D estables y funcionales son tan raras  que los científicos, actualmente, no intentan encontrarlas usando librerías aleatorias de secuencias. En lugar de ello, utilizan información obtenida de retroingeniería de proteínas biológicas para diseñar de manera inteligente proteínas artificiales.

De hecho, nuestros supercomputadores del siglo 21 no son suficientemente potentes para evaluar las variables y ubicar estructuras 3D novedosas. En cambio, una predicción fundamental de la teoría neodarwinista es que un proceso evolutivo implacable y lento consistente de deriva genética, mutaciones, inserciones y deleciones deberían poder «encontrar» no sólo una, sino millares de secuencias pretedeterminadas por la física que exhibirán diferentes estructuras estables funcionales en 3D. Entonces, ¿qué tal resiste esta predicción falsable cuando la confrontamos con datos reales? Tal como se debería hacer en ciencia, he puesto mi programa a disposición para que cada uno pueda ejecutar sus propios datos y verificar personalmente las clases de probabilidades que están representadas por estas familias de proteínas.

Este programa puede computar un límite superior para la probabilidad de obtener una familia de proteínas a partir de una gran abundancia de datos reales contenidos en la base de datos Pfam. El primer paso computa el límite inferior para la complejidad funcional o información funcional para codificar una familia determinada de proteínas, usando un método publicado por Durston et al. Este valor para I(Ex) puede luego incorporarse a una ecuación publicada por Hazen et al. a fin de resolver la probabilidad M(Ex)/N de «encontrar» una secuencia funcional en un solo intento.

Procedí a descargar 3.751 secuencias alineadas para el dominio ribosómico S7, parte de una proteína universal esencial para toda la vida. Cuando los datos se ejecutaron a través del programa, se reveló que el límite inferior para la cantidad de información funcional precisa para codificar este dominio es de 332 Fits (Bits funcionales). El límite superior extremo para la cantidad de secuencias que pudieran ser funcionales para este dominio es de alrededor de 10^92. En un solo intento, la probabilidad de obtener una secuencia que fuese funcional para el dominio ribosómico S7 es de 1 posibilidad en 10^100 ... y esto es solamente para un dominio estructural de 148 aminoácidos, mucho más pequeño que una proteína promedio.

Para otro ejemplo, procedí a descargar 4.986 secuencias alineadas para la familia ABC-3 de proteínas y las ejecuté a través del programa. Los resultados indican que la probabilidad de obtener, en un solo intento, una secuencia funcional de ABC-3 es de alrededor de 1 posibilidad en 10^128. Este método ignora relaciones emparejadas y de orden superior dentro de la secuencia que limitaría inmensamente las secuencias funcionales por muchos órdenes de magnitud, reduciendo la probabilidad aún más por muchos órdenes de magnitud — de modo que esto nos da una estimación para el mejor de los casos.

¿Cuáles son las implicaciones de esos resultados, obtenidos de datos reales, con respecto a la predicción fundamental de la teoría neodarwinista mencionada más arriba? Si suponemos 10^30 formas de vida con una rápida velocidad de replicación de 30 minutos y un enorme genoma con una tasa mutacional muy elevada durante un período de 10 mil millones de años, el valor del límite superior extremo para la cantidad total de mutaciones durante toda la historia de la vida sería de alrededor de 10^43. Desafortunadamente, un dominio proteínico como el ribosómico S7 exigiría una media mínima de 10^100 intentos, alrededor de  10^57 intentos más que los que podría proporcionar toda la historia teórica de la vida — y esto sólo para un único dominio. Olvidemos acerca de «encontrar» una proteína de tamaño medio, por no mencionar miles.

Como todos sabemos acerca de las probabilidades, uno puede tener un golpe de suerte, pero no miles de golpes de suerte. Esto decididamente refuta la predicción fundamental de la teoría darwiniana de que los procesos evolutivos pueden «encontrar» familias proteínicas funcionales. Una teoría que se encuentra con una predicción esencial completamente refutada por los datos no debería tener lugar en la ciencia.

¿Podría la solución ser la selección natural? Como sabemos por algoritmos genéticos, una «búsqueda evolutiva» sólo funcionará para problemas de ascensión de montes, no para problemas «de la aguja en un pajar». Hay pequeñas proteínas que exigen unos niveles tan bajos de información funcional para realizar unas simples tareas de enlace que forman un elegante problema de ascensión de una montaña que se puede localizar fácilmente en una búsqueda. Pero esto no es lo que sucede en la inmensa mayoría de las familias proteínicas. Como desvelan los datos reales, la probabilidad de encontrar una secuencia funcional para una familia de proteínas promedio es tan baja que hay una posibilidad virtualmente cero de obtenerla en ninguna parte de este universo durante toda su historia — por no hablar de encontrar miles de familias de proteínas.

¿Cuáles son las implicaciones para la ciencia del diseño inteligente? Una hipótesis falsable de un diseño inteligente susceptible de ensayo se puede enunciar como sigue:

Un atributo singular de una mente inteligente es la capacidad de producir efectos que exijan un nivel estadísticamente significativo de información funcional.

Dada la anterior hipótesis susceptible de ensayo, si observamos un efecto que exija un nivel estadísticamente significativo de información funcional, podemos concluir que detrás del efecto hay una mente inteligente. La familia de proteínas promedio exige un nivel estadísticamente significativo de información funcional o prescriptiva. Por ello, los genomas de la vida están cubiertos de las huellas dactilares de una fuente inteligente.

Publicar un comentario

MKRdezign

Formulario de contacto

Nombre

Correo electrónico *

Mensaje *

Con la tecnología de Blogger.
Javascript DisablePlease Enable Javascript To See All Widget