La
vida biológica demanda miles de diferentes familias de proteínas, un 70 por
ciento de las cuales son proteínas «globulares», con una conformación tridimensional
específica para cada familia de proteínas. Se muestra una ilustración al
comienzo de este artículo. Esta conformación en 3D es necesaria para una
determinada función biológica, y queda determinada por la secuencia de los diferentes
aminoácidos que constituyen dicha proteína. En otras palabras, no es la
biología lo que determina la forma, sino la física. Las secuencias que producen
estructuras en 3D estables y funcionales son tan raras que los científicos, actualmente, no intentan
encontrarlas usando librerías aleatorias de secuencias. En lugar de ello,
utilizan información obtenida de retroingeniería de proteínas biológicas para diseñar de manera inteligente
proteínas artificiales.
De hecho,
nuestros supercomputadores del siglo 21 no son suficientemente potentes para
evaluar las variables y ubicar estructuras 3D novedosas. En cambio, una predicción
fundamental de la teoría neodarwinista es que un proceso evolutivo implacable y
lento consistente de deriva genética, mutaciones, inserciones y deleciones
deberían poder «encontrar» no sólo una, sino millares de secuencias
pretedeterminadas por la física que exhibirán diferentes estructuras estables
funcionales en 3D. Entonces, ¿qué tal resiste esta predicción falsable cuando
la confrontamos con datos reales? Tal como se debería hacer en ciencia, he puesto mi programa a disposición para que cada uno pueda ejecutar sus
propios datos y verificar personalmente las clases de probabilidades que están
representadas por estas familias de proteínas.
Este
programa puede computar un límite superior para la probabilidad de obtener una
familia de proteínas a partir de una gran abundancia de datos reales contenidos
en la base de datos Pfam. El primer paso
computa el límite inferior para la complejidad funcional o información
funcional para codificar una familia determinada de proteínas, usando un método publicado por Durston et
al.
Este valor para I(Ex) puede luego incorporarse a una ecuación publicada por Hazen et
al.
a fin de resolver la probabilidad M(Ex)/N de «encontrar» una secuencia
funcional en un solo intento.
Procedí
a descargar 3.751 secuencias alineadas para el dominio ribosómico S7, parte de
una proteína universal esencial para toda la vida. Cuando los datos se
ejecutaron a través del programa, se reveló que el límite inferior para la
cantidad de información funcional precisa para codificar este dominio es de 332
Fits (Bits funcionales). El límite superior extremo para la cantidad de
secuencias que pudieran ser funcionales para este dominio es de alrededor de 10^92.
En un solo intento, la probabilidad de obtener una secuencia que fuese
funcional para el dominio ribosómico S7 es de 1 posibilidad en 10^100 ... y
esto es solamente para un dominio estructural de 148 aminoácidos, mucho más
pequeño que una proteína promedio.
Para
otro ejemplo, procedí a descargar 4.986 secuencias alineadas para la familia
ABC-3 de proteínas y las ejecuté a través del programa. Los resultados indican
que la probabilidad de obtener, en un solo intento, una secuencia funcional de
ABC-3 es de alrededor de 1 posibilidad en 10^128. Este método ignora relaciones
emparejadas y de orden superior dentro de la secuencia que limitaría
inmensamente las secuencias funcionales por muchos órdenes de magnitud,
reduciendo la probabilidad aún más por muchos órdenes de magnitud — de modo que
esto nos da una estimación para el mejor de los casos.
¿Cuáles
son las implicaciones de esos resultados, obtenidos de datos reales, con
respecto a la predicción fundamental de la teoría neodarwinista mencionada más
arriba? Si suponemos 10^30 formas de vida con una rápida velocidad de
replicación de 30 minutos y un enorme genoma con una tasa mutacional muy
elevada durante un período de 10 mil millones de años, el valor del límite
superior extremo para la cantidad total de mutaciones durante toda la historia
de la vida sería de alrededor de 10^43. Desafortunadamente, un dominio
proteínico como el ribosómico S7 exigiría una media mínima de 10^100 intentos, alrededor
de 10^57 intentos más que los que podría
proporcionar toda la historia teórica de la vida — y esto sólo para un único
dominio. Olvidemos acerca de «encontrar» una proteína de tamaño medio, por no
mencionar miles.
Como
todos sabemos acerca de las probabilidades, uno puede tener un golpe de suerte,
pero no miles de golpes de suerte. Esto decididamente refuta la predicción
fundamental de la teoría darwiniana de que los procesos evolutivos pueden
«encontrar» familias proteínicas funcionales. Una teoría que se encuentra con
una predicción esencial completamente refutada por los datos no debería tener
lugar en la ciencia.
¿Podría
la solución ser la selección natural? Como sabemos por algoritmos genéticos,
una «búsqueda evolutiva» sólo funcionará para problemas de ascensión de montes, no para problemas «de la aguja en un
pajar».
Hay pequeñas proteínas que exigen unos niveles tan bajos de información
funcional para realizar unas simples tareas de enlace que forman un elegante
problema de ascensión de una montaña que se puede localizar fácilmente en una
búsqueda. Pero esto no es lo que sucede en la inmensa mayoría de las familias
proteínicas. Como desvelan los datos reales, la probabilidad de encontrar una
secuencia funcional para una familia de proteínas promedio es tan baja que hay
una posibilidad virtualmente cero de obtenerla en ninguna parte de este
universo durante toda su historia — por no hablar de encontrar miles de
familias de proteínas.
¿Cuáles
son las implicaciones para la ciencia del diseño inteligente? Una hipótesis falsable de un diseño
inteligente susceptible de ensayo se puede enunciar como sigue:
Un atributo singular de una
mente inteligente es la capacidad de producir efectos que exijan un nivel
estadísticamente significativo de información funcional.
Publicar un comentario