domingo, 26 de abril de 2009

la baraja de exones en el medaka


El locus IGH del medaka parece complejo y confuso pero puede que todo sea simple. Lo de complejo y confuso viene por el hecho de que se encuentran numerosos exones para codificar genes de cadenas constantes, pero no queda claro que el conjunto de estos exones puedan codificar un anticuerpo real. La situación es tan confusa que es mejor clasificar las 500,000 pares de bases que componen el locus en zonas. Existen cinco zonas claramente delimitadas con exones que codifican para las regiones constantes de anticuerpos. En estas zonas hay exones para codificar una o dos IgM y probablemente una IgD. Pongo una figura con el esquema de la Zona 2 que es muy similar al resto que los otras 5 zonas. Como puede verse detrás de tres exones de IgM hay un exon de IgD y de nuevo vuelve haber exones de IgM y de nuevo exones de IgD. La conclusión es que varios de estos exones parecen haberse barajado. A pesar de toda esta organización de exones no he podido encontrar ninguna EST con estas secuencias, indicando que probablemente la Zona 2 no codifique a ningún anticuerpo real.
Ha habido por lo tanto procesos de duplicación y recombinación múltiples que no han debido generar una organización genética viable para producir un anticuerpo real. Este proceso ha ocurrido hace tan poco tiempo que los exones tienen secuencias idénticas no existiendo ninguna mutación. Por lo tanto no llegan a ser funcionales probablemente porque se han perdido secuencias regulatorias o estructurales necesarias para el proceso de transcripción.

miércoles, 22 de abril de 2009

IgM especial en el medaka


Una mirada general al locus IGH del medaka (Oryzias latipes, en la imagen únicamente un trozito del locus) evidencia una distribución de los genes de los anticuerpos y exones que va a ser difícil de interpretar. Existe procesos de duplicación de largos segmentos de la secuencia y parece que ahí únicamente dos clases de anticuerpos IgM e IgD (aunque puede haber tres o cuatro isotipos de cada una de ellas). Pero tanto la IgM como la IgD tienen peculiaridades.
Existe una IgM de aspecto normal con cuatro dominios de inmunoglobulinas y que supongo que será la fundamental del pez (no es la expresada en el gráfico). A su vez existen otros genes conformados por dominios de inmunoglobulina de IgM pero son genes con únicamente tres dominios (sería el primer caso de una IgM de tres dominios). La cosa se complica cuando he determinado que el dominio que falta es el CH3 (en un anticuerpo siempre que falta un dominio el ausente es el CH2). Para complicar más la cosa he buscado las base de datos EST y encontrado que el RNA mensajero de estos genes de tres dominios de IgM solamente tienen dos (los correspondientes a los dominios CH1 y CH2). Así que el gen de la "IgM especial" del medaka (quizás haya que ponerle un nombre propio) está conformado por dominios de IgM 1, 2 y 4. Además tras ellos existe en dos dominios trasmembrana (sorprendentemente cada uno de los dominios codifica para una hélice alfa hidrofóbica). Este gen genera un RNA mensajero con los dominios 1, 2, TM1 y TM2. Este anticuerpo no se parece a ningún otro anticuerpo publicado. Todas las EST que encontraron son de membrana (parece que no existe forma secreta). Tampoco he encontrado ninguna EST que tuviera el dominio 4.
La cosa no acaba aquí. Existen en el locus dominios de IgM sueltos o interpuestos entre los dominios de la IgD. La conclusión que saco de forma provisional es que en este locus ha debido ocurrir recientemente una catástrofe con un gran número de recombinaciónes en la cual se han destruido y se han creado nuevos genes. Probablemente debió de ocurrir hace poco tiempo y no ha dado tiempo a la mutación estocástica evolutiva a ir borrando los exones que han caído dentro de zonas no codificantes. Es la única forma de poder explicar la existencia de exones perfectos pero que no pasan a RNA mensajero.
Es necesario algo de tiempo para madurar estas ideas o cambiarlas. El estudio no está en absoluto completo.

sábado, 18 de abril de 2009

Duplicaciones en el locus IGH del medaka

Al igual que en el pez espinoso en el medaka también existen un gran número de duplicaciones de amplios segmentos de DNA genómico dentro del locus genético de las cadenas pesadas de los anticuerpos. Estas duplicaciones son recientes y han generado un gran número de isotipos de los cuales algunos de ellos puede que no sean funcionales. Más aún, en el medaka, parece que el proceso ha sido caótico. Aparecen IgMs con tres dominios en los que se ha perdido el CH3 (hasta ahora no existe otro ejemplo en la literatura) y además ahí exones sueltos que probablemente no se expresen en RNA mensajero. La explicación de estos exones sueltos es sugestiva de una generación muy reciente y que no han existido tiempo para inducir cambios mutacionales significativos. Por lo tanto en el estudio del locus genético del medaka va a ser muy importante saber cuál de los isotipos son realmente funcionales y significativos en la respuesta inmune. Por otro lado nos puede ayudar a entender lo que ocurre en los procesos evolutivos. Debido al amplio número de duplicaciones y la generación de diferentes formas de isotipos se puede deducir las formas posibles que puede tener un anticuerpo. Sobre esto hay datos interesantes que se mencionaran en otros post.
¿Porque el pez espinoso y el medaka tienen triplicaciones en el locus IGH?. Una explicación podría ser que el proceso de tiplificación hubiera sido único y ocurriera antes de la divergencia de las dos especies. Esto no puede ser posible..... las diferencias de secuencia en cada una de las clases de anticuerpos entre las dos especies son mayores que las diferencias de secuencia entre los isotipos de la misma especie. La conclusión que se obtiene es que el proceso de triplicación ha ocurrido de forma independiente en cada una de las dos especies. Por lo tanto la tendencia a la multiplicación de los anticuerpos es un proceso que abarca por lo menos a estas dos especies y queda descartado que sea un acto estocástico casual. ¿Tiene algo que ver el proceso biológico que induce la diversificación de las regiones VH?. Quizás un análisis detenido nos pueda ayudar a contestar estas preguntas.

miércoles, 15 de abril de 2009

Una paradoja evolutiva en la IgM


He estado buscando el origen evolutivo de la IgT/Z. En un principio me pareció muy plausible que se correspondiera con una duplicación simple de la IgM. El hecho de que también tenga regiones J apoyaría esta sospecha. Para confirmarla obtuve múltiples secuencias IgM desde peces cartilaginosos hasta mamíferos. A todas las secuencias eliminé la secuencia correspondiente a la codificada por el exón CH1 ya que tenemos una sospecha clara de que este exón es intercambiado durante el proceso evolutivo.

El árbol filogenético tal como sale no confirma la hipótesis anteriormente mencionada. El árbol también da resultados conflictivos. El más sorprendente es que la IgM de los animales terrestres procede evolutivamente de la IgM de los peces cartilaginosos. Esto podría indicarnos que es una falsedad inducida por el árbol, pero el problema que tengo es que hay otros datos que apoyan esta hipótesis. Los datos proceden del estudio de la IgD. La IgD de los peces teleósteos parece que no tiene relación evolutiva con la IgD de los animales terrestres, y en cambio la IgW y IgNARC si que la tienen. Además el pez pulmonado tiene IgW. Otro dato que confirma lo anterior es el hecho de que la IgY también parece proceder de los cuatro primeros dominios de la IgW. Tambien la IgM del pez pulmonado se coloca perfectamente entre la IgM de los cartilaginosos y los animales terrestres.

domingo, 12 de abril de 2009

Las bases de datos EST

Cuando empezamos a realizar el estudio del locus IGH de Eublepharis macularius todo lo teníamos que hacer nosotros. Extraer DNA y RNA, realizar PCRs y RT-PCRs y posteriormente secuenciar los productos. Ahí no acababa el trabajo; las secuencias fueron sometidas al paso por múltiples softwares para sacar la información relevante.
En la actualidad ha cambiado todo. El trabajo manual y experimental de laboratorio ha desaparecido. Gente con impresionantes máquinas secuencian el genoma completo de diferentes especies y dejan estas secuencias para su uso público. Incluso esta secuencias son introducidas y pasadas por diferentes softwares intentando sacar la información relevante. En la actualidad sólo queda una cosa que es lo que estamos haciendo nosotros. Personas que tienen conocimientos sobre el tema revisan los datos y ordenan la información para la realización de la publicación científica.
Hago esta reflexión debido a que he introducido en los estudios las bases de datos EST. En el trabajo experimental que realizamos con Eublepharis macularius una de las partes más complicadas era el trabajar con RNA. Esto lo hacíamos para ganar confianza en las predicciones génicas que habíamos hecho a partir de las secuencias del DNA genómico. Como todos los genes eran definidos informáticamente era necesario la secuencia del RNA mensajero para confirmar los límites exón-intron y las diferentes formas probables del gen. En la actualidad la totalidad de proyectos de secuenciación de un genoma se acompaña de una secuenciación de EST (en realidad no sé lo que significan estas siglas). Lo que sí he visto es que son secuencias de cDNA de diferentes tejidos. Por lo tanto para nosotros esto cierra el círculo. Podemos hacer el estudio de un locus genético identificando los genes informáticamente y posteriormente confirmar estas predicciones mediante el estudio de las secuencias ESTs del proyecto. En una palabra han logrado hacer digital una cantidad enorme de trabajo manual

sábado, 4 de abril de 2009

El medaka (Oryzias latipes)



Ya hemos llegado al final del estudio de G. aculeatus. En él hemos descrito una nueva forma de la IgT y sus orígenes evolutivos y además hemos evidenciado la existencia de un mecanismo biológico que induce la diversificación de los genes VH. Comenzamos el estudio con otro pez llamado "Medaka" (Oryzias latipes). Es un pez muy pequeño del sudeste asiático y habita tanto ríos como océanos. Puede que tenga una distancia evolutiva de aproximadamente 180 millones de años respecto al pez espinoso lo cual puede poner a prueba las hipótesis que hemos realizado con este último sobre la evolución de los anticuerpos. He localizado en el cromosoma ocho el locus IGH. Tiene un tamaño muy grande e igualmente se encuentran barajadas las regiones constantes y las regiones VH. En un primer análisis y ya se detectan zonas de interés. Tiene una combinación de IgZ más IgD sin la presencia de IgM (nunca se había descrito este hecho). Además aparecen unas IgD  extremadamente cortas con solamente tres dominios de inmunoglobulina. También hay una IgD muy larga pero existe un "exon suffling" de la IgM........ etc... Tenemos mucho trabajo para poder entender lo que hay en este locus.

jueves, 2 de abril de 2009

La IgZ/T de G. aculeatus a fondo

Hoy estoy buceando por la web introcudiendo 363 aminoácidos de esta inmunoglobulina aquí y allá en las diferentes herramientas on line disponibles, estudiando los puntos de glicosilación, que por cierto solo hay 3 posibles (muchos menos de lo que estamos acostumbrados con otras proteínas hasta ahora), también prediciendo los puentes disulfuro entre las cisteínas... y la figura caracterizando todo esto comienza a tomar forma. Aprovecho para hacer referencia a una nueva herramienta en el ExPASy de estudio de mutabilidad relativa, la verdad es que te das cuenta de que todos los programas relacionados con evolución, filogenia... al final se basan en lo mismo, no es lo mismo una mutación que conlleve un cambio en la traducción de una cisteína que de una alanina y por tanto esto se puede relacionar matemáticamente con una escala de valores que pego a continuación y obtener una gráfica de tu secuencia de interés (en este caso la IgZ/T que también os la muestro al final) y analizar los puntos débiles y fuertes en relación a su susceptibilidad de cambio:

ProtScale Tool

Amino acid scale: Relative mutability of amino acids (Ala=100).

Author(s): Dayhoff M.O., Schwartz R.M., Orcutt B.C.

Reference: In "Atlas of Protein Sequence and Structure", Vol.5, Suppl.3 (1978).

Amino acid scale values:

Ala:100.000
Arg:65:000
Asn: 134.000
Asp: 106.000
Cys: 20.000
Gln: 93.000
Glu: 102.000
Gly: 49.000
His: 66.000
Ile: 96.000
Leu: 40.000
Lys: 56.000
Met: 94.000
Phe: 41.000
Pro: 56.000
Ser: 120.000
Thr: 97.000
Trp: 18.000
Tyr: 41.000
Val: 74.000