Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.

Proyecto genoma

Подписчиков: 0, рейтинг: 0

El Proyecto Genoma son los esfuerzos científicos que, en última instancia, tienen como objetivo determinar la secuencia completa del genoma de un organismo (ya sea un animal, una planta, un hongo, una bacteria, una arquea, un protista o un virus) y para anotar genes que codifican proteínas y otras características importantes codificadas por el genoma.​ La secuenciación del genoma de un organismo incluye la recopilación de las secuencias de cada cromosoma en el ADN de un organismo. Para una bacteria, que contiene únicamente un cromosoma, el proyecto genoma buscará mapear la secuencia de ese cromosoma. Para la especie humana, cuyo genome incluye 22 pares de autosomas y 2 cromosomas sexuales, una secuencia completa del genoma tendrá 46 secuencias separadas de los cromosomas.

El Proyecto Genoma Humano fue un proyecto histórico del genoma que ya está teniendo un impacto importante en la investigación a través de las ciencias de la vida, con potencial para estimular numerosos desarrollos médicos y comerciales.​

Ensamblaje de secuencias

El ensamblaje del genoma se refiere al proceso de tomar un gran número de secuencias de ADN cortas y volver a juntarlas para formar una representación de los cromosomas originales de los cuales se originó el ADN. En un proyecto de secuenciación shotgun, todo el ADN de una fuente (normalmente un organismo simple, desde una bacteria hasta un mamífero) primero es separado en millones de piezas pequeñas. Estas piezas son "leídas" por máquinas automatizadas de secuenciación, que pueden leer hasta 1000 nucleótidos o bases al mismo tiempo. (Las cuatro bases son adenina, guanina, citosina, y timina, representadas como AGCT.) El algoritmo de montaje de un genoma funciona al tomar todas las piezas y alinearlas una con otra y detectando todos los lugares donde dos o más de las secuencias cortas o "lecturas" se sobreponen. Estas lecturas sobrepuestas se pueden combinar, y el proceso continúa.

El ensamblaje del genoma es un problema computacional muy difícil porque muchos genomas contienen un gran número de secuencias idénticas, conocidas como repeticiones. Estas repeticiones pueden tener miles de nucleótidos de longitud, y algunas se producen en miles de lugares diferentes, especialmente en los genomas grandes de plantas y animales.

La secuencia resultante de la secuencia del genoma se produce al combinar la información secuenciada Cóntigos de información y luego empleando la información de enlace para crear andamios. Los andamios biológicos se posicionan a lo largo del mapa físico del cromosoma creando una "ruta excelente".

Software de ensamblaje

Originalmente, la mayoría de los centros de secuenciación de ADN a gran escala desarrollaron su propio software para ensamblar las secuencias que produjeron. Sin embargo, esto ha cambiado a medida que el software se ha ido volviendo más complejo y ha ido aumentando el número de centros de secuenciación. Un ejemplo de un ensamblador es Short Oligonucleotide Analysis Package desarrollado por BGI para el nuevo ensamblaje de genomas del tamaño del humano.​​​

Anotación de genomas

La anotación de genomas es el proceso de juntar la información biológica a las secuencias de ADN.​​​

Consiste en tres pasos fundamentales:

  1. Identificar las partes del genoma que no codifica proteínas.
  2. Identificar los elementos en el genoma, es un proceso llamado predicción de genes.
  3. Determinar la información biológica de estos elementos.

Las herramientas de anotación automática intentan realizar todo esto por medio de un análisis en la computadora, al contrario de la anotación manual que requiere habilidad humana. Idealmente, estos acercamientos coexisten y se complementan el uno al otro en la misma tubería de anotación.

El nivel básico de anotación utiliza BLAST para encontrar similitudes, y después se anotan los genomas basado en eso.​ Sin embargo, hoy en día se agrega más y más información a la plataforma de anotación. La información adicional permite a los anotadores manuales encontrar discrepancias entre los genes dados en la misma anotación. Algunas bases de datos usan la información del contexto del genoma, puntajes similares, información experimental, y la integración de otros recursos para generar anotaciones del genoma a través de sus enfoques de subsistemas. Otras bases de datos (e.g. Ensembl) recae tanto en las fuentes de información como en las diferentes herramientas de software en la automatización de la tubería para la anotación del genoma.​

Anotación estructural consiste en la identificación de elementos genómicos.

  • ORFs y su localización.
  • Estructura de los genes.
  • Regiones codificantes.
  • Ubicación de los motivos reguladores.

Anotación funcional consiste en juntar la información biológica a elementos genómicos.

  • Función bioquímica.
  • Función biológica.
  • Regulación implicada e interacciones.
  • Expresión.

Estos pasos puede involucrar ambas, experimentos biológicos y análisis in silico. La proteogenómica basa sus aproximaciones utilizando información de proteínas expresadas, normalmente derivada de un espectrómetro de masas, para mejorar las anotaciones genómicas.​

Una variedad de herramientas de software han sido desarrolladas que le permiten a los científicos observar y compartir las anotaciones genómicas.​​

Las anotaciones genómicas siguen siendo un gran reto para los científicos que investigan el genoma humano, ahora que las secuencias del genoma de más mil individiuos humanos y organismos modelos están finalmente completadas.​​ Identificar las ubicaciones de los genes y otros elementos genéticos de control normalmente se describen al definir las "lista de partes" biológicas para el montaje y la operación normal de un organismo.​ Los científicos aún están en una fase temprana del proceso de delinear la "lista de partes" y en entender como todas las pares se "ajustan juntas".​

La anotación del genoma es un área de investigación que involucra a diferentes organizaciones en la comunidad de ciencias de la vida, que publican los resultados de sus esfuerzos en bases de datos biológicas disponibles al públicos y accesible vía en línea y otros medios electrónicos. Aquí hay una lista en orden alfabético de proyectos relevantes de anotación del genoma:

En Wikipedia en inglés, la anotación del genoma ha empezado a automatizarse bajo los auspicios de Gene Wiki portal el cual opera un bot que cosecha datos de genes de bases de datos de investigación y crea resguardos de genes en esa base.​

Véase también

Error en la cita: La etiqueta <ref> definida en las <references> con nombre «Stein2001» no se utiliza en el texto anterior.

Error en la cita: La etiqueta <ref> definida en las <references> con nombre «ensembl» no tiene contenido.

Enlaces externos


Новое сообщение