Evaluación funcional del efecto de hormona T3 en estudio transcriptómico

Objetivo

Caracterizar funcionalmente mediante diferentes estrategias de enriquecimiento (métodos de sobrerrepresentación y GSEA), los resultados obtenidos en el análisis de la expresión diferencial del experimento donde utilizamos RNA-Seq en ratón, y en el que estábamos interesamos en detectar genes diferencialmente expresados entre estos 2 grupos: wild type (WT) y tratados con hormona T3.

Datos

  1. Tras realizar un análisis de expresión diferencial entre dos grupos experimentales, se obtuvieron los siguientes resultados:
    • la lista de los genes top (significativos y con mayor expresión en T3 cuando comparamos T3 vs. WT): top list
    • la lista de los genes bottom (significativos y con mayor expresión en WT cuando comparamos T3 vs. WT): bottom list
    • la lista de todos los genes que participan en el estudio, ordenados por el estadístico de contraste: list of all ranked genes
  2. Además de la lista con los genes de interés, necesitamos un segundo input: la anotación funcional. Es un fichero de texto con dos columnas, la primera incluye los identificadores de los genes y la segunda las funciones respectivas que realiza. Esta información la podemos descargar desde BioMart . Esta es la anotación que utilizaremos: mart_export.txt.


Plan de trabajo

A. Lista de genes de interés vs. resto del genoma

Empezaremos con el análisis de sobrerrepresentación sobre cada una de las listas top y bottom frente el resto del genoma (resto de genes en nuestro fichero de anotación).

  1. Abre los ficheros con un bloc de notas o similar e inspecciona su contenido.
  2. Subimos inicialmente el fichero con la lista de los genes bottom en Babelomics desde el menú “Upload”. Tendremos que indicar el tipo de dato: “Id list (Id)”.
  3. Como queremos realizar un análisis de enriquecimiento funcional, vamos al menú “Functional / Single Enrichment: FatiGO”.
  4. Para empezar, compararemos nuestra lista de genes frente el resto del genoma. Seleccionamos los datos con los que trabajaremos.
  5. En databases subiremos nuestra propia información funcional: la anotación que hemos obtenido desde Biomart y no será necesario por lo tanto seleccionar ningún organismo.
  6. Damos un nombre al job y lo ejectuamos. Puede tardar unos 20 minutos la finalización de este job.
  7. A continuación realizaremos el mismo proceso con el fichero que incluye los genes top.

B. Lista 1 de genes (top) vs. lista 2 de genes (bottom)

  1. Como queremos realizar un análisis de enriquecimiento funcional, vamos al menú “Functional / Single Enrichment: FatiGO”.
  2. En “Define your comparison” indicaremos que queremos comparar dos listas de genes: “id list vs. id list”. En “select your data” seleccionaremos qué lista es la 1 y cuál es la 2.
  3. En databases subiremos nuestra propia información funcional: la anotación que hemos obtenido desde Biomart y no será necesario por lo tanto seleccionar ningún organismo.
  4. Damos un nombre al job y lo ejectuamos. Puede tardar unos 20 minutos la finalización de este job.


Cuestiones

A. Lista de genes de interés vs. resto del genoma

Para cada una de las listas de genes (top y bottom) hemos realizado un enriquecimiento funcional. Por favor contesta las siguientes cuestiones a partir de los resultados obtenidos en cada uno de estos 2 escenarios:

  1. ¿Cuántos términos GO son significativos?
  2. Nos interesa especialmente el término “positive regulation of cartilage development”. ¿Qué genes de nuestra lista de interés, están enriquecidos con esta función?
  3. ¿Qué nos indican los valores estadísticos que aparecen en este término GO en cada una de las columnas de la tabla?
  4. Vamos a ser más exigentes con los niveles de significación y sólo queremos las funciones que presenten un p-valor ajustado < 0.005. ¿Cuántas son? Y si por el contrario, somos más laxos y utilizamos un p-valor ajustado < 0.1?


Información detallada sobre el uso de FatiGO en Babelomics