Table of Contents
Evaluación funcional del efecto de hormona T3 en estudio transcriptómico
Objetivo
Caracterizar funcionalmente mediante diferentes estrategias de enriquecimiento (métodos de sobrerrepresentación y GSEA), los resultados obtenidos en el análisis de la expresión diferencial del experimento donde utilizamos RNA-Seq en ratón, y en el que estábamos interesamos en detectar genes diferencialmente expresados entre estos 2 grupos: wild type (WT) y tratados con hormona T3.
Datos
- Tras realizar un análisis de expresión diferencial entre dos grupos experimentales, se obtuvieron los siguientes resultados:
- la lista de los genes top (significativos y con mayor expresión en T3 cuando comparamos T3 vs. WT): top list
- la lista de los genes bottom (significativos y con mayor expresión en WT cuando comparamos T3 vs. WT): bottom list
- la lista de todos los genes que participan en el estudio, ordenados por el estadístico de contraste: list of all ranked genes
- Además de la lista con los genes de interés, necesitamos un segundo input: la anotación funcional. Es un fichero de texto con dos columnas, la primera incluye los identificadores de los genes y la segunda las funciones respectivas que realiza. Esta información la podemos descargar desde BioMart . Esta es la anotación que utilizaremos: mart_export.txt.
Plan de trabajo
A. Lista de genes de interés vs. resto del genoma
Empezaremos con el análisis de sobrerrepresentación sobre cada una de las listas top y bottom frente el resto del genoma (resto de genes en nuestro fichero de anotación).
- Abre los ficheros con un bloc de notas o similar e inspecciona su contenido.
- Subimos inicialmente el fichero con la lista de los genes bottom en Babelomics desde el menú “Upload”. Tendremos que indicar el tipo de dato: “Id list (Id)”.
- Como queremos realizar un análisis de enriquecimiento funcional, vamos al menú “Functional / Single Enrichment: FatiGO”.
- Para empezar, compararemos nuestra lista de genes frente el resto del genoma. Seleccionamos los datos con los que trabajaremos.
- En databases subiremos nuestra propia información funcional: la anotación que hemos obtenido desde Biomart y no será necesario por lo tanto seleccionar ningún organismo.
- Damos un nombre al job y lo ejectuamos. Puede tardar unos 20 minutos la finalización de este job.
- A continuación realizaremos el mismo proceso con el fichero que incluye los genes top.
B. Lista 1 de genes (top) vs. lista 2 de genes (bottom)
- Como queremos realizar un análisis de enriquecimiento funcional, vamos al menú “Functional / Single Enrichment: FatiGO”.
- En “Define your comparison” indicaremos que queremos comparar dos listas de genes: “id list vs. id list”. En “select your data” seleccionaremos qué lista es la 1 y cuál es la 2.
- En databases subiremos nuestra propia información funcional: la anotación que hemos obtenido desde Biomart y no será necesario por lo tanto seleccionar ningún organismo.
- Damos un nombre al job y lo ejectuamos. Puede tardar unos 20 minutos la finalización de este job.
Cuestiones
A. Lista de genes de interés vs. resto del genoma
Para cada una de las listas de genes (top y bottom) hemos realizado un enriquecimiento funcional. Por favor contesta las siguientes cuestiones a partir de los resultados obtenidos en cada uno de estos 2 escenarios:
- ¿Cuántos términos GO son significativos?
- Nos interesa especialmente el término “positive regulation of cartilage development”. ¿Qué genes de nuestra lista de interés, están enriquecidos con esta función?
- ¿Qué nos indican los valores estadísticos que aparecen en este término GO en cada una de las columnas de la tabla?
- Vamos a ser más exigentes con los niveles de significación y sólo queremos las funciones que presenten un p-valor ajustado < 0.005. ¿Cuántas son? Y si por el contrario, somos más laxos y utilizamos un p-valor ajustado < 0.1?