Plan de trabajo

En un estudio transcriptómico con datos de RNA-Seq disponíamos de dos grupos experimentales: casos y controles. Tras realizar el análisis de expresión diferencial obtuvimos los siguientes resultados que te puedes descargar en este archivo comprimido y que incluye:

  • Top list: genes significativos con alta expressión en los casos y con nivel de expresión bajo en los controles (sig.up.genes.txt).
  • Bottom list: genes significativos con alta expresión en los controles y con nivel de expresión bajo en los casos (sig.down.genes.txt).
  • All genes: incluye la lista de todos los genes que participan en el experimento, ordenados por su nivel de expresión diferencial. Los genes que están en la parte superior de la lista, presentan mayor expresión en los casos, mientras que los que están en la parte inferior de la lista, están menos expresados en los casos que en los controles.


Empieza la acción!

Abre el fichero de datos “top list” con un bloc de notas o similar e inspecciona su contenido. Inspecciona también los otros dos ficheros.

Paso 1. Desde el home de la herramienta nos dirigimos a la pestaña “Gene List Analysis”. Sube este fichero txt “top list” o bien copia los ids de los genes en la ventana indicada para ello.

Paso 2. Seleccionamos el organismo. En este caso “homo sapiens”.

Paso 3. Escogemos el tipo de análisis. A continuación revisamos todas las opciones disponibles:

3.1. Descripción funcional

  • Empezaremos con una descripción de las funciones anotadas (términos GO, pathways de señalización) a estos genes y para ello utilizaremos estas dos opciones: “Functional classification viewed in gene list” y “Functional classification viewed in graphics charts” que nos proporcionará respectivamente la lista y el resumen gráfico de funciones asociadas a este grupo de genes.
  • Necesitamos:
    1. Tras obtener la lista de la clasificación funcional de estos genes, la guardaremos en un fichero (“Send list to file”)
    2. Desde la opción “Functional classification viewed in graphic charts” obtén un gráfico de barras para cada ontología de la Gene Ontology. La misma información, por favor represéntala desde un “pie chart”.

3.2. Análisis estadístico: Statistical overrepresentation test

  • Este método nos proporciona las funciones que están sobrerrepresentadas en nuestra lista de genes frente el resto del genoma de referencia.
  • Los resultados funcionales caracterizarán los genes incluidos en nuestra lista de interés.
  • Nos gustaría:
    1. Realizar un análisis utilizando los PANTHER GO-Slim Biological Process. Los resultados que obtengamos los visualizaremos en un “multiple pie chart”. ¿Hay diferencias funcionales entre el genoma de referencia y nuestro grupo de genes?.
    2. Repite el análisis pero esta vez utilizaremos todos los Biological Process. Comenta los resultados.

A continuación reproduce los dos puntos anteriores con el fichero “Bottom list”.

3.3. Análisis estadístico: Statistical enrichment test

  • Este método de enriquecimiento funcional incorpora una información de interés (clínica, biológica o estadística) que ordena los genes que integran la lista.
  • Los resultados funcionales caracterizarán los genes incluidos en nuestra lista de interés, incluyendo la información adicional que pondera los genes de esta lista, en este caso según su nivel de expresión diferencial (el estadístico de contraste).


Compara y comenta las diferentes estrategias de caracterización funcional de este experimento transcriptómico.