Actividad 1. Análisis de datos de RNA-Seq: diferencia de expresión entre grupos

Objetivo

Queremos conocer mejor los mecanismos moleculares de una determinada enfermedad compleja en la que sabemos que una determinada hormona tiene un papel importante. Para ellos diseñamos un experimento caso-control utilizando RNA-Seq en ratón, donde estamos interesamos en detectar genes diferencialmente expresados entre estos 2 grupos: wild type (WT) y tratados con hormona T3 .

Datos

En un estudio con 9 muestras, disponemos de conteos no normalizados en 38.293 genes. Estos datos se obtuvieron tras aplicar un análisis primario que incluyó la evaluación de calidad de las secuencias, mapeo y cuantificación de la expresión a nivel de gen.

Los nombres de las muestras que incluyen “T3” corresponde a los tratados con hormona tiroidea y las muestras que no incluyen en su nombre “T3” son del grupo wild type (WT).

Plan de trabajo

  1. Abre el fichero de texto dataset1 con una hoja de cálculo e inspeccion su contenido. Habrá tantas columnas como sujetos y tantas filas como genes que queramos valorar.
  2. Sube este fichero txt en Babelomics desde el menú “Upload”. Tendremos que indicar el tipo de dato que subimos: “Data matrix expression”. En este link se describen los diferentes tipos de datos que podemos utilizar en Babelomics: https://github.com/babelomics/babelomics/wiki/Data-types
  3. Tenemos que informar a la herramienta que muestras son WT y cuáles son T3. Esta información la incluiremos desde “Processing / Edit your uploaded data”, siguiendo el asistente que aparece en esta opción. Para ello generamos una variable que llamaremos “TRATAMIENTO” (tras incluir este nombre hay que clickar el símbolo + para incorporarla) y utilizaremos los valores “WT” y “T3” para etiquetar cada uno de los valores. Tras asignar un valor a cada sujeto, guardaremos los cambios.
  4. Tras la carga y etiquetado de los datos, el siguiente paso incluye la normalización y la expresión diferencial simultáneamente. Desde “Expression / RNA-Seq, class comparison” seleccionaremos nuestro fichero, la variable que establece los grupos que queremos comparar, el orden de la comparación (mediante la elección de los atributos o grupos, nos gusta esta comparación: T3 vs. WT), un método de normalización (TMM) y un procedimiento para la corrección de test múltiple.
  5. Por último, damos un nombre al job y lo ejecutamos.

Cuestiones

  1. ¿Cuántos genes diferencialmente expresados hemos obtenido en el análisis?
  2. ¿Cuál es la interpretación de los gráficos que aparecen en los resultados?
  3. Comenta los valores obtenidos para un gen que nos gusta especialmente: ENSMUSG00000059751.
  4. Descarga el ficheros con resultados significativos. ¿Cuántos genes están up-expresados? ¿Y cuántos down-expresados?
  5. Estamos comparando T3 vs. WT. Si comparásemos WT vs. T3, ¿obtendríamos los mismos resultados?
  6. ¿Hay alguna muestra con un comportamiento anómalo? ¿Sería interesante eliminar la muestra WT4 y volver a realizar el análisis de la expresión diferencial?
  7. En el caso de que decidas que sí es interesante eliminar la muestra WT4, puedes reproducir de nuevo el análisis utilizando el archivo: dataset1_less_wt4.txt. Comenta las diferencias encontradas.