Actividad 4.2. Detección de patrones de expresión entre pacientes con tumores de riñón y pulmón


Objetivo

Detectar genes diferencialmente expresados entre 2 grupos de inviduos en un estudio de cáncer.

Datos

Disponemos de conteos no normalizados en 29.405 genes para un total de 10 individuos. Estos datos se obtuvieron tras aplicar un análisis primario que incluyó la evaluación de calidad de las secuencias, mapeo y cuantificación de la expresión a nivel de gen.

Las cinco primeras muestras corresponden a RNA de riñón (k) y las 5 últimas a RNA de pulmón (l).

Plan de trabajo

  1. Abre el fichero de datos dataset2_10samples.txt con una hoja de cálculo e inspeccion su contenido. Habrá tantas columnas como sujetos y tantas filas como genes que queremos valorar.
  2. Sube este fichero txt en Babelomics desde el menú “Upload”. Tendremos que indicar el tipo de dato que subimos: “Data matrix expression”. En este link se describen los diferentes tipos de datos que podemos utilizar en Babelomics: https://github.com/babelomics/babelomics/wiki/Data-types
  3. Tenemos que informar a la herramienta que las 5 primeras muestras son de riñón (K) y las 5 últimas son pulmón (L) Esta información la incluiremos desde “Processing / Edit your uploaded data”, siguiendo el asistente que aparece en esta opción. Para ello generamos una variable que llamaremos “GRUPO” y utilizaremos los valores “K” y “L” para etiquetar cada uno de los valores. Tras asignar un valor a cada sujeto, guardaremos los cambios.
  4. Tras la carga y etiquetado de los datos, el siguiente paso incluye la normalización y la expresión diferencial simultáneamente. . Desde “Expression / RNA-Seq, class comparison” seleccionaremos nuestro fichero, la variable que establece los grupos que queremos comparar, el orden de la comparación (mediante la elección de los atributos o grupos. Realizaremos la comparación K vs. L), un método de normalización (TMM) y un procedimiento para la corrección de test múltiple.
  5. Por último, damos un nombre al job y lo ejecutamos.

Cuestiones

  1. ¿Cuántos genes diferencialmente expresados hemos obtenido en el análisis?
  2. ¿Cuál es la interpretación de los gráficos que aparecen en los resultados?
  3. Descarga el ficheros con resultados significativos. ¿Cuántos genes están up-expresados? ¿Y cuántos down-expresados?
  4. Comenta los valores obtenidos para un gen que nos gusta especialmente: MSRA.