Cuestiones


A. Análisis de sobre-representación (ORA)

Queremos caracterizar por una parte la lista de genes top (más expresados en K que en L) y por otra parte la lista de genes bottom (más expresados en L que en K):

  1. ¿Cuántos genes están incluidos en el input de cada análisis?.
  2. ¿Qué nomenclatura o “Type” utiliza? (nos referimos a qué base de datos pertenecen los ids de los genes).
  3. En cada análisis de sobrerrepresentación, ¿qué dos listas de genes estamos comparando?
  4. ¿Quién es el universo de genes con el que trabajamos: todos los genes del experimento, todos los genes que presentan alguna función anotada….?
  5. Genera un análisis de sobrerrepresentación funcional para cada una de las 3 ontologías de la GO: CC, MF, BP.
  6. ¿Hay alguna ontología que presenta un número de resultados claramente mayor que otra? En el caso de haber diferencias, ¿a qué crees que se debe?
  7. ¿Qué significa cada uno de los indicadores que aparecen en los resultaods? “ID”, “Description”, “GeneRatio”, “BgRatio”, “pvalue”, “p.adjust”, “qvalue”, “geneID”, “Count”
  8. ¿Cómo interpretas funcionalmente los resultados obtenidos?
  9. Interpreta los gráficos obtenidos.
  10. ¿Podríamos realizar un análisis de enriquecimiento de este tipo si NO tenemos genes significativos?

B. Gene Set Analysis (GSE)

  1. ¿Cuántos genes están incluidos en el input? ¿Por qué es diferente del análisis de sobrerrepresentación?
  2. Genera un GSEA para cada una de las 3 ontologías: CC, MF, BP.
  3. En los resultados, ¿cuántas funciones significativas se obtuvieron? ¿Te parecen pocas o muchas? ¿Es manejable esta información obtenida?
  4. ¿Qué significa cada uno de los indicadores estadísticos que aparecen en los resultados?
  5. Comparando los resultados del GSA con los análisis de sobrerrepresentación, ¿que podrías indicar?
  6. ¿Podríamos realizar un análisis de enriquecimiento de este tipo si NO tenemos genes significativos?
  7. Interpreta los gráficos resultantes del GSE, comentando estos puntos:
    • ¿Qué representan estos gráficos?
    • ¿Qué mostramos en los ejes X e Y de cada uno de los dos gráficos?
    • Este grupos de genes correspondientes a la función GO_0070469, ¿tienen un nivel de expresión mayor en los tumores de riñón o en los tumores de pulmón? ¿Y para la función GO_0072562?
    • GO:0070469:

  • GO:0072562: