Queremos caracterizar por una parte la lista de genes top (más expresados en K que en L) y por otra parte la lista de genes bottom (más expresados en L que en K):
¿Cuántos genes están incluidos en el input de cada análisis?.
¿Qué nomenclatura o “Type” utiliza? (nos referimos a qué base de datos pertenecen los ids de los genes).
En cada análisis de sobrerrepresentación, ¿qué dos listas de genes estamos comparando?
¿Quién es el universo de genes con el que trabajamos: todos los genes del experimento, todos los genes que presentan alguna función anotada….?
Genera un análisis de sobrerrepresentación funcional para cada una de las 3 ontologías de la GO: CC, MF, BP.
¿Hay alguna ontología que presenta un número de resultados claramente mayor que otra? En el caso de haber diferencias, ¿a qué crees que se debe?
¿Qué significa cada uno de los indicadores que aparecen en los resultaods? “ID”, “Description”, “GeneRatio”, “BgRatio”, “pvalue”, “p.adjust”, “qvalue”, “geneID”, “Count”
¿Cómo interpretas funcionalmente los resultados obtenidos?
Interpreta los gráficos obtenidos.
¿Podríamos realizar un análisis de enriquecimiento de este tipo si NO tenemos genes significativos?