Caracterización funcional mediante redes de interacción proteína-proteína en estudio transcriptómico

En un estudio transcriptómico con datos de RNA-Seq disponíamos de dos grupos experimentales: casos y controles. Tras realizar el análisis de expresión diferencial obtuvimos los siguientes resultados que te puedes descargar en este archivo comprimido y que incluye:

  • Top list: genes significativos con alta expressión en los casos y con nivel de expresión bajo en los controles (sig.up.genes.txt).
  • Bottom list: genes significativos con alta expresión en los controles y con nivel de expresión bajo en los casos (sig.down.genes.txt).
  • All genes: incluye la lista de todos los genes que participan en el experimento, ordenados por su nivel de expresión diferencial. Los genes que están en la parte superior de la lista, presentan mayor expresión en los casos, mientras que los que están en la parte inferior de la lista, están menos expresados en los casos que en los controles.

Nos centraremos en los genes significativos up y down descritos anteriormente.

Queremos caracterizar funcionalmente esta lista de genes. Hay varias estrategias y una de ellas se basa en las redes de interacción proteína-proteína. Si detectamos un alto nivel de interacción, estaríamos confirmando una relación funcional entre ellas.

Este enriquecimiento funcional nos proporcionará una información adicional que permitirá una mejor comprensión de los procesos en los que están participando.


Objetivo

Caracterizar funcionalmente dos grupos de genes de interés (up y down) procedentes de un estudio transcriptómico.

Comenzaremos por los genes up-regulados y luego repetiremos el ejercicio para los down-regulados.

Actividades

  1. Desde un navegador, accedemos a la herramienta web STRING y le echamos un vistazo a los disntintos menús que aparecen, especialmente al menú de “ayuda”.
  2. Selecciona el menú “Search” y en “Multiple proteins” aparecerán varias ventanas de diálogo:
    • Pega los genes up-regulados“
    • Indica que el organismo es humano
    • Esa red nos está esperando: pulsamos “Search”

Cuestiones

  1. ¿Qué te parece la red obtenida? ¿Crees que está muy conectada?
  2. ¿Por qué hay algunas proteínas conectadas y otras no? ¿Qué significan las diferentes líneas que conectan las proteínas? (pista: “legend”).
  3. Indica algunos indicadores que describan la red de interacciones proteína-proteína (pista: “analysis”, por ejemplo el número de conexiones, degree, coeficiente de clustering).
  4. ¿En qué funciones están participando este grupo de proteínas? ¿Son esperables?
  5. ¿Qué proteínas participan en “Pl3k-Akt signaling pathway”? ¿Y en “Collagen chain trimerization”? Por último señala simultáneamente las proteínas que participan en alguna de estas dos funciones o incluso las dos a la vez.
  6. Como nos ha gustado mucho esta red, la incluiremos en una publicación que estamos preparando. Exporta la network como un fichero png (pista: “exports”)
  7. Determina un gráfico que muestre los niveles de coexpresión de los genes seleccionados a lo largo de diversos experimentos (pista: “viewers / coexpression”).
    • ¿Qué genes se coexpresan en humano? ¿Y en otros organismos?
    • Guarda la imagen, que seguro la incluiremos en un informe que queremos preparar ;)
  8. Queremos conocer más proteínas que presenten alta interacción con nuestro grupo inicial. Indícaselo a STRING utilizando la opción “More”. Si quieres volver al escenario inicial (11 proteínas), utiliza “Less”.
  9. Nos gustaría disponer de los resultados de este análisis en un enlace, porque así se lo pasaremos directamente a nuestro colaborador. Un enlace a los resultados en la herramienta estaría fenomenal. Por favor, localízalo (pista: “permanent link / short link”).