CIBERER Spanish Variant Server

Estos ejercicios nos muestran cómo obtener información sobre la variabilidad de la población española en diversos escenarios de interés. La herramienta es útil para filtrar polimorfismos y variaciones locales, en el proceso de priorización de genes candidatos para determinadas enfermedades.


Ejercicios

A. Uso de la base de datos

Vamos a familiarizarnos con esta herramienta:

  1. Para empezar, desde el menú Stats te recomendamos que revises el número de personas que integran la base de datos. ¿Cuántas muestras y cuántas variantes aparecen en cada grupo de enfermedad? ¿Y por tipo de tecnología?
  2. ¿Cuántas variantes se describen en la región del cromosoma 1: 1000-20000 (start-end)? (Menú Search)
  3. Tras limpiar la búsqueda anterior. ¿Cuántas variantes hay descritas en el gen BEST1 para todas las muestras de la base de datos? ¿Y cuántas variantes aparecen sólo en los controles sanos (MGP, Medical Genome Project)? ¿Y si además sumamos a los controles sanos (MGP), los controles de los 1000 Genomas (IBS)? Descarga este último grupo de variantes en un fichero csv.
  4. Nos centramos en dos variantes de interés localizadas en chr11, 61719334 y chr11,61719387.
    • ¿Qué significa cada uno de los campos que aparecen en la base de datos?
    • Estamos buscando una variante rara en la población. ¿Cuál de estos cambios encajaría en este perfil de variación?
  5. Queremos conocer mejor la variante chr11, 61719334. Para ello selecciónala y explora las pestañas Genomic context, Frequencies, Phenotype, Effect.
    • ¿Hay algún fenotipo asociado a esta variante?
    • ¿Por qué aparecen varios efectos distintos para este cambio?


B. Variantes candidatas en distrofias de retina

En la Unidad de Genética de un centro hospitalario se han realizado diversos estudios familiares sobre distrofias de retina. Tras la revisión de resultados de diversas pruebas, se han detectado tres genes candidatos (ABCA4,ADAMTS18,AIPL1) sobre los que nos gustaría conocer información de la variabilidad genética española. Por favor, contesta las siguientes cuestiones:

  1. ¿Cuántas variantes se han detectado en estos tres genes en la base de datos de sujetos españoles? (Search)
  2. Determina el perfil de saturación de cada uno de los tres genes anteriores. (Saturation)
    • ¿Qué gen aporta un mayor número de variantes? ¿Son patrones similares o diferentes? ¿Crees que todavía quedan variantes por incluir en la base de datos de variabilidad genética española?
  3. Nos centraremos en las variantes descritas en el gen ABCA4.
    • Tras limpiar la búsqueda anterior, desde Search, determina sólo las variantes para este gen. ¿Cuántas aparecen?
    • Excluye las variantes que aporte el grupo de sujetos VII Diseases of the eye and adnexa y guárdalas en fichero csv. ¿Se ha producido una gran variación en el número de variantes, descartando el número de sujetos del grupo VII Diseases of the eye and adnexa? ¿Te parece apropiado que eliminemos este grupo?
  4. Hemos revisado este fichero y nos gustaría contestar algunas preguntas, realizando consultas a la base CSVS:
    • ¿Qué MAF (Minimum Allele Frequency) presenta la variante chr1,94471154 C>T en la población española? ¿Es una variante que podríamos considerar autóctona o característica de la población española? (Para ello observa la MAF de las otras poblaciones descritas en la base de datos: 1000 Genomes, ExAc, 6500 ESP).


C. Enfermedades neurodegenerativas. Charcot-Marie-Tooth

La enfermedad de Charcot-Marie-Tooth comprende un grupo heterogéneo de neuropatías periféricas hereditarias no inflamatorias. Todavía desconocemos todas las bases genéticas de esta patología. A partir de varios estudios familiares de exoma completo, hemos detectado dos nuevos genes candidatos: KIF1B,PLEKHG5, sobre los que nos gustaría conocer información detallada en el CSVS:

  1. Determina el perfil de saturación de cada uno de los genes anteriores. (Saturation). ¿Son patrones similares o diferentes? ¿Crees que todavía quedan variantes por incluir en la base de datos de variabilidad genética española?
  2. ¿Cuántas variantes se han detectado en estos dos genes, en la base de datos de sujetos españoles? (Search). Descarga esta información en un fichero csv.
  3. Explora este fichero y detecta variantes con alta frecuencia (MAF) en población española.
  4. También nos gustaría seleccionar las variables que presente una MAF menor.
  5. ¿Es cómodo realizar priorizaciones con este procedimiento?