Header Ads Widget

Ticker

6/recent/ticker-posts

El papel de las API en genómica


 Cuando algunas personas piensan en las API, piensan en cosas como la automatización del marketing o tal vez en impulsar una casa inteligente . En otras palabras, es muy fácil asociar las API con la frivolidad o, para decirlo con menos dureza, simplemente hacer las cosas más convenientes.

Pero como ya hemos visto en los artículos de este blog, las API son capaces de hacer mucho más que eso, como incluso salvar vidas . La genómica representa otra área en la que las API no solo pueden tener un gran impacto, sino que ya lo están haciendo a través de servicios como SMART Genomics , 23andME y Google Genomics .

A continuación, analizaremos más de cerca estos servicios y descubriremos por qué las API y la genómica son una gran combinación.

Genómica 101

A diferencia de la genética, que es el estudio de un solo gen, la genómica analiza todos los genes de un organismo. De buenas a primeras, podemos ver por qué sería mucho más intensivo en datos que examinar un solo gen.

También es un campo de estudio increíblemente útil porque, si bien a menudo se considera que la genética se enfoca en identificar "genes problemáticos" que pueden ser responsables de enfermedades y similares, la genómica tiene el potencial de identificar cómo y por qué la estructura genética de un individuo lo hace inmune a enfermedades.

Cuando piensas en algunas de las características del campo de la genómica (grandes volúmenes de datos complejos que, idealmente, deben compartirse entre instituciones de investigación a través de la web), rápidamente se hace evidente que usar API para administrar datos de genómica es un desastre.

El problema de la genómica

Uno de los proyectos de genómica más destacados del Reino Unido es el Proyecto 100.000 Genomas , dirigido por Genomics England. Esta iniciativa otorga a los investigadores acceso a, como su nombre indica, 100.000 genomas de decenas de miles de personas diferentes.

Actualmente, los datos se recopilan del NHS y se anulan su identificación antes de ser canalizados a un centro de datos. Los investigadores y académicos deben solicitar el acceso, con la esperanza de que se les otorgue permiso para acceder a los datos registrados y monitoreados a través de una computadora virtual.

Si alguna vez usó una computadora virtual, ya sabrá que hay algunos problemas asociados con ellos:

  • La potencia de procesamiento, la velocidad, etc.están limitados por la producción real de la máquina.
  • Existe en una red diferente al resto de su hardware
  • Descargar / compartir datos, especialmente de forma segura, puede resultar complicado

En otras palabras, existen algunas limitaciones complicadas asociadas con el manejo de datos genómicos utilizando máquinas virtuales. Y ni siquiera hemos empezado a hablar del problema del tamaño ...

Relacionado: Explorando el laboratorio en la nube: avances en biotecnología y ciencia como servicio

Genómica y BIG Data

En un artículo para ComputerWeekly, Jim Davies, director de tecnología de Genomics England, habla sobre el tamaño masivo de los datos genómicos:

"Se trata de archivos de 150 GB cada uno ... Las interfaces de programación de aplicaciones (API) y las abstracciones de esos datos aún están en desarrollo; se está trabajando mucho con los estándares globales".

En el mismo artículo, Anthea Martin de Cancer Research UK afirma que "la potencia de las computadoras ha avanzado, lo que nos permite analizar esa enorme pila de datos", pero luego destaca el hecho de que la transmisión de datos es un gran problema para las redes informáticas existentes , y señala que los miembros de su equipo ha recurrido al envío y recepción de discos duros por correo. ¡No es la forma más segura de enviar información que puede tener serios problemas de protección de datos a su alrededor!

¿Podrían las API, mediante una combinación de claves de acceso privadas y abstracción de bases de datos, ofrecer una solución más eficaz? Seguro que lo parece. Pero debemos señalar que los intercambios de datos RESTful todavía están sujetos a los límites de las velocidades de procesamiento en la web, por lo que las API no son necesariamente una solución perfecta cuando se trata de terabytes de datos. Dicho esto, veamos cómo tres servicios de API de genómica ya están haciendo olas en este espacio.

23andME

Cuando se trata de hacer que la genómica sea accesible para una audiencia más amplia, la conversación debe comenzar con los servicios ofrecidos por 23andME . 23andME es un caso interesante para nosotros porque la compañía ofrece una API que permite a los desarrolladores de API acceder a datos genómicos para crear aplicaciones. ¿La baja? Solo es posible acceder a información sobre su propio genoma.

Eso ofrece un potencial interesante para las aplicaciones que permiten a los usuarios conectar su información genómica para hacer cosas interesantes, como integrarla con otras fuentes de datos. Ingresar datos podría ayudar con programas sugerentes de nutrición / ejercicio utilizando MyFitnessPal, por ejemplo, o integrarse con la aplicación Salud de Apple para sugerir medidas preventivas de atención médica que pueden aplicarse a las personas en riesgo de diabetes.

Pero efectivamente cierra la puerta a cualquier implicación de investigación más amplia debido a la protección de datos. Desafortunadamente, debido a la naturaleza sensible de los datos genómicos, eso probablemente terminará siendo la ruina del 90% de los servicios genómicos. ¿O será…?

Google Genomics

Google Genomics es una propuesta tan atractiva porque facilita el acceso a petabytes, "creciendo rápidamente hacia exabytes" en las propias palabras de Google, de datos genómicos para grupos de investigación. Entonces, ¿de dónde provienen todos estos datos? Los investigadores deben traer los suyos.

En su documento técnico, Google Genomics proporciona el convincente estudio de caso del Proyecto MSSNG, administrado por Autism Speaks. Con 100 terabytes de datos de 1300 genomas (más más en cola), lo que equivale a alrededor de 10,000 personas, es un gran ejemplo de la escalabilidad de Google Genomics .

A $ 0.022 / GB por mes, el almacenamiento de datos genómicos con Google Genomics (según la cifra aproximada proporcionada por Jim Davies arriba) equivale a alrededor de $ 3 por individuo por mes. Una investigación, como el estudio anterior, que involucra a 10,000 personas, podría volverse prohibitivamente costosa rápidamente para aquellos con fondos limitados.

Si bien a otros investigadores se les puede otorgar acceso individual a todos estos datos, Google no parece tener planes para hacerlos más disponibles para el público o los profesionales médicos que no participan en el proyecto. Eso es lamentable, porque limita las posibilidades de observar cómo las enfermedades o condiciones (o la susceptibilidad a ellas) afectan a otras personas con similitudes genómicas.

Para obtener más información sobre el almacén de datos personales en evolución, lea The API of Me

Genómica inteligente

Uno de los proyectos de API de genómica más interesantes del mercado es SMART Genomics debido a sus implicaciones directas para la salud. Un proyecto en Harvard, SMART Genomics interactúa con el marco FHIR (Fast Healthcare Interoperability Resources) y se desarrolló para resolver la falta de estándares de comunicación genómica. El objetivo final es un método sencillo para que los médicos o las aplicaciones web consulten la información genómica de un paciente.

El proyecto es de código abierto y utiliza tres recursos principales para ayudar a estandarizar la catalogación y recuperación de datos genómicos:

  • Secuencia : almacena datos sobre las secuencias de aminoácidos, ARN o ADN del paciente.
  • SequencingLab : recursos de contenedor que contienen resultados sobre laboratorios específicos utilizados para secuenciar genomas.
  • Observación genética : recursos que transmiten información sobre el fenotipo y el genotipo.

Para obtener más información sobre SMART Genomics, lea la guía del desarrollador .

“SMART Genomics brinda soporte para el uso de información genómica en el entorno de la atención médica al proporcionar nuevas definiciones de recursos y extensiones de recursos al marco SMART on FHIR existente. Con SMART Genomics, las aplicaciones médicas pueden acceder rápidamente a la información genómica de un paciente junto con sus datos clínicos estándar para brindar atención personalizada de alta calidad a sus pacientes ”.

En otras palabras, SMART Genomics representa un movimiento hacia la estandarización de un vasto tesoro de información humana que podría ser fundamental para el diagnóstico y la medicina preventiva. En un número de Genetic Engineering & Biotechnology News , Ph.D. Kate Marusina reconoce que una singularidad genómica está cerca y dice que "una vez que hayamos subido nuestros genomas y la red esté llena de datos de nuestros biosensores, los médicos y clínicas virtuales podrían volverse muy reales".

¿A qué otras industrias están afectando las API? Lea nuestra cobertura de sectores para explotación con API

Genómica: otra industria madura para la estandarización con API

La barrera más importante entre la genómica que adopta API de manera más amplia es, como ocurre en muchos otros campos, la falta de coherencia o estándares. Volviendo a las opiniones de Jim Davies sobre el tema: "Todavía no tenemos una arquitectura de gestión de datos estable definitiva".

En otras palabras, no existe un estándar para la abstracción o la anotación de datos cuando se trata de secuencias genómicas y datos genéticos. Establecer estos estándares requiere una confluencia de tecnología API pura con principios científicos increíblemente complejos, y esa no es una pregunta fácil.

Las implicaciones para las mejoras en la atención médica y el estilo de vida , si se hicieran públicas franjas de datos genómicos a través de API, son enormes. Más allá de identificar los componentes genéticos de enfermedades o afecciones, podría ser posible investigar el impacto de comportamientos como la dieta y el ejercicio en el inicio o la evitación de esas afecciones.

Pero es complicado incluso comenzar a hablar de eso sin considerar la cuestión de cómo la financiación se vería afectada por los avances que dependen de la información genómica extraída de múltiples instituciones a través de API, lo que hace que los datos sean más accesibles.

Digamos que Joe Public identifica que el levantamiento de pesas parece retrasar, digamos, la aparición de la demencia. Si está usando datos de tres ensayos clínicos diferentes, un montón de datos cargados por los levantadores de pesas a través de una aplicación de fitness y API mantenidas por dos instituciones de investigación diferentes, ¿quién recibe crédito por el descubrimiento?

Como resultado, aunque algunos servicios como SMART Genomics parecen estar comenzando a derribar barreras, deberíamos moderar cualquier expectativa de verdaderos avances en el espacio API para genómica. Pero, dado el potencial allí, diríamos que no se trata de si, sino de cuándo .

Publicar un comentario

0 Comentarios