Código de la vida: Blockchain y el futuro de la genómica

En una era de debates acaloradamente controvertidos en torno a la propiedad de los datos, la privacidad y la monetización, una pieza particular de datos podría decirse que es la más personal de todas: el genoma humano.

Si bien somos 99.9 por ciento idénticos en nuestra composición genética en toda la especie, el 0.1 por ciento restante contiene variaciones únicas en el código que se cree que influyen en nuestra predisposición a ciertas enfermedades e incluso a nuestros sesgos temperamentales: un modelo de lo susceptibles que somos a todo, desde corazón la enfermedad y el Alzheimer a los celos, la imprudencia y la ansiedad.

2018 ofreció amplios ejemplos de cómo los malos actores pueden causar estragos con el uso nefasto de incluso datos relativamente triviales. Para aquellos interesados en proteger esta forma de identidad más crítica, blockchain ha suscitado considerable interés como una poderosa alternativa a las arquitecturas cerradas y explotaciones propietarias del mercado de datos genómicos existentes, prometiendo en su lugar un protocolo seguro y abierto para el código de la vida.

Cadenas cifradas

La secuenciación del genoma humano hasta el nivel molecular de las cuatro "letras" que se unen a las hélices bicatenarias de nuestro ADN se completó por primera vez en 2003. El proyecto costó $3.7 mil millones y 13 años de potencia de cálculo. Hoy en día, cuesta $1.000 por genoma único y toma solo unos días. Se estima que pronto costará tan poco como $100.

COSTO DE SECUENCIA DE ADN POR GENOMA

A medida que evolucionen el diseño de fármacos impulsados ​​por datos genómicos y las terapias dirigidas, se espera que el interés de las compañías farmacéuticas y biotecnológicas catapulte el mercado de datos genómicos en los próximos años, con un pronóstico que alcanzará los 27.600 millones de dólares para 2025.

Si el conjunto de datos de sus me gusta de Facebook y las maravillas de las noticias ya ha sido reconocido como un activo importante y monetizable, el valor encerrado en su código genético aumenta exponencialmente a medida que la revolución en la medicina de precisión y la edición de genes acelera.

En el último año, se han otorgado aprobaciones sin precedentes a nuevas terapias génicas en los EE.UU. Uno edita las células del sistema inmune de un paciente para curar el linfoma no Hodgkin; otro trata una rara enfermedad hereditaria de la retina que puede conducir a la ceguera.

Sin embargo, aquí está el problema.

El potencial inigualable de Genomics para desencadenar un cambio de paradigma en la medicina moderna se basa en aprovechar vastos conjuntos de datos para establecer correlaciones entre las variantes genéticas y los rasgos.

Generar la explosión de grandes datos genómicos que todavía se necesita para decodificar los 4 bits del organismo vivo enfrenta obstáculos que no solo son científicos, sino también éticos, sociales y tecnológicos.

Para muchos al borde de esta frontera, aquí es exactamente donde aparece el fabuloso libro blanco de 2008 de Nakamoto, y la tecnología que se conocería como blockchain.

Cointelegraph habló con tres figuras del espacio genómico blockchain para descubrir por qué.

¿A quién pertenece tu genoma? Resucitando el mamut lanudo ... y blockchain

Para el profesor George Church, el genetista inconformista mundialmente famoso de Harvard, las fronteras entre las tecnologías dentro y fuera del laboratorio son porosas. Tras haber sido pioneros en la secuenciación directa del genoma en 1984, un breve resumen de sus ambiciones recientes incluye intentos de resucitar al mamut extinto hace mucho tiempo, crear células a prueba de virus e incluso revertir el envejecimiento.

Ahora ha colocado otra tecnología de punta en el centro de la revolución de la genómica: blockchain.

El año pasado, Church -junto con sus colegas de Harvard Dennis Grishin y Kamal Obbad- cofundó la empresa de blockchain Nebula Genomics. Church había intentado durante años acelerar e impulsar la generación de datos genómicos a gran escala. Apeló a voluntarios para que contribuyeran a su Proyecto Genoma Personal sin fines de lucro (PGP), una 'Wikipedia' de datos genómicos humanos de libre acceso que ha acumulado alrededor de 10.000 muestras hasta el momento.

PGP confió en las personas que renuncian a la privacidad y la propiedad en la búsqueda del avance de la ciencia. Como dijo Church en una entrevista reciente, en su mayoría eran "particularmente altruistas" o personas preocupadas por acelerar la investigación de una enfermedad en particular debido a las experiencias familiares.

En otros casos, como le dijo a Cointelegraph el experto en ciberseguridad, Drab Sam Brama, de DNABits, son los propios pacientes los que generan los datos y están "lo suficientemente enfermos como para desechar cualquier preocupación sobre la propiedad y la privacidad":

"Los muy enfermos vienen al sistema de atención médica y dicen: 'Te daremos todo lo que desees, tómalo, firmaremos cualquier documento, consentimiento. Solo cúranos, encuentra una cura'".

El desafío es conseguir a todos los demás. Si bien nadie sabe exactamente a cuántas personas se les ha secuenciado su genoma hasta la fecha, algunas estimaciones sugieren que es alrededor de un millón.

Empresas como Nebula y DNABits proponen que un ecosistema tokenizado, habilitado con blockchain podría ser el punto de inflexión tecnológico para la incorporación de las masas.

Al permitir a las personas monetizar sus genomas y vender el acceso directamente a los compradores de datos, Nebula cree que su plataforma podría ayudar a reducir los costos de secuenciación "a cero o incluso ofrecer a las personas una ganancia neta".

Si bien Nebula no subvencionará directamente la secuenciación del genoma completo, un modelo de blockchain permitiría que los compradores interesados, por ejemplo, dos compañías farmacéuticas, ofrezcan el efectivo para la secuencia de alguien a cambio del acceso a sus datos.

La tokenización abre la flexibilidad y el consentimiento granular para habilitar diferentes escenarios. Como Brama sugirió, un propietario de datos podría tener derecho a acciones en cualquier fármaco que se desarrolle en función de la investigación que haya habilitado o a que se le reembolse por su prescripción médica en fichas cripto. Los contratos se publicarían y harían hash, y se hará referencia al consentimiento del individuo registrado en el blockchain.

Distopias genomicas

Conducir y acelerar la generación de datos es solo una parte de la ecuación.

Nebula realizó una encuesta que encontró que, en lugar de simplemente la asequibilidad, la privacidad y las preocupaciones éticas eclipsaron a todos los demás factores cuando se les preguntó a las personas si considerarían o no la secuenciación de su genoma. En otro estudio de 13.000 personas, el 86 por ciento dijo que les preocupaba el mal uso de sus datos genéticos: más de la mitad se hizo eco de los temores sobre la privacidad.

ENCUESTA DE NEBULA SOBRE LA SECUENCIA DEL GENOMA

Estas preocupaciones no se basan simplemente en la ciencia ficción distópica de los años 90 de Hollywood: piense en el imaginario biopunk de Gattaca sobre una sociedad futura en las garras de la fiebre neo eugenésica.

Como dice Ofer Lidsky, cofundador, CEO y CTO de DNAtix, la nueva empresa de genómica de blockchain:

"Una vez que su ADN se ha visto comprometido, no puede cambiarlo. No es como una tarjeta de crédito que puede cancelar y recibir una nueva. Tu código genético está contigo toda tu vida [...] Una vez que se ha visto comprometido, no hay vuelta atrás".

Los datos son cada vez más interceptados, comercializados e incluso convertidos en armas. La secuenciación, y mucho menos compartir, su genoma es quizás un paso más de lo que muchos están dispuestos a tomar, dada su singularidad, irrevocabilidad y longevidad.

Brama de DNABits dio su opinión de ciberseguridad, diciendo que:

"Las consecuencias son muy difíciles de imaginar, pero en un mundo [en el que] las personas crean portadores como virus que se propagarán a las células del cuerpo y las editarán, es aterrador, pero de hecho, todos los componentes básicos ya están ahí: secuenciación del genoma, violaciones de datos, edición de genes. La gente ahora está trabajando para arreglar las principales condiciones de salud mediante la edición de genes in vivo. Pero deberíamos suponer que cada herramienta que existe finalmente también caerá en las manos equivocadas".

Agregó que "no estamos hablando de aprovecharse de alguien solo por una noche con GHB o alguna otra droga", esto afectaría el resto de la vida de una persona.

Este abril, poco después del escándalo de Cambridge Analytica, las noticias revelaron que los detectives de la policía habían extraído una base de datos de genealogía de aficionados para fragmentos de ADN de individuos que esperaban que ayudaran a resolver un caso de homicidio que se había congelado durante más de treinta años.

La policía no se resistió a acceder a una tienda centralizada de material genético que había sido subido por un público involuntario. Y aunque muchos elogiaron el arresto del Golden State Killer a través de una maraña de ADN, otros expresaron una considerable inquietud.

Esta oscuridad de acceso tiene implicaciones más allá de la ciencia forense. Si bien la distopía de Brama puede estar algo distante, hoy existen preocupaciones sobre la discriminación genética por parte de los empleadores y las compañías de seguros, la última de las cuales actualmente solo está legalmente proscrita en forma parcial. Grishin se hizo eco de esto, señalando que en los EE.UU., "Se le puede negar el seguro de vida debido a su ADN".

En mayo, la Comisión Federal de Comercio de EE.UU. abrió una investigación sobre empresas de pruebas genéticas populares para consumidores, incluidas 23andMe y Ancestry.com, sobre sus políticas para el manejo de información personal y genética, y cómo comparten esa información con terceros.

23andMe y Ancestry.com representan un fenómeno reciente de las llamadas pruebas genéticas directas al consumidor, cuya popularidad se estima que se duplicó con creces el año pasado.

Estas firmas usan una técnica más estrecha llamada genotipado, que identifica 600.000 posiciones espaciadas a intervalos regulares aproximadamente a través de las 6.4 mil millones de letras de un genoma completo. Aunque limitado, aún revela información genética intrínsecamente personal.

El muy popular kit de genotipado para el hogar 23andMe, solemnemente empaquetado como "Bienvenido a ti", promete contarle a la gente todo, desde su composición ancestral hasta la probabilidad de pasar la noche en las embravecidas garras del insomnio. El kit viene con un precio tan bajo como $99.

Este julio, la sexta mayor compañía farmacéutica del mundo, GlaxoSmithKline (GSK), invirtió $300 millones en un acuerdo de cuatro años para acceder a la base de datos de 23andMe, y se estima que la empresa de pruebas ganó $130 millones vendiendo acceso a alrededor de un millón de humanos genotipos, trabajando a un precio promedio de alrededor de $130. En comparación, se informa que Facebook genera alrededor de $82 en ingresos brutos a partir de los datos de un solo usuario activo.

Sistemas de cadena de bloques a prueba de batalla y anónimos para la revolución de la genómica.

En este panorama de datos genómicos cada vez más opaco, las empresas monetizan los datos genotípicos generados por sus consumidores, y los datos de secuencia se fragmentan a través de silos centralizados patentados, ya sea en los legados sistemas de instituciones de atención sanitaria e investigación o en los tesoros privados de empresas de biotecnología.

Llevar la genómica a la cadena de bloques permitiría la circulación necesaria para acelerar la investigación, al tiempo que se protege esta información exclusivamente personal al mantener las identidades anónimas separadas de los identificadores criptográficos. Los usuarios conservan el control de sus datos y deciden exactamente con quién se comparte y para qué fines. Ese acceso, a su vez, se rastrearía en un libro auditable e inmutable.

Grishin describió la versión de Nebula, que colocaría requerimientos asimétricos en diferentes miembros del ecosistema. Los usuarios tendrían la opción de permanecer en el anonimato, pero un sistema de cadena de bloques autorizado con nodos de validación verificados requeriría que los compradores de datos que usan la red sean completamente transparentes con respecto a su identidad:

"Si alguien se comunica con usted, no debería ser solo una identificación de red criptográfica, pero debería decir que es John Smith de Johnson & Johnson, que trabaja, por ejemplo, en oncología".

Grishin agregó que Nebula ha experimentado tanto con blockstack como con la cadena de bloques Ethereum (ETH), pero desde entonces ha decidido pasar a un prototipo interno, considerando que la capacidad de 15 transacciones por segundo de Ethereum es insuficiente para su ecosistema.

La Brama de DNABits, también comprometida con el uso de un sistema autorizado, propuso usar "la forma más simple y robusta de blockchain, es decir, una red de tipo Bitcoin".

"Entre más potente y más capaz sea el motor que uses, mayor será el ataque a la superficie".

A prueba de mentiras el blockchain

Se dice que 23andMe almacena alrededor de cinco millones de perfiles de clientes genotipo, y la firma rival Ancestry.com alrededor de 10 millones. Para cada perfil, recolectan alrededor de 300 puntos de datos fenotípicos, creando encuestas que apuntan a averiguar cuántos cigarrillos (piensas) has fumado durante tu vida o si el yoga o el Prozac fueron más efectivos para controlar tu depresión.

Un fenotipo es el conjunto de características observables de un individuo que resulta de la interacción de su genotipo con su entorno. Generar y compartir el acceso a estos datos es crucial para decodificar el genoma a través de una correlación de variantes y rasgos. Pero como señala Grishin, en gran medida autoinformado, la calidad de muchos de los datos existentes es incierta, y una genómica tokenizada se enfrenta a un obstáculo en este sentido:

"Si las personas pueden monetizar sus datos genómicos personales, entonces pueden imaginarse que algunas personas podrían pensar: 'Si digo tener una condición rara, muchas compañías farmacéuticas estarán interesadas en comprar acceso a mi genoma', que no es necesariamente cierto. El valor de un genoma es algo difícil de predecir y no es correcto decir que si tienes algo raro, entonces tu genoma será más valioso. De hecho, muchos estudios necesitan muchas muestras de control que son casi normales".

La educación puede ayudar a las personas a darse cuenta de que no ganarán más dinero mintiendo y que un genoma intermedio podría ser tan interesante para un comprador como uno inusual. Pero Grishin también señaló que un sistema de cadena de bloques puede ofrecer mecanismos únicos que impiden el engaño, incluso donde la educación falla:

"Blockchain puede ayudar a crear encuestas de fenotipo que detectan respuestas incorrectas o identifican dónde un participante individual ha intentado mentir. Y esto se puede combinar con sistemas de depósito en garantía habilitados con blockchain, donde, por ejemplo, antes de participar en una encuesta, debe depositar una pequeña cantidad de criptomoneda en una billetera de depósito en garantía".

Si las respuestas conflictivas indican que alguien ha intentado mentir sobre su condición médica, entonces su depósito podría retenerse de una manera que es mucho más fácil de implementar dentro de un sistema de cadena de bloques en comparación con uno que usa monedas fiduciarias.

2018: virus y cromosomas golpean la cadena de bloques

Incluso con solo una fracción de la población a bordo, dada la intensificación de datos del código del cuerpo, un tsunami de secuencia ya está inundando las tiendas centralizadas existentes.

El conjunto de datos complejo y sin procesar de un solo genoma llega a 200 gigabytes: en junio de 2017, el GenBank del Instituto Nacional de Salud de EE.UU. Informó, según los informes, más de dos billones de bases de secuencia. Una de las firmas de biotecnología más grandes del mundo, BGI Genomics de China, anunció ese mismo mes que planeaba producir cinco petabases de ADN nuevo en 2017, aumentando cada año para alcanzar 100 petabases para 2020.

En su entrevista con Cointelegraph, Lidsky propuso que el conjunto de datos en bruto de 200 gigabytes es innecesario para los analistas, enfatizando que la secuenciación inicial del genoma se lee varias veces, "digamos 30 o 100 veces", para mitigar las imprecisiones. Una vez que se combina, explicó, "el tamaño de la secuencia se reduce a 1,5 gigabytes". Esto todavía requiere una compresión significativa para llevarlo a la cadena de bloques. Como referencia, el tamaño promedio de una transacción en la cadena de bloques Bitcoin (BTC) fue de 423 kilobytes, a partir de mediados de junio de 2018.

Tamaño de transacción promedio en la cadena de bloques de Bitcoin, 2014-18.

Tamaño de transacción promedio en la cadena de bloques de Bitcoin, 2014-18. Fuente: TradeBlock.com

En junio, DNAtix anunció la primera transferencia de un cromosoma completo utilizando la tecnología blockchain, específicamente el tejido Hyperledger de IBM. Lidsky le dijo a Cointelegraph que la firma había logrado alcanzar una tasa de compresión del 99 por ciento para el ADN en agosto.

Nebula, por su parte, prevé que incluso en una cadena de bloques, la transferencia de datos es innecesaria y desacertada, dada la sensibilidad única de la genómica. Propone compartir el acceso a datos en su lugar. La solución combinaría blockchain con técnicas avanzadas de cifrado y métodos de computación distribuidos. Como lo describió Grishin:

"Sus datos pueden analizarse localmente en su computadora simplemente ejecutando una aplicación sobre sus datos usted mismo [...] con medidas de seguridad adicionales en su lugar, por ejemplo, mediante el uso de cifrado homomórfico para compartir datos de forma encriptada".

Grishin explicó que las técnicas homomórficas encriptan los datos pero aseguran que no son "absurdos", creando "transformaciones que transforman los datos sin alterarlo":

"El comprador de datos no obtiene los datos subyacentes en sí, sino que calcula en su forma cifrada para derivar resultados de la misma. Por lo tanto, el código se traslada a los datos en lugar de que los datos se trasladen a los investigadores".

Los datos cifrados pueden ponerse a disposición de los desarrolladores de las llamadas aplicaciones genómicas, algo que Nebula, DNAtix y muchas otras nuevas empresas emergentes en el campo proponen como una forma de proporcionar a los usuarios una interpretación de sus datos. También podrían proporcionar una fuente adicional de monetización para investigadores y otros desarrolladores de terceros.

¿Pero es la interpretación genómica 'outsourcing' a una aplicación tan simple? El modelo de atención médica de hace décadas remitió a los pacientes a los asesores genéticos para que revisen los riesgos y hablen sobre las expectativas, lo que ayuda a traducir lo que puede ser desconcertante y, a menudo, atemorizante.

Las firmas de pruebas genéticas del consumidor ya han sido acusadas de dejar a sus clientes "con muchos datos y pocas respuestas". Más allá de satisfacer la curiosidad genealógica e interpretar una variedad de genes de "bienestar", 23andMe puede revelar si usted tiene una variante genética que podría afectar la salud futura y, hasta 2017, incluso ha sido autorizado a divulgar los riesgos genéticos para la salud, incluso para el cáncer de mama y el Parkinson.

Blockchain puede que no le vaya mucho mejor cuando se trata de dejar a las personas en la oscuridad, frente al resplandor azul de las pantallas de sus computadoras. Nebula y DNAtix están considerando cómo integrar consejeros genéticos en sus ecosistemas, y Grishin también propuso que los usuarios podrían "decidir" si realmente quieren "saber todo" o si solo quieren ideas "accionables", es decir, cosas que la medicina moderna puede abordar.

Blockchain y grandes farmacéuticas

Se pronostica que las ventas de medicamentos recetados a nivel mundial llegarán a 1,2 billones de dólares para el año 2024. Pero cerrar el circuito de retroalimentación entre los productos farmacéuticos y los millones de personas que toman sus pastillas todos los días todavía enfrenta importantes obstáculos.

El desarrollo de fármacos se basa en la correlación y el seguimiento del ciclo de vida de los ensayos médicos, las pruebas genéticas, los efectos secundarios de las prescripciones y los efectos a más largo plazo relacionados con el estilo de vida; la tokenización puede incentivar a individuos y empresas a compartir datos que se generan a través de múltiples flujos. Como Brama describió:

"Los datos de estilo de vida provienen de wearables, teléfonos inteligentes, hogares inteligentes, ciudades inteligentes, compras, interacciones comerciales, redes sociales, etc. Otro es llevado por todos, y ese es nuestro genoma. El tercero es la información clínica y de estado de salud generada en el sistema de atención médica".

Brama utilizó la analogía de una baraja de cartas para explicar cómo la cadena de bloques podría ser la clave para comenzar a conectar estos datos, al tiempo que protege el anonimato de los propietarios de datos.

Una persona puede tener un número ilimitado de direcciones únicas en su billetera digital. Entrar en una farmacia para comprar un medicamento en particular, por ejemplo, vitamina C, con un código QR, generaría una transacción para una de estas direcciones. Una visita a un médico de familia podría generar un hash adicional para un diagnóstico en su registro médico electrónico (EMR), por ejemplo, una secreción nasal. Esta transacción va entre el cuidador y otra dirección de billetera.

Un usuario puede optar por poner la correlación entre las transacciones para sus diferentes billeteras en la cadena de bloques y hacerla pública para que las personas pujen por los datos subyacentes. O bien, pueden mantener la correlación fuera de la cadena y enviar pruebas solo cuando, por ejemplo, una empresa de seguros o un instituto de investigación anuncia a los usuarios que tienen un conjunto particular de transacciones:

"Tú sostienes la plataforma. Miras las cartas, decides si dices, si no lo dices. Y puede ponerlos sobre la mesa y dejar que todos lo vean, o puede indicar en privado que realmente los tiene. Realmente deja la elección y la implementación a su alcance".

Fronteras biotecnológicas

El profesor Church hizo una analogía que probablemente haga sonar las campanas para cualquier persona conectada al espacio de la cadena de cifrado y blockchain, diciendo que "en este momento, la secuenciación del genoma es como la de Internet a fines de la década de 1980. Estaba allí, pero nadie lo estaba usando".

Blockchain y la vanguardia de la investigación genómica tal vez se hayan acercado más que nunca. Ahora que el ADN en nuestras células se entiende como un almacén de información de por vida, se necesita una tecnología nueva y disruptiva para administrar de forma segura y flexible las redes entrelazadas del código del cuerpo.

El advenimiento de la genómica plantea preguntas que no pueden ser solucionadas solo por la ciencia. Para todos nuestros entrevistados, blockchain podría ser la clave para crear los medios de propiedad y circulación equitativos y transparentes que garantizarían que estas hélices de biomaterial en bruto no se salgan de control.