NAvegue pelos canais

Basecamp Research lança Trillion Gene Atlas para ampliar terapias desenvolvidas por IA

AGÊNCIA DE COMUNICAÇÃO Conteúdo de responsabilidade da empresa 19 de março de 2026

  • O Atlas expandirá a diversidade genética evolutiva conhecida em 100 vezes, coletando dados genômicos inovadores de mais de 100 milhões de novas espécies em milhares de locais em todo o mundo.
  • Ao fazer parceria com Anthropic, Ultima Genomics e PacBio, e alimentada pela infraestrutura de IA da NVIDIA, a Basecamp Research pretende condensar mais de duas décadas de coleta e análise de dados biológicos em menos de dois anos.
  • O treinamento dos modelos EDEN revelou novas leis de escalonamento: à medida que os conjuntos de dados biológicos crescem e enriquecem, as capacidades de IA aumentam – abrindo portas para sistemas que podem projetar novos medicamentos para diferentes doenças e tipos de tratamento.

AUSTIN, Texas e SAN JOSE, Califórnia, 19 de março de 2026 /PRNewswire/ — Basecamp Research, um laboratório de ponta em IA para projetos biológicos, anunciou hoje o lançamento do Trillion Gene Atlas, uma iniciativa científica histórica para gerar e modelar dados biológicos na escala de um trilhão de genes. Lançado em colaboração com Anthropic, Ultima Genomics e PacBio, e alimentado pela infraestrutura de IA da NVIDIA, o Trillion Gene Atlas visa expandir a diversidade genética evolutiva conhecida por 100 vezes, coletando dados genômicos de mais de 100 milhões de espécies em milhares de locais em todo o mundo.

Isso é possível graças à crescente rede de parceiros globais de biodiversidade da Basecamp Research. Seu objetivo final é fornecer os vastos e diversos dados de treinamento necessários para que os sistemas de IA aprendam com a evolução e projetem novos medicamentos sob demanda.

“Os modelos de IA biológica de hoje são treinados em um segmento estreito da vida na Terra”, disse Glen Gowers, cofundador e CEO da Basecamp Research, falando no SXSW em Austin. “O Trillion Gene Atlas expande o universo genético conhecido em ordens de magnitude além do que está nas bases de dados públicas. Treinar modelos nessa escala estabelecem um novo paradigma para o design terapêutico programável.”

A iniciativa, que está na escala do Projeto Genoma Humano, foi revelada durante a Health Track no SXSW e a conferência NVIDIA GTC em San Jose.

Abordagem do Gargalo de Dados Biológicos

Com enormes aumentos no tamanho do modelo e no poder computacional, dados diversos são um facilitador crítico para o progresso no desenvolvimento de medicamentos com IA e nos benchmarks do mundo real. Todos os modelos atuais de fundação baseados em sequência dependem de variantes dos mesmos repositórios públicos, com 80% deles treinados em um banco de dados público contendo menos de 250 milhões de sequências.

Os modelos da fundação EDEN da Basecamp Research, lançados em janeiro, contornam o “data wall” evolutivo do setor, treinando inteiramente com o BaseData(TM), um banco de dados genômico proprietário que atualmente é mais de 10 vezes maior do que todos os recursos públicos somados. Ao aprender com um número sem precedentes de 10 bilhões de genes novos para a ciência em 1 milhão de espécies recém-descobertas, a EDEN desbloqueou leis críticas de escalonamento para IA na biologia.

Essa enorme expansão na diversidade de conjuntos de dados levou o EDEN além da simples previsão, tornando-o o primeiro modelo capaz de projetar terapias diversas diretamente a partir de um prompt para doença. Na validação em laboratório úmido, o EDEN demonstrou atividade zero-shot em células T humanas primárias, sem necessidade de dados humanos ou clínicos. O modelo gerou com sucesso resultados em múltiplas modalidades de fronteira, notadamente sendo pioneiro na Inserção Genética Programável por IA (aiPGI) para inserir genes saudáveis e no design de peptídeos antimicrobianos direcionados com taxa de acerto de 97% contra patógenos prioritários.

O Trillion Gene Atlas se baseia nessa abordagem, expandindo consideravelmente a amplitude e a profundidade contextual dos dados genômicos na conhecida “internet da biologia” adequada para o treinamento em IA.

“Modelos maiores por si só não são suficientes”, acrescentou Phil Lorenz, diretor de tecnologia da Basecamp Research. “EDEN mostrou que o desempenho em IA biológica segue trajetórias de escala muito mais acentuadas com dados de maior qualidade e totalmente contextualizados. O Trillion Gene Atlas estende esse princípio 100 vezes.”

Parcerias Globais de Biodiversidade

Nos últimos seis anos, a Basecamp Research construiu uma rede de colaboradores científicos em 31 países, estabelecendo um pipeline de genômica evolutiva escalável criado especificamente para o treinamento em IA. Ao ser pioneira em uma combinação de novas estruturas regulatórias e econômicas e tecnologias de sequenciamento de DNA totalmente fora da rede, a empresa coleta dados genômicos de alta qualidade de ecossistemas fora do alcance dos laboratórios tradicionais.

Essas parcerias são baseadas na troca de conhecimento, capacitação local e acordos equitativos de Acesso e Compartilhamento de Benefícios alinhados com os regulamentos emergentes de Informações de Sequência Digital. Essa estrutura permite a coleta de dados genômicos responsável, em grande escala e de alta qualidade, ao mesmo tempo em que investe em infraestrutura científica e treinamento nas regiões parceiras.

Como parte do lançamento do Atlas, a Basecamp está anunciando novas parcerias no Chile e na Argentina e uma colaboração expandida na Antártida, ampliando ainda mais sua rede global de biodiversidade.

Dimensionando a geração e a computação de dados com Ultima Genomics, PacBio e NVIDIA

O Trillion Gene Atlas é possibilitado por avanços no sequenciamento de leitura curta e longa de ultra-alta produtividade e computação acelerada. A Basecamp fez uma parceria com a Ultima Genomics e a PacBio para fornecer sequenciamento em escala industrial, incluindo leituras longas ricas em dados e de alta precisão.

A Ultima é uma desenvolvedora de sistemas de sequenciamento de próxima geração (NGS) de rendimento ultra-alto. O mais recente sistema de sequenciamento da Ultima, a Série UG200, avança a arquitetura exclusiva de sequenciamento baseada em wafer da empresa para permitir o sequenciamento de alto rendimento, genoma completo e multiômica em escala industrial a um preço baixo para permitir iniciativas como o Trillion Atlas.

“A biologia tem sido fundamentalmente carente de dados quando comparada a outros campos, como linguagem ou visão computacional, já que os pesquisadores não têm as ferramentas necessárias para gerar dados em escala”, declarou Gilad Almogy, fundador e CEO da Ultima Genomics. “Acreditamos firmemente que a IA terá um impacto imenso em nossa compreensão da biologia e da saúde humana, e a Série UG200 foi projetada desde o início para permitir que os enormes conjuntos de dados necessários para a BioAI cumpram essa promessa. Estamos entusiasmados que nossa tecnologia possa permitir que a Basecamp tenha sua visão e avance em iniciativas inovadoras como o Trillion Gene Atlas.”

“O sequenciamento PacBio HiFi oferece leituras longas altamente precisas que preservam o contexto genômico completo e permitem a resolução de subespécies e até mesmo de nível de cepa em amostras complexas”, afirmou Christian Henry, presidente e CEO da PacBio. “Os dados HiFi fornecem a base confiável e rica em informações que os modelos biológicos de IA precisam para aprender com a natureza em escala e iniciativas de energia como o Trillion Gene Atlas.”

O Trillion Gene Atlas será alimentado pela infraestrutura de computação acelerada da NVIDIA para processar grandes quantidades de dados genéticos em escala de petabase. Como parte desse esforço, a Basecamp planeja alavancar a NVIDIA Parabricks para acelerar significativamente a montagem metagenômica. Essa colaboração se concentra na engenharia avançada e no desenvolvimento de novos métodos algorítmicos para otimizar a forma como as amostras ambientais complexas são reconstruídas. Graças a essa aceleração, se espera que o processamento de quatrilhões de pares de bases de DNA, uma tarefa que antes levaria mais de 20 anos, leve menos de dois anos para ser concluída.

Por meio de processamento de dados em paralelo, anotação automatizada e treinamento de modelo em grande escala, os parceiros esperam compactar uma tarefa que anteriormente exigiria mais de 20 anos de tempo de processamento para menos de dois anos. Esta compressão de sequenciamento, montagem, anotação e treinamento de modelo destina-se a expandir o desempenho e o escopo dos modelos de base biológica em todo o desenvolvimento terapêutico.

Criando um Fluxo de Trabalho de Design Terapêutico Agêntico de Ponta a Ponta

A Anthropic se junta como parte de seu esforço mais amplo para adicionar novas capacidades para as ciências da vida: conectando Claude a plataformas mais científicas. Trabalhando com a equipe Claude for Life Sciences, o objetivo é aproveitar o Trillion Gene Atlas e o EDEN para tornar Claude um parceiro de pesquisa ainda mais produtivo para cientistas e clínicos e apoiar organizações que tragam novos avanços científicos ao público.

Ao combinar as capacidades avançadas de raciocínio de Claude, os recursos de design terapêutico da EDEN e as Bibliotecas CUDA-X da NVIDIA para processar dados não estruturados, a iniciativa visa criar um fluxo de trabalho integrado para interpretar dados clínicos complexos e traduzi-los diretamente em design terapêutico.

O Trillion Gene Atlas é construído em três pilares: sequenciamento de DNA em grande escala, parcerias globais de fornecimento de dados e computação avançada. Juntamente com sistemas de IA capazes de raciocinar sobre dados complexos, essas bases podem ajudar a transformar vastos conjuntos de dados em descobertas terapêuticas. Ao aumentar os dados evolutivos disponíveis para a IA em mais 100 vezes, a Basecamp Research visa tornar o projeto de medicamentos mais rápido e sistemático – ampliando os avanços anteriores da EDEN em campos como a terapia genética e a luta contra bactérias resistentes a antibióticos.

Cision View original content:https://www.prnewswire.com/br/comunicados-para-a-imprensa/basecamp-research-lanca-trillion-gene-atlas-para-ampliar-terapias-desenvolvidas-por-ia-302719445.html

FONTE Basecamp Research

Tópicos Relacionados: Novos Produtos/Serviços, Médico / Farmacêutico, Saúde/Hospitais, Análise de Dados, Biotecnologia, Computador/Eletrônica, Expansão Corporativa

A OESP não é(são) responsável(is) por erros, incorreções, atrasos ou quaisquer decisões tomadas por seus clientes com base nos Conteúdos ora disponibilizados, bem como tais Conteúdos não representam a opinião da OESP e são de inteira responsabilidade da PR Newswire Ltda

Encontrou algum erro? Entre em contato

Compartilhe