Terapötikler için etkili mRNA dizileri tasarlamak zorlu bir görev olmaya devam etmektedir. Protein tasarımındaki başarılardan ilham alan dil modelleri (LM’ler) artık RNA’ya da uygulanıyor, ancak kapsamlı eğitim verilerinin eksikliği ilerlemeyi genellikle engelliyor. Mevcut modeller genellikle UTR veya CDS bölgeleriyle sınırlı olduğundan, tam mRNA dizileri için uygulamaları kısıtlanıyor. Mevcut en büyük mRNA veri kümesi üzerinde önceden eğitilmiş, sağlam ve hepsi bir arada bir mRNA tasarımcısı olan mRNABERT’i tanıtıyoruz. Performansı artırmak için, protein dizilerinden gelen anlamsal bilgileri entegre etmek üzere çapraz-modaliteli karşılaştırmalı bir öğrenme çerçevesine sahip ikili bir belirteçleme şeması öneriyoruz. Kapsamlı bir kıyaslamada, mRNABERT, 5′ UTR ve CDS tasarımı, RNA bağlayıcı protein (RBP) bölgesi tahmini ve tam uzunlukta mRNA özelliği tahmini görevlerinin çoğunda önceki modellerden daha iyi performans göstererek en son teknolojiyi göstermektedir. Ayrıca, çeşitli ilgili görevlerde büyük protein modellerini de geride bırakmaktadır. Sonuç olarak, mRNABERT’in bu çeşitli görevlerdeki üstün performansı, mRNA araştırmaları ve terapötik geliştirme alanında önemli bir sıçramayı göstermektedir.
Daha fazlasını okumRNABERT: Evrensel bir dil modeli ve kapsamlı veri setiyle mRNA dizi tasarımını ilerletmek












