Günümüzde, ciddi hastalıklar söz konusu olduğunda risk faktörlerinin bulunabilmesi amacıyla genom biliminin gücünden yararlanmak için çok sayıda genomu analiz etmek gerekiyor. Son derece maliyetli ve zaman alıcı bu yöntemi basitleştirmek isteyen Johns Hopkins Üniversitesi araştırmacıları, dünyanın en büyük genomik veri tabanlarından birine kolay erişim sağlayan bulut tabanlı bir platform oluşturmayı başardı.
Mevcut durumda, araştırmacıların genomik analiz yapabilmesi için merkezi depolardan kendi veri merkezlerine büyük miktarlarda veri indirmesi gerekiyor. Bu işleyiş ise süreci, araştırmacılar için zahmetli ve, verimsiz aynı zamanda oldukça pahalı bir hale getirirken ayrıca, diğer kurumlardaki araştırmacılarla iş birliğini de zorlaştırıyor. Genomik araştırmalardaki bu sorunu aşabilmek için Johns Hopkins Üniversitesi’nden bilim insanları, dünyanın en büyük genomik veri tabanlarından birine kolay erişim sağlayan bulut tabanlı bir platform oluşturdu. Genomik Veri Bilimi Analizi, Görselleştirme ve Bilişim Laboratuvarı (AnVIL) olarak bilinen yeni platform, internet bağlantısı olan herhangi bir araştırmacının binlerce analiz aracına, hasta kaydına ve 300 binden fazla genoma erişimine imkan sunuyor. Dünyanın her yerinden araştırmacılar; şu anda platformu otizm spektrum bozuklukları, kardiyovasküler hastalık ve epilepsi dahil olmak üzere çeşitli genetik hastalıkları incelemek için kullanıyor.
Hedef, araştırmacılara eşitlik sağlamak
Johns Hopkins’ten Profesör Michael Schatz, yeni platformun genomik veri paylaşımı modelini tersine çevirdiğini söyleyerek “AnVIL, heyecan verici yeni keşifler sağlamayı vadediyor ve bilim için benzeri görülmemiş yeni fırsatlar sunuyor. Her büyüklükteki kurum için, özellikle de kendi veri merkezlerini inşa edecek kaynaklara sahip olmayan küçük kurumlar için dönüştürücü olacağını düşündüğümüz bu yeni platformda hedefimiz, umudumuz tüm çalışmalar yapan kişilere eşit şartlar sunmak, böylece her araştırmacı keşif yapabilmek için eşit erişime sahip olabilecek” diyor.
Prof. Schatz’ın verdiği bilgilere göre kanser veya kardiyovasküler hastalıklar gibi rahatsızlıklar için genetik risk faktörleri genellikle hemen göze çarpmıyor, bu nedenle de araştırmacıların yeni ilişkileri keşfetmek için binlerce hastanın genomunu analiz etmesi gerekiyor. Tek bir insan genomu için ham veri yaklaşık 40 GB boyutlarında,dolayısıyla binlerce genomun indirilmes birkaç hafta sürebiliyor.
Bütün bunlara ek olarak, birçok çalışma birden fazla kurumdan toplanan verilerin entegre edilmesini gerektiriyor, bu durum ise her kurumun kendi kopyasını indirmesi ve hasta veri güvenliğinin sağlanması gerektiği anlamına geliyor. Araştırmacılar, aynı anda milyonlarca genomun analizini gerektiren daha büyük çalışmalara başladıkça, bu zorluğun gelecekte daha da büyüyeceğini öngörüyor.
Buluttaki verilere kolaylıkla ulaşılıyor
Prof. Schatz’e göre AnVIL’e uzaktan bağlanmak, bu büyük çaplı veri indirmelerine olan ihtiyacı ortadan kaldıracak. “Veriler, araştırmacılara zahmetli bir şekilde ulaştırmak yerine, araştırmacıların buluttaki verilere kolaylıkla erişimine izin veriyoruz. Ayrıca, verilerin genomlar arasında yeni ilişkiler bulabilmesi için yeni yollarla bağlanabilmesi gerekiyor. Bunun için de veri kümelerinin paylaşımını çok daha kolay hale getiriyoruz” diyen Prof. Schatz, birçok bilgi işlem uygulamasını da basitleştirdiklerini vurguluyor.
Kaynak: https://www.sciencedaily.com/releases/2022/01/220112145118.htm