Amazon Web Services(AWS)近期與加拿大哥倫比亞大學雲端創新中心(UBC CIC)合作,以AWS雲端科技為基礎建構的超級運算平台,助力國際科學團隊在短短11天內蒐集了近600萬份公開可用的生物樣本,成功辨識超過13萬種新型RNA病毒,其中包括9種新型冠狀病毒。若使用一台傳統電腦,需要2000年才能完成。該專案實現了RNA病毒研究的另一創舉,透過辨識並溯源新型病毒,科學家們希望在病毒感染人、動物、農作物和瀕危物種前,能盡早辨識出病毒,幫助防範全球傳染病大爆發。
在AWS的幫助下,UBC CIC團隊和全球計算生物學家發起了The Open Virome(開放病毒專案),並建立Serratus,一個開放性病毒偵測雲端運算平台。目前該研究成果已經發表在科學雜誌《Science》上,同時也創建了公開病毒資料庫,向全球科學界分享研究成果,幫助加速對RNA病毒的研究。
由RNA病毒引起的疾病包含普通感冒、流行性感冒、嚴重急性呼吸道症候群(SARS)、新冠肺炎、C型肝炎、伊波拉病毒、狂犬病、脊髓灰質炎(小兒麻痺症)和麻疹等。由於RNA病毒繁殖和進化速度快,因此更容易感染新的宿主物種。如果基因組學研究人員能夠提前辨識新冠病毒,將徹底改變當前全球疫情的狀況。基於AWS服務所取得的研究成果,徹底改變了生物資訊學的研究方式。在此之前,科學家們經過幾十年的資料分析,只發現了1.5萬種病毒。而在使用AWS的基礎架構和服務後,The Open Virome專案團隊在發現新病毒方面,已為科學界節省了數百萬美元和長達數年的時間。
病毒的辨識和研究需要分析海量的基因定序數據,其中就包括數十萬種未知病毒的DNA和RNA。基因組學的資料量每天都以倍速增長,造成病毒定序資料庫的總量非常龐大,依靠傳統運算方式根本無法對其進行全面分析或處理。計算生物學家兼The Open Virome專案負責人Artem Babaian表示:「未來預防大流行病的關鍵是知識。現今的資料量遠遠超過我們所能處理的能力,我們擁有所需的一切資訊,但卻沒有使用這些資訊的工具。」
The Open Virome專案的研究人員僅用8週的時間,順利地運用AWS的雲端科技建構功能強大的超級運算平台。借助其優異且彈性的運算能力,快速處理數百萬GB的資料,並獲得顯著成本效益。該團隊運用Amazon Simple Storage Service(Amazon S3)中鏡像出病毒基因定序資料庫SRA,而後使用AWS彈性運算雲端執行個體Amazon Elastic Compute Cloud(Amazon EC2)來分析資料集。專案團隊的目標是在處理每個定序資料集支付不到1美分,而在專案完成時全面超越此目標,實際上在處理每個定序資料集支付不到半美分。
在短短11天內,該團隊處理高達570萬個定序資料集,僅花費2.4萬美元,並發現了13萬個新型RNA病毒。奠基於AWS雲端科技打造的Serratus平台,研究人員相信他們既能辨識潛在的有害新病毒,又能提醒科學家注意新冠肺炎病毒SARS-CoV-2 virus的潛在突變成因,幫助改善診斷測試和疫苗開發,為醫療政策決策者提供更有效的指引。
醫療和生命科學產業是AWS的優勢領域之一,透過在基因組學研究中應用雲端運算,讓客戶能將更多時間和資源應用於科學研究,以更快獲得洞察,並加速進行突破性研究和產品上市。AWS強大的運算和機器學習服務確保科學家可以快速執行工作,強大的運算能力且彈性的定價帶來高性價比,同時遍佈全球的基礎設施和統一架構,以及託管超過40個開放的生命科學和基因組資料集,實現在全球展開安全的研究協作。