|
|
| |
Golden Helix  |
|
Golden Helix是全基因組分析領域裡功能最完備的軟體,舉凡GWAS study, Haplotype study, CNV分析,家族疾病關聯性分析,eQTL分析,NGS(高通量基因定序)的tertiary分析等,都是Golden Helix的強項;全世界生物醫學界的著名研究機構與藥廠都具備Golden Helix,目前已有三百多篇著名期刊引用,數目仍不停的增加當中,因為它有如下不可取代的優點 |
|
| 1. |
簡易的即時編輯介面(Real time editing):
讓你輕鬆處理基因組分析裡的各種不同資料形態,無論是哪一種平台所產出的資料,都能簡易編輯。 |
| 2. |
有強大的QC功能:
在全基因組的分析裡,無論是GWAS的SNP或HAPLOTYPE分析,CNV的分析,都有完善的QC步驟,例如性別確認,隱藏性關聯分析(IBD),主成分分析(PCA),Wave detection等。
|
| 3. |
有完善的基本統計模型與進階演算法:
例如顯/隱性模型,線性與邏吉式回歸,Step wise regression等基礎的統計工具,與ROH (Runs of homozygosity:用於家族性關聯分析),CMC, KBAT (NGS data裡的collapsing method)等進階的演算模型,都已內建在Golden Helix裡。 |
| 4. |
完整的database建置:
各種public domain的Annotation track與Marker map都轉換成Golden Helix特殊的檔案形式,定期更新,方便使用者註解與搜尋。 |
| 5. |
特殊的NGS模組:
分為過濾與關聯分析兩大部分,前者適用於小數目的NGS data,有快速強大的population與functional based的篩選功能,讓使用從大量的NGS data裡快速得到可能的致病rare variant;另外進階的collapsing method,可以處理大數目的NGS data,進行大數量的NGS data裡罕見變異(rare variant)與疾病的關聯分析。 |
| 6. |
友善的視覺呈現(User friendly visualization):
可以完美呈現各種分析後的圖象,且能在圖象上對database進行即時連結,輕鬆在圖象上註解,著色。 |
| 7. |
採用GPU技術:
使CNV分析裡特殊的univariate 與multivariate分割演算法, ,運算速度加快好幾倍。 |
| 8. |
可外掛Python程式:
方便擴充。 |
|
| |
| Golden Helix有六個模組,其功能與特性茲分述如下 |
| 1. |
Helixtree:
可用來作單點的(SNPs)與多點的(Haplotype)的遺傳關聯性分析,表現型的預測因子可以是二元的(Cases/Controls)與數量性狀的(Quantitative),豐富的質量驗證(QC)功能,包含性別確認(Gender check),親屬關聯程度確認(Identity by descent),族群分層(Population stratification)及主成分分析(PCA)等,並有容易操作與整合的視覺化界面。 |
| 2. |
Whole genome:
全基因組的關連性分析模組,此模組運用特殊的壓縮方式更有效率的儲存SNP的數據,提升了分析的速度與效率,整合的基因組瀏覽器提供優質的視覺,環境與基因註解方面,可以快速連結至各種public domain 的database,這些databse有以族群為基礎的(如1000 Genome project)與以功能性為基礎的(如SIFT),使用者能夠快速瀏覽感興趣的基因或區域,並連上相關資料庫作進一步比對,多處理器支持也使的此模組能夠更快速的進行計算密集
的計算,此模組亦包含了Runs of Homozygosity(ROH)分析。 |
| 3. |
PBAT:
此模組包含以家族為主的質量驗證與SNP和CNV的分析,並有多種演算法,如Rapid extended pedigree algorithm等,可以運算變異位點與家族性遺傳疾病的關聯分析。 |
| 4. |
CNAM:
Copy number的變異分析模組,可以處理多種供應商(Illumina,Affy,Agilent等)的數據,與極佳的主成分分析與視覺界面進行質量驗證,此模組並有強大的最優化分割(Segmentation)演算法,包含單一樣本(Univariate)與多樣本(Multivariate)的分割法,前者可幫助研究者找到大片段且少數人才有的Copy number變異,後者則可以找到小片段且多數人都有的Copy number變異,使用GPU可使此模組的運算速度增加數倍以上。 |
| 5. |
Regression:
包含線性與羅吉斯迴歸分析,逐步回歸分析,完整/簡化模型,多重測試校正等功能。 |
| 6. |
NGS sequencing:
具有處理NGS(Next generation sequencing)Tertiary分析功能,在獲得VCF(Variant call format)後,運用靈活的過濾功能連結到數個資料庫來獲取所謂的罕見變異(Rare variant)區段。並輔以強大的演算法,如CMC,KBMC做罕見變異(Rare variant)的關聯性分析,供做罕見變異與人類疾病相關研究。 |
|
| |
Module Selection Guide
|
|
|
|
|
|
|
|
|
|
|
|
|
| Data Management |
● |
|
|
|
|
|
| SNP Analysis |
● |
|
|
┿ |
|
|
| LD & Haplotype Analysis |
● |
|
|
┿ |
|
|
| Runs of Homozygosity |
● |
|
● |
┿ |
|
|
| Genome-Wide Association |
● |
|
● |
┿ |
|
|
| Genome Browser |
● |
|
● |
|
|
|
| Copy Number Analysis |
● |
● |
┿ |
┿ |
|
|
| Family-Based Analysis |
● |
|
|
|
● |
|
| Next-Generation Sequencing Analysis |
● |
|
● |
|
|
● |
|
|
|
|
 |
|
|