Hibayes
高效贝叶斯基因组选择工具,支持多种贝叶斯模型和大规模数据分析
1
2
3
4
数据输入
拖放基因型文件或点击上传
支持 PLINK (.bed/.bim/.fam), VCF, CSV 等格式拖放表型文件或点击上传
包含个体ID和表型值的文本文件拖放协变量文件或点击上传
如环境因子(温度、湿度)、田间区组、处理方式等,需与个体ID对应,文本格式(.txt/.csv)。模型参数
BayesB 模型简介:
- 智能筛选少数重要的基因标记,大部分标记效应为零
- 每个有效标记都有独立的效应方差,精确建模
- 通过 pi 参数控制有效标记的比例
- 特别适合少数大效应基因控制的性状
pi 值越大,模型选择的有效标记越少
基因组窗口大小影响效应定位精度
拖放SNP注释文件或点击上传
包含SNP位置信息的文本文件
标准精度:迭代20,000次,预热10,000次,采样间隔10次,平衡速度和准确性
根据计算机性能选择
进度输出频率
交叉验证
关于 bayesa
Hibayes 是一个高效的贝叶斯基因组选择R包,专门用于大规模SNP数据的基因组预测分析。
- 支持多种贝叶斯模型 (BayesA/B/C/R/L)
- 高效的MCMC算法实现
- 并行计算加速
- 基因组窗口分析
- 交叉验证预测精度
数据格式
用户需上传的数据:
- 基因型数据文件(M):支持 PLINK (.bed/.bim/.fam)、VCF (.vcf/.vcf.gz)、数值矩阵 (0/1/2编码) 格式,需包含所有分析个体的SNP信息。
- 表型数据文件(data):需包含个体ID和表型值,支持多性状,文本格式(.txt/.csv),第一列为个体ID,第二列及以后为性状值。
- 协变量/固定效应文件(可选):如环境因子(温度、湿度)、田间区组、处理方式等,需与个体ID对应,文本格式(.txt/.csv)。
- SNP注释文件(map,可选):如需窗口分析,需包含SNP位置信息,文本格式(.txt/.csv)。
基因型数据:
- PLINK格式 (.bed/.bim/.fam)
- VCF格式 (.vcf/.vcf.gz)
- 数值矩阵 (0/1/2编码)
表型数据:
- 制表符或逗号分隔
- 第一列:个体ID
- 第二列:表型值
资源估算
1万个体 × 5万标记:
~2GB 内存
2万迭代 × 4线程:
~10分钟
输出文件大小:
~100MB