制作:张敖 https://datahold.cn
张学才,CIMMYT,指导
瞿静涛,四川农业大学,算法思路
给定一个有基因型的自交系,在众多自交系中找到最接近的可能亲本,推测血缘。亲本可以设置为1个2个或3个,由于计算量巨大,不建议设置为超过3个。用两种算法实现,第一种速度较快,但是会有遗漏;第二种速度可能会很慢,数据量大时可能无法运行。
HMP文件即可,需要将基因型调整到第12列,也就是数据列的第1列。
【2020-08-17】
增加国内线路。
【2020-05-06】
完成功能,由于之前的一版由于电脑重做而丢失,重新写了一版。
多之前的算法思路有所改进。
复制下面代码,然后在R Studio中运行。第二行和第三行可以修改参数。
海外:
x
rm(list=ls())
method <- "full" # "fast" or "full"
parents <- 3 # 2 or 3
source("https://aozhangchina.github.io/R/guessParents/guessParents.r") # 加载程序文件,需要联网
国内:
x
rm(list=ls())
method <- "full" # "fast" or "full"
parents <- 3 # 2 or 3
source("https://dataholdcn.cn/R/guessParents/guessParents.r") # 加载程序文件,需要联网