西安互联网网站搭建公司排名视频网站程序
- 作者: 五速梦信息网
- 时间: 2026年03月21日 07:11
当前位置: 首页 > news >正文
西安互联网网站搭建公司排名,视频网站程序,安阳市建设工程领域网站,校园网站开发的需求和分析摘要 由于教程时间比较久远#xff0c;因此不建议实操#xff0c;仅阅读以了解学习。 在运行基于可能性的系统发育分析之前#xff0c;用户需要决定模型中应包含哪些自由参数#xff1a;是否应该为所有替换假设单一速率#xff08;如序列进化的 Jukes-Cantor 模型#xf… 摘要 由于教程时间比较久远因此不建议实操仅阅读以了解学习。 在运行基于可能性的系统发育分析之前用户需要决定模型中应包含哪些自由参数是否应该为所有替换假设单一速率如序列进化的 Jukes-Cantor 模型或者是否应该允许不同的转换率和颠换率如 HKY 模型。或者是否应该对所有替换使用不同的比率如 GTR 模型四种核苷酸的频率“状态频率”是否应该被估计或假设为全部相等自由模型参数的最佳数量取决于可用数据并且可以根据 Akaike 信息准则AIC等标准进行选择该准则旨在在模型拟合的改进与模型拟合所需的附加参数数量之间取得平衡。 在本教程[1]中我将介绍如何使用软件 PAUP* (Swofford 2003) 选择系统发育分析的替代模型PAUP* 是一种用于各种类型系统发育分析的流行多功能工具。 数据集 本教程中使用的数据是教程多序列比对中为 16s 和 RAG1 序列生成的比对的过滤版本。由于 PAUP* 需要 Nexus 格式的对齐作为输入因此请使用文件 16s_filtered.nex 和 rag1_filtered.nex。 PAUP* 该软件最初开发于 20 世纪 80 年代末是最古老的系统发育分析程序之一尽管它已经存在了很长时间但其作者 Dave Swofford 从未发布过最终版本。尽管在基于可能性的系统发育推断方面PAUP* 在速度方面早已被其他程序超越但它对于它包含的各种其他功能仍然很重要。不久前PAUP* 只能以 100 美元左右的价格从 Sinauer Associates 购买。自 2015 年起Dave Swofford 在他的新 PAUP* 网站上免费分发 PAUP* 4.0 的更新版本作为试用版。这些试用版会在几个月后过期因此如果您将来还想使用 PAUP则可能需要重新下载。这种情况可能只是暂时的因为 PAUP 5 的开发正在进行中该产品将至少部分进行商业分发。 虽然本教程中的描述假设您已安装适用于 Mac OS X 或 Windows 的 PAUP* 图形用户界面 (GUI) 版本但也可以安装 PAUP* 的命令行版本这在 Linux 上是必需的或 Mac OS X Catalina 或更新版本因为这些系统当前不存在 GUI。如果您使用命令行版本您可能需要查找等效命令启动 PAUP* 后始终可以通过 PAUP* 的帮助屏幕来完成此操作只需键入“”即可显示该帮助屏幕。并按 Enter 键。下面的屏幕截图显示了 PAUP* 命令行版本的帮助屏幕。 模型选择和系统发育推断 基于替换模型与序列数据的拟合程度的比较已在多种工具中实现并且最常使用程序 jModelTest 进行。但由于最近在 PAUP* 中实现了自动选择替代模型并且该存储库中的其他教程无论如何都需要安装 PAUP因此我在这里使用 PAUP 而不是 jModelTest 来进行模型选择。实际上两个程序之间的模型选择非常相似。 单击 PAUP* 的“文件”菜单中的“打开…”。确保在打开的窗口底部选择“执行”作为初始模式如下一个屏幕截图所示。选择 Nexus 格式的 16s 序列对齐文件 (16s_filtered.nex)然后单击“打开”。 PAUP* 将给出其对该文件的解释的简短报告包括在比对中发现的物种分类单元和字符的数量。 “自动模型选择”选项可以在 PAUP* 的“分析”菜单中找到。但是当您单击它时您会看到为了运行此模型选择需要系统发育。虽然这可能看起来可能会导致循环推理选择替代模型是最大似然系统发育分析所必需的但也取决于系统发育但这在实践中不是问题因为模型选择的结果并不强烈依赖于正确的系统发育因此任何合理的系统发育都会导致相似的模型选择结果。因此最好的解决方案是使用 Neighbor-Joining 算法运行快速系统发育分析该算法也可以在 PAUP* 中方便地实现。 要从邻接系统发育分析的可用设置中进行选择请单击 PAUP* 的“分析”菜单中的“邻接/UPGMA…”如下面的屏幕截图所示。 在新打开的弹出窗口中保留所有默认选项并单击“确定”PAUP* 命令行版本中的等效命令只是 NJ;。 再次单击“分析”菜单中的“自动模型选择…”。使用邻接生成的树将已被选择用于模型选择弹出窗口现在将为您提供用于此模型选择的多个选项。模型选择的可用标准称为“AIC”、“AICc”、“BIC”和“DT”。这些与似然比检验类似但优点是它们可用于比较非“嵌套”模型如果其中一个模型具有其他模型的所有参数加上附加参数则两个模型是嵌套的。 “AIC”代表“Akaike信息准则”“AICc”是“针对小样本量校正的Akaike信息准则”“BIC”是“贝叶斯信息准则”“DT”是“决策理论”标准。其中最常用的是 Akaike 信息准则。每个模型的 AIC 独立计算为 AIC 2 k −2 log(L)其中 k 是模型中自由参数的数量L 是所有自由参数优化后数据的可能性即最大可能性。通常如果一个模型的 AIC 分数比另一个模型的 AIC 分数好 小至少 4 分则该模型被认为优于另一个模型。设置“AIC”旁边的勾号但删除“AICc”、“BIC”和“DT”旁边的勾号。另请选择“应用选择模型的设置”右侧的“AIC”。作为“模型集”选择数字“3”。这意味着将测试具有相等替代率的模型例如 Jukes-Cantor 模型、具有单独的转换和颠换替代率的模型例如 HKY 模型以及具有六个独立替代率的模型GTR 模型。保留“等速率”和“gamma”旁边的勾号允许站点间速率变化的伽玛分布但删除“invar.sites”和“两者”的勾号。我建议这样做因为不变位点比例“I”和位点间速率变化“G”的参数很混乱因为对一组位点应用特别低的速率几乎具有相同的效果。考虑到这些站点的效果完全不变。保留“显示每个模型的输出”旁边的勾号并设置“显示每个模型的参数估计”旁边的勾号。确保设置面板如下面的屏幕截图所示然后单击“确定”。 PAUP* 将在三个表中报告模型选择的输出。在第一个部分在“评估树 1 的模型”下您将看到已比较的 12 个模型的列表如下所示“JC”代表 Jukes-Cantor 模型。 在同一个表的第 4 列和第 5 列中您将看到 k即模型中自由参数的数量。第 4 列列出了与最简单模型相比额外的自由参数的数量第 5 列列出了自由参数的总数。第二个表列出了每个模型的参数估计值。每个型号的编号和名称后面有九列数字。最后第三个表再次列出了模型但这次是按 AIC 分数排名。 重复替换模型与 RAG1 序列比对 (rag1_filtered.nex) 的比较。 动动您发财的小手点个赞吧 Reference [1] Source: https://github.com/mmatschiner/tutorials/blob/master/substitution_model_selection/README.md 本文由 mdnice 多平台发布
相关文章
-
西安国内做网站的公司有哪些1m的带宽做网站可以吗
西安国内做网站的公司有哪些1m的带宽做网站可以吗
- 技术栈
- 2026年03月21日
-
西安工程建设信息网站长沙百度关键词优化
西安工程建设信息网站长沙百度关键词优化
- 技术栈
- 2026年03月21日
-
西安给大学做网站公司企业网站模板psd
西安给大学做网站公司企业网站模板psd
- 技术栈
- 2026年03月21日
-
西安建百度网站的公司ppt设计工具怎么调出来
西安建百度网站的公司ppt设计工具怎么调出来
- 技术栈
- 2026年03月21日
-
西安建设工程信息网怎么看优化公司
西安建设工程信息网怎么看优化公司
- 技术栈
- 2026年03月21日
-
西安建设规划局网站WordPress是静态的吗
西安建设规划局网站WordPress是静态的吗
- 技术栈
- 2026年03月21日
