网站建设 >

查看其它板块

r语言作go富集 r语言faithful数据集

R语言：clusterProfiler进行GO富集分析和Gene_ID转换

ID转换用到的是 bitr() 函数，bitr()的使用方法：

10年积累的成都做网站、网站制作、成都外贸网站建设经验，可以快速应对客户对网站的新想法和需求。提供各种问题对应的解决方案。让选择我们的客户得到更好、更有力的网络服务。我虽然不认识你，你也不认识我。但先网站设计后付款的网站建设流程，更有黟县免费网站建设让你可以放心的选择与我们合作。

org.Hs.eg.db包含有多种gene_name的类型

keytypes() ：keytypes(x)，查看注释包中可以使用的类型

columns() ：类似于keytypes()，针对org.Hs.eg.db两个函数返回值一致

select() ：select(x, keys, columns, keytype, ...) eg.

函数enrichGO()进行GO富集分析，enrichGO()的使用方法：

举例：

「GO富集分析」从原理到实践 ~ 零基础掌握

原本，我并无写这一稿件的想法。主要原因有二：

如果要找合理解释，那么针对第一点，就是每天仍然有大量新接触生信数据分析的朋友；针对第二点，......在前两天我推的文稿《零基础快速完成基因功能注释 / GO / KEGG / PFAM...》中，评论区答应了下，阅读过5000，那就写一写富集分析。于是，如果不写，总是不对。如果要写，只能现在写。毕竟有些事情，现在不做，以后真的不会做。

对于这一块，完全陌生的朋友，尤其是不少生物学背景朋友，有必要温习一下数理统计基础。这一稿件只做原理最简单的但使用最广泛其速度最快的Over-Represence Analysis模式的富集分析讲演。其他模式，不涉及。

回到主题，先举个经典的抽球例子：

小红小绿小蓝三个人自称有超能力，可以用手摸摸球就分辨出黑球白球，于是我们找来黑袋子，放100个球，其中20个白球80个黑球，让三人分别无放回地抽取。

小红随机抽出来10个球，其中2个白球8个黑球，情况即，

抽球中白球比例与背景白球比例完全一致，说明小红抽球结果随机。

球放回去，小绿来抽球，抽出来的10个球，其中3个白球7个黑球，情况即，

这是经典的抽球案例，抽取到的白球个数的概率分布为超几何分布。基于此，我们可以简单计算抽取到比小绿抽取到球个数（或更多即更极端）的概率如何，在 R语言中计算，即

而对于小蓝的情况，那么概率如何？

在 TBtools 中也可以计算，只是写法有点区别

可以看到，尽管这只是一次抽球，小绿抽球中白球比例（或更极端情况）出现的概率是31.88%+，还是挺高的，于是我们有较高的把握说，小绿嘛，只是走了狗屎运。相反，小蓝抽球中白球比例或更极端情况出现的概率几乎为 0 ，我们几乎没啥把握说，小蓝走狗屎运....换句话说，我们有理由相信，或许小蓝真有抽白球的超能力.....

说了这么多，那么跟基因集合富集分析有啥关系？....基因集合功能富集分析。那么我们就需要有一个基因集合（如差异表达基因集合或ChIP-seq的Peaks或GWAS定位的系列区间），还有一个功能标签（如生长素信号转导相关）。于是黑白球案例可以简单调整一下。假定现在这个物种一共有100个基因，其中20个基因与生长素信号转导相关，80个没有注释到与生长素信号转导相关（换句话说，约等于无关），我们做了对植株做了处理，和CK分别测定转录表达谱，通过差异表达分析，鉴定到10个差异表达基因，其中2个与生长素信号转导相关，而另外8个则没注释到生长素信号转导相关，简单画一下，即

好，剩下的两个就不替换了。整体上，ORA模式的富集分析，本身就是经典的抽球案例，感兴趣的自行替换就可以了。

基本原理，相信都搞清楚了。不过还是有两三点需要注意：

具体如何做物种所有基因的背景注释，请参考前述推文《零基础快速完成基因功能注释 / GO / KEGG / PFAM...》。

首先，打开 TBtools GO 富集分析界面

整体如上，一共三个文件：

具体示例如下

点击 Start ，随后等待即可。完成时会有弹窗提示。查看输出文件

（写到这里，突然觉得这些都没啥意思，不知为何....就不详细写了，大伙自己看看列名，猜猜吧）

很多时候，我们会选择，筛选第一列，只看 Biological Process。一般这些与我们的生物学认知会贴近一些。

基因集合功能富集分析，是一个常常被谈起的话题，甚至近期都有不少新方法或算法被提出。感兴趣的朋友可以去了解。这份教程，只与大伙说最简单，但也是使用最为广泛的一种富集分析模式。无论是不是 TBtools 用户，理论上来说，都可以轻松理解并掌握，从原理到实践。

写到一半，其实我已经不想写了。原因非常简单，这也是为什么在我之前，并没有一个人写出来 TBtools 类似的工具。不是写不了，而是不想写。有时候，随着能力增长和知识积累，往往不再愿意做一些简单的事情。或许这还涉及到年龄的增长，角色的转变，责任的变化....云云。

小时候，我以为写 TBtools 玩玩；

后来，我以为我会一直写下去；

现在，，，，，，

【R语言】解决GO富集分析绘图，标签重叠问题

前面我给大家详细介绍过

☞GO简介及GO富集结果解读

☞四种GO富集柱形图、气泡图解读

☞GO富集分析四种风格展示结果—柱形图，气泡图

☞KEGG富集分析—柱形图，气泡图，通路图

☞ DAVID GO和KEGG富集分析及结果可视化

也用视频给大家介绍过

☞ GO和KEGG富集分析视频讲解

最近有粉丝反映说，利用clusterProfiler这个包绘制GO富集分析气泡图和柱形图的时候，发现GO条目的名字都重叠在一起了。

气泡图

柱形图

这个图别说美观了，简直不忍直视。经过我的认真研究，发现跟R版本有关。前面我给大家展示的基本都是R 3.6.3做出来的图。很多粉丝可能用的都是最新版本的R 4.1.2。

我们知道R的版本在不停的更新，相应的R包也在不停的更新。我把绘制气泡图和柱形图相关的函数拿出来认真的研究了一下，终于发现的症结所在。

dotplot这个函数，多了个 label_format 参数

我们来看看这个参数究竟是干什么用的，看看参数说明

label_format :

a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters

原来这个参数默认值是30，当标签的长度大于30个字符就会被折叠，用多行来展示。既然问题找到了，我们就来调节一下这个参数，把他设置成100，让我们的标签可以一行展示。

是不是还是原来的配方，还是熟悉的味道

同样的柱形图，我们也能让他恢复原来的容貌。

关于如何使用R做GO和KEGG富集分析，可参考下文

GO和KEGG富集分析视频讲解

[R语言] GO富集分析可视化 GOplot::GOCircle

查看GOplot内示例数据的格式，对自己的数据做处理

观察结论：

观察自己的两个数据表：

table.legend 设置为T时会显示表格

本图中表格和图例是出图后剪切拼合而成，没有用R中的拼图包

本文题目：r语言作go富集 r语言faithful数据集
网站URL：http://cdkjz.cn/article/ddeeeih.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

网站建设公司 APP定制开发成都主机租用网站建设自贡托管服务器 ncwzjz.com 网站域名重庆外贸网站建设宜宾网站设计普格博源建站

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

r语言作go富集 r语言faithful数据集

R语言：clusterProfiler进行GO富集分析和Gene_ID转换

「GO富集分析」从原理到实践 ~ 零基础掌握

【R语言】解决GO富集分析绘图，标签重叠问题

[R语言] GO富集分析可视化 GOplot::GOCircle

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

r语言作go富集 r语言faithful数据集

R语言：clusterProfiler进行GO富集分析和Gene_ID转换

「GO富集分析」从原理到实践 ~ 零基础掌握

【R语言】解决GO富集分析绘图，标签重叠问题

[R语言] GO富集分析可视化 GOplot::GOCircle

相关资讯

jquery文档,jquery文档就绪函数

sqlserver端出错,sql语句常见错误

go语言可以写什么,go用什么语言写的

nosql和数据库的观点,nosql数据库的缺点

关于vb.netmap的信息

linux命令装软件包,Linux软件包安装

java线程报时代码,线程的代码

易语言怎么添加mysql,易语言怎么添加模块

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接