apc物流,apc物流查询

  

  利用cBioPortal分析并作图   

  

  回顾一下昨天发布的标题:   

  

  《模仿文学》,由PMID cBioportal绘制:28930697,图5。   

  

  图纸很多,但是流程是一样的。   

  

  答:TCGA前列腺癌临时数据集。查询APC、CTNNB1、GALNT10、GRB2、LYN、SIGLEC1、SOS1、ZAP70、FAM84B这9个基因,选择拷贝数变异(CNA)的子集。浏览每个样本中每个基因的变异,并标记无病状态。   

  

  b:有或无上述基因变异的无进展生存期生存曲线。   

  

  c:前列腺癌,MSKCC,癌细胞2010数据集,选择有CNA的子集,查询上述9个基因的变异情况,标记疾病状态。   

  

  d:无进展生存曲线,数据集与c相同。   

  

  e:与图A和b相同的数据集的总体寿命曲线。   

  

  提示:图A、B、E是provisonal的数据,可能有更新,所以做出来的图和发表的文献略有不同,不需要平方。图C和D与正文中的相同。   

  

  步骤   

  

  打开cBioportal的官网:研究项目中的http://www.cbioportal.org/.依次找到前列腺癌,再找到TCGA的暂定数据集:   

  

  低于的基因组数据类型是默认的。然后,案例子集选择具有CNA数据的案例。在基因查询列表中填入标题中的9个基因,自动验证所有名称有效。出现下面的绿色提示后,单击提交查询按钮。   

  

  下面自动弹出的第一个界面,OncoPrint,就是样本中这些基因的变异,差不多就是图a,把鼠标悬停在图和选项卡之间的空白区域,显示其他选项。   

  

  在添加临床追踪的下拉框中,搜索无病状态,输入前几个字母就能找到。检查一下。这样就很方便的在图中添加疾病状态的图片,标注每个样本的“无病”或“复发/进展”状态。   

  

  接下来是文献中的图片,可以下载保存。建议选择PDF或SVG,这是可以放大不失真的矢量格式,容易进入Adobe Illustrator进一步编辑排版。比如文章中的图例和生存数据汇总表的位置和网页上的位置不一样,可能是为了后期排版而调整的。   

  

  在文章中,图A只截取了一段含有基因变异的部分,但实际上是把后面492个样本的信息画了出来。以下图片取自下载的PDF文件,还没完。   

  

  接下来,在顶部选项卡中找到生存,你会在底部看到卡普兰迈耶的生存图。   

  

  在这个页面上,最上面是总体生存的KM图(图E),最下面是无进展生存的图(图B)。如果你要问作者为什么倒排,我也不会(oo)。   

  

  还可以保存svg格式,而png适合网页显示。如果你把它粘贴到一篇文章中,它可能会被烧毁。   

  

  如你所见,这张图和原图有点出入,应该是数据更新了。但是大的结论没有改变。   

  

  接下来,在图C和图D中,只需更改一个数据集,点击网页顶部的修改查询,修改查询条件即可。   

  

  这又回到熟悉的查询界面,   

找到前列腺后,选择MSKCC,Cancer Cell 2010的数据集,同时记得取消刚才的TCGA, Provisional,下边样本子集选择CNA,再次提交查询。

  

接下来的步骤就跟上边一样了。同样,OncoPrint中的图只截取了有变异的一小段,成为图C。

  

后边的Survival找到无进展生存期的图,即图D。

  

这回是用一份已发表的数据,所以做出来应该跟示例文献中的图是一样的。啊~文中两个OncoPrint的图里为啥“无疾病”和“复发/进展”的颜色是反过来的捏?本宝宝也不知道这图经历了什么^(oo)^但是我们新做的图,颜色是一致的,所标的样本疾病状态和下面的基因变异情况,跟文中的是能对应上的。

  

除了这张图之外,这份文献对TCGA的运用还有不少值得学习的地方。比如,那9个基因的筛选也有TCGA的参与,即是用TCGA provisional数据集的485例患者随机拆分成10套n = 300的训练集(training set)和n = 185的测试集(testing set),经过Cox模型筛选得来的。

  

本题作业所用的图,是把筛选好的9个基因放回原来的TCGA provisional整个数据集中进行验证,再用一个独立的外部数据集,即MSKCC, Cancer Cell 2010,再次验证。此外,也在黑色素瘤的TCGA, provisional数据集中得到相似的结果。

  

当然作为一篇5分的文章,还要加上动物实验和作者新收集的临床样本等,感兴趣的同学可以自己看看~

  

明天第三题预告

  

模仿文献,用R语言作箱线图,PMID: 26559812,Fig 1B

  

用RTCGAToolbox包下载结肠癌的mRNAArray的数据,肿瘤类型代号:COAD;版本号:20140115;基因:IL17A。

  

图中所标的P值,其获取方法在本次单元课中未提及,故作业不做要求。

  

有兴趣的小伙伴还可以试试该文补充材料的Fig 1,即同一套数据的RORC基因。

  

相关文章