TCGA癌症临床数据资源全面介绍---癌症数据分析领域的全谱!

2021-11-29 01:48 来源:上海妇科医院

2006年,大肠肿肿测序示意图谱(The Cancer Genome Atlas, TCGA)计划以多形亦然续性胶质母细胞内肿(GBM)、大肠柱状细胞内肿肿(LUSC)和输卵管浓缩亦然续性囊腺肿肿(OV)开始为期3年的试点重大项目,2009年~2015年取而代之一轮展开。到重大项目截止,TCGA互联分析管理工作者已再现了33种大肠肿肿一般来说10,000余同上伤寒人的分子会形态,并表述了很多分子会流感病毒。TCGA都有的伤寒理最重要形态代注记小党化的统计数据搜罗。为维护确实适用这些越来越有测序形态的海量伤寒理统计数据,最近TCGA尚未完成一批重大成果,发注记在CellPress大中华区的学术期刊。

本文对4年底5日发注记Cell上的一文同步进行转译。文章阐述以OS(总肉食动物期)、PFI(无重大突破等长)、DFI(无伤寒等长)和DSS(哮喘实际存活)为四个主要伤寒理结果终点站的TCGA小党大肠肿肿伤寒理统计数据资源(TCGA-CDR)常规化统计检索,并忽略到了每种大肠肿肿一般来说的终点站适用建言。TCGA伤寒理统计数据可从测序统计数据共享空间(GDC)门户网站iTunes,所有的分子会统计数据在iTunes。伤寒理统计数据和分子会统计数据适用举例来说的条码结构,便于伤寒人的伤寒理资料和比对分子会统计数据导入。

TCGA小党肿肿统计检索字段形态

示意图1A为伤寒理统计数据导入和分析方法方法及4个主要伤寒理终点站引申和风险评估的流程示意图,对33份初始登记和97份后续统计数据文件,共33种大肠肿肿一般来说111,60同上大肠肿肿伤寒人的资料同步进行了执行。注记1为每个TCGA字段的基本形态。按原发比对根据分子会形态选入每个字段,皮肤上黑色素肿(SKCM)的原发和移往冶两种一般来说都有,其它极少数的原发与移往一般来说也有分析。

示意图1. 伤寒理统计数据导入和分析方法方法及4个主要伤寒理终点站引申和风险评估流程示意图

注记1. TCGA 小党肿肿字段形态

伤寒理结果终点站OS、PFI、DFI和DSS

总肉食动物期(OS)很举足轻重,好处是表述OS惨案时模糊亦然续性最较高。但适用OS作终点站似乎削弱伤寒理分析,因为非肿肿疑点不一定能反映出生物学学、侵扰亦然续性或对用药缓和。适用OS或必需越来越长的随访间隔时间;很多伤寒理试验中都,通常采用相对于随访间隔时间较短的DFI或PFI。针对原有TCGA伤寒理统计数据,要体认到短时伤寒理随访等长在侵扰亦然续性大肠肿肿一般来说结果的举足轻重亦然续性,因为似乎几年内就通过观察到伤寒理惨案,在丧命此前已浮现伤寒情住院或重大突破。对侵扰亦然续性要强的大肠肿肿一般来说,伤寒人在数十乃至几十年后住院,随访后曾似乎无法通过观察有限惨案以支亦然准确结果供推断。该分析方法的目的是检查TCGA小党肿肿伤寒理检测的相对于竞争者和不足,个人兴趣今后的分析方法和避免随访等长间隔时间不足等缺陷。

分析方法全部TCGA伤寒理统计数据后,结论如下:在统计数据可授予时,OS、PFI及DFI相对于精确,但大多才会只能估计值DSS。示意图1B为33种相异大肠肿肿一般来说的OS K-M曲率。尽管肉食动物分析方法不是TCGA主要目标,大多大肠肿肿一般来说肉食动物曲率与即使如此风险评估相异肉食动物终点站的统一分析基本相异,GBM、OV(2008, 2011)和较高级别胶质肿(LGG)(2015)的TCGA结果就是比较好同上证。PFI、DFI和DSS的K-M曲率见示意图1C–1E。

示意图1 B-E伤寒理统计数据分析方法

基于每种大肠肿肿一般来说4个终点站的通过观察间隔时间近似值平均随访间隔时间及惨案或检查的中都位间隔时间(注记2)。所有的中都位随访间隔时间为22.1个年底,但相异一般来说大肠肿肿该间隔时间区别极大;GBM和急亦然续性髓系白血伤寒(LAML)最短有约12个年底,而大肠嫌色细胞内肿肿(KICH)三长有约48个年底。

注记2 总体中都位随访间隔时间及4个终点站的惨案与通过观察中都位间隔时间

自荐适用的伤寒理结果终点站

伤寒理结果终点站为了让取决于分析目标、惨案为数、字段大小和结果统计数据准确性。将这些方法和技术开发的其它方法作为对单个哮喘统计检索的检验和补充检查,忽略到在每种哮喘一般来说中都适用每个结果终点站的建言及缘故(注记3)。每种大肠肿肿一般来说的肉食动物终点站必必需大概通过一个主要检验和补充检查才被接受。33种肿肿中都的13种适用全部4个终点站:膀胱尿路上皮肿肿(BLCA)、宫颈柱状细胞内肿肿(CESC)、结肠肿肿(COAD)、食管肿肿(ESCA)、头颈部柱状细胞内肿肿(HNSC)、大肠状细胞内肿肿(KIRP)、大肠腺肿肿(LUAD)、LUSC、OV、胰腺肿肿(PAAD)、肉肿(SARC)、大肠腺肿肿(STAD)和乳房内膜肿肿(UCEC)。相反,很难一个终点站的有嗜铬细胞内肿和副骨骼肌肿(PCPG)。肺部弥漫大B细胞内肺部肿(DLBC)、LAML和胸腺肿(THYM)只能一个终点站;全数大肠肿肿一般来说2或3个终点站,但其中都一些亦然论调。最准确的是PFI,可无保留地自荐给除LAML(无统计数据)、DLBC和KICH(果断适用)和PCPG(不自荐)以外的4种。

注记3 终点站OS,PFI,DFI及DSS的风险评估与自荐适用

检验TCGA-CDR及案同上运用于

在白血伤寒分析中都,雌激素ER阴亦然续性伤寒人伤寒理肉食动物期病状比ER+伤寒人一比。分别用OS、PFI、DFI和DSS较为这两类伤寒人的肉食动物期(示意图3A–3D;曲率截止于10年随访间隔时间,但适用整个统计检索同步进行分析方法)。单考量分析方法看出,适用PFI(p= 0.005)和DFI(p = 0.001)作为伤寒理终点站,TCGA中都ER+白血伤寒伤寒人比ER-伤寒人有越来越多的肉食动物期,但适用OS时两类伤寒人间不缺少于区别(p = 0.097) 。此以外,两类伤寒人的DSS(p = 0.009)有明显区别,注记明DSS的潜在价系数。以上挖掘出证实了PFI和DFI是特定一般来说白血伤寒分子会分析的适宜终点站。

示意图3 检验和运用于实同上

此以外还检验了侵扰亦然续性GBM肉食动物结果终点站。TCGA中都GBM中都位OS为12.6个年底,介于此此前华盛顿邮报的常规用药的12.1个年底和常规用药联合替莫唑胺的14.6个年底两者之间。中都位PFI是6.1个年底,介于此此前华盛顿邮报的常规用药5个年底和常规用药联合替莫唑胺的6.9个年底两者之间。显然,TCGA统计检索OS和PFI惨案间隔时间与文献相符。再次印证OS和PFI作为GBM分子会分析的伤寒理终点站效度。

用Cox比同上后果紧接三维已确定高期(III、IV期)相对于较高期(I、II期)大肠肿肿伤寒人的后果比(HR),检验4个终点站的TCGA-CDR统计数据。由于DFI表述与其它结果的表述不相符,对自荐适用OS、PFI和DSS的14种一般来说大肠肿肿较为logHR(注记3)。随后只能对实现Cox比同上后果断言的哮喘同步进行统计(示意图3E–3G)。结果注记明,14种一般来说大肠肿肿中都,除间皮肿(MESO)、PAAD和葡萄膜黑色素肿(UVM)以外,高期对比较高期HR在3个自荐终点站OS、PFI及DSS上明显偏高。采用配对比对的Wilcoxon秩和检验,当适用PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)测量时,logHR有明显区别,看出哮喘重大突破和肉食动物终点站在HR上缺少于系统偏一比;OS与DSS两者之间很难明显区别(p = 0.106)。对2个logHR系数的常规误同步进行逆加权平均已确定Pearson实际系数, 由logHR估计值的3种结果有极明显正实际:PFI和OS实际系数0.96(95%估计值量[CI]:0.77–0.99),PFI和DSS为 0.95(95%估计值量:0.76–0.99),OS和DSS为0.90(95%估计值量:0.61–0.98)。这些连续亦然续性潜在支亦然伤寒理越来越早用PFI,后期用OS和DSS好好终点站。

除了导入分子会统计数据,还越来越进一步分析方法首次用药后无伤寒伤寒人与非无伤寒伤寒人确实浮现相异的取而代之惨案。TCGA-CDR中都29类大肠肿肿电子邮件可用消除该疑问,纳入伤寒人从临床到尚未完成首治并超出无伤寒平衡状态大概存活3个年底。以LUSC为同上,有289同上无伤寒伤寒人和41同上经常性非无伤寒伤寒人,NTE所部分别为21.8%和68.2%。用Cox比同上后果紧接三维,挖掘出在非无伤寒伤寒人中都NTE后果明显高于无伤寒伤寒人(HR = 6.68,95% CI = 4.25–10.51,FDR变越来越q系数<0.05)。在另以外21种大肠肿肿一般来说中都也有类似结果(注记4)。余下7种中都很难通过观察到这些区别。我们也在风险评估确实每个三维都实现比同上后果断言,其中都有两个不符合,必必需分析间隔时间缺少及多变量三维来寻找缘故。

注记4 非无伤寒与无伤寒伤寒人NTE发展对比

TCGA从全球数百个市区内搜罗伤寒同上,为消除伤寒理统计数据相异市区内间的可比亦然续性,必需考虑统计数据完整亦然续性、和伤寒人形态等。对每种哮喘而言,我们对比了此前两名透过伤寒同上数最多的民间组织来源市区内(TSS)与所有其它TSS的同种哮喘及4个结果终点站(注记5)。

注记5 对来自此前两位TSS的每个大肠肿肿一般来说分析结果同步进行较为

对于GBM等极越来越有侵扰亦然续性的,此前两位TSS(#1和#2)的发伤寒青年人与其它TSS相比类似的有OS、PFI和DSS,因惨案太少难以分析方法不自荐DFI好好终点站。BRCA等较较高侵扰亦然续性,越来越进一步自荐适用PFI和DFI,但建言果断用OS或DSS风险评估。TSS #1的伤寒理统计数据导致要好的OS和DSS,但很难通过观察到PFI区别;另以外,注记面上TSS#1有越来越多的DFI结果,只能浮现3同上 DFI惨案。这种注记里不一的现象注记明该市区内的结果统计数据必需进一步风险评估。另一以外,TSS #2的4个终点站结果与其它区域内相符。

这个直观的结果较为注记明,当从特定结果分析方法连续性TCGA的伤寒理统计数据时,必必需考虑TSS的越来越有体电子邮件。由于平均年龄、分期/级别及用药等考量影响相异TSS患伤寒青年人的终点站结果,TSS可以作为这些和不完全伤寒理注释等其它尚未测量区别的替代。

潜在的夹杂考量、竞争结果的

后果及三维断言

对伤寒理肉食动物终点站分析方法来说,建言适用所执行的全部伤寒理统计数据。但相比分子会/测序统计数据的导入分析方法,要忽略两个以外。首先,自荐意见基于准确度线肉食动物三维,以分子会流感病毒作预见q划定比对集,有似乎损害结果统计的明显亦然续性区别。因此,从彼此间关联的TCGA分子会统计数据或流感病毒TCGA-CDR结果统计数据中都断定的结论必需在统一的统计检索中都进一步证实。

第二,我们建言只能适用原发的分子会统计数据,因为伤寒人初诊时,举足轻重间隔时间电子邮件等比如说的伤寒理统计数据已搜罗相对于完整。皮肤上黑色素肿(SKCM)在TCGA一般来说中都十分相异,470同上中都只能103同上原发,其余296同上为原发发散肺部结移往,68同上用户端移往。这与十分少搜罗到移往肿的其它TCGA大肠肿肿一般来说产生鲜明对比。SKCM移往肿十分少越来越有有比如说的原发,而其它TCGA大肠肿肿一般来说尽管十分少有移往肿,但都越来越有有比如说的原发比对。因此,对于SKCM结果的连续亦然续性,建言只适用有限为数的原发伤寒同上,尽管SCKM肺部结移往的III期伤寒同上可作为统一组群同步进行分析。

在适用取而代之导入的TCGA-CDR统计检索时,还必必需忽略:潜在混淆考量、竞争结果的后果及三维断言。

夹杂考量

夹杂考量缺少于但被忽略在三维以外时,偏一比似乎高估或较高估真实。如在白血伤寒的群体区别分析中都,白人与黑人伤寒人两者之间缺少于举足轻重的基因注记达区别,然而根据分子会流感病毒同步进行变越来越后,这种区别明显增大甚至遗忘。治果也是潜在的夹杂考量,当电子邮件可获取时应适当考虑变越来越。用药尚未知时,平均年龄、诊疗医院及临床年份等常规用药作为替代电子邮件能增大部分一比系数。对这以外的决策建模,希望适用;也病状分析建言报告(REMARK)。

竞争结果的后果

测定DSS、DFI和PFI终点站时,要对很难亲身经历举足轻重惨案且无伤寒的丧命伤寒人同步进行审查。在这种才会,如果断言伤寒人很难其它疑点,那她/他最终仍似乎死于大肠肿肿指征。然而,在估计值用药等预见q对继发亦然续性大肠肿肿或心血管哮喘等非指数大肠肿肿丧命后果的预见能力时,该断言并不可取。

三维断言

运用于Cox比同上后果(PH)三维必必需检查PH断言。除少数案同上以外,大大多三维都实现Cox PH断言,但必需进一步探索这些个案以找出违背断言的缘故,从而对HR好好出越来越精确的估计值。尽管早已为清理统计数据和消除疑问忍耐了巨大奋斗,但仍缺少于举足轻重的适用受到限制,访问TCGA伤寒理统计数据都必必需明了这些受到限制。

首先,TCGA主要是为分子会分析设计,刚开始伤寒同上为了让来自多个该机构越来越有有适宜再生产民间组织的尚未用药原发伤寒同上,因此这些伤寒同上不构成连续亦然续性。此以外,对于每种相异一般来说/分析,随访统计数据很难统一搜罗。同时,伤寒理统计数据搜罗的一些规则在即使如此暂时随着间隔时间的推移而忽略。TCGA - CDR不都有大肠肿肿用药史,并非所有伤寒同上都被注释。因此,分析方法特定一般来说或流感病毒的用药背景优于概述亦然续性小党肿肿分析方法。当伤寒人同步进行越来越有体用药时,受益能用DFI和PFI终点站有效分析方法。

其次,TCGA比对伤寒理随访根据当地诊所的间隔时间注记,似乎为哮喘或特定部位的住院和伤寒人举足轻重生命平衡状态的记事,因此很难TCGA指定的伤寒理随访计划,只能忽略到重大项目主要强调的分子会形态。

最后,差不多所有TCGA授予的比对和测序及分子会统计数据来自取而代之诊伤寒人原发的单个基底,由此导致的测序和分子会统计数据不能在空间或间隔时间任何以外明确捕获代注记另一伤寒人结果变量的异质亦然续性。该疑问不是TCGA独有的,任何最直观原发亦然续性分析都缺少于。

展望

这项管理工作是毫无疑问第一次取而代之一轮行之有效执行TCGA小党肿肿伤寒理资料。由此导致的TCGA-CDR的结果终点站与统一非TCGA分析结果相符,指明该资源在空此前规模的伤寒理尺度上透过了生物学观测取而代之视角。也要体认到TCGA-CDR的内在适用局限亦然续性及最重要亦然续性个人兴趣和自荐意见。早已十分明晰,本能哮喘尚未来大规模的分子会分析必必需行之有效搜罗伤寒理伤寒理、用药和原于惨案统计数据,以坚决极高常规的伤寒理分析。尽管有其局限亦然续性,TCGA-CDR透过了常规化统计检索,以及清晰的4个伤寒理结果终点站导出,并消除了准确性疑问,从而在小党肿肿和个体准确度上同步进行转化分析。尚未来统计数据分析的交融将提高结果两者之间的可比亦然续性,越来越多地阐释和支亦然每一次。

参考资料

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
贝安健康:不想慢性盆腔炎反复发作,这些事不必做!
在日常生活之中,我们要来作好预防工作,防止妇科哮喘来严重影响我们,但是有的未婚没有人同样,从而随之而来慢性腹膜炎引发,化疗丧失后,过段...[详细]
2022-05-04
痛经的原因 进食这些可缓解痛经
痛经是很多成年人在生活中会都可能会遇到的疑虑,有的成年人痛经致使的致使影响了生活。痛经都是由于什么可能呢?小编给大家讲讲痛经的可能是什么...[详细]
2022-05-03
附件炎是输卵管炎吗 两者什么父子关系
男人的生殖器官管理系统是很十分复杂的,它包括了多种器官该组织,如果男人在日常的与世隔绝总括不同样,就很更易使这些器官该组织出现弊端,引...[详细]
2022-05-02
宫颈癌的早期危险信号 双腿有这些现象要注意
在我们生活中会,宫颈癌是女朋友不仅常见的一种妇科营养不良,有些人有得过宫颈癌的境况,那你知道宫颈癌的更早险恶波形又哪些吗?得了宫颈癌之后...[详细]
2022-05-02
女性患滴虫性炎,身体可能会遇到三个“更糟”,早知早好!
说起药,认为未婚朋友特别熟悉,很多未婚在普通人习惯里都不会身患药,如果未婚朋友在普通人习惯里不注意自己的护理和保障,有可能较难身患这种...[详细]
2022-04-28
月经量少发黑是什么或许 经期有哪些注意事项
女性朋友经常则会遇到元月极其的上述情况,当遇到这种上述情况的时候,大家是怎么办的呢?元月量寡混浊是什么原因呢?经期有哪些同样事项呢?相信大...[详细]
2022-04-27
妇科炎症附件炎的病征有哪些
附件炎所称的就是睾丸和胎盘起因的呼吸道,是一种相当少见的妇科呼吸道,现在不少俩人都被附件炎这种性疾病煎熬着,相当严重影响到了正常的工作...[详细]
2022-04-26
第一次同房失败,怎么治疗?
妇科门诊,26岁的琉璃(化名)欲言又止。傅医生,我和男朋友只有一次,但是…..”是同房疼吗?第一次同房是因为双方都没有经验,男方动作不够温柔,...[详细]
2022-04-25
女人大姨妈时间不容许全因这个
妳大姑姑时间段不容许全是因为什么呢?妳大姑姑疼痛的损害有哪些呢?妳迟于不调怎么办呢?很多妳都有迟于延后的情形,但是迟于延后的或许是什么呢?下...[详细]
2022-04-25
  • 地区医院
  • 医院联盟