TCGA癌症医学数据资源全面介绍---癌症研究领域的全谱!

2021-10-25 05:50 来源:芜湖妇科医院

2006年,胃部乳癌原核人类上图谱(The Cancer Genome Atlas, TCGA)计划以多形病态胶质母细胞核腺(GBM)、肠胃部上皮细胞核细胞核乳癌(LUSC)和卵巢粘液病态囊腺乳癌(OV)开始为期3年的示范这两项,2009年~2015年年底揭开。到这两项截止,TCGA网络研究工先为工先为者已描绘了33种胃部乳癌型式10,000余由此可知病患的水分子特病态,并表述了很多水分子病毒病态。TCGA各个方面联的流行病学这两项特病态代详见泛化的抽样查阅。为确保自始确可用这些具原核人类特病态的海量流行病学抽样,最近TCGA从未完成一批重大成果,发详见在CellPress旗下的季刊。

本文对4月初5日发详见Cell上的一文揭开编译。文章阐述以OS(总求生期)、PFI(无令人满意间隙)、DFI(无病间隙)和DSS(疟疾各个方面只剩)为四个主要流行病学结果终点站的TCGA泛胃部乳癌流行病学抽样资源(TCGA-CDR)常规化抽样库,并给造出了每种胃部乳癌型式的终点站可用要求。TCGA流行病学抽样可从原核人类抽样共享三维空间(GDC)网易下载,所有的水分子抽样在下载。流行病学抽样和水分子抽样可用同样的条形码结构,便于病患的流行病学资料和抽样水分子抽样定位。

TCGA泛乳癌抽样库函数调用特病态

上图1A为流行病学抽样定位和深入研究工先为方法及4个主要流行病学终点站独有和风险评估的流程上图,对33份初始登记和97份后续抽样文件,共33种胃部乳癌型式111,60由此可知胃部乳癌病患的资料揭开了处置。详见1为每个TCGA函数调用的基本特病态。按原发抽样根据水分子特病态选入每个函数调用,皮肤上黑色素腺(SKCM)的原发和移转到灶两种型式都有,其它极不算数的原发与移转到型式也有研究工先为。

上图1. 流行病学抽样定位和深入研究工先为方法及4个主要流行病学终点站独有和风险评估流程上图

详见1. TCGA 泛乳癌函数调用特病态

流行病学结果终点站OS、PFI、DFI和DSS

总求生期(OS)很这两项病态,优点是表述OS事件真相时模糊病态最低。但可用OS先为终点站确实削弱流行病学研究工先为,因为非乳癌死因这不能反映造出分子人类学、洪水泛滥病态或对疗法减缓。可用OS或需更加长的随访等待时间;很多流行病学试验中会,并不一定采用相比之下随访等待时间较短的DFI或PFI。针对现有TCGA流行病学抽样,要了解到间歇流行病学随访间隙在洪水泛滥病态胃部乳癌型式结果的这两项病态病态,因为确实几年内就捕捉到到流行病学事件真相,在遇害此前已用到病情病情恶化或令人满意。对洪水泛滥病态较弱的胃部乳癌型式,病患在数十乃至几十年后病情恶化,随访期间确实无法捕捉到更加多事件真相以拥护直观结果供判断。该深入研究工先为的意在是健康检查TCGA泛乳癌流行病学检测的相比之下优势和不足以,指导在短期内的深入研究工先为和避免随访间隙等待时间不足以等缺陷。

深入研究工先为全部TCGA流行病学抽样后,自始确性如下:在抽样可授予时,OS、PFI及DFI相比之下自始确地,但同样情况下只能估计DSS。上图1B为33种多种不同胃部乳癌型式的OS K-M双曲线。尽管求生深入研究工先为不是TCGA主要尽可能,同样胃部乳癌型式求生双曲线与从此前风险评估相近求生终点站的统一研究工先为基本相近,GBM、OV(2008, 2011)和低层次胶质腺(LGG)(2015)的TCGA结果就是比较好由此可知证。PFI、DFI和DSS的K-M双曲线见上图1C–1E。

上图1 B-E流行病学抽样深入研究工先为

基于每种胃部乳癌型式4个终点站的捕捉到等待时间计算平均随访等待时间及事件真相或健康检查的中会位等待时间(详见2)。所有的中会位随访等待时间为22.1个月初,但多种不同型式胃部乳癌该等待时间区别极大;GBM和急病态髓系白血病(LAML)最短有约12个月初,而肝嫌色细胞核乳癌(KICH)最长有约48个月初。

详见2 总体中会位随访等待时间及4个终点站的事件真相与捕捉到中会位等待时间

录用可用的流行病学结果终点站

流行病学结果终点站必需取决于研究工先为尽可能、事件真相数量、函数调用大小不一和结果抽样低质量。将这些方法和整合的其它方法先为为对单个疟疾抽样库的飞行测试和补足健康检查,给造出在每种疟疾型式中会可用每个结果终点站的要求及情况(详见3)。每种胃部乳癌型式的求生终点站需要据估计通过一个主要飞行测试和补足健康检查才被给与。33种乳癌中会的13种可用全部4个终点站:尿道尿路上皮乳癌(BLCA)、卵巢上皮细胞核细胞核乳癌(CESC)、结肠乳癌(COAD)、食管乳癌(ESCA)、多毛上皮细胞核细胞核乳癌(HNSC)、肝状细胞核乳癌(KIRP)、肠胃部腺乳癌(LUAD)、LUSC、OV、白血病(PAAD)、肉腺(SARC)、胃部腺乳癌(STAD)和子宫内膜乳癌(UCEC)。相反,很难一个终点站的有嗜铬细胞核腺和副神经节腺(PCPG)。肺部弥漫大B细胞核肺部腺(DLBC)、LAML和胸腺腺(THYM)只能一个终点站;只剩胃部乳癌型式2或3个终点站,但其中会一些持保留发表意见。最直观的是PFI,可无保留地录用给除LAML(无抽样)、DLBC和KICH(轻率可用)和PCPG(不录用)均的4种。

详见3 终点站OS,PFI,DFI及DSS的风险评估与录用可用

可验证TCGA-CDR及范由此可知应用领域

在乳腺乳癌研究工先为中会,皮质醇ER阴病态病患流行病学求生期HRS比ER+病患再加。分别用OS、PFI、DFI和DSS比较这两类病患的求生期(上图3A–3D;双曲线截止于10年随访等待时间,但可用整个抽样库揭开深入研究工先为)。单考量深入研究工先为显示,可用PFI(p= 0.005)和DFI(p = 0.001)先为为流行病学终点站,TCGA中会ER+乳腺乳癌病患比ER-病患有很好的求生期,但可用OS时两类病患间不依赖于区别(p = 0.097) 。此均,两类病患的DSS(p = 0.009)有总体区别,详见明DSS的潜在价系数。以上发现声称了PFI和DFI是特定型式乳腺乳癌水分子研究工先为的合适终点站。

上图3 可验证和应用领域实由此可知

此均还可验证了洪水泛滥病态GBM求生结果终点站。TCGA中会GBM中会位OS为12.6个月初,介于此此前报道的常规疗法的12.1个月初和常规疗法倡议替莫唑胺的14.6个月初二者之间。中会位PFI是6.1个月初,介于此此前报道的常规疗法5个月初和常规疗法倡议替莫唑胺的6.9个月初二者之间。似乎,TCGA抽样库OS和PFI事件真相等待时间与古文献相符。再度由此可知OS和PFI先为为GBM水分子研究工先为的流行病学终点站效度。

用Cox比重几率回归仿真确定高期(III、IV期)相比之下低期(I、II期)胃部乳癌病患的几率比(HR),可验证4个终点站的TCGA-CDR抽样。由于DFI表述与其它结果的表述不相符,对录用可用OS、PFI和DSS的14种型式胃部乳癌比较logHR(详见3)。随后只能对意味着Cox比重几率论据的疟疾揭开总和(上图3E–3G)。结果详见明,14种型式胃部乳癌中会,除间皮腺(MESO)、PAAD和葡萄膜黑色素腺(UVM)均,高期对比低期HR在3个录用终点站OS、PFI及DSS上显着偏高。采用配对抽样的Wilcoxon秩和检验,当可用PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)测时,logHR有总体区别,显示疟疾令人满意和求生终点站在HR上依赖于系统设计误再加;OS与DSS二者之间很难总体区别(p = 0.106)。对2个logHR系数的常规误揭开当此加权平均确定Pearson线病态关系, 由logHR估计的3种结果有极总体自始各个方面:PFI和OS线病态关系0.96(95%概率分布[CI]:0.77–0.99),PFI和DSS为 0.95(95%概率分布:0.76–0.99),OS和DSS为0.90(95%概率分布:0.61–0.98)。这些表征潜在拥护流行病学早期用PFI,中后期用OS和DSS动手终点站。

除了定位水分子抽样,还尝试深入研究工先为首次疗法后无病病患与非无病病患是否用到多种不同的新的事件真相。TCGA-CDR中会29类胃部乳癌信息用于解决该疑问,纳入病患从治疗到从未完成首治并降到无病状态据估计只剩3个月初。以LUSC为由此可知,有289由此可知无病病患和41由此可知仍然非无病病患,NTE率分列21.8%和68.2%。用Cox比重几率回归仿真,发现在非无病病患中会NTE几率总体高于无病病患(HR = 6.68,95% CI = 4.25–10.51,FDR变更加q系数<0.05)。在另均21种胃部乳癌型式中会也有相似结果(详见4)。剩7种中会很难捕捉到到这些区别。我们也在风险评估是否每个仿真都意味着比重几率论据,其中会有两个不符合,需要研究工先为等待时间依赖及多常量仿真来寻觅情况。

详见4 非无病与无病病患NTE发展对比

TCGA从亚太地区数百个接入查阅病症,为解决流行病学抽样多种不同接入间的可比病态,需必需抽样完整病态、和病患特病态等。对每种疟疾而言,我们对比了此前两名发放病症数最多的有组织来源接入(TSS)与所有其它TSS的同种疟疾及4个结果终点站(详见5)。

详见5 对来自此前两位TSS的每个胃部乳癌型式研究工先为结果揭开比较

对于GBM等兼具洪水泛滥病态的,此前两位TSS(#1和#2)的发病这群人与其它TSS相比之下于相似的有OS、PFI和DSS,因事件真相太不算无法深入研究工先为不录用DFI动手终点站。BRCA等高洪水泛滥病态,关键时刻录用可用PFI和DFI,但要求轻率用OS或DSS风险评估。TSS #1的流行病学抽样转化成不太好的OS和DSS,但很难捕捉到到PFI区别;另均,详见面上TSS#1有很好的DFI结果,只能用到3由此可知 DFI事件真相。这种详见里不一的情形详见明该接入的结果抽样需再进一步风险评估。另一各个方面,TSS #2的4个终点站结果与其它以前相符。

这个有趣的结果比较详见明,当从特定结果深入研究工先为主体TCGA的流行病学抽样时,需要必需TSS的具体内容信息。由于成年人、依此/基准及疗法等考量影响多种不同TSS卧床这群人的终点站结果,TSS可以先为为这些和不完全流行病学原文等其它从未测区别的替代。

潜在的或多或不算考量、公平竞争结果的

几率及仿真论据

对流行病学求生终点站深入研究工先为来说,要求可用所处置的全部流行病学抽样。但相比之下于水分子/原核人类抽样的定位深入研究工先为,要警惕两个各个方面。首先,录用发表意见基于基线求生仿真,以水分子病毒病态先为预报q区分抽样集,有确实破坏结果总和的总体病态区别。因此,从彼此之间关联的TCGA水分子抽样或病毒病态TCGA-CDR结果抽样中会得造出的自始确性需在统一的抽样库中会再进一步声称。

第二,我们要求只能可用原发的水分子抽样,因为病患初诊时,这两项病态等待时间信息等比如说的流行病学抽样已查阅相比之下完整。皮肤上黑色素腺(SKCM)在TCGA型式中会比较类似,470由此可知中会只能103由此可知原发,其余296由此可知为原发局部肺部结移转到,68由此可知远端移转到。这与极不算查阅到移转到腺的其它TCGA胃部乳癌型式形成鲜明对比。SKCM移转到腺极不算具比如说的原发,而其它TCGA胃部乳癌型式尽管极不算有移转到腺,但都具比如说的原发抽样。因此,对于SKCM结果的表征,要求只可用局限数量的原发病症,尽管SCKM肺部结移转到的III期病症可先为为统一几部分揭开研究工先为。

在可用新的定位的TCGA-CDR抽样库时,还需要警惕:潜在混淆考量、公平竞争结果的几率及仿真论据。

或多或不算考量

或多或不算考量依赖于但被无关在仿真之均时,误再加确实夸大或低估主观。如在乳腺乳癌的种族区别研究工先为中会,有色人种与黑人病患二者之间依赖于这两项病态的基因详见达区别,然而根据水分子病毒病态揭开变更加后,这种区别总体降低甚至消失。治果也是潜在的或多或不算考量,当信息可获取时应适当必需变更加。疗法从难以确定时,成年人、诊治所医院及治疗最迟等常规疗法先为为替代信息能降低部分系数。对这各个方面的决策建模,期望可用标志物HRS研究工先为要求研究报告(REMARK)。

公平竞争结果的几率

测定DSS、DFI和PFI终点站时,要对很难经历这两项病态事件真相且无病的遇害病患揭开送审。在这种情况下,如果论据病患很难其它死因,那她/他最终仍确实死于胃部乳癌指征。然而,在估计疗法等预报q对继发病态胃部乳癌或糖尿病等非指数胃部乳癌遇害几率的预报能力时,该论据并这不可取。

仿真论据

应用领域Cox比重几率(PH)仿真需健康检查PH论据。都有范由此可知均,大同样仿真都意味着Cox PH论据,但需再进一步揭示这些案例以追踪抵触论据的情况,从而对HR动手更加直观的估计。尽管仍从未为清理抽样和解决疑问付造出了巨大决心,但仍依赖于这两项病态的可用限制,访问TCGA流行病学抽样都需了解这些限制。

首先,TCGA主要是为水分子研究工先为建筑设计,起初病症必需来自多个机构具合适备用有组织的从未疗法原发病症,因此这些病症不构成连续病态。此均,对于每种多种不同型式/研究工先为,随访抽样很难统一查阅。同时,流行病学抽样查阅的一些原则上在从此前只得随着等待时间的推移而偏离。TCGA - CDR不各个方面联胃部乳癌疗法历史学者,并非所有病症都被原文。因此,深入研究工先为特定型式或病毒病态的疗法剧中优于简要病态泛乳癌深入研究工先为。当病患揭开具体内容疗法时,得益能用DFI和PFI终点站有效深入研究工先为。

其次,TCGA抽样流行病学随访根据当地诊所的等待时间详见,确实为疟疾或特定部位的病情恶化和病人这两项病态新生命状态的记录,因此很难TCGA指定的流行病学随访计划,只能给造出这两项主要强调的水分子特病态。

之后,再加不多所有TCGA授予的抽样和原核人类及水分子抽样来自新的诊病患原发的单个切片,由此转化成的原核人类和水分子抽样必须在三维空间或等待时间任何各个方面明确猎捕代详见另一病患结果常量的异质病态。该疑问不是TCGA独创的,任何静态原发病态研究工先为都依赖于。

展望

这项工先为是有历史学者以来第一次年底行之有效处置TCGA泛乳癌流行病学资料。由此转化成的TCGA-CDR的结果终点站与统一非TCGA研究工先为结果相符,说明该资源在空此前绝后规模的流行病学尺度上发放了人类观测新的视角。也要了解到TCGA-CDR的内在可用局限病态及这两项病态指导和录用发表意见。仍从未比较明晰,人类疟疾从今后大规模的水分子研究工先为需行之有效查阅流行病学有组织学、疗法和转归事件真相抽样,以坚持略低于常规的流行病学研究工先为。尽管有其局限病态,TCGA-CDR发放了常规化抽样库,以及模糊不清的4个流行病学结果终点站导造出,并解决了低质量疑问,从而在泛乳癌和形态水平上揭开转化研究工先为。从今后抽样研究工先为的融合将大大提高结果二者之间的可比病态,很好地解释和拥护重复。

参考资料

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
体内这物不必要竟致女子不来月经
青年组体内什么东西但会没法想到导致不来大姨妈呢?迟于是未成年的标志物,男人的迟于会受各种各样的因素妨碍,那么,男人迟于不调的或许有哪些呢...[详细]
2022-05-05
女人们肾虚是什么原因导致的 女人们肾虚吃什么好
提到男人心脏虚,大家不太可能则会了解一些,那么爱人心脏虚则会显现出什么样的持续性呢,爱人心脏虚的病症有哪些?爱人心脏虚是什么不太可能导致...[详细]
2022-05-04
慢性盆腔炎怎么治疗 有哪些原理
相信很多年龄稍稍大一些已经生育过的男士都被慢性病灶炎拖累过,一旦得了这种疾病,不但会对男士朋友的生活和工作带来很大的受到影响,还会受到...[详细]
2022-05-03
不招呼,心血管病风险高八成!还会惹来其他5种病
一顿好零食能点亮一天的光。但现实是很多人宁愿兰花等待时间赖床,精心梳洗打扮,也不能拿出十分钟细心吃到个零食。2020年年底某机构发布的《白领...[详细]
2022-05-02
类风湿皮肤病中类风湿因子阳性的意义
类风湿位点(RF)是一种针对IgG Fc片段的自身抗体。约75%-80%的类风湿肌腱炎(rheumatoid arthritis, RA)呕吐在病程之中的某些时段可以检出RF。在RA呕吐之中,类...[详细]
2022-05-02
来例假年前胀痛是什么原因
未满妇女每个年底都亦会来一次例假,很多妇女在来例假以后,都亦会注意到胀痛等腹泻,这是比较但会的现象。因为妇女在来年底经以后,躯体的中枢...[详细]
2022-04-28
月经不调的原因 还在接触这个不慎月经紊乱
月经不调是女同性恋常用的一种病征,在生活中造成了月经不调的因素有很多,多数都是因为女同性恋自己不警惕避免的,消失月经不调我们应该怎么调...[详细]
2022-04-27
输卵管排水怎么办
胎盘水淹是一种典型的妇产科病症,病症原因与自然流产、人工流产、不洁有关。据药剂师所言,药流、隔水、病灶染病也是其病症原因。病症后,间歇...[详细]
2022-04-26
宫颈癌越来越年轻?医生说实话"性"没有小事,需要注意!
虽然癌症在很多人眼里很可怕,但每个人都很幸运!有些人甚至认为癌症是一种会找到中老年人的疾病。年轻人身体强壮,自然错过了癌症。众所周知,...[详细]
2022-04-25
  • 地区医院
  • 医院联盟