更全的杂志信息网

应用生物信息学挖掘肝母细胞瘤发病差异基因

更新时间:2009-03-28

肝母细胞瘤是儿童最常见的原发肝脏恶性肿瘤,通常在患儿1至2岁时被诊出,男性较女性发病率高。在过去的60年中,肝母细胞瘤的总体生存率已由30%提升至70%,这得益于标准化疗方案的推行、外科手术技术的改进,以及术前经导管动脉栓塞化疗等治疗措施的综合运用[1]。研究提示肝母细胞瘤的发病常与Wnt信号通路基因如环连蛋白β1、原癌基因c⁃myc等的异常表达相关,而人体端粒酶逆转录酶可能在这一通路的激活中起重要作用[2]。目前肝母细胞瘤尚无广泛公认的基因靶标、完善的分子分型,其具体病因及发病机制尚不明确,其诊疗手段仍待完善。

基因芯片又称DNA微列阵(microarray),是一种基于基因杂交原理的高通量基因信息检测技术,已广泛应用于肿瘤研究领域,如探索肿瘤分子分型、发现新的诊断标记物及治疗靶点等。目前,由美国国立生物技术信息中心支持的当今世界最大、最全面的基因表达数据库(Gene Expression Omnibus,GEO)中已有部分肝母细胞瘤组织芯片数据集上传共享,这些数据集提供的海量数据仍有待生物信息学手段进一步挖掘探索[3]。本研究通过检索GEO数据库,获得了三组肝母细胞瘤相关组织芯片数据集,并通过R语言软件及在线基因数据分析网站进行生物信息学分析,找出肝母细胞瘤与小儿正常肝脏组织间的差异表达基因(differentially expressed genes,DEGs),进一步从不同角度探究肝母细胞瘤的可能发病机制,希望为其诊断和治疗提供新方向。

在移动化和碎片化消费渐成趋势的当下,新出现的移动音频资源为人们的教育、学习、求知、娱乐活动带来巨大的价值,作为承担着作为文献中心、知识中心、文化中心和情报中心职责的高校图书馆,更需要重视移动音频资源的开发与利用,在产业链上、中、下游中探索对移动音频内容资源开发利用的应对之道。

1 材料和方法

1.1 芯片数据检索获取

在GEO数据库中检索芯片条件:1)小儿正常肝脏组织与小儿肝母细胞瘤组织;2)来源于人体组织的表达谱芯片。根据上述条件筛选到由Mistretta T等人于2015年上传的GSE75271样本数据集(基于 GPL570([HG⁃U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array芯片分析平台)[4];由Hooks KB等人于2017年上传的GSE104766样本数据集(基于GPL16791Illumina HiSeq 2500芯片分析平台);以及由Rui Dong等人于2013年上传的GSE51701样本数据集(基于GPL17843 Agilent-042818 Human lncRNA Micorarray 8_24_v2芯片分析平台)[5]。下载符合纳入条件的经过标准化处理的芯片 Series Matrix File(s)文件及 MINiML formatted family file(s)文件,录入R语言软件进一步分析处理。

1.2 差异基因筛选

本研究使用经验贝叶斯方法通过R语言软件RSTUDIO的limma算法包[6],选取表达量具有显著差异的基因,即DEGs。DEGs需符合以下条件:(1)差异倍数大于1.75或小于0.55;(2)差异显著性P<0.05。本研究分别筛选出3组芯片数据集的DEGs,取交集进行进一步处理,其中差异倍数大于1.75的为上调DEGs,差异倍数小于0.55的为下调DEGs。

马克·吐温是最优秀的批判现实主义讽刺小说家之一,也是使用反讽修辞的行家。马克·吐温的作品对客观的社会现实进行描述的同时,也包含着个人对丑恶现象的强烈抨击。

1.3 GO注释分析

肝母细胞瘤是一种来源于胚胎的恶性肿瘤,其发病涉及多因素多基因的改变。本研究通过检索GEO数据库中的芯片数据集,联合分析三组来自不同中心的芯片数据集GSE75271、GSE51701和GSE104766中的小儿正常肝脏组织标本及肝母细胞瘤组织标本进行生物信息学分析,获得具有代表性的分析结果。

本研究使用在线分析网站DAVID(The Data⁃base for Annotation,Visualization and Integrated Discovery,https://david.ncifcrf.gov/)对 DEGs 进 行GO功能注释分析[8]

1.4 蛋白质相互作用网络构建

使用R语言软件对三组芯片数据样本进行分析,取交集获得差异表达基因共290个,其中上调基因99个,下调基因191个。与小儿正常组织相比,肝母细胞瘤组织中上调的基因主要有IMPDH2,PFAS等,下调的基因主要有AGXT,ALDH1A1等。

Y o u n g在美国名校学习计算机,很早就离开了家。上次能在北京遇到他也是奇遇,他们大学的同学来中国玩儿,正好他能听读中文就把他拉上了。

2 结果

2.1 差异表达基因筛选

将上述筛选所得差异表达基因进行GO功能注释(表1)。GO功能注释显示,在生物学过程(Biological Process)中上调的DEGs主要涉及细胞分裂(Cell division)、蛋白结合的正性调控(Posi⁃tive regulation of protein binding)等86个功能簇;下调的DEGs主要涉及脂蛋白代谢过程(Lipoprotein metabolic process)、脂质外排(Phospholipid efflux)等67个功能簇。在细胞结构(Cellular Component)中上调的DEGs主要涉及细胞外外泌体(Extracel⁃lular exosome)、粘着斑(Focal adhesion)等4个功能簇;下调的DEGs主要涉及细胞外外泌体(Extracel⁃lular exosome)、线粒体(Mitochondrion)等 13个功能簇。在分子功能(Molecular Function)中上调的DEGs主要涉及金属离子结合(Metal ion binding)、鸟苷三磷酸酶激活活性(GTPase activator activity)等4个功能簇;下调的DEGs主要涉及血红素结合(Heme binding)、铁离子结合(Iron ion binding)等20个功能簇。

  

图1 差异表达基因筛选 A上调差异表达基因,B下调差异表达基因

2.2 差异基因GO功能注释

使用经验贝叶斯方法,以差异显著性P<0.05和差异表达倍数大于1.75或小于0.55为条件分别获取三组芯片数据集的差异表达基因(DEGs),进一步取交集获得共290个DEGs,其中上调基因99个,下调基因191个。(图1)

 

表1 肝母细胞瘤组织上调差异表达基因GO功能注释

  

差异表达类别富集度%P上调差异表达基因3 4 4 2 3 3 5 1 8 13 3 2 4 4 3 3 4 5下调差异表达基因种类GOTERM_BP_DIRECT GOTERM_BP_DIRECT GOTERM_BP_DIRECT GOTERM_BP_DIRECT GOTERM_CC_DIRECT GOTERM_CC_DIRECT GOTERM_CC_DIRECT GOTERM_CC_DIRECT GOTERM_MF_DIRECT GOTERM_MF_DIRECT GOTERM_MF_DIRECT GOTERM_MF_DIRECT GOTERM_BP_DIRECT GOTERM_BP_DIRECT GOTERM_BP_DIRECT GOTERM_BP_DIRECT GOTERM_CC_DIRECT GOTERM_CC_DIRECT GOTERM_CC_DIRECT GOTERM_CC_DIRECT GOTERM_MF_DIRECT GOTERM_MF_DIRECT GOTERM_MF_DIRECT GOTERM_MF_DIRECT GO功能项目GO:0060449~bud elongation involved in lung branching GO:0032092~positive regulation of protein binding GO:0051301~cell division GO:0061149~BMP signaling pathway involved in ureter morphogenesis GO:0005581~collagen trimer GO:0000784~nuclear chromosome,telomeric region GO:0005925~focal adhesion GO:0070062~extracellular exosome GO:0046872~metal ion binding GO:0017137~Rab GTPase binding GO:0070700~BMP receptor binding GO:0005096~GTPase activator activity GO:0033700~phospholipid efflux GO:0051005~negative regulation of lipoprotein lipase activity GO:0010903~negative regulation of very⁃low⁃density lipoprotein particle remodeling GO:0042157~lipoprotein metabolic process GO:0070062~extracellular exosome GO:0072562~blood microparticle GO:0005739~mitochondrion GO:0034361~very⁃low⁃density lipoprotein particle GO:0020037~heme binding GO:0030170~pyridoxal phosphate binding GO:0005506~iron ion binding GO:0008392~arachidonic acid epoxygenase activity 4 9 2 4 4 9 7 9 4 0.017339 0.023119 0.023119 0.011559 0.017339 0.017339 0.028898 0.104034 0.075136 0.017339 0.011559 0.023119 0.015 0.01125 0.01125 0.015 0.202505 0.033751 0.090002 0.015 0.033751 0.026251 0.033751 0.015 6.88E⁃04 0.003043 0.006649 0.011599 0.021995 0.073909 0.075424 0.079711 0.007856 0.027518 0.036383 0.064145 3.02E⁃04 6.52E⁃04 6.52E⁃04 6.97E⁃04 1.66E⁃09 1.73E⁃06 1.53E⁃05 4.56E⁃04 2.19E⁃05 2.72E⁃05 6.53E⁃05 8.98E⁃05

2.3 蛋白质相互作用网络构建及核心蛋白分析

使用在线蛋白质相互作用分析平台STRING数据库分析上述筛选出的DEGs,并构建蛋白质相互作用网络(图2)。进一步对STRING数据库分析得出的相互作用网络中156个节点的475条相互作用关系进行分析,计算网络中每个节点的度中心性(Degree Centrality),即与其他节点相关的数目。获得12个度中心性最高的核心调控基因:IMPDH2、AGXT、ALDH1A1、ALDH2、PFAS、SER⁃PINC1、AGXT2、KNG1、APOA1、MAT1A、APOC3和HSD17B6(表2)。

  

图2 肝母细胞瘤组织差异表达基因的蛋白相互作用网络图中红色节点为上调差异表达基因,蓝色节点为下调差异表达基因,菱形节点为核心调控基因

 

表2 肝母细胞瘤组织差异表达基因中12个核心调控基因

  

基因名IMPDH2 AGXT ALDH1A1 ALDH2 PFAS SERPINC1 AGXT2 KNG1 APOA1 MAT1A APOC3 HSD17B6度中心性28 24 24 20 18 17 17 17 16 15 15 15校正P 3.17E⁃03 3.37E⁃03 3.48E⁃02 4.71E⁃02 1.70E⁃02 2.78E⁃02 2.83E⁃02 1.54E⁃04 1.32E⁃02 2.04E⁃02 2.16E⁃02 4.53E⁃03差异表达类别上调差异表达基因下调差异表达基因下调差异表达基因下调差异表达基因上调差异表达基因下调差异表达基因下调差异表达基因下调差异表达基因下调差异表达基因下调差异表达基因下调差异表达基因下调差异表达基因

3 讨论

GO(Gene Onology,基因本体)功能注释是指对不同数据库中的基因和蛋白功能使用标准表达术语进行生物学功能描述,该项目由基因本体联合会建立[7]。GO注释目前包括三个方面的生物学内容:Biological Process(生物学过程)、Cellular Componet(细胞结构)、Molecular Function(分子功能)。

STRING数据库(Search Tool for the Retrieval of Interacting Genes)是一个研究蛋白质相互作用(Protein⁃Protein Interaction,PPI)模式的在线分析工具,可以构建PPI网络,并提供相关通路及功能信息[9]。本研究使用STRING数据库对DEGs进行蛋白-蛋白相互作用分析,在这里DEGs作为网络节点构建PPI网络,并进一步筛选出中心性最高,即与其他节点关系最密切的核心蛋白。

一个文档在索引内的排序由文档的相关性权重决定。一个文档的权重计算由关键词在该文档中出现的位置和出现次数计算得来(出现的次数越多,出现该词的文档数量越少,则权重越大)。基于ES 存储文档的JSON 特性,以及校内检索用户的身份识别特性,我们可以根据关键词在不同位置(标题、作者、机构、内容等)分别出现的次数来综合计算关键词的权重,使搜索结果能够进一步的匹配用户的期望。

进一步通过GO功能注释分析发现,大量上调及下调差异基因均富集在细胞外外泌体功能簇。外泌体是细胞分泌的直径在30~150 nm的囊泡,可携带核酸、蛋白质,参与细胞间重要物质与信号的传递。Hoshino等和Milane等证实肿瘤细胞可释放大量外泌体至转移器官埋下“种子”,使受体器官形成适合肿瘤增殖的“土壤”促进了肿瘤转移[10,11]。本研究中筛选出的大量差异表达基因富集在外泌体功能簇,提示肝母细胞瘤转移有很大可能与外泌体传递相关,对这些基因的研究将有助于探索肝母细胞瘤的转移机制。

通过STRING数据库构建蛋白质相互作用网络,并对相互作用网络进一步分析得到12个度中心性最高的核心调控基因。度中心性是衡量网络中节点重要性的主要指标之一,度中心性越高的节点在网络中与其他节点的关系最密切[12]。上述12个核心基因中,ALDH1A1、MAT1A、AGXT2、AGXT、IMPDH2、PFAS等6个基因均与代谢通路(Metabolic pathways)相关。大量研究发现,肿瘤细胞采取包括葡萄糖代谢异常、脂质代谢异常和应用摄取异常等与正常细胞不同的代谢途径以满足其快速、持续增殖并且耐缺氧的需要。近年来,有科学家提出肿瘤“代谢重编程”的观点,提示代谢异常不仅是肿瘤发生发展伴随现象,代谢通路相关基因的异常表达可能直接参与调控,促进肿瘤细胞的异常增殖[13,14]。本研究筛选出的肝母细胞瘤组织中核心调控基因与代谢通路关系密切,对其进一步深入研究可能揭示肝母细胞瘤发病的新机制,联合靶向代谢通路的治疗方案可能成为未来肝母细胞瘤治疗的新方向。

综上所述,本研究通过R语言软件、DAVID及STRING等在线分析工具对GEO数据库中的芯片信息进行整合挖掘,从多角度探索肝母细胞瘤组织与正常小儿肝脏组织中的差异表达基因。这些差异基因主要与外泌体、代谢通路等密切相关,通过对差异基因的进一步深入研究将可能揭示肝母细胞瘤发生发展的重要机制,为其诊断和治疗提供新的方向。

参考文献

[1] Sharma D,Subbarao G,Saxena R.Hepatoblastoma[J].Semi Diagn Pathol,2017,34(2):192-200.

[2] Czauderna P,Lopez⁃Terrada D,Hiyama E,et al.Hepatoblas⁃toma state of the art[J].Curr Opin Pediatr,2014,26(1):19-28.

[3] Edgar R,Domrachev M,Lash AE.Gene Expression Omnibus:NCBI gene expression and hybridization array data repository[J].Nucleic Acids Res,2002,30(1):207-210.

[4] Sumazin P,Chen Y,Trevino LR,et al.Genomic analysis of hepatoblastoma identifies distinct molecular and prognostic sub⁃groups[J].Hepatology,2017,65(1):104-121.

[5] Dong R,Jia D,Xue P,et al.Genome⁃wide analysis of long noncoding RNA(lncRNA)expression in hepatoblastoma tissues[J].PLoS One.2014,9(1):e85599.

[6] Ritchie ME,Phipson B,Wu D,et al.limma powers differen⁃tial expression analyses for RNA⁃sequencing and microarray studies[J].Nucleic Acids Res,2015,43(7):e47.

[7] Ashburner M,Ball CA,Blake JA,et al.Gene ontology:tool for the unification of biology.The Gene Ontology Consortium[J].Nat Genet,2000,25(1):25-29.

[8] Huang da W,Sherman BT,Lempicki RA.Systematic and inte⁃grative analysis of large gene lists using DAVID bioinformatics resources[J].Nat Protoc,2009,4(1):44-57.

[9] Szklarczyk D,Franceschini A,Wyder S,et al.STRING v10:protein⁃protein interaction networks,integrated over the tree of life[J].Nucleic Acids Res,2015,43(Database issue):D447-D452.

[10] Milane L,Singh A,Mattheolabakis G,et al.Exosome mediat⁃ed communication within the tumor microenvironment[J].J Control Release,2015,219:278-294.

[11] Hoshino A,Costa⁃Silva B,Shen TL,et al.Tumour exosome in⁃tegrins determine organotropic metastasis[J].Nature,2015,527(7578):329-335.

[12] Scardoni G,Petterlini M,Laudanna C.Analyzing biological network parameterswith CentiScaPe [J].Bioinformatics,2009,25(21):2857-2859.

[13] Soga T.Cancer metabolism:key players in metabolic repro⁃gramming[J].Cancer Sci,2013,104(3):275-281.

[14] Cairns RA,Harris IS,Mak TW.Regulation of cancer cell me⁃tabolism[J].Nat Rev Cancer.2011,11(2):85-95.

 
陈子月,伍耀豪,曾乐祥,邱荣林,周嘉嘉,张杰,邓小耿
《岭南现代临床外科》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息