体必康生物科技(广东)股份有限公司

https://bc-bio.biomart.cn

公众号

扫一扫
进入手机商铺

公司新闻

博翀芯片定制服务助力肝细胞癌血清标志物筛选

发布时间:2020-07-28 11:23 |  点击次数:

概述:

肝细胞癌(HCC)是一个全球性的疾病,每年新增病人数超过 70 万,死亡率居恶行肿瘤第二。甲胎蛋白(AFP)是 HCC 早期诊断中经典的标志物,而由于其低灵敏度导致的假阴性问题较为普遍,因此临床上需要更有效的早诊标志物。但是,在新的标志物筛选中,常常面临着两个问题,第一,系统性、全局性不够;第二,精准度不够,即从海量的原始数据无法精准定位某一个或几个靶标分子。

为解决上述问题,近日,复旦大学附属中山医院肝癌研究所高强团队基于 Huprot 人类全蛋白质组芯片系统性、全局性的筛选 HCC 早期诊断标志物,通过集成逻辑回归(logistics regression)、人工神经网络(Artificial Neural Network)算法建立了针对 HCC 的精准区分模型,模型中包含了 CIAPIN1,EGFR,MAS1,SLC44A3,ASAH1,UBL7 和 ZNF428 这 7 种蛋白质,最后通过独立样本对模型的泛化能力进行验证。该研究在《Journal of Hematology & Oncology》在线发表 (IF = 11.059)。

研究思路:

 
Shu Zhang,et al.Journal of Hematology & Oncology.2020.

该研究包括三个阶段:Discovery Phase(I)、Test Phase(II)、Validation Phase(III)。

蛋白芯片筛选潜在标志物

在 discovery 阶段(I),基于人类全蛋白质组芯片(芯片包括 >20,000 新测序的重组人源蛋白,覆盖率 81%,是目前世界上通量最高的蛋白质芯片)筛选出 HCC 血清中的特异性免疫高响应的自身抗体(AAb),共计筛选出 81 个(图 A);在 test 阶段(II),联合相关文献报道的 19 个蛋白(共计 100 个),制备成肝癌特异的小芯片,并通过样本测试重复性,结果显示测试阵列呈现高重现性(图 B);用制备的小芯片进行大样本量测试,展示 HCC 患者、肝硬化患者、健康对照各一例的信号强度的三维渲染(图 C)。

 
Shu Zhang,et al.Journal of Hematology & Oncology.2020.

ANN(人工神经网络)模型建立

在 Test 阶段(II),基于定制芯片测试结果,分别比较分析 HCC 与 Cirrhotic、HCC 与 healthy 数据,并基于 p-value <0.05,fold change ≥ 1.2,sensitivity>15%,specificity>90% 判定标准,筛选出 55 个潜在的生物标志物。

为了更加精准筛选出具备显著区分能力的单个或多个标志物,基于逻辑回归(logistics regression)算法对 55 种潜在的生物标志物进行进一步筛选,并通过 10-fold cross validation(图 A)筛选出 7 个蛋白,分别为 CIAPIN1,EGFR,MAS1,SLC44A3,ASAH1,UBL7 和 ZNF428。

基于筛选出的标志物,通过神经网络中 error BackPropagation 算法建立多个人工神经网络 (ANN) 模型,并将模型进行集成,对肝细胞、肝癌患者和其他对照样本进行区分。在项目研究中建立的人工神经网络为全连接前馈神经网络,网络分为三层,输入层为 7 个神经元,隐含层为 5 个神经元,输出层为 2 个神经元,激活函数和输出函数均为 sigmod 函数(图 C)。其中,所建立的 7-AAb panel 的 ANN 模型的 sensitivity = 68.6%,specificity = 92.1%,AUC = 0.894(HCC VS 对照 [健康+肝硬化]),优于 AFP(临界值 = 400 mg/mL,sensitivity = 28.4%,specificity = 98.7%,AUC = 0.808)。

 
Shu Zhang,et al.Journal of Hematology & Oncology.2020.

ANN(人工神经网络)模型验证

在 validation 阶段 (III),577 例样本 (279 例肝细胞肝癌, 179 例正常, 119 例肝硬化患者) 作为独立样本,通过盲测法对模型进行验证;在盲测过程中,通过训练产生的模型委员对每例样本进行投票,确定是否肝癌患者,最后通过临床确诊信息来确定模型的准确度。

 
ANN 模型的工作流程图
(Shu Zhang,et al.Journal of Hematology & Oncology.2020.)

对于建立的 ANN 模型,通过独立样本验证其泛化能力。验证结果中,sensitivity = 68.6%,specificity = 90.1%,AUC = 0.902(HCC VS 对照 [健康+肝硬化])(表 1),并且对于 AFP 阴性患者,即 AFP 指标无法检出的患者,ANN 模型的 sensitivity = 80.6%,specificity 90.1%,AUC = 0.926(AFP- HCC VS 对照 [健康+肝硬化])(表 2)。综合,ANN 模型的灵敏度(62.2-77.5%),优于 AFP(30.7%)。

当结合阶段(II)和阶段(III)的数据时,整体 sensitivity = 71.6%,specificity = 90.0%,AUC = 0.898(HCC VS 对照组 [健康+肝硬化])(表 2),对于 AFP 阴性患者,整体 sensitivity = 76.1%,specificity = 89.1%,AUC = 0.912(AFP-HCC 与对照组 [健康+肝硬化])(表 2)。

 
表 1.  在 HCC 检测中评估 7-AAb panel 和 AFP
Shu Zhang,et al.Journal of Hematology & Oncology.2020.
 
表 2. 在 AFP- HCC 检测中评估 7-AAb panel
Shu Zhang,et al.Journal of Hematology & Oncology.2020.

ANN 模型应用

乙型肝炎表面抗原(HBsAg)可用于确定患者是近期还是长期感染 HBV。实验中,大约 70% 的 HCC 患者为 HBsAg+。对于 HBsAg+-HCC 检测,该模型提供了 59.6-79.1% 的灵敏度和 85.2-95.5% 的特异性(AUC = 0.822~0.932),而 AFP(临界值 400 mg/mL)提供了 31.4-34.7% 的灵敏度和 96.7-100% 的特异性。说明 ANN 模型能够有效地检测出 HBsAg--HCC 患者。

小结:

在本研究中,Huprot 人类全蛋白质组芯片和定制芯片的应用,为标志物的筛选提供了系统性和全局性的解决方案,而人工神经网络(ANN)算法能从海量的原始数据中精准定位相关的靶标分子,为筛选出肝癌相关标志物组合提供新思路。

博翀生物可提供相关芯片实验服务及人工神经网络(ANN)算法。

参考文献

[1]Shu Zhang,et al. Autoantibody signature in hepatocellular carcinoma using seromics. Journal of Hematology & Oncology.2020.

关于我们

广州博翀生物科技有限公司为体必康集团子公司,同时也是中科院生物物理所成果转化的标杆企业之一。博翀生物是以系列蛋白芯片产品、质谱蛋白质组学(iTRAQ、TMT、DIA 等产品)、代谢组学产品及其整体科研解决方案等为特色,整合科技、临床和产业资源,为科研和创新转化领航的高科技企业。

博翀生物人全蛋白质组芯片简介: