文件精读：建筑基于机器学习的HCC早期会诊瞻望模子

发布日期：2025-03-14 11:07 点击次数：158

*仅供医学专科东谈主士阅读参考 eHCC-pred模子将HCC早期会诊的准确率从78.15%进步至97%。肝细胞癌（HCC）的会诊频繁依赖于影像学检查或组织活检。尽管大大王人HCC病例在影像学上具有特异性发扬，但仍有约10%的（在直径为1-2cm的肿瘤中，这一比例可高达30%）短少典型的影像学特征[1]。在临床上怀疑HCC但影像学特征不典型的情况下，不应推迟进行活检或安排复查。若复查效力仍然不解确，则应进行活检[2]。然则，活检样本若蚁集位置不精准，可能导致误诊（即假阴性效力）。关于从非肿瘤

*仅供医学专科东谈主士阅读参考
eHCC-pred模子将HCC早期会诊的准确率从78.15%进步至97%。
肝细胞癌（HCC）的会诊频繁依赖于影像学检查或组织活检。尽管大大王人HCC病例在影像学上具有特异性发扬，但仍有约10%的（在直径为1-2cm的肿瘤中，这一比例可高达30%）短少典型的影像学特征[1]。在临床上怀疑HCC但影像学特征不典型的情况下，不应推迟进行活检或安排复查。若复查效力仍然不解确，则应进行活检[2]。然则，活检样本若蚁集位置不精准，可能导致误诊（即假阴性效力）。关于从非肿瘤（如肝硬化或普通）组织中蚁集到的HCC活检样本，小活检样本的会诊假阴性率梗概在30%-50%[3,4]。因此，建筑新的分子标记物关于早期HCC的会诊尤为关节，止境是在活检样本位置可能存在偏差的情况下。
近期，一项谋划应用大样本数据，集合最小冗余最大关联性（mRMR）和最大关联性最大距离（MRMD）两种特征聘请步调，并和会八种基于机器学习的算法，建筑出一种用于HCC早期瞻望的模子（eHCC-pred）。该模子将HCC早期会诊的准确率从78.15%进步至97%，有望在个体化水平上剖析地应用于临床推论，助力HCC的早期会诊。该模子可于http://www.dulab.com.cn/eHCC-pred/免费获取[5]。医学界肿瘤频谈整理该谋划现实如下，以供参考。
谋划步调
本项谋划招揽了来自三个大门户据库（GEO、ICGC和TCGA）的46个数据集，商量5586个组织样本，其中包含4045个肝细胞癌（HCC）样本、416个未发生HCC的肝硬化（CwoHCC）样本、334个伴有HCC的肝硬化（CwHCC）样本以及791个未发生HCC的普通肝组织（NwHCC）样本。
GEO数据库的44个转录组数据集包含3431个HCC样本、416个CwoHCC样本、334个CwHCC样本和741个NwHCC样本。数据通过Affymetrix、Agilent和Illumina平台检测，Affymetrix芯片数据集经RMA步调责罚，Agilent和Illumina芯片数据集使用预责罚数据。ICGC和TCGA数据集分别包含243个和371个HCC样本，以及50个NwHCC样本。谋划还使用了HPA数据库下载的2902个分泌基因数据。
谋划效力
▌1.HCC瞻望模子的推导
本谋划的举座分析历程如图1所示。当先，基于988个HCC样本和332个CwoHCC样本的基因抒发谱，分别获取了25,341,086对和20,559,429对剖析的基因对。在这两组基因对中，有5765对基因对在HCC组织和CwoHCC组织之间发扬出剖析的逆转相干。接着，通过筛选2902个分泌基因中的基因对，最终获取了242对基因对，这些基因对中的基因i和基因j均为分泌基因。随后，基于包含242个特征（基因对）的新数据集索要了最好特征。
图1. 举座分析历程
表1展示了基于准确率、F1分数顺应函数和AUC值对不同瞻望模子分类性能的比较。表1的效力标明，包括mRMR + KNN、mRMR + SVM、mRMR + LR、mRMR + XGBoost、mRMR + LMT、MRMD + KNN、MRMD + SVM、MRMD + LR和MRMD + LMT在内的九种瞻望模子，在系数性能商量上均发扬优异，准确率、F1分数和AUC值均达到1。
在这九种瞻望模子中，mRMR + KNN和mRMR + SVM的基因对数目最少，仅包含11对基因对（表2）。
▌2.HCC瞻望模子的考证
使用孤苦数据集（包括测试集、GEO数据集、ICGC数据集和TCGA数据集）对各式算法的性能进行了考证。如表3所示，关于3057个HCC样本和84个CwoHCC样本，MRMD + SVM瞻望模子（包含28对基因对）在孤苦数据鸠集获取了最高的准确率和F1分数，其准确率、F1分数和AUC值分别为0.9834、0.9915和0.9278。而mRMR + SVM瞻望模子（包含11对基因对）在孤苦数据鸠集获取了最高的AUC值0.9384，高于其他瞻望模子。因此，在后续分析中要点讲理这三个瞻望模子。他们在活检样本和手术样本中的详备考证效力如表4所示。
活检样本
在测试集（29个HCC样本和48个CwoHCC样本）中，mRMR + SVM瞻望模子和mRMR + KNN瞻望模子均已毕了1的明锐性和1的特异性，而MRMD + SVM瞻望模子的明锐性为1，特异性为0.8542。在GEO活检数据鸠集（GSE121248, GSE47197），mRMR + SVM瞻望模子正确分类了96.18%的HCC样本，mRMR + KNN瞻望模子正确分类了66.41%的HCC样本，而MRMD + SVM瞻望模子对131个HCC样本的分类准确率达到了100%。
手术样本
在测试集（220个HCC样本和36个CwoHCC样本）中，mRMR + SVM瞻望模子和mRMR + KNN瞻望模子的明锐性和特异性均为1，而MRMD + SVM瞻望模子的明锐性为1，特异性为0.8889。
这些效力标明，在使用活检样本时，mRMR + SVM瞻望模子、mRMR + KNN瞻望模子和MRMD + SVM瞻望模子均大约准确离别HCC和CwoHCC。
▌3.与现存瞻望模子的比较
关于1800个HCC样本，Ao熏陶团体建筑的模子、本谋划团队既往建筑的模子以及本次提倡的mRMR + SVM瞻望模子和MRMD + SVM瞻望模子的准确度分别为0.6639、0.7656、0.8428和0.9872。关于1931个HCC样本，Ao步调的准确度为0.6572，本谋划团队既往步调的准确度为0.7815，而mRMR + SVM瞻望模子和MRMD + SVM瞻望模子的准确度分别提高到0.8503和0.97。上述效力标明，mRMR + SVM瞻望模子和MRMD + SVM瞻望模子在与现存瞻望模子比拟，发扬更为优厚。
最终，本谋划告捷建筑了一种基于机器学习的HCC早期会诊瞻望模子eHCC-pred。该模子集成了两种不同的机器学习瞻望算法：MRMD + SVM和mRMR + SVM，将HCC早期识别的准确率从78.15%进步至97%，将为临床大夫提供了更为精准的用具，以期在HCC的早期阶段就进行有用的打扰和挽救。
精彩资讯等你来
参考文件：
[1]Llovet JM, Kelley RK, Villanueva A, et al. Hepatocellular carcinoma. Nat Rev Dis Primers. 2021 Jan 21;7(1):6. doi: 10.1038/s41572-020-00240-3. Erratum in: Nat Rev Dis Primers. 2024 Feb 12;10(1):10.
[2]Marrero JA, Kulik LM, Sirlin CB, et al. Diagnosis, Staging, and Management of Hepatocellular Carcinoma: 2018 Practice Guidance by the American Association for the Study of Liver Diseases. Hepatology. 2018 Aug;68(2):723-750.
[3]Forner A, Llovet JM, Bruix J. Hepatocellular carcinoma. Lancet. 2012 Mar 31;379(9822):1245-55.
[4]Villanueva A, Minguez B, Forner A, et al. Hepatocellular carcinoma: novel molecular approaches for diagnosis, prognosis, and therapy. Annu Rev Med. 2010;61:317-28.
[5]Zhang ZM, Huang Y, Liu G, et al. Development of machine learning-based predictors for early diagnosis of hepatocellular carcinoma. Sci Rep. 2024 Mar 4;14(1):5274.
审批编号：CN-150407 有用期至：2025-12-18
本材料由阿斯利康提供，仅供医疗卫生专科东谈主士参考

文件精读：建筑基于机器学习的HCC早期会诊瞻望模子

相关资讯

友情链接：