医学院郑钜圣与浙江大学周丹等多个团队联合绘制中国人群血清代谢物的遗传调控图谱
代谢物是机体在生理或病理状态下产生的中间或者最终产物,其浓度反映了机体的代谢状态以及相关的分子过程。在人体内,代谢物的水平不仅受多种环境因素的影响,同时也受到遗传变异的调控。针对人群代谢组的遗传调控研究是分子流行病学领域的重要前沿,旨在揭示基因组对代谢通路的精细调控机制,从而使人们能够深入理解疾病生理和病理过程中的代谢变化以及潜在疾病干预靶点。
代谢组的全基因组关联分析(metabo-GWAS)是构建代谢物遗传调控图谱的基本方法。以此为基础的遗传变异-代谢物-疾病联合分析是揭示疾病发生与发展过程中代谢特征的有效路径。然而,迄今为止,该领域的研究主要集中于欧洲人群,针对东亚人群的研究仍极为稀缺且规模有限。通过对东亚人群代谢组进行系统性遗传分析,我们能够更加全面、深入地理解代谢异常与疾病易感性(特别是不同种族的差异性)之间的关系。这不仅为跨种族联合精细定位提供了支撑,也为疾病预防与治疗策略的制定提供了更加精准的科学依据。
北京时间2025年1月20日,西湖大学医学院/西湖实验室郑钜圣与浙江大学公共卫生学院周丹联合华中科技大学潘安、中山大学陈裕明、四川大学潘雄飞、浙江大学朱益民等多个研究团队,在国际知名期刊《细胞-基因组学》(Cell Genomics)杂志发表了题为“Genetic mapping of serum metabolome to chronic diseases among Han Chinese”的研究论文(图1)。该研究系统性解析了中国汉族人群2,759种血清代谢物的遗传图谱,鉴定了慢性疾病相关的血清代谢物。此外,研究还结合转录组和蛋白质组的遗传调控信息,揭示了多种代谢物的潜在调控因子。以上发现为血清代谢物在慢性疾病中的生物学作用机制研究提供了新的见解,为基于中国人群的个性化健康管理和干预提供了数据支撑。
文章链接:
https://www.cell.com/cell-genomics/fulltext/S2666-979X(24)00372-0

图1 文章截图
本研究对2,759种血清代谢物进行了定量分析,并在汉族人群中开展了全基因组关联研究(GWAS)。研究鉴定出184个显著性的代谢物数量性状位点(metaboQTLs),其中88.59%先前未见报道。
整合东亚人群的37种临床性状的GWAS数据,并通过基于遗传变异的因果推断,本研究鉴定了906种代谢物与临床性状之间的潜在因果关联。此外,结合转录组和蛋白质组的遗传调控信息,研究揭示了多种代谢物的潜在调控因子。本研究系统解析了我国汉族人群血清代谢组的遗传调控图谱,揭示了血清代谢物在慢性疾病中的潜在作用,为相关机制研究的开展提供了重要线索。01 研究设计
本研究汇集了我国华东、华西、华南地区的四个多组学队列。其中,浙江代谢综合征队列(ZMSC)、西湖精准出生队列(WeBirth)、同济华西双流出生队列(THSBC)的2,901名参与者作为发现队列;广州居民营养与健康队列(GNHS)的894名参与者作为验证队列。研究采用基于超高效液相色谱-串联质谱(HPLC-MS/MS)的广泛靶向检测技术,测定了发现队列中的2,759种血清代谢物;利用靶向定量检测技术,测定了验证队列的212种血清代谢物。研究通过采用基于混合线性模型的GWAS分析方法(GCTA-MLMA),识别了代谢物数量性状位点(metaboQTLs),并在验证队列中进行靶向验证。研究还利用转录组和蛋白质组的遗传调控信息对metaboQTLs进行了多组学注释,探索了血清代谢物水平的潜在遗传调控机制。此外,研究利用日本生物银行库(BBJ)和韩国基因组与流行病学研究(KoGES)中的37种复杂性状GWAS数据,开展了基于遗传变异的代谢物-表型因果推断。该研究的实验设计及分析流程如图2所示。

图2 研究队列和分析流程
02 主要发现
2.1血清代谢物的全基因组关联分析
研究团队使用GCTA-GREML方法评估了代谢物基于单核苷酸多态性(SNP)的遗传力,即某种性状在群体中由遗传因素决定的比例。结果显示,所有代谢物的平均遗传力估计值为17.53%,其中酚酸类的遗传力最高(23.06%),甘油磷脂类次高(18.81%),甘油脂类(8.87%)和醇类、胺类(7.79%)较低。
针对发现队列(ZMSC、WeBirth和THSBC)的代谢物,研究团队进行了metabo-GWAS分析。三个亚队列的遗传估计效应值相似(WeBirth vs.THSBC,r = 0.81;WeBirth vs.ZMSC,r = 0.71)。随后,研究人员对三个亚队列的metabo-GWAS结果进行了meta分析。曼哈顿图展示了2,759个代谢物meta后的metabo-GWAS结果(见图3)。研究共鉴定出931个独立的全基因组显著的SNP-代谢物关联(P < 5.00×10⁻⁸),涉及549个代谢物和521个信号区域(metaboQTLs)。在对2,759个代谢物进行Bonferroni多重检验校正后,364个关联仍然显著,涉及264个代谢物和184个metaboQTLs(P < 1.81×10⁻¹¹)。在184个metaboQTLs中,163个metaboQTLs先前未被报道过。此外,研究通过对319个代谢物比值进行GWAS分析,鉴定了涉及552个信号区域的1,750个显著关联(P < 5.00×10⁻⁸)。
图3 全基因组基因-代谢组关联分析
研究发现了尚未报道过的信号,包括FAAH基因座处(lead SNP:rs324420-A,β = 0.79,P = 1.34×10⁻¹⁰⁷,N = 2,887)N-肉豆蔻酰甘氨酸的信号;FADS1/FADS2基因座处(lead SNP:rs174574-C,β = 0.48,P = 1.07×10⁻⁸²,N = 2,883)溶血磷脂胆碱(LPC, 0:0/20:4)的信号;PRODH基因座处(lead SNP:rs4269009-G,β = 0.57,P = 1.60×10⁻³⁹,N = 2,889)处,顺丁烯二酸的信号等。
2.2代谢物遗传调控信号的靶向验证
研究团队在验证队列(GNHS队列)中,对发现队列中全基因组显著的metaboQTLs(P < 5.00×10⁻⁸)进行了靶向验证。QQ图显示在发现队列与验证队列中,这些metaboQTLs表现出了明显的关联性(图4A)。研究人员在GNHS队列中验证了12种代谢物的全基因组显著信号,涉及38个SNP-代谢物关联。其中包括3-吲哚丙酸(IPA)、水杨酸、N-乙酰甘氨酸和甘氨酸等。研究还发现了肠道微生物来源代谢物的遗传基础, 如IPA和IAA。曼哈顿图(图4B)和LocusZoom图(图4C)所示,研究发现了在ZMSC、THSBC和GNHS中ACSM2A基因座附近的遗传变异(lead SNP:rs59261767)与IPA存在显著关联。IPA是肠道细菌产生的必需色氨酸代谢物,可在肝脏或肾脏转化为3-吲哚丙烯酸(IAA)。研究还发现在THSBC中,IPA和IAA均与位于ACSM2A附近的SNP rs59261767独立相关,进一步支持了ACSM2A基因座在色氨酸代谢中的调控作用。在THSBC中,IPA和IAA水平之间的Pearson相关系数为0.78。此外,研究发现rs59261767的T等位基因与较高水平的IPA和IAA相关,揭示了这两种代谢物遗传调控方向的一致性。

2.3代谢物遗传调控信号的跨种族比较
研究团队对具有全基因组显著性的184个metaboQTLs进行了跨种族比较。经过比对来自不同数据源的代谢物名称后,验证了21个metaboQTLs,其中大多数信号在欧洲人群中得到了验证,有两个metaboQTLs在东亚/南亚人群中得到了验证。
为探索东亚和欧洲人群中共享的metaboQTLs与东亚人群的潜在特异性metaboQTLs间的差异,研究基于千人基因组计划(1KG)第3阶段的数据,比较了东亚和欧洲人群的次要等位基因频率(MAF)差异。结果显示,仅在东亚人群存在特异性metaboQTLs。这些metaboQTLs在欧洲人群中的MAF显著低于东亚人群的MAF(P Wilcoxon检验 = 0.004)。对于共享的metaboQTLs,东亚和欧洲人群之间的MAF差异未表现出显著性统计学差异(P Wilcoxon检验 = 0.97)。值得注意的是,11个东亚人群潜在特异性的metaboQTLs在欧洲人群中是低频变异(MAF < 0.01)。此外,11个东亚人群特异性的metaboQTLs中,rs2296651、rs61342118和rs147361130在东亚人群中为常见变异,但在欧洲人群中表现为单态型。研究发现,SLC10A1(又名NTCP)编码区的错义变异(S267F,rs2296651)与牛磺胆酸(TCA)和牛磺去氧胆酸(TCDCA)相关(见图5A)。胆汁酸是胆固醇的衍生物,主要在肝细胞中合成,并发挥多种生理作用。钠依赖性牛磺胆酸共转运多肽(NTCP)是从血液到肝细胞的钠依赖性胆汁酸转运蛋白,由SLC10A1基因编码。S267F突变型NTCP具有正常的细胞表面表达,但几乎完全丧失胆盐的摄取功能。此外,S267F变异是亚洲特有的变异,在不同亚洲血统中的MAF范围为3.10%-9.20%。
图5 潜在遗传-基因表达-蛋白质-代谢物关联证据链
2.4代谢物遗传调控信号的多组学注释
为进一步基于以上发现的metaboQTLs探索背后潜在的生物学机制,研究团队聚焦于基因表达和蛋白质丰度,探索了遗传变异与代谢物之间的遗传调控路径。研究团队比对了当前研究中metaboQTLs与他们先前研究建立的中国汉族人群血清蛋白质数量性状基因座(pQTLs)信号(包含304种蛋白质,https://omics.lab.westlake.edu.cn/data.html)、英国生物样本库(UK Biobank, UKB)中的欧洲和亚洲人群的血浆pQTL信号(涵盖2,923种蛋白质),以及“基因型-组织表达(GTEx)”项目中欧洲人群的肝脏转录数量性状基因座(eQTLs)之间共享的遗传变异。通过Bonferroni校正的184个metaboQTLs中,18个遗传信号参与了中国汉族人群血清蛋白质的丰度调控。基于英国生物银行的数据,122个和15个遗传信号是欧洲人群和东亚人群中的pQTLs,10个遗传信号是肝脏eQTLs,(PFDR < 0.05)。此外,研究还在中国汉族人群中识别了233个有强共定位证据(后验概率> 80%)支持的蛋白质-代谢物关联。进一步深入的研究为推测遗传-基因表达-蛋白质-代谢物证据链提供了依据。以凝血因子FXII的分子调控为例(见图5B),在代谢物水平,研究发现位于F12基因座(lead SNP:rs1801020)的metaboQTL信号与一组氨基酸和肽类(包括L-精氨酸、N-乙酰鸟氨酸、亮氨酸-缬氨酸和异亮氨酸-缬氨酸)相关。在蛋白水平,研究团队先前对东亚人群进行的大规模pQTL研究表明,rs1801020是FXII及其相关肽类的pQTL。同时,基于英国生物银行的血浆蛋白质组数据也发现了一致的结果,rs1801020与欧洲人群中的血浆FXII、丝氨酸蛋白酶抑制剂、以及丝氨酸/苏氨酸蛋白激酶ULK3的水平相关。2.5代谢物与常见慢性疾病的潜在因果关系
研究团队将鉴定的metaboQTLs作为工具变量进行全代谢组孟德尔随机化分析,探究了血清代谢物水平异常的潜在结局。使用IVW、MR-Egger、MR-RAPS及GSMR三种分析方法并结合HEIDI检验,识别出了9,303个血清代谢物-性状关联,涉及2,759种血清代谢物和37种复杂性状(包括人体测量学、代谢、炎症、以及肝肾功能参数等)。一级(Tier 1,最高级)、二级(Tier 2)和三级(Tier 3)的证据水平分别包含906、2,527和5,870个潜在因果关联。研究重点关注代谢(糖尿病和冠状动脉疾病)和免疫(类风湿性关节炎和哮喘)相关性状的一级潜在因果关联(见图6)
图6 孟德尔随机化分析鉴定了复杂性状相关代谢物
研究团队鉴定了27个代谢物与糖尿病(本文特指2型糖尿病)的一级潜在因果关联。孟德尔随机化分析表明,一组溶血磷脂醇(LPE),包括LPE(0:0/18:0)、LPE(18:0/0:0)和LPE(0:0/18:2),其受遗传调控的血清水平增加与较低的糖尿病风险相关(见图7A)。同时,该关联在KoGES的糖尿病GWAS数据中得到了验证。研究团队进一步整合了转录组和蛋白质组数据,探索了LPE水平的潜在调控机制。在代谢水平,研究发现位于LIPC基因座的metaboQTL rs1077835与LPE(0:0/18:0)和LPE(18:0/0:0)相关。在转录水平,rs1077835先前被报道为GTEx肝脏LIPC的eQTL。LIPC基因编码脂蛋白脂肪酶,该酶位于HDL颗粒上并促进脂质代谢。在蛋白质水平,英国生物银行的结果显示rs1077835作为反式pQTL,与三个与脂质代谢相关的HDL颗粒蛋白相关,包括载脂蛋白A1(APoA1)、磷脂转移蛋白(PLTP)和过氧化物酶3(PON3)。在表型水平,本研究发现LPE(0:0/18:0和18:0/0:0)与T2D之间存在潜在因果关联。综上,这些发现提示了从遗传位点(lead SNP: rs1077835)到基因/蛋白质(LIPC基因和HDL相关蛋白),再到代谢物(LPE [0:0/18:0]和LPE [18:0/0:0]),以及糖尿病风险的潜在证据链,突出了脂质代谢在糖尿病发生发展中的重要作用。此外,研究发现乙基3-吲哚乙酸(吲哚-3-乙酸衍生物)水平升高与糖尿病风险的降低相关。尽管在验证中通过靶向分析未能检测到乙基3-吲哚乙酸,但发现了吲哚乙酸(吲哚-3-乙酸衍生物)与糖尿病之间的负向关联(见图7B)。研究团队鉴定了代谢物与冠心病有38个一级水平的潜在因果关联。研究发现虾青素对冠心病具有潜在保护效应(见图7C)。虾青素具有抗炎和抗氧化特性,有助于调节脂质和葡萄糖代谢。研究团队还鉴定了与其它临床性状的具有潜在因果代谢物。如,1)DHA及其衍生物(±)4-HDHA是类风湿性关节炎的潜在保护因子(见图7D);2)虾青素是哮喘的潜在保护因子(见图7C)。3)L-脱氢抗坏血酸具有降低甘油三酯水平的潜能。
03 交互式共享数据库资源构建
研究团队将2,759种血清代谢物的全基因组关联数据进行了可视化并共享在网站:https://omics.lab.westlake.edu.cn/data/metabolites/phenotypes。对于每种代谢物,网站提供了其类别、测定可信度、GWAS的样本量、基因组lambda、显著位点的数量以及全基因组中排名最高的信号。研究已经通过了科技部人类遗传资源信息开放使用事先报告。同时,研究团队将血清代谢物与健康表型的潜在因果推断结果共享在网站:https://omics.lab.westlake.edu.cn/resource/metabolomemr.html。对于每个代谢物-表型关联,网站展示了效应值、标准误差、P值、工具变量数量以及孟德尔随机化分析方法。
04 总结
本研究对来自四个中国人群队列共3,795名个体的血清样本进行了全面的代谢组学检测和分析,通过将代谢组数据与全基因组数据相整合,绘制了2,759种血清代谢物水平的遗传调控图谱,为深入理解代谢物数量性状位点的潜在遗传分子调控机制提供了启示。研究揭示了血清代谢组与37种慢性病和相关临床性状之间的潜在因果关系,为中国人群常见慢性疾病的代谢分子特征研究和新型干预靶点开发奠定了基础。
浙江大学博士生程春晓、西湖大学许凤喆博士、四川大学潘雄飞研究员以及中山大学王澄博士为本文的共同第一作者,西湖大学郑钜圣研究员、浙江大学周丹研究员、华中科技大学潘安教授以及中山大学陈裕明教授为本文的共同通讯作者。本项研究得到了国家自然科学基金、国家重点研发计划、浙江省“尖兵”“领雁”研发攻关计划、西湖实验室(生命科学和生物医学浙江省实验室)的资助;课题实施过程中还得到了西湖大学高性能计算中心的大力支持。
西湖大学郑钜圣精准营养与计算医学实验室:
精准营养与计算医学实验室(主页:http://zheng.lab.westlake.edu.cn/)由郑钜圣研究员担任PI,致力于运用人体和人群生物大数据,结合基因组、代谢组、微生物组和蛋白质组等技术手段,在人群层面探索发现人类疾病的全新干预靶点。近5年来,已经在营养微生物组、代谢以及衰老领域取得多项原创性研究发现,成果发表于Nature Metabolism、Cell Genomics、Nature Communications、Gut等杂志。欢迎有志于精准营养或者计算医学等多学科交叉研究的朋友加盟。联系邮箱:zhengjusheng@westlake.edu.cn。由浙江大学百人计划研究员周丹担任PI,致力于开发、应用基于基因组的致病分子定位方法、构建中国人群多组学参考图谱,其中包括由国家脑库支持的“中国多地区人脑多组学图谱”项目(CBMAP)和由朱益民教授支持的“浙江舟山自然人群多组学队列”项目。近5年成果发表于Nature Genetics, Nature Communications, European Heart Journal, Cell Genomics, Genome Medicine等杂志。欢迎各位同道联系交流,详见https://person.zju.edu.cn/danzhou。