上周带小儿去做儿保,医生对着屏幕皱着眉头说:"体重偏低,在第12百分位,需要关注。"
我盯着那张曲线图看了半天,问:这用的是哪个标准?医生愣了一下,说是WHO的。我又问:是2006版还是更新的?她说不清楚。
好吧,这事就说来话长了。
一张曲线图背后的统计工程
做了十年儿童健康科技,我一直觉得"生长曲线"这个东西被家长严重低估了。大家以为那只是一张对照表——身高85厘米,体重12公斤,看看落在哪条线上,然后焦虑或不焦虑,就完了。
实际上不是的。
那条平滑的曲线,背后是一套叫做LMS的统计模型。L是偏态(Lambda),M是中位数(Mu),S是变异系数(Sigma)。这三个参数共同决定了每个年龄点、每个百分位数的具体数值。曲线之所以是"平滑的",是因为需要对原始数据进行拟合,消掉样本误差带来的锯齿感。
这套方法从1992年被T.J. Cole提出以来,是全球儿童生长标准的核心算法,WHO的生长曲线、英国参考标准、美国CDC图表,基本都是基于这个框架。
去年发表在《Statistics in Medicine》上的一篇论文(Cole, 2026),对LMS方法进行了改进——当数据分布曲率很高的时候(比如婴儿期早期体重增长极快),传统平滑方式会出问题,新方法通过"变量变换"和"自适应平滑"两种技术来修正,让拟合结果更准确。
"A popular approach to growth reference centile estimation is the LMS method... this article provides two methods, transformation and adaptive smoothing, for improving the centile estimation when there is high curvature."
(生长参考百分位数估算的常用方法是LMS法……本文提出变量变换和自适应平滑两种方法,用于改进高曲率情况下的百分位数估算。)
听起来很学术对吧,但这个细节很重要。婴儿出生后头三个月体重增速是人一生中最快的时期,这段时间曲线曲率最高,老方法容易系统性地低估或高估。也就是说,你看着孩子"在第15百分位",误差可能就藏在方法论里面。
谁的标准,量谁的孩子?
更大的问题是:用哪个国家的标准量哪个国家的孩子?
这两年国际上有一个明显趋势——越来越多的国家在建立自己的本地化生长参考值,而不是直接照搬WHO的标准。
约旦今年在《Frontiers in Pediatrics》上发表了一篇研究,专门为约旦0-2岁儿童建立了本国生长曲线,因为他们发现,按WHO标准评估,会系统性地误判本国儿童的营养状况。巴基斯坦旁遮普省也做了类似的工作(发表在《Journal of Clinical Medicine》,2025),20845名3到60个月的儿童数据,建了自己的体重、身长、BMI百分位参考值,和WHO标准对比发现存在明显差异。
这研究里有个数据我印象深,BMI在出生后12个月左右达到峰值,之后就开始下降,到5岁前都是下降趋势。这个"胖嘟嘟的婴儿"现象其实是正常的生理规律,但如果用错了标准,就可能被误判为"超重"或者"肥胖"。
"The median BMI increased steeply in early life, with a peak at 12 months, then declined in both sexes."
(BMI中位数在出生早期急剧上升,在12个月时达到峰值,之后在男女儿童中均呈下降趋势。)
把这套逻辑放到中国来,情况一点也不简单。目前国内正在用的标准起码有四五个版本同时流通:WHO 2006版、国家卫健委2009版、2022/2023版的《7岁以下儿童生长标准》,加上2025年新出的《婴幼儿营养喂养评估服务指南》里带的参考数据……每个版本基于的数据年份不同,采样城市不同,结论自然也不一样。
实际我观察到很多医院和社区诊所用的还是WHO或者老版本的曲线,基层儿保医生换标准的速度远不如研究机构更新标准的速度。就拿首都儿科研究所李辉研究员的数据来说,近十年中国儿童生长发育已超过WHO现行标准,7岁以下儿童身高平均比2009年版高了0.5-0.6厘米。
换句话说:用旧标准量现在的孩子,很可能低估了孩子的实际发育水平,反而制造不必要的焦虑。
罕见病孩子的"尺"更难找
还有一个更小众但更尖锐的问题,是做罕见病的人才会面对的——对于携带特定基因突变的孩子,连"本地化生长标准"都不够用。
发表在《European Journal of Human Genetics》上的一项研究(Low et al., 2026)专门解决了这个问题。他们研究了6种单基因神经发育障碍(ANKRD11、ARID1B、ASXL3、DDX3X、KMT2A、SATB2),这些基因变异会影响孩子的生长模式,但每种疾病的患者样本量都很少,传统LMS方法根本建不出稳定的生长曲线。
他们的解法挺聪明——先把每个孩子的测量值转换成相对于健康儿童参考标准的z分数(标准差),然后在z分数尺度上建模,得到基因特异性的中位数和±2SD范围,再反推回实际的身高/体重数值。
这个方法叫"LMSz",只需要对均值和标准差建模,不用额外估计偏态参数,样本量需求大大降低。328名英国病例加上264名国际病例,总共592人,就能做出6个基因的生长图谱。
结果挺有意思的,不同基因对生长的影响方向完全不同:KMT2A突变的孩子身高随年龄有上升趋势,ASXL3突变的孩子头围中位数只在第3百分位,相当低。这类信息对临床医生判断孩子发育是否偏离"自己的轨道"非常有价值。
"Our LMSz method produces gene-specific growth charts for rare diseases, which, when used in the correct context, could be an important clinical tool."
(LMSz方法能够为罕见病生成基因特异性生长图表,在合适的临床场景中使用,可以成为重要的临床工具。)
而且他们计划把这个方法自动化,接入DECIPHER平台——那是一个全球罕见病基因组数据共享平台,有了自动化工具,将来每发现一个新的生长相关基因,就能快速生成对应的生长曲线,而不用等待数年才能收集到足够样本再手工建模。
从工程角度来看,这其实是一套很优雅的pipeline设计:standardize → model → back-transform → automate。
"你家娃达标了吗"这个问题本身就有问题
作为一个两个孩子的爸,我深刻理解那种每次儿保体检完就焦虑地对着曲线图发呆的心情。老大那时候体重一直在P25附近,我查了很久资料,才弄明白P25不是"不达标",是说这个孩子比25%的同龄儿童重,比75%的同龄儿童轻,在正常范围内。
很多医生(甚至不少儿科医生)习惯用P50作为"标准",低于P50就说体重偏轻,这其实是对百分位数的误读。标准区间一般是P3到P97,在这个范围内的任何位置都是正常的,关键看的是趋势有没有跨越大曲线。
更关键的一点,很多人容易忽略的是:不同标准之间差异确实不小。曾有个案例,同一个1岁男宝身高71.2厘米,用一个版本的标准是"生长迟缓"(低于-2SD),换一个标准就落在-1SD到-2SD之间,属于正常范围。就因为用了哪张表,孩子的"诊断"就变了。
这不是小事。
我的判断
从技术上看,目前国内生长监测这个场景存在几个比较明显的问题:数据标准碎片化(多个版本并行使用)、基层机构更新标准滞后、针对中国儿童的本地化持续研究投入还不够系统。
从数据驱动的角度,我认为未来的儿童生长监测系统应该做到这几件事:
一是标准要及时更新并统一推送,不能让基层医生和家长自己去判断用哪个版本。
二是工具要能支持多标准对比,比如同时显示WHO和国标的数值,让医生有判断空间而不是被单一数字绑架。
三是对于罕见病或特殊遗传背景的孩子,要有机制能快速生成"个性化"的生长参考,而不是硬套普通人群标准。
说到底,生长曲线是一个监测工具,不是诊断工具。如首都儿科研究所的专家强调的:标准不能直接作为临床诊断,它只是筛查高危的工具。孩子的生长发育,最终还是要结合生长速度、遗传背景、整体发育状态综合判断。
下次儿保医生说孩子"偏低",你大可以追问一句:用的是哪年的哪个版本的标准?




