在中国,地理差异始终是解读社会文化与经济发展的重要密码。谈及文化分野,“南北” 框架几乎成为默认视角 —— 从 “南甜北咸” 的饮食偏好、“南船北马” 的出行传统,到 “南柔北刚” 的性情刻板印象,乃至方言腔调的婉转与铿锵、戏曲唱腔的细腻与豪迈、建筑风格的灵动与厚重,皆被纳入南北对比的分析范畴。更具争议性的是 Talhem 等学者在 2014 年提出的假说:他们认为 “南稻北麦” 的农业格局,并非单纯的生产方式差异,更在深层塑造了中国人的文化心理结构与行为逻辑,为南北文化差异提供了历史溯源的可能。
而当话题转向社会经济发展,“东西” 维度则取而代之成为核心叙事。东部沿海地区凭借临海区位的天然优势与政策先行的制度红利,在经济开放程度、产业现代化水平、城市化进程速度及国际资源融合度上均遥遥领先;反观西部内陆,受限于山脉阻隔的地理条件、产业基础薄弱的历史积淀,发展步伐相对迟缓。这种东西部发展不平衡的态势,早已成为当代中国经济格局中无法忽视的核心特征。
那么,在与民生紧密相连的人口行为领域,这种地理分野是否同样存在?答案是肯定的。人口学研究的核心共识之一,便是任何人口行为都并非孤立存在,而是文化传统与社会经济因素共同作用的结果。我们近期开展的一项研究,通过小区域估计方法整合调查数据与普查数据,对中国县级层面的理想子女数与意愿子女数进行了精准测算,结果清晰呈现出一幅独特的空间图景:生育意愿的两个关键指标,分别对应着 “南北分化” 与 “东西差异” 的鲜明态势,为地理差异影响人口行为提供了直接证据。
概念辨析:理想与意愿,两种生育认知的本质差异
要理解生育意愿空间分布的复杂性,首先需要打破一个认知误区 ——“理想子女数” 与 “意愿子女数” 并非同义替换,二者虽存在关联,却承载着截然不同的内涵,反映了个体对生育问题的两种思维逻辑。从测量方式来看,二者的提问设计便已体现出差异:
- 理想子女数:通常通过 “你认为一个家庭拥有几个孩子最理想?” 这一问题获取,聚焦于 “家庭” 这一社会单元的最优状态;
- 意愿子女数:则以 “你自己想生几个孩子?” 为核心提问,落脚于 “个体” 的实际生育计划。

图1 理想子女数(左)与意愿子女数(右)的空间分布
正如人口学者郑真真所指出的,这种提问差异背后,是两种完全不同的思维模式:理想子女数是一种 “向后看” 的总结性认知,它源于个体长期接受的文化规范、社会期待与家庭传统,本质上是对 “应该有几个孩子” 的价值判断,因此很少考虑现实中的约束条件;而意愿子女数是 “向前看” 的规划性认知,它更关注个体在未来生命周期中 “能生几个孩子”,经济压力(如育儿成本、住房支出)、政策环境(如生育支持政策)、个人条件(如职业发展、健康状况)等现实因素,都会对其产生直接影响。
这种本质差异,直接体现在数据特征上:理想子女数的均值普遍较高,且不同区域、不同群体间的差异(即方差)较小,其空间分布更稳定地贴合文化区域的划分;而意愿子女数的均值更低,方差更大,其空间格局与社会经济发展梯度的契合度更高 —— 经济发达地区与欠发达地区的意愿子女数,往往呈现出显著差距。

图2:理想子女数(左)和意愿子女数(右)在分层回归后数据交叉单元(年龄组县)估计的分布
方法创新:如何用有限数据,绘制县级生育意愿地图
要捕捉生育意愿在县级层面的细微差异,最大的挑战在于数据的 “精度不足”。当前主流的生育相关问卷调查,其设计目标多是保证全国或省级层面的代表性,难以覆盖县级这样的微观地理单元,就像用 1:1000 万的地图寻找一座小镇,无法看清局部细节。为解决这一问题,我们基于 2017 年全国生育状况抽样调查数据,结合人口普查分县育龄妇女年龄结构数据,引入了 Gelman 等学者在 2017 年提出的 “分层回归与事后加权(MRP)” 方法,成功将不具备县级代表性的调查数据,转化为可反映县级真实情况的生育意愿指标。整个方法流程可分为两个核心步骤:
第一步:分层回归模型,解决 “数据稀疏” 问题
我们首先构建了多层级的回归模型,将被访个体的年龄组、所属县、地级市、省份等作为不同层级的 “随机效应”,以此预测个体的生育意愿。这种模型设计的关键优势,在于应对 “样本量极少或无样本的县” 的估计难题 —— 模型不会孤立看待这些 “数据空白” 的县,而是通过 “部分池化(partial pooling)” 技术,让这些县的估计值向整体平均水平适度 “收缩”,避免因样本偶然因素导致的极端结果,从而得到更稳定、合理的县级生育意愿预测值。在分层回归模型中,学者通常更关注 “固定效应”(如年龄、教育程度等个体特征的影响),但 “随机效应” 的 “收缩特性” 实则是保证估计精度的核心技术。其逻辑基础是:所有观测单位(如不同县、不同年龄组的女性)都属于某一 “共同体”(如同一个省份、同一个年龄段),因此可以借助数据充足群体的信息,校正数据稀疏群体的估计偏差,最终提升推断结果的稳定性与可靠性。
第二步:事后加权,还原 “真实人口结构”
分层回归模型的输出结果,是每个 “人口亚群”(例如 “XX 县 25-29 岁女性”“XX 县 30-34 岁女性”)的生育意愿预测值。但此时若直接将这些亚群的预测值平均,无法真实反映整个县的生育意愿 —— 因为调查样本中各亚群的比例,可能与现实中该县的实际人口结构存在显著差异(例如样本中 35 岁以上女性比例偏高,而现实中 25-30 岁女性占比更高)。为解决这一问题,我们引入了人口普查数据,提取出各县育龄妇女的真实年龄构成比例,将其作为 “权重”,对各亚群的生育意愿预测值进行加权合并。通过这一步骤,最终得到的县级生育意愿数据,能够完全贴合当地的实际人口结构,确保了数据的真实性与代表性。
研究启示:地理尺度与多维视角下的生育意愿新认知
除了揭示生育意愿的空间分异规律,我们的研究还带来了一个关键发现:地理尺度对解读生育意愿至关重要。数据显示,无论是理想子女数还是意愿子女数,其 “省内差异” 的幅度与 “省际差异” 基本相当。这一结果打破了 “省级行政单元是生育意愿影响因素主要作用层面” 的固有认知,提示我们:影响生育意愿的关键变量(如地方文化传统、区域经济活力、基层生育支持政策),可能更多作用于县级、乡镇级等更微观的地理或社会尺度。从更宏观的视角来看,这项研究不仅绘制了中国生育意愿的 “精细地图”,更提供了一种理解中国社会差异的新维度。它告诉我们,“生育意愿” 这个看似简单的指标,当被置于 “文化与经济”“理想与现实”“南方与北方”“东部与西部” 的多维透镜下观察时,会呈现出层次丰富的复杂图景 —— 就像石墨与钻石,虽由同种碳原子构成,却因内部结构的细微差异,展现出截然不同的物理性质。
这种认知转变的价值在于,它提醒我们:在分析中国的社会问题时,既不能忽视宏观的地理分野与历史传统,也不能忽略微观的区域差异与现实约束;唯有从多维视角出发,才能更精准地把握问题本质,为制定更具针对性的政策(如差异化的生育支持措施)提供科学依据。
