蜘蛛|「社会科学」庞珣:避免“下不该下的结论”——社会科学研究中的识别与信度( 五 )


从理论一方看 , 识别虽不是理论构建的必要工作 , 但带着识别意识进行理论创新 , 对避免所创建的理论与实证脱节至关重要 。 这对理论创新本身有莫大裨益 , 因为如果理论无法在经验世界中找到哪怕是局部的或间接的映射 , 这个理论就会由于缺乏实证检验而停留于猜想 。 或许有人担心 , 顾及实证考量的可行性会限制“理论高度” , 认为经验世界由特殊性构成 , 因此理论的普遍性越高 , 它在现实中的可识别度就越低 。 这种担忧是对实证研究的误解 , 将其等同于直接观察所得 。 实证研究尽管可以停留于经验归纳 , 但更多的实证方法是推论性的 , 即超越经验观察而作为连接理论世界和经验世界之间的桥梁 。 换言之 , 实证方法通常致力于帮助我们从经验世界的束缚中走出足够远而可以与纯粹的理论在某处相汇合 。 普遍性高的理论并非不能通过实证研究来与现实世界相连接 , 关键在于理论对象的可识别性和实证研究的识别策略 , 即桥梁应架在哪里和桥梁应如何设计 。 因此 , 不可识别在任何情况下都不应成为对理论的褒奖 。
有一些理论的不可识别性确系观测技术滞后所带来 , 克服这类理论与实证相脱节问题需要后者的努力而非理论的屈就 。 但其他一些不可识别的理论则需要修改理论本身 , 如果不可识别性来自理论自身的缺陷 , 如概念含混和概念间逻辑关系模糊导致无法定位识别对象、假定设置过强以致完全无法映射到现实世界等 。 致力于理论创新的研究者在构建自己的理论时 , 有必要考虑以下问题:理论哪些部分可识别、哪些部分无法识别?这些部分对整个理论而言在逻辑上处于什么地位?可识别部分的主要识别困难在哪里?不可识别部分能否进行修改而变得尽量可识别?理论有哪些可观察含意(observable implications)?等等 。 带着这些问题进行理论构建 , 不但能够帮助理论得到实证检验 , 还有助于理论的严谨和优雅 。
三、避免过度量化: 明确和透明的识别假定 判断任何现象和行为是否“过度” , 首先需要明确什么是“适度”以及在什么意义上超过了这个合适的“度” 。 即使定量研究使用的频度非常高、范围非常广和增长速度非常快(事实上在很多社会科学领域并非如此) , 其本身都不必然为“过度量化” 。 从识别的角度来理解过度量化的问题 , “过度”可能是因为定量研究在以下三个方面产生了问题 。 第一 , 过度扩展定量研究的识别对象范畴 , 对那些在理论和逻辑上缺乏可识别性的对象进行强行(错误或有重大偏差的)识别 。 第二 , 将识别策略等同于对数据的技术分析 , 忽视或否认理论假定在识别策略中的重要作用和地位 , 缺乏对理论假定的深入探讨和仔细斟酌 。 第三 , 试图以数据和技术来弥补甚至是自动纠正识别设计中的缺陷和错误 。
“不可识别”并不是研究对象的“不可知” , 而是对在什么程度上“可知”的判断错误 。 前文的探讨中我们已经看到 , 在选择和定义识别对象时 , 设计驱动型研究承认不是所有的对象在任意程度上均可以得到识别 , 比如因果效应因包含无法观测的“反事实”而不可“精准”识别只能进行近似识别 。 即使我们有再多的数据和再强的技术 , 也无法直接观测到它 。 如果无视这一点而认为大数据可以提供因果识别的全样本从而通过直接观测而非推论即可识别因果效应 , 从而不承认识别所依赖的假定以及识别结果的不确定性 , 就会产生“过度量化”的问题 。
任何识别对象的“可识别”均不同程度建立在识别假定上 , 数据的丰富和技术的进步可以帮助我们放松一些识别假定 , 但“可识别”始终无法做到完全脱离假定 。 因此 , 我们有必要让这些假定清晰化和透明化 , 而用数据和技术来淹没或掩盖这些假定则会造成“过度量化” 。 比如 , 在上文的GATT/WTO例子中 , 虽然个体因果效应不可识别 , 但我们可以给予一个强假定 , Yit(0) =Yjt(0), 即非GATT/WTO国家j的出口结果可以视为GATT/WTO国家i在t年的“反事实”而提供所需识别信息 。 这之所以是一个假定而无法用数据或技术来证明或检验 , 仍在于它是对从定义上即无法观测的反事实Yit(0)的假定 。 如果不愿意使用如此强的假定 , 我们还可以通过降低识别对象细粒度来降低识别难度 , “退而求其次”地追求平均因果效应δ=E[Y(1)-Y(0)\\
。 虽说从个体因果效应到平均因果效应还是没有解决“反事实”不可观测的问题 , 但假定一组“国家—年份”的平均结果为另一组的平均结果的反事实 , 这个假定要比在个体层次上更弱、更有可能成立 。 比如在随机实验的条件下 , 随机分配让“可忽略性”(ignorability)这一关键识别假定变得合理 , 一组单元的平均可以合理地视为另一组单元平均的反事实 , 从而δ成为可识别的对象 。 但社会科学能够进行随机试验的情况很少 , 大多时候只能依靠观察性信息 , 因此无法较好地满足“可忽略性”假定 。 比如 , 我们很难接受国家加入或不加入GATT/WTO是随机选择的假定 , 即“可忽略性”假定难以成立 , 从而δ仍然不可识别 。 于是 , 我们可能不得不继续“退而求其次”定义一个新的可识别的对象 , 比如“条件的平均因果效应”δ(Z)=E[Y1-Y0 |Z\\