产业气象站|网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?( 二 )


2.海上贸易关系预测的
关键是贸易网络共同邻居数
本文利用不同拓扑信息或者港口特征信息所构成的模型对海上贸易网络进行链路预测 。 为了比较不同模型的预测效果 , 文章采用正确预测连边数量与新产生的连边数量的比例来刻画 , 并对不同类型的子网络进行了验证 。
在这些模型中 , 预测效果最好的模型是“共同邻居数-海洋距离”所构成的模型 , 即两个港口之间的共同邻居越多 , 它俩的链接概率越高;而两个港口越近 , 它俩的链接概率越低 。 研究结果表明建立海上贸易直接关系的关键特征是共同邻居数 。 在不同类型船舶的子网络上 , 该模型都适用 。 在1997年-2008年的整个研究区间内 , 模型的预测效果都很稳定 。
此外 , 基于港口的人口潜力、国家的GDP值和港口海洋距离的经典引力模型的性能较差 。 而将GDP值或人口潜力数据与共同邻居数量相结合 , 并不会提高共同邻居的预测准确性模型 , 表明这两个变量对预测海上贸易联系没有更多的附加值 。
为什么共同邻居数能很好地预测港口间的贸易关系?研究者认为捷径道路的选择趋势(Thetendencytoshortcutroutes)是一种可能的解释 , 即两个港口间的共同邻居数量和它们间的网络中的两条路径的数量是一致的 。 可以预期的是 , 共享大量邻居的两个港口之间 , 会有更大的间接贸易流 。 为此 , 建立直接贸易连接可降低运输成本 。
产业气象站|网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?
文章图片
产业气象站|网络科学前沿:怎样用国际海运网络预测港口间的贸易往来?
文章图片
图2:1978年至2008年之间 , 不同预测模型结果的对比情况 。 使用不同模型正确预测的链接打开量的百分比度量 。 Y+1年的预测基于Y年的特征 。 表中提供了该期间的平均结果 。 在度量的设计中 , 将每个模型要预测的连边数设为连续几年之间实际创建的连边数 , 因此 , 误报率=误报率=(100%–百分比量度) 。 用于链路预测的模型的相对质量是稳定的 , 且依赖于公共邻居数量的模型的预测结果始终是最好的 。
3.共同邻居数实现了
对海洋贸易货物流量的最佳预测
该部分将上述链路预测的方法拓展到加权方案来预测海上贸易网络中连边的流量 。 现对公式1进行改写 , wij被定义为在Y+1年对港口i、j之间绝对值流量的估计 , 即wij代表从港口i流向港口j的份额 。 一般地 , 在Y+1年 , 港口i , j之间流量的估计值可被计算:
其中 , deadweighttonnage(DWTi)表示Y年份通过港口i总的船舶自重吨位值 。 N(i)表示港口i的度值 , 港口i的直接贸易伙伴的集合 , Φ是参数的拟合函数 。 在本研究中 , 将公式2定义为“流出模型” 。 在流量预测的过程中 , 使用了Y年的未加权网络数据和港口的吞吐量(PortDWT)来预测年的流量 。
与链路预测结果相类似 , 依赖于公共邻居的数量和海洋距离的模型 , 可以实现对海上贸易中实际货物流量的最佳预测 , 且预测结果在不同类型的海洋贸易网络中表现一致 。 他们的对数流量确定系数在0.33至0.45的范围内 , 并且其性能优于其他的测试模型 。
与经典引力模型预测结果对比来看 , 基于人口 , GDP和港口之间的海上距离的重力模型预测效果不佳 。 此外 , 在忽略港口的历史和文化联系对确定系数的影响很小 。
进一步 , 在仅考虑海洋距离的情况下(不考虑共同邻居特征)流量的确定系数降低0.10至0.14 , 而海上距离对流量预测的效果在不同类型的船舶网络中表现不同 。 对于干散货船和油轮 , 仅基于共同邻居的流出模型可提供良好的预测质量(与包括海洋距离的模型相比 , 其系数降低了0.03至0.05) , 而对于集装箱和普通货船 , 其系数比包含海距的模型低0.12 。
共同邻居数对流量预测起到关键作用的原因 , 文章给出的解释是从港口出来的船舶及其贸易遵循着加权随机游走(在加权的国际贸易网络中以一定的概率随机跳跃) 。 通过这种方式 , 港口的总吞吐量在其邻居之间分配(分配比例与模型描述的权重成比例) 。 最佳流出模型依赖于权重wij , 该权重wij是港口之间共同邻居的数量及其海洋距离的函数 。