马费成:大数据、人工智能如何与人文社会科学研究深度融合|光明讲坛216讲


马费成:大数据、人工智能如何与人文社会科学研究深度融合|光明讲坛216讲文章插图
马费成 1947年出生 , 武汉大学人文社会科学资深教授、国家教学名师、教育部人文社会科学重点研究基地武汉大学信息资源研究中心首席科学家、武汉大学大数据研究院院长 。 长期从事情报学理论方法、信息资源规划与管理等领域的教学科研工作 , 承担国家社会科学基金重大项目、教育部哲学社会科学重大课题攻关项目、国家自然科学基金重点项目等国家及省部级科研项目30余项 , 出版著作20余部 , 发表论文200余篇 。
在这个快速变革和发展的新时代 , 人文社会科学研究的内涵与外延处在不断深化和拓展之中 , 电子踪迹、社交媒体、数字文本以及空间位置信息等大规模数据已经广泛渗透应用于人文社会科学研究之中 , 当代人文社会科学研究的新场景值得我们重视和思考 。
人文社会科学研究的新场景
大数据时代 , 从典型案例探析研究新动向
人文社会科学研究的真正价值源自于研究问题 。 把握人文社会科学研究的发展趋势在于寻求研究问题的解决路径 。 相同的研究问题可以从不同学科领域、不同角度以及不同侧重点进行分析 。 在大数据时代 , 运用信息技术有助于人们更加深入透彻地了解人文社会科学研究中的新动向 , 例如 , 进一步跟踪和关注以下具体研究问题 。
第一 , 实时洞察热点事件 。 大数据在各行各业的应用 , 能够即时且最大化的体现数据价值 。 如央视新闻采用百度定位数据展示春运人口流动图景;印度研制的MogIA人工智能系统用网络数据四次成功预测美国大选结果;谷歌研发的GFT流感趋势预测系统基于用户搜索记录预测美国的流感趋势;等等 。 过去用传统数据进行研究具有很大的时滞性 , 而实时性数据的获取 , 能够有效提升人们发现世界的真实度 , 人文社会科学研究也可以得到更多有意义的结论 。
第二 , 解读人类行为规律 。 社交媒体数据为解读人类行为规律或行为倾向提供了很好的机遇 。 在过去 , 研究人的行为主要通过问卷、访谈、实验等方法 。 现在社交媒体成为提供数据的重要场所 , 研究人员不需要被测对象响应和配合 , 也不需要等待被测对象 , 因此给人文社会科学研究提供了很大方便 。
马费成:大数据、人工智能如何与人文社会科学研究深度融合|光明讲坛216讲文章插图
第三 , 用科学来破解文学争议 。 如辨别红楼梦前80回和后40回作者是否为同一作者以及《静静的顿河》的作者之争等等 , 这些文学问题都可以通过统计分析、数据挖掘、机器学习等手段进行分析 。 这种用数学解决文学问题的方法有一个形象的说法叫“文学指纹” , 即像识别指纹一样来识别不同作家的文学风格倾向 。 同样 , 这也体现出文学在研究思维上发生的重大转变 。
第四 , 宏观分析历史变化 。 大数据为全面、宏观的分析历史变化提供了充分条件 。 如武汉大学社会学系龚为纲博士用网络数据分析西方社会民粹主义思潮的历史演变;Maximilian Schich等学者用名人出生地和死亡地的数据研究文化艺术中心的历史迁移问题;等等 。 过去的研究很难对历史变化有整体性把握 , 研究结论往往与研究者个人视野有很大关系 , 只能分析解决局部问题 , 而数据处理技术和分析手段出现后 , 我们能够通过数据的直观展示了解到历史变化过程以及历史事物 。
第五 , 探究重大社会问题 。 通过数据中隐藏的规律来揭示重大社会问题 。 过去应对复杂非线性社会问题 , 最常用的是实证化研究 , 当时这些研究的解释力度不够 。 而现在可以用“数据发现逻辑” , 解决以往难以攻克的社会问题 , 有助于国家相关政策的制定以及维护社会稳定 。
我认为 , 如果数据方法和分析手段运用得当 , 真正融入人文社会科学的重要问题中 , 那便是优秀的、具有影响的研究成果 。
技术环境变化 , 创造有利研究条件
从当前人文社会科学研究场景中可以看出 , 有许多研究以前行不通而现在可以进行了 。 实际上是技术环境变化创造了有利的研究条件 。
比如说 , 现实世界的转换路径:数字化 。 数字化是一个时代感很强的术语 , 也是一种常见的现实应用场景 , 指将复杂多变的信息对象 , 如声音、颜色、图形、图像等 , 转换为二进制 , 由计算机统一处理 。 从而人们可以在另外一个世界(空间)去研究原来现实中的一些问题 。 数字化的理念以及数字化工具和技术能力应用于很多领域 , 解决了许多基础性问题 , 如数字化书籍、报纸杂志、图书馆、博物馆等等 。