爱与否科技|19 种灾害事件,MIT 更新最大自然灾害图像数据集,囊括( 二 )


这些图像分辨率为1024×1024 , 其中每个建筑物都有标识符 , 并在灾前灾后图片中保持一致 。
但研究者发现建筑物的分辨率往往太小 , 模型无法准确绘制建筑物边界 。 为此 , 他们在4张512×512的图像上训练和运行模型 , 形成左上角、右上角、左下角和右下角象限 。
根据这些灾前和灾后数据 , 损伤评估可以被定义为单时间和多时间任务 。 在单时间设置中 , 只有灾后图像被输入模型 , 该模型必须预测每个像素的损伤水平 。 在多时间背景下 , 灾前灾后图像都被输入到模型中 , 该模型必须在后图像上预测损伤程度 。
爱与否科技|19 种灾害事件,MIT 更新最大自然灾害图像数据集,囊括
文章图片
团队综合多方资料 , 制定的损坏评估量表
数据集从何而来?
团队表示 , 这套新数据集旨在填补该领域的空白 。 现有数据集的图像数量和事件类别的多样性都受到限制 。
作者还解释了如何创建数据集、如何创建模型以检测图像中的事件 , 以及如何过滤嘈杂的社交媒体数据中的事件 。
他们的其中一项工作是 , 过滤了4000万张Flickr图片 , 来寻找灾害事件 。 另外一些工作则是可对地震 , 洪水和其他自然灾害期间 , 发布在Twitter上的图像进行过滤 。
比如 , 该团队将与自然灾害相关的推文过滤为特定事件 , 并通过将推文频率与美国国家海洋和大气管理局(NOAA)提供的数据库相关联 , 来验证这一过程 。
EthanWeber说:“我对这个数据集能够进行进一步的研究以检测图像中的事件感到兴奋 , 它也非常有效地激发了人们对计算机视觉界的兴趣 。 ”
他还表示 , 社交媒体和卫星图像都是有助于应急响应的数据形式 。 社交媒体提供实地观察 , 而卫星图像提供宏观的观察(expansiveinsights) , 例如确定哪些地区受野火影响最大 。
爱与否科技|19 种灾害事件,MIT 更新最大自然灾害图像数据集,囊括
文章图片
每逢灾害发生 , 网友通常会在社交媒体上发布实地拍摄照片
正是意识到这种相互联系 , EthanWeber和他的校友合作 , 在损害评估方面做出了卓越的成绩 。
EthanWeber说:“现在我们有了数据 , 对定位和量化破坏很感兴趣 。 我们正在与应急组织合作 , 以保持专注并开展具有现实利益的研究 。 ”
访问https://hyper.ai/datasets/13127或点击原文阅读 , 即可高速下载该数据集 。
编辑:黄继彦
——END——
【爱与否科技|19 种灾害事件,MIT 更新最大自然灾害图像数据集,囊括】想要获得更多数据科学领域相关动态 , 诚邀关注清华-青岛数据科学研究院官方微信公众平台“数据派THU” 。