傻大方


首页 > 潮·科技 > >

算法|从引力波探测到RNA测序,AI如何加速科学发现( 三 )



按关键词阅读:

】后来许多工作开始集中在边缘计算和深度学习间的融合。有研究人员使用联邦学习的方式训练AI模型,而不是将所有数据发送给中央控制器进行训练。由于缺乏既快速又高效的实用型ML/AI解决方案,上述工作基本上停留在仿真阶段。更具体地说,开发一种计算平台,使得该平台能够以小于10ms的速度执行复杂ML模型,且可以配置在小型小区接入点是现阶段的主要目标。


2

数据处理的三种主要形式
实时、加速的人工智能推理有望在当前和未来的科学仪器领域提高探测能力。为设计高性能的AI系统,我们需要重点关注目标域机器学习算法的性能系数,它可能受到推理延迟、计算成本、可靠性、安全性和极端环境下运行能力的影响。例如,机器学习在大型强子对撞机上触发需要延迟100 ns的稀有事件采集系统。
此外,先进科学仪器的实时分析必须不间断地分配计算资源,无线医疗设备处理患者敏感信息必须保密。上述特征和特性为人们分辨出域和应用程序之间的差异和共性提供了可量化的准则。这些准则可以解决不同科学领域的不同需求。合适的数据表达是设计过程中重要一步,也是第一步,因为它能够决定模型的应用场景。
数据表示
在特定领域使用的数据表达方式对计算系统和数据存储均有影响。国际上,跨域数据表达可以分为原始数据和重构数据。数据表达方式通常因重建阶段和数据处理管道中的上游步骤而异。当数据具有图像性质时,现有的应用程序包括完全连接的CNN模型在内,通常将预处理的熟练特征变量作为输入值或 CNN模型。现有的CNN算法发展成果得益于变量的精准性和高效性。
为了充分挖掘CNN模型的力量,使其信息损失降到最低水平,需要采用一种合适的原始数据表达方式,例如点云,它根据不同实验和测量系统的原始数据可以明显得出:
  • 空间数据:用于描述几何空间中的物理对象。主要有两种类型:矢量和栅格数据。矢量数据可以由点、线或多边形组成;栅格数据是指由像素组成的网格,像素相依表示为图像或其他的值,如强度、电荷、场强等。
  • 点云:一种空间数据类型。这种数据表达是通过整理一组空间数据(即三维空间中的点)创建的,这些数据通常在空间中共同构成一个对象。
  • 时序数据:用于表示系统/实验在特定时间的状态。跨时段收集而来的数据会按照特定的顺序进行分类。时间序列数据是上述表达方式中的一个子集,其中的数据以固定的时间间隔进行采样。
  • 时空数据:可在空间和时间两个维度上测量和观测某个系统。在这种情况下,数据可以被认为是时空的。
  • 多光谱数据:用于表达多个传感器中的输出值,上述传感器能够从电磁光谱的多个频段捕获测量值。多光谱表达通常用于成像,与能够识别波长各异的光的传感器有关。通常会涉及几个到几十个光谱的量级。
  • 高光谱数据:用于表示从大量光谱(如100s)中得到的测量值。这些从各异的窄带光谱中采集到的图像被合并成一个高光谱立方体,该立方体具有三个主要维度,前两个维度参考了二维空间位置(例如,地球表面),第三个维度代表了每个“像素”位置的完整频谱内容。
点云
点云数据表达是高能粒子领域中一个常见的概念。在高能粒子领域里,经大量探测器收集而来的测量数据被合并成一个数据集。在众多高能粒子应用中,点云通常用于表示数据尺寸超过1Pb/s的粒子射流。通俗地说,点云可以用来捕捉任何三维空间事件和空间中运动部件的相互作用。
质子之间发生碰撞后的残余物在定制化和优化后的探测器中产生信号,在空间中以点的形式显示。扫描后的各类图像数据可以按照点云的方式呈现,生物医学工程和虚拟实境中的CT和PET扫描也是利用点云进行成像,还有用于产品设计、实体对象建模、体系结构和基础设施设计的三维扫描仪。
上述成像任务中,大部分都是按照从GB到TB的顺序生成相应大小的点云。域共享点云表达(例如高能粒子和生物医学成像)也会涉及到空间特性。
算法|从引力波探测到RNA测序,AI如何加速科学发现
文章插图
图注:Kaggle数据集中,Track机器学习在三维空间中将粒子跟踪命中进行可视化
多/高光谱数据
多光谱数据在无线医疗监测和无线通信系统之间普遍存在。一组生理传感器通常代表不同的模式,被合并成一个多光谱数据集,用于医疗监测和干预系统。对于无线通信而言,通过多光谱数据捕获信号干扰情况和网络流量状况,两个领域都会跨时间捕获数据,因此也会显示出时间特性。


稿源:(雷锋网)

【傻大方】网址:http://www.shadafang.com/c/110394261H021.html

标题:算法|从引力波探测到RNA测序,AI如何加速科学发现( 三 )


上一篇:淘品牌|淘品牌,消失在双十一战场

下一篇:没有了