点击蓝字
关注我们
上科大近期科研速递@信息科学领域
视觉与数据智能中心多项科研成果被AAAI年会录用
王浩宇组提出无线电能传输系统的通用时域建模方法
团队合作在压电微型超声换能器器件与应用取得多项成果
刘宇组本科生围绕电力系统继电保护与故障定位发表多项研究成果
张海鹏组提出一种新的汉字表征方法
视觉与数据智能方向产出多项成果
作为上科大“智能感知与人机协同”教育部重点实验室的核心研究方向之一,近期信息学院视觉与数据智能中心 ( VDI Center)教授团队围绕智能视觉方向产出多项科研成果,并被AAAI 年会(AAAI Conference on Artificial Intelligence, AAAI 2023)接收录用。AAAI年会是中国计算机学会推荐的CCF-A类人工智能领域学术会议。
1、FusionPose,一种新的基于单台激光雷达相机设计的大规模场景3D-MPE方法
大型户外场景室外三维多人姿态估计(3D-MPE)是人类运动理解的一项重要技术,可为许多下游的现实世界应用带来便利,如动作识别、人机协作、服务型机器人等。马月昕团队提出了FusionPose,一种新的基于单台激光雷达相机设计的大规模场景3D-MPE方法,该方法在新收集的数据集LiCamPose和其他相关的开放数据集上实现了较先进的性能。
图 传感器设置及算法结果可视化
2、CL3D,一种基于无监督的跨域跨激光雷达传感器的三维物体检测算法
基于激光雷达点云的三维物体检测是大场景三维感知的一项重要的任务。马月昕团队提出了一种基于无监督的跨域跨激光雷达传感器的三维物体检测算法CL3D,在新数据没有任何标注数据的情况下依旧保持算法较好的性能表现。相关研究在自动驾驶数据集如Waymo、nuScenes等上进行了实验测试,均取得了较好的性能表现。
3、HybridCap,一种复杂人体运动通过惯性辅助的单目捕捉算法
单目三维人体运动捕捉(mocap)对于许多应用有着重要的价值。许岚团队提出了一种轻量级的混合式动捕技术,还提出一种结合惯性反馈和视觉线索的混合优化方案,以提高追踪精度。在各种数据集上的广泛实验表明,该技术能够鲁棒地处理从健身动作到拉丁舞等具有挑战性的运动,达到每秒60帧的实时性能,并在3DPW,AIST++, 和HCM等公开数据集上取得了较高的准确度。
图 算法流程图
4、CCQ: 通过建模跨类查询从多个部分标注的数据集中学习分割多器官和肿瘤
三维CT图像的多器官和肿瘤分割是许多临床应用的基础。杨思蓓团队提出利用多个部分标注的单器官和肿瘤数据集进行联合训练,同时创新提出了跨类别查询网络CCQ,实现充分利用部分标注的医学图像数据集进行多器官分割。实验表明,该方法在开放的七个器官和肿瘤分割数据集上大幅提升了多器官分割的准确性。
5、IKOL:基于高斯-牛顿微分的逆向动力学三维人体姿势和形状估计
三维人体参数化模型估计在视频分析、摄像头监控、人机交互、虚拟现实增强现实等领域得到广泛应用。石野团队提出了IKOL,设计了逆向动力学优化层的网络结构用于三维人体姿势和形状估计。IKOL在人体姿态估计榜单3DPW和3DHP上等开放数据集上实现了较优的性能。
图 三维人体参数化模型估计示例
6、CALIP,一种基于注意力机制增强CLIP零样本图片分类的无训练参数算法
对比性语言-图像预训练(CLIP)模型已显示出具有良好零样本性能的视觉表示学习。为进一步提高其下游准确性,何旭明团队与上海人工智能实验室合作提出了一种无训练参数的增强方法CALIP,通过一个无参数的注意力模块来提高CLIP的零样本训练性能,实现更好的自适应零样本对齐。
详细新闻:/2023/0508/c1006a1077284/page.htm
无线电能传输系统的通用时域建模方法
无线电能传输系统因其灵活度高、可靠性强、使用便利等优点,在电动汽车、消费电子、医疗植入设备等领域得到广泛应用。时域建模方法可极大提高建模的精度,但模型相对复杂,且依赖于特定的补偿网络和谐振参数。为解决该难题,信息学院智慧电气科学中心王浩宇团队提出了一种简单且通用的时域建模方法,适用于不同补偿网络、谐振参数和调制方式。
本研究建立了一套简单的输入电压信息获取方法,适用于任何调制方式,极大简化了模型的复杂度。该模型在给定谐振腔输入电压信息的情况下,可以准确预测任意时刻谐振腔的电压和电流信息,具有较强的通用性。仿真和实验结果验证了该模型的有效性,且仿真速度比MATLAB/Simulink快64倍。
图 不同补偿网络的仿真和计算值
该成果发表在电力电子领域知名学术刊物IEEE Transactions on Industrial Electronics上。
详细新闻:/2023/0501/c1006a1077156/page.htm
压电微型超声换能器器件与应用上多项成果
近年来随着先进压电材料、集成电路、微纳声学等的飞速发展,基于氮化铝(AlN)和氮化铝钪(AlScN)薄膜的压电微机电系统(MEMS)以其低成本、小体积和高性能而受到广泛关注。信息学院吴涛教授与多位上科大教授合作在压电微型超声换能器( PMUT)器件的理论建模、器件设计、微纳工艺,以及医学应用等方面取得了多项研究成果。
1、氮化铝及氮化铝钪PMUT的工艺研发
氮化铝薄膜具有生物兼容性好、热稳定性高和集成电路工艺(CMOS)兼容等优点,是可植入设备和医用传感应用领域的首选压电材料之一。前期吴涛团队通过对氮化铝钪溅射工艺的优化,成功制备出不同浓度的高质量、应力可控的氮化铝钪薄膜。基于优质氮化铝钪压电薄膜,信息学院特聘教授李昕欣团队与吴涛团队合作开发了多种微加工压电超声换能器件加工工艺,其中一种创新工艺在超声领域学术会议 2022 IEEE International Ultrasonics Symposium (IUS) 发表。
图 基于不同工艺的PMUT制备流程图。(a)前向预填充开孔释放工艺;(b)背部深硅刻蚀工艺;(c)微孔各项异性腐蚀释放工艺
2、基于氮化铝及氮化铝钪PMUT的创新应用:人体可穿戴设备
利用压电薄膜材料和微机电(MEMS)技术制备的PMUT是可实现微米量级的超声换能器,在可穿戴、小尺寸医学影像等设备中有着广泛应用前景。李昕欣团队博士生吴声制备了频率高达5 MHz氮化铝钪压电超声换能器阵列,并利用其实现了脉搏无创监测和血压的测量功能,未来可应用在可穿戴人体健康监测设备上。相关成果发表在微机电系统领域期刊Micromachines和会议TRANSDUCERS上,吴涛和李昕欣为共同通讯作者。
图 AlN PMUT 用于脉搏血压检测
3、基于氮化铝及氮化铝钪PMUT的创新应用:多功能成像
当生物组织受到短脉冲激光束照射时,因不同成分的光吸收而发生瞬时热膨胀和收缩所形成的声波可以被超声换能器接收并进行三维成像。信息学院吴涛团队与高飞团队合作,实现了基于带宽扩展的PMUT光声成像。结果表明,提高PMUT的带宽,能够在光声成像中得到半峰宽更小的信号,并能有效提升光声成像的分辨率,尤其是轴向(深度方向)的成像分辨率。该工作结合微机电制造工艺和光声成像技术,在微创医疗内窥成像方面有广泛的应用前景。相关成果发表在传感器领域学术期刊 IEEE Sensors Letters上。
生物组织受微波脉冲加热振动产生的热声信号可反映相关组织的理化状态,从不同角度采集热声信号后可计算得到生物组织热吸收特性的三维图像。为了使热声成像系统小型化,信息学院吴涛团队与王雄团队合作,实现并验证了基于氮化铝压电微机械超声换能器(AlN PMUT)的热声成像系统,在临床诊疗与可穿戴设备的研发有广泛应用前景。相关成果在期刊Applied Physics Letters会议IEEE MEMS 2023发表。
图 (a)基于带宽扩展的氮化铝PMUT的光声成像研究;(b)基于氮化铝PMUT的热声成像研究
详细新闻:/2023/0506/c1006a1077256/page.htm
本科生围绕电力系统继电保护与故障定位发表多项研究成果
鼓励本科生进实验室、参与前沿科学研究是上科大本科生培养的一大特色。近日,信息学院智慧电气科学中心刘宇团队本科生的三篇论文被电气与电子工程师协会(IEEE)电力与能源协会学术年会(Power and Energy Society General Meeting, PESGM)录用。PESGM由IEEE电力与能源学会主办,是电力系统领域级别最高、规模最大的国际学术会议。
1、基于动态状态估计的多端混合线路继电保护原理
为提高清洁能源的利用率,近年来输电线路的结构变得更加复杂,对于传统的线路保护方案适用性存在一定挑战。为此,刘宇团队提出一种基于动态状态估计的输电线路继电保护方案。该方案基于输电线路的多端时域量测构建保护判据,充分考虑了输电线路的分布参数特性,精确补偿对地容性电流,有效缩短了保护动作时间,提升了保护的灵敏度与可靠性。信息学院2019级本科生邱锦灏为第一作者。
图 构区内外故障的卡方值差异 (a)区内高阻故障 (b)严重区外故障
2、电缆-架空线混合输电线路的单端精确故障定位原理
架空线与海底电缆的混合传输线路是连接海上风电与陆地电网的重要传输通道。由于混合输电线路阻抗存在分段特性、对地电容较大,给单端定位方案带来了一定困难。本工作构建完全分布参数的混合输电线路相量域模型,并利用零序故障分量网络,实现精确单端故障区段识别与故障定位。针对单相高阻故障下故障定位存在多解的挑战,通过结合负序网络与零序网络信息,确定故障位置,得到了较好的效果。信息学院2021级本科生管仲焘为第一作者。
图 高故障电阻下的多解问题与负序、零序关系
3、基于电压幅值测量与稀疏估计的电力网络故障定位原理
在大规模电力网络中,准确辨识故障区段、确定故障位置,对于保障电力网络的供电可靠性有着重要作用。现有方法利用在部分网络节点安装同步相量测量装置,要求卫星时钟同步,在现有电力网络中安装数量有限。本工作提出了一种基于本地电压幅值量测的电力网络故障定位方法,充分利用故障的等效注入电流稀疏性特征,构建故障定位新原理。该方案在兼容电压幅值量测的同时,仍能保持定位结果的准确性。信息学院2020级本科生朱宇轩为第一作者。
图 A相接地故障,30-38线路225公里处,计算所得等效注入电流的实部、虚部具有明显的稀疏性
详细新闻:/2023/0419/c1006a1076919/page.htm
一种新的汉字表征方法
对汉字进行语义表征是一项非常重要的基础工作,可以帮助机器学习算法更好地提高分词、命名实体识别和文本分类等任务的准确性。作为一种意音文字(logogram),汉字通过读音、结构、部首等信息形成字与字之间意涵上的丰富关联。如何充分捕捉汉字间关联所表示的意义,是汉字语义表征的一个挑战。
信息学院张海鹏团队研究提出了一种创新的汉字表征方法。该方法利用部首的方位角来表达汉字的内部结构,利用形声字的形旁和声旁来连接汉字的外部关系,并采用了异构图注意力网络来学习汉字内部与外部之间的联系,从而得到汉字的语义表征。
图 异构图汉字外部关系示例
中文姓名-性别推测是汉字表征的一个重要下游任务。然而,当前中文姓名-性别推测方法的准确率并不理想,制约了中国背景下的性别研究发展。张海鹏团队提出并开源的模型,在多个人名-性别数据集上都取得了最高准确率。目前由团队建设的该任务下最大的数据集(包含5800万真实人名-性别数据)已公开,将更好地推动该领域的研究发展。
以上成果被第37届AAAI人工智能会议(AAAI Conference on Artificial Intelligence, AAAI 2023) 录用,并入选大会的口头报告。
详细新闻:/2023/0404/c1006a1076567/page.htm
来源 | 科技发展处
责编 | 高瑄 管舜瑛
今天“分享”“点赞”“在看”了吗?