学术动态

当前位置: 首页 学术动态 正文
我院张学良教授课题组(IMUSPEECHLab)何树林同学最新研究 成果发表在神经网络领域国际顶级期刊Neural Networks

发布日期:2025-04-07来源:

近日,张学良教授课题组(IMUSPEECHLab)何树林同学在目标说话人提取(Target Speaker Extraction,TSE)方面的研究取得新进展,相关论文《Enhancing Target Speaker Extraction with Hierarchical Speaker Representation Learning》发表在《Neural Networks》学术期刊。该刊是计算机科学、神经网络领域国际旗舰期刊,最新影响因子为6.0。

在智能音频处理领域中目标说话人提取作为语音增强和语音分离的替代方案备受关注,何树林同学提出了创新的Hierarchical Speaker Representation Learning (HSRL)方法,与传统的目标说话人提取技术不同,论文通过构建一个包含局部和全局说话人特征提取器的层次化策略,显著提升了目标说话人提取的性能。

图1所提HSRL-TSE方法框图

122大阳城集团网站为论文第一完成单位,论文第一作者为2021级博士研究生何树林,通讯作者为太阳成集团tyc122cc张学良教授。这项研究得到了国家自然科学基金、中国科协青年人才托举工程博士生专项计划等项目的支持。

论文链接:https://www.sciencedirect.com/science/article/pii/S0893608025002679

第一作者简介:

何树林(博士研究生)

指导教师:张学良 主要研究方向:目标说话人提取,语音增强。

2019年于122大阳城集团网站获得学士学位,同年开始硕博连读,2021年于中国科学院自动化研究所模式识别重点实验室访问交流,2022年-2023年入选腾讯犀牛鸟精英人才计划联合培养并获得腾讯犀牛鸟精英人才计划优秀学生奖,2023年至2024年于香港科技大学访学,联合培养。入选首批中国科协青年人才托举工程博士生专项计划。多次入选NCMMSC优秀学生论坛。多次在大象声科(深圳)科技有限公司实习。截至目前,何树林在语音领域顶级会议ICASSP以一作身份共录用4篇论文,并合作发表论文十余篇。并担任ICASSP审稿人。

地址:内蒙古呼和浩特市大学西路235号太阳成集团tyc122cc

版权所有 © 太阳成集团(tyc122cc-VIP认证)官方网站

官方微信