登录/注册 之江实验室官网

挑战前沿问题 贴近产业应用 一文详解2021之江杯AI大赛赛题

2021-09-29

计算机将一段语音自动转换为文本,自动识别出某个物体,这些都是日常生活中常见的人工智能技术应用场景。纵使应用广泛,人工智能技术本身仍有许多亟待突破的瓶颈。比如,在嘈杂环境下,如何识别不同对象的声音并保证语音转换的准确率?当计算机面对它从未见过的某类物体时,如何正确识别物体的类别?

这些极具应用价值的技术问题也是2021之江杯全球人工智能大赛创新赛的赛题——非确定场景语音识别、零样本目标物体识别。

“如果参赛选手的语音识别机器学习模型能够达到比较高的精度,是能够直接应用在相关场景中的。而零样本目标物体识别具有更高的前沿性,是近年来学术界聚焦的一个热门方向,长期来看有着很大的应用潜力。”本次大赛的出题人表示。


创新赛瞄准实际应用场景

据大赛出题人介绍,非确定场景语音识别主要考察参赛队伍在声纹识别语音识别两方面的技术积累。“参赛者需要提取不同说话人的声纹特征,识别出语音数据集中其中特定的说话人,然后再将提取出来的语音翻译为文本。”出题人介绍说。

值得一提的是,在这道赛题中,设置了城市道路环境场景、地铁机场环境场景、餐厅环境场景、居家环境场景和室外风雨天场景5个与日常生活息息相关的场景,每个场景中均包含一定信噪比的噪声。“嘈杂的环境更贴近我们实际的日常生活。做语音识别的门槛不高,但训练精度要看对于细节的处理。我们希望通过设置包含大量说话人、非确定性的环境、包括古诗文在内的各种类型的语音文本、以及包含多位说话人同时说话的语音段落,不仅考察参赛选手的综合能力,更考察他们对于细节的处理。”出题人表示。

与高度贴近产业应用的语音识别相比,零样本目标物体识别更具前沿性和挑战性。所谓零样本目标物体识别,简单来说,就是机器学习模型需要识别出从未训练过的数据类别“机器学习的一种方式是监督性学习,即训练多少数据类别,那么也只能检测这些数据类别。而零样本学习中,待检测的数据类别和训练的数据类别是没有交叉的,难度更高。”出题人介绍道。

为了让赛题更贴近实际应用场景,本次大赛将数据集限定在安防检测的场景之下“在训练的数据集中,可能是电脑、手机、水杯这些常见物品的图像,但在测试集中,我们需要机器学习模型能够识别出一些异常或者是有危险性的目标对象。举个例子,我们给出一个待测试的数据集和一把刀的图像,模型需要在测试数据集中找出所有刀的图像。”出题人进一步解释道,“同时,模型不仅要找出与指定对象一致的图像,还要将其归类到相应的类别之中。且在实际比赛中,需要识别的可能是很多类。”

在一些无法获得大量训练数据的专业领域,零样本目标物体识别有着更大的应用潜力。“有一些领域专业性太强,比如说医学影像,类似这样的领域很难获得大量有标签的数据;还有一些领域可能本身就不常见,那么可以用来训练的数据也很少。这就是我们做零样本或者小样本学习的原因所在。”出题人表示。



期待推动人工智能迈向下一个里程碑

除了上述语音识别和物体识别这类传统任务,之江实验室还希望通过比赛推动人工智能辅助艺术创作和科学探索,推动科学研究范式转变

在本次之江杯全球人工智能大赛中,特别设置了揭榜赛,规划了四大赛题——基于人工智能生成模型的可编辑影视场景生成、基于深度生成网络的多类别参数化三维模型生成算法和系统、基于数据与计算驱动的材料设计算法与模型、基于靶标结构的小分子配体从头设计与生成。

“这些选题涵盖了艺术创作以及材料学、医学相关科学研究领域。”之江实验室基础理论研究院应用数学与机器智能研究中心研究专家刘斌表示,“赛题设置反映了当前人工智能的一大发展趋势,即人工智能与各行业中计算问题的深度结合。以深度学习为代表的人工智能技术,为我们提供了可将多模态、多领域海量数据进行汇聚并高效准确地从中提取规律、价值的可能。”

“以材料设计为例,传统的人工设计方法中需要材料设计者通过不断调整设计参数,在不同参数设置下分别进行实验,来寻找满足需求的材料设计参数。而借助人工智能技术,我们可为以往实验数据构建一个模型,通过模型预测某个特定设计参数下的目标响应。这样在面对新的材料设计需求时,便可以借助模型预测值来搜索最优的材料设计参数,从而大大减少物理实验次数。”刘斌解释道。

刘斌强调,选手们在面对赛题的时候,一方面要关心最新算法、模型,另一方面也要深度理解题目背景,尽量做到将算法和领域知识结合。“深度学习这一类方法的性能高度依赖于数据,数据越丰富、质量越高、对数据的建模假设越精准,算法的表现越好。但目前没有一套通用的模型、算法可以胜任不同类型的任务。对数据之外的领域知识的把握和利用程度有可能成为决定比赛结果的关键因素,比如影视创作规律、现有药物合成的基本经验、材料学知识等等。”

人类所处的物理世界高度复杂,而人的精力是有限的,“利用人工智能来帮助人类更广阔、更深入地探索世界、认知世界,作为一名科研工作者,我认为这是人工智能发展历程中最激动人心的地方,而这一切,才刚刚开始。”刘斌说道,“希望比赛能够启发大家进行更深层次的思考,开发更先进的人工智能方法,推动人工智能和科学研究探索迈向下一个里程碑。”