小米声音识别算法再创高峰国际性能排名第一

2023-09-13

软件资讯

来自：网络收集

　　9月13日消息，近日，小米公司的声音识别算法取得了令人瞩目的突破，成为全球性能最出色的模型之一。这一成就是在Google发布的音频标记任务中取得的，该任务被认为是音频领域的ImageNet，具有极高的影响力和权威性。

　　Google将AudioSet数据集划分为三个子集，前两个子集合并成了"AudioSet-2M"。在这个庞大的训练集中，小米的声音识别算法首次突破了50 mAP(平均精度)，刷新了音频标记技术的指标，位居国际性能排名第一。值得一提的是，小米还发布了一个Mini版本的模型，适用于资源有限的场景，虽然参数量仅为原模型的九分之一，但性能却优于其他所有机构的模型。

　　这一技术突破意味着小米的声音识别算法能力得到了显著提升，将有望在小米的智能硬件设备中得到广泛应用。这将使这些设备更加敏锐地捕捉和识别周围环境的声音，从而提高硬件的智能化水平，为用户创造更便捷的智能生活体验。

　　据本站了解，小米的声音识别算法不仅可以应用于智能手机，还广泛用于智能家居设备。例如，小米手机上的“小米闻声”功能可以监测各种环境声音，如火警、婴儿哭声和水壶声，并通过手机通知栏将其转化为文字推送，使听力受损的用户也能享受便捷的智能生活。此外，小米的智能家居设备，如摄像头和音箱，也都采用了声音识别技术，用于监测宝宝哭声、火警等重要的家居环境声音，提供更安全和智能的居家体验。

　　小米还将这一声音识别技术应用于机器人的研发中，大幅提升了机器人的感知能力。小米的人形机器人CyberOne和仿生四足机器人CyberDog 2都能识别多种环境声音，使其具备更强大的动态响应能力。

　　小米作为一个拥有强大AIoT平台生态的公司，为声音识别算法的应用提供了广阔的空间，这也是小米技术研发的优势之一。目前，小米的声学语音技术已经应用于超过5000款智能产品，包括手机、音箱、电视、耳机、手表和机器人等79个品类。而小米旗下的智能语音助手小爱同学的月活跃用户数量也已达到1.15亿，是世界上最活跃的语音助手之一。

　　总的来说，小米的声音识别算法的突破不仅将提升智能硬件的性能，还为行业的前沿研究提供了重要的技术价值，推动了音频领域的发展。小米在底层技术的深耕和科技创新方面表现出了强大的实力，将继续在全球科技领域发挥重要作用。

极狐考拉预售价公布：四款车型齐上阵，满足不同需求

谷歌发布紧急安全更新针对Chrome零日漏洞进行修复

小米声音识别算法再创高峰 国际性能排名第一

文章教程 分类

小米声音识别算法再创高峰国际性能排名第一

文章教程分类