小米声音理解大模型 MiDashengLM-7B 发布并全量开源,22 个公开评测集刷新最好成绩
时间:2025-08-05 14:23:35
xiayx 8月4日消息,小米自研声音理解大模型 MiDashengLM-7B 今日正式发布,并全量开源。
据小米官方介绍,MiDashengLM-在速度与精度方面实现了显著突破:单样本首Token延迟仅为同类模型的四分之一,同显存下并发性能提升超过。该模型在公开评测集上刷新了多项多模态大模型的最佳成绩(SOTA)。

MiDashengLM- 是一种基于 Xiaomi Dasheng 的新型音频编码器与 QwenOmni- Thinker 的自回归解码器组合,通过独特的通用音频描述训练策略,实现了对语音、环境声音和音乐的全面理解。
,小米的Xiaomi Dasheng声音基座模型在全球首次超越了AudioSet 的平均准确率,并在国际上确立了在HEAR基准测试中的领先地位,特别是在环境声、语音和音乐三大领域持续保持领先优势。
Xiaomi Dasheng 在小米智能家居和汽车座舱等多个场景中拥有超过落地应用,行业首发了多项创新技术。其核心算法加持下,“打个响指”环境音关联 IoT 控制能力、车外唤醒防御、全天候监控异常声音以及增强哨兵模式的划车检测等技术功能,都成为了小米智能家居和汽车座舱的重要亮点。
MiDashengLM 的训练数据由 100% 的公开数据构成,模型以宽松的 Apache License 2.0 发布,同时支持学术和商业应用。

小米指出,不同于QwenOmni等未公开训练数据细节的模型,MiDashengLM完整公开了数据源的详细配置。在该模型的技术报告中,详细描述了从音频编码器预训练到指令微调的全流程。

作为小米“人车家全生态”战略的关键技术,MiDashengLM拥有强大的跨领域理解和语音、环境声与音乐分析能力。它不仅能够理解用户的日常生活中的各种声音和环境,还能从这些声音中挖掘出隐藏的信息,提升场景的理解泛化性。这无疑为小米智能家居产品的进一步发展提供了强有力的支撑。
基于 MiDashengLM 的模型通过自然语言处理技术,实现了与用户的高效交互和个性化的沟通。它不仅能够为用户提供唱歌、外语练习等场景下的精准反馈和定制提升方案,还能在驾驶过程中即时回答环境噪音问题。这种智能化方式使交流更加人性化和便捷。
MidasengLM 由 Xiaomi Dasheng 音频编码器构成,是 Xiaomi Dasheng 系列模型的重要革新。在当前版本的基础上,小米正致力于提升计算效率,以实现模型在终端设备上的离线部署,并增加基于用户自然语言提示的更全面声音编辑功能。
xiayx附 MiDashengLM 开源地址:
GitHub 主页:https://github.com/xiaomi-research/dasheng-lm
技术报告:https://github.com/xiaomi-research/dasheng-lm/tree/main/technical_report
模型参数(Hugging Face):https://huggingface.co/mispeech/midashenglm-7b
模型参数(魔搭社区):https://modelscope.cn/models/midasheng/midashenglm-7b
网页 Demo: https://xiaomi-research.github.io/dasheng-lm
交互 Demo:https://huggingface.co/spaces/mispeech/MiDashengLM
热门推荐
-
小米账号能同时登录几个设备_小米账号可以绑定几个设备小米账号能同时登录几个设备?我们注册小米账号以后,经常会与家人共用一个账号,小米账号中绑定了很多vip,家人可以同时享受福利,很多玩家不知道小米账号可以绑定几个设备,一起来看看吧
-
小米手环7什么时候发布-小米手环7上市时间小米手环7什么时候发布?小米手环7据说显示屏将比其前身更大,面板尺寸为1.56英寸。据推测,Mi波段7的总体占地面积也将大于小米手环6。很多人都很好奇,下面是小编为大家整理的小米手环7上市时间介绍,希望能帮到大家,一起来看看吧
-
小米卡怎么激活 小米卡激活的方法1、新买的小米手机激活SIM卡的方法:设置-选择相应的流量套餐,支付完成并实名认证即可。2、打开小米手机设置按钮,进入点击其他连接方式。在这里点击米SIM,选择相应的流量套餐,支付完成并实名认证即可。
-
小米手环7怎么自定义壁纸_小米手环7壁纸怎么换佩带小米手环的同伙在看腻了体系表盘今后,会想要本身改换壁纸。那小米手环7怎样自定义壁纸?一起来看看吧~
-
m2103k19c是小米什么型号m2103k19c是小米Redmi Note 10 5G型号,分辨率为2400*1080的6.5英寸中孔屏幕,这块屏幕材质为LCD,刷新率最高支持90Hz。
-
为什么实况照片没声音 iphone实况打开了但是没有声音为什么实况照片没声音:实况照片没声音是因为音效没有开启,如果发现实况照片没有声音,按一下手机左侧的静音键,看看手机目前是否处于静音状态,如果没有静音,查看手机声音是不是被关闭或调至为最小了,所以无法听到实况声音,只需按声音键即可判断。
-
回森怎么开变声器? 回森开启声音设置教程这段内容是关于怎么进行声响设置的攻略。具体步调如下:第一步:在界面中找到【我的】选项,并点击加入。第二步:在【我的】界面中,选择【设置图标】并点击加入
-
微信麦克风关了对方能听到你声音吗微信麦克风关了对方能听到你声音吗:微信语音,是微信为开发者提供免费的语音技术,已经开放的语音技术包括在线语音识别、在线语音合成等。小编整理了相关内容介绍,下面一起来看看相关的信息。
-
小米摄像机云台版2k通话时候的声音怎么调节小米摄像机云台版2k通话时候的声音怎么调节:含有300万像素画质,F1.4大光圈,可以AI人形侦测辨认。可选择给家人友人标志身份,可移动追踪,有用过滤无效报警,同意多装备长途检察,下面一起来看看相关的信息。
-
华为浏览器声音关闭方法有的玩家在使用华为浏览器的过程中,发明时常会收到浏览器的关联报告提醒,并且又有提醒音。那么若是我们想要取消声响该怎样弄呢?接下来小编就为网友带来了华为手机浏览器声响的取消方式讲解,不知道怎样弄的玩家能够跟小编一起来了然下。
-
小米声音理解大模型 MiDashengLM-7B 发布并全量开源,22 个公开评测集刷新最好成绩xiayx8月4日消息,小米自研声音理解大模型MiDashengLM-7B今日正式发布,并全量开源。据小米官方介绍,MiDashengLM-在速度与精度方面实现了
-
Perplexity AI如何实现语义理解 Perplexity AI上下文关联分析本文将深入探讨PerplexityAI在实现语义理解和上下文关联分析方面的能力。我们将解析其核心技术,并逐步介绍PerplexityAI如何通过多维度数据分析,有
-
多模态AI如何处理图像描述任务 图像理解与文字生成技术说明在当今数字时代,多模态人工智能(MMA)系统已经显示出其强大的能力,能够处理和理解复杂的数据类型。其中一个令人瞩目的应用是图像理解和文字生成任务
-
潜水员戴夫料理解锁顺序是啥h1>潜水员戴夫料理解锁顺序是啥文章来源:本站作者:本站发布时间:225-2-517:24:45潜水员戴夫料理解锁顺序是:首先解锁寿司,然后是石花菜
-
无处遁形第三章消失的证据推理解谜攻略无处遁形第三章消灭的凭证怎样通关?游戏第三章名为消灭的凭证,本章有两处推理,需求做出许多的选择,难度较高。接下来带来无处遁形第三章推贯通谜指南,列位玩家快来瞧瞧吧。
-
沃尔沃全新 XC70 车机系统公布:四音区独立识别、AI 大模型上车,8 月预售今日,吉利宣布推出全新车型星越L智能驾驶辅助系统,通过多种方式提升行车安全和便利性。新车现已开始接受预订,未来将提供更多的配置选择和更好的用户体验
-
北大张牧涵团队依托腾突破推理效率瓶颈大模型推理百万tokens成本仅1 元在人工智能领域,大语言模型的训练和推理一直受到高昂成本的困扰。近期,北京大学人工智能研究院助理教授张牧涵领导的研究团队,在鲲鹏腾科教创新卓越中心(简称“卓越中心”
-
豆包 AI 大模型怎样和 AI 模型配音选择工具结合选择配音?教程解读在实现高效配音的流程中,结合豆包AI与专业AI配音工具的核心步骤如下:明确主题与目的:首先确定你希望录制的声音内容,例如是商业广告还是个人故事讲述
-
Intern-S1 上海AI Lab推出的科学多模态大模型Intern-S1是什么新型科学多模态模型Intern-S式开源在上海人工智能大会上,由上海人工智能实验室推出的Intern-S为关注焦点
-
小米15什么时候上市,小米15发布时间一年又一年,一代又一代的轮回,这不2024年就来到了小米15了。那么很多人比较着急的想知道,到底什么还是能发布这个型号手机呢?嗯.看起来没那么快,毕竟新年还没过,根据往年的惯例来说,还得等等。这不,小编找
-
58同城发布广告信息方法58同城是一个绝顶受欢迎的生活服务平台,许多人都选择在这里发布广告信息,以宣扬自个的产物或服务。在58同城上发布广告信息必要耐烦和注意。惟独不断地实验和调节,才能找到最适合自个的广告体例和推行策略。那么,若何在58同城上发布广告信息呢?接下来就为网友详细讲解。
-
全民k歌发布的歌曲怎么重新编辑在使用全民K歌发布过作品之后觉着不是很好有一点毛病想要从新编纂一下该怎样设置呢,有许多用户都不太晓得,此刻我们就一块来看一下全民k歌从新编纂已发布歌曲的方式吧
-
米游社图片评论怎么发布 米游社发布图片评论方法教程米游社发布图片评论方法介绍:在米游社这款软件很多玩法还是相当多的,对于软件中图片评论又该如何搞呢?想必不少用户还是不了解的,小编整理了相关内容介绍,下面一起来看看相关的信息。
-
FLUX.1 Krea [dev] 黑森林联合Krea AI开源的文生图模型FLUX.1Krea[dev]是什么flux.krea[dev]是由黑森林实验室联合KreaAI共同开发的新一代文本生成图像模型
-
开源电子原型平台arduino起源于开源电子原型平台arduino起源于意大利。arduino是一款便捷灵活、方便上手的开源电子原型平台。arduino构建于开放原始码simple I/O介面版,并且具有使用类似Java、C语言的Processing/Wiring开发环境。
-
群雄时代陷阵营深度解析 地形战场破阵战术全公开特战精英们注意了!今天为大家揭秘特种部队的超级战队陷阵营全方位评估!这支部队不但能召唤鬼魂般的力量,还能创造自己专属的安全空间
-
抖音评论如何设置不公开在当今社交媒体盛行的时代,抖音已成为许多人分享生活、展示才华的重要平台。然而,随着用户数量的增加,个人隐私保护也成为了一个备受关注的问题
-
《生化危机》手游版部分细节公开 迷幻风大师天野喜孝加盟近日,生化危机:生存单元手游版的部分细节被揭晓。游戏邀请了FF系列迷幻风大师天野喜孝为异常感染物设计插画,这无疑将使玩家在游戏中体验到独特的风格和质感
-
腾讯代理、育碧 FPS 游戏《彩虹六号》国服实机演示公开,2026 年春开启首测,育碧在BW台上宣布,彩虹六号:统御将在春季进行中国区首次测试,并公开了钟的实况演示视频。今天来个新惊喜
-
王者荣耀诸葛亮天机白泽评测王者荣耀中,诸葛亮的新皮肤“天机白泽”已正式上线,这款无双限定品质皮肤以山海经中的神兽白泽为灵感,融入了诸葛亮的智谋形象,设计上巧妙融合了仙气与妖兽元素
-
奇迹世界起源手游评测 奇迹世界起源手游好玩吗奇迹世界起源拥有独特的MMO元素,创造了一个充满剑与魔法的世界。这吸引了许多玩家的好奇心和兴趣,并期待它是否能够满足自己的期望
-
胜利女神 新的希望联动角色2B评测新的希望联动角色在有练度的情况下也能在boss战中使用,无论是突进还是近战都能持续一段时间,但其上限远不及爱丽丝
-
乱涂彩世界好玩吗 乱涂彩世界评测分享在新的过审游戏版号中有一款名为乱涂彩世界的游戏,这是一款涂色、弹幕射击手游,那么乱涂彩世界好玩吗?这里就给大家带来乱涂彩世界评测,聊一聊这个游戏的玩法特色,以及这
-
《我的世界》村民死光了咋办?村民死了会刷新吗?我的世界村民死光了咋办?村民死了会刷新吗?相信许多网友都遇到了村民死了许多的情状,不要焦急,接下来就和本站网小编一起来瞧瞧吧
-
dnf巴卡尔周几刷新 巴卡尔团本奖励刷新时间dnf巴卡尔周几刷新呢?许多网友还不太清晰,接下来给大伙分享一下dnf巴卡尔团本奖励刷新时间详解,一块来看一看吧
-
妄想山海飞鹤哪里多 妄想山海飞鹤刷新位置介绍妄想山海飞鹤哪里多?有的玩家们不知道哪里的飞鹤多,容易刷。那么接下来就带给各位玩家们妄想山海飞鹤刷新位置介绍,感兴趣的玩家们不要错过,一起来看看把。
-
妄想山海迷树刷新位置在哪 妄想山海迷树刷新位置分享妄想山海迷树刷新位置在哪?迷树是飓雪异变玩法的道具,相信还有很多小伙伴不是很清楚迷树在哪里,那么下面就给大家带来妄想山海迷树刷新位置分享,感兴趣的小伙伴就一起来看看吧。
-
《CF手游》绝命之谷武器刷新介绍 绝命之谷武器配比作为行将上线的复刻地图,想必另有好多网友们不是很知道,那么下面就带给列位网友们CF手游绝命之谷武器刷新讲解,不要错过了,一起来瞧瞧把。CF手游绝命之谷武器刷新讲解