财经

百度发布端到端语音语言大模型,可上文小言免费体验

5035ca41bbdc4a089d6bbe692f15408a~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=202503311929463721B47C98EE16A743E4&x-expires=2147483647&x-signature=5eX3mdQQBKhu2RWT64nJEnGMsdo%3D

3月31日,在百度AI DAY上,百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,实现超低时延与超低成本,在电话语音频道的语音问答场景中,调用成本较行业均值下降约50%-90%。当日,文小言宣布品牌焕新,率先接入该模型,还带来多模型融合调度、图片问答等功能升级。

接入全新的端到端语音语言大模型后,文小言不仅能支持更拟真的语聊效果,而且支持重庆、广西、河南、广东、山东等特色方言。据介绍,语音大模型具备极低的训练和使用成本,极快的推理响应速度,语音交互时,可将用户等待时长从行业常见的3-5秒降低至1秒左右。

更新后的文小言还支持“多模型融合调度”,通过整合百度自研的文心X1、文心4.5等顶尖模型,并接入DeepSeek-R1等第三方优质模型,实现了多模型间的智能协同。用户可以选择“自动模式”,一键调用最优模型组合,也可根据需求灵活选择单一模型完成特定任务,大幅提升响应速度与任务处理能力。

同时,文小言还加强了图片问答功能,用户拍摄或上传图片,以文字或语音提问即可直接获取深度解析。例如,拍摄一道数学题可实时生成解题思路与视频解析;上传多款商品图可对比参数、价格,辅助购物决策;拍摄杯子设计图后,AI可自动解析风格并生成同款手机壳、支架等周边产品。


本文经授权后发布,本文观点不代表立场
上市12年派现1340亿,美的清仓小米套现18亿,生态战争没有永远的朋友
« 上一篇 05-01
当耐克"跌出"增长跑道,利润缩水的李宁何以应对赛道剧变?
下一篇 » 05-01

相关内容

饿了么紧急入局,补贴大战再升级,外卖市场进入深度博弈期
全球第八的野心!储能新秀果下科技赴港上市,直指“AI+储能”的高地
京东美团外卖大战高潮迭起,饿了么再不宣战就来不及了
量贩零食界"蜜雪冰城"?零食很忙+赵一鸣零食要赴港上市了