
3月30日,阿里发布千问新一代全模态大模子Qwen3.5-Omni,在音视频通晓、识别、交互等215项任务中赢得SOTA(性能最好),卓绝Gemini-3.1 Pro,成为当今各人最强的全模态大模子之一。新模子领有极强的音视频通晓与及时交互才调,大约对音视频履行生成注视且可控的结构化款式,可识别说话和方言数目多达113种,还惊喜地披表露了音视频Vibe Coding才调,用户对着镜头推崇需求,就能让模子自主生成APP、网页、游戏等复混居品代码。当今,阿里云百真金不怕火已上新Qwen3.5-Omni的Plus、Flash、Light三种API,可无为愚弄于短视频/直播平台、游戏、自媒体等行业。
Qwen3.5-Omni接受搀和驻防力MoE架构,在海量文本、视觉以及率先1亿小时的音视频数据上进行了原生多模态预老到,可终了图片、视频、语音、翰墨等全模态履行的输入与输出。新模子在音视频通晓、跨模态推理、Agent方面终知道性能飞跃,在音视频通晓、语音识别、多语种翻译、对话等215项第三方性能测试任务中赢得SOTA。比如,在聚焦视听交互才调的DailyOmni、QualcommInteractive、Omni Cloze等测试中,Qwen3.5-Omni得分大幅率先Gemini-3.1 Pro;在检测嘈杂环境抗侵犯才调的WenetSpeech测试中,世界杯Qwen3.5-Omni失实率远低于Gemini,识别准确率极高;在测验多说话语音生成质地的Multi-Lingual (30lang) 测试中,Qwen3.5-Omni相似权贵优于Gemini-2.5-Pro-TTS。

Qwen3.5-Omni跑分图九游app下载
Qwen3.5-Omni领有极强的说话才调,相沿113种说话及方言的语音识别和36种说话及方言的语音生成,就连使用东谈主数不及一百万的毛利语和国内的海南边言,也能精确识别。新模子还大幅增强了及时交互体验,能高情商听懂用户对话意图,准确折柳有用复兴和随口维持,九游app就像和真东谈主聊天一样。同期,模子还不错凭据领导解放调度语音、语调,并基于立异的ARIA工夫,使生成的语音更当然、更踏实。 在面临访佛“今天的天气如何”的及时发问时,模子还能自主判断并调用器具,确保回复履行准确且时效性强。
基于一系列工夫立异,Qwen3.5-Omni将Vibe Coding推入下一阶段。与纯文本或图片运转的Vibe Coding不同,千问不错终了音视频编程:翻开录像头,用户对着草图口述需求,哪怕是包括复混居品逻辑的款式,模子也能平直生成带有复杂UI的居品原型界面,着实终了“动动嘴即可编程”。这一才调并非刻意缱绻,而是模子在原生多模态才调握续扩张流程中当然披表露的成果。
Qwen3.5-Omni顶尖的全模态才调,还能为专科领域带来超等坐褥力。新模子可对画面主体、东谈主物商量、对话逻辑、乃至东谈主物情怀转动进行极细的拆解,并自动完成视频章节切片与时间戳标注,相沿率先10小时的音频输入,将繁琐的视频后期梳理职责镌汰至秒级,大幅诽谤了企业的履行惩办资本,在视频创作、履行审核等领域具有极高的落地价值。
当今,浅显用户也可前去Qwen Chat免费体验,缔造者和企业可通过阿里云百真金不怕火平台调用Qwen3.5-Omni模子,每百万Tokens输入不到0.8元,比Gemini-3.1 Pro的1/10还低。据了解,千问稳居中国企业级大模子调用市集第一,就业涵盖互联网、金融、耗尽电子及汽车等重心行业超100万家客户。

Qwen3.5-Omni跑分图
米兰体育MiLan(中国)官网首页