20260327 AI 资讯快报
20260327 AI 资讯快报
2026-03-27 · 实时更新
谷歌发推出Gemini 3.1 Flash Live实时语音模型
谷歌推出模型,是其最高质量的实时语音模型,已在Gemini App、Search Live及Google AI Studio开放。模型核心升级包括:语音可直接驱动应用开发(vibe coding),上下文窗口扩大2倍,支持200+国家多语言实时交互。在ComplexFuncBench音频测试中函数调用准确率达90.8%,显著优于前代。
商汤科技推出商汤输入法AudioClaw和SenseAudio AI语音开放平台
商汤科技于3月27-29日亮相上海全球开发者先锋大会,推出及 AI语音开放平台。AudioClaw集成语音输入、AI会议助理、知识库等功能,支持微信接入和语音交互。SenseAudio提供70+精品音色及ASR、TTS、文生图/视频等能力。
Suno推出 AI 音乐生成模型Suno V5.5
Suno推出Suno推出Suno V5.5,模型首次引入”个性化资产”体系,推动AI音乐从生成工具迈向创作平台。新增 Voices 声音定制、Custom Models 自定义模型和 My Taste 个性化推荐三大功能。同时优化工作流,支持音轨分离、部分替换等编辑功能,音质与情感表达显著提升。
字节跳动 Seedance 2.0 正式出海,面向全球多地推出
字节跳动旗下剪映()宣布推出CapCut Video Studio,集成音视频模型正式出海。产品无需时间轴即可在无限画布上完成从构思到导出的全流程视频创作,支持最长15秒视频和6种宽高比,已覆盖非洲、南美、中东和东南亚地区。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Linの博客!
评论
