【ZEGO即构开发者日报】Meta 开源 Omnilingual ASR 框架;字节推出编程优化的新代码模型Doubao-Seed-Code;商汤开源SenseNova-SI系列空间智能大模型....
科技前沿:Meta开源支持1600种语言的语音识别框架OmnilingualASR,错误率低于10%;字节推出低成本编程模型Doubao-Seed-Code;商汤开源空间智能大模型SenseNova-SI系列。行业动态:短剧出海市场收入增长249%但普遍亏损,头部平台亏损超4600万元;Yalla Q3财报显示游戏收入增长11.9%至3379万美元,社交收入略有下滑。
🔨「产品技术」
1.Meta 开源 Omnilingual ASR 框架,识别1600种语言,78%语言识别错误率<10%
【关键词】Meta、Omnilingual ASR 框架
Meta AI FAIR团队发布Omnilingual ASR语音识别模型套件,能为超过1600种语言提供自动语音识别能力,78%语言字符错误率低于10%。
该框架采用社区驱动设计,用户仅需提供少量样本即可将模型扩展到新语言,首次实现大规模ASR框架的上下文学习能力。同时开源Omnilingual ASR Corpus数据集(覆盖350种服务欠缺语言)和70亿参数的Omnilingual wav2vec 2.0语音表征模型。
2.字节推出编程优化的新代码模型Doubao-Seed-Code
【关键词】字节、编程优化、Doubao-Seed-Code、火山引擎
火山引擎推出Doubao-Seed-Code代码模型,调用价格降低,0-32k区间输入仅1.20元/百万Token。该模型是支持视觉理解能力的编程模型,可参照UI设计稿生成代码,原生256K长上下文,原生兼容Anthropic API实现零成本切换。
2.商汤开源SenseNova-SI系列空间智能大模型,2B&8B
【关键词】商汤、SenseNova-SI、空间智能大模型
商汤发布并开源SenseNova-SI系列空间智能大模型(2B和8B版本),其中8B模型在四个核心空间智能任务上平均成绩60.99。
该系列模型首次在空间智能领域验证了"尺度效应",构建了六大核心维度的空间能力分类体系,包括空间测量、空间重构、视角转换等。目前模型已接入"悟能"具身智能平台,同步开源空间智能测评平台EASI,将补强具身智能在三维结构认知方面的基础能力。

🔎「行业观察」
1.短剧出海市场陷盈利困境
【关键词】短剧、出海、市场分析
短剧出海市场2025年上半年收入达10.88亿美元,同比增长249%,呈现高速增长。然而,行业面临普遍亏损困境,头部平台ReelShort上半年净亏损超4600万元,中文在线前三季度净亏损达5.2亿元。据业内人士透露,约80%-90%的出海短剧项目无法回本,高昂的本地化制作和投流成本是主要压力,市场正经历洗牌期。
2.Yalla发布Q3财报:总营收8960万美元,游戏收入同比增长11.9%
【关键词】Yalla、财报分析、游戏服务
Yalla发布了25年Q3季度财报,根据财报显示,其第三季度营业收入为8963.6万美元,其中社交服务收入为5545.9万美元,游戏服务收入为3379.8万美元,相较于去年同期,其社交服务营收略有下滑(2024Q3社交服务收入5848.7万),游戏服务收入呈现增长趋势(2024Q3游戏服务收入3021.1万)。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐

所有评论(0)