豆包大模型1.6-vision是豆包大模型家族首个具备工具调用能力的视觉深度思考模型,拥有更强的通用多模态理解和推理能力,并支持Responses API。
蚂蚁集团9月30日在HuggingFace上线全球首个开源万亿参数推理大模型Ring-1T-preview,专注自然语言推理。
目前,该模型已正式上架华为云大模型即服务平台MaaS,为企业及开发者提供模型体验和API服务。
根据DeepSeek官方介绍,这是一个实验性(Experimental)的版本,作为迈向下一代架构的过渡。
2025年9月29日,寒武纪已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。
9月24日阿里巴巴推出迄今规模最大模型Qwen3Max,其预览版在LMArena文本榜排第三,正式版代码与智能体能力再升级,多基准测试领先业界。
恒生电子与东兴证券签署三年战略合作协议,聚焦智能投研、投顾、风控、问答四大场景,共推证券行业大模型落地。
语言一致性:缓解了中英文混杂、偶发异常字符等情况;Agent能力:进一步优化了CodeAgent与SearchAgent的表现。
华为云CEO张平安在2025全联接大会上宣布,将持续加大对盘古大模型投入,该模型已在30多个行业、500多个场景实现落地应用。
该模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,并在预训练观察到明显的“涌现”行为。
资金将主要用于两方面:一是开展面向大模型的智能处理器技术创新,研发覆盖不同类型大模型任务场景的系列化芯片方案;二是建设先进封装技术平台,以灵活支撑差异化产品封装,增强对未来大模型技术发展的适应性。
据介绍,混元3D3将建模精度提升3倍,并首创3D-DiT分级雕刻模型,支持1536³几何分辨率,整体包含36亿建模体素。
报告指出,中国在全球大模型开源生态的贡献度已达18.7%,仅次于美国的37.4%,两国合计贡献比例超过55%。
小米集团AI实验室发布ZipVoice系列语音合成模型,基于FlowMatching架构,解决零样本语音合成参数量大和速度慢问题。ZipVoice-Dialog模型专攻对话语音合成,提升稳定性和推理速度,推动语音技术新进展。
据了解,新的Qwen3-Next模型架构旨在更好地处理大量信息,同时减少训练过程中和训练后的计算成本。
广州交易集团数智化交易服务平台完成首个建设工程试点项目交易,验证全流程电子化、智能辅助评审等核心能力,实现与十余个政府监管平台无缝对接。
字节跳动Seed团队9月11日上线Seedream 4.0图像创作模型,已在豆包App、即梦AI、扣子免费开放,并通过火山引擎向企业客户开放接口。
微软将向AI初创Anthropic购买技术,Office 365 Copilot部分功能将运行在Anthropic模型上,以提升电子表格与PowerPoint任务表现。