九方智投子公司入驻“模速空间”,与腾讯云计算合作开发AI企业工具,推动数字化转型和AI技术研发。
VeOmni采用以模型为中心的分布式训练方案,可将复杂的分布式并行逻辑与模型计算解耦,为全模态模型组合设置高效的并行训练方案。
昆仑万维8月12日开源升级版世界模型Matrix-Game 2.0,显著提升跨场景长时视频的时序一致性,支持连续指令输入。
据介绍,该模型依托盾构/TBM工程大数据中心773条工程线路,1200亿条工程建造数据,构建了通用大模型调度中小模型驱动的垂直领域大模型技术体系。
小红书发布中国开源首个视觉语言模型dots.vlm1,基于12亿参数视觉编码器和DeepSeek V3 LLM构建,在视觉感知与推理领域达到准SOTA水平。该模型通过大规模预训练实现高效性能,标志着AI视觉技术的重要突破。
8月7日,阿里通义千问发布Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507,前者非推理性能超越闭源GPT4.1-Nano,后者推理能力接近30B级模型,已在魔搭社区及HuggingFace开源。
亚马逊宣布将在Bedrock和Sagemaker平台首次提供OpenAI全新开放权重模型,CEO Andy Jassy称AWS将成企业AI工具超市。
阿里开源全新文生图模型Qwen-Image,当天即登上全球最大的AI开源社区HuggingFace的模型榜单首位,成为全球热度最高的开源模型。
阿里云开源推出20B参数图像生成模型Qwen-Image,采用MMDiT架构提升文本渲染与图像编辑精度。作为通义千问系列首个图像基础模型,其开源特性将加速AI技术研发与产业落地。
小米8月4日发布并开源MiDashengLM-7B多模态大模型,该模型在22个评测集上刷新最佳成绩,首Token延迟仅为业界先进模型的25%,同等显存下数据吞吐效率达20倍以上。小米正推进模型终端设备离线部署升级。
小红书推出面向SNS场景的定制化大模型RedOne,在8项核心社交任务上平均性能提升14.02%,有害内容曝光率降低11.23%。
上海市经信委7月28日发布措施,将发放3亿元模型券和1亿元语料券,补贴企业调用大模型API及采购高质量语料,单企最高可获500万元。
蚂蚁数科7月28日在世界人工智能大会发布Agentar-Fin-R1,基于Qwen3,在FinEval1.0、FinanceIQ等基准上超越DeepSeek-R1等同尺寸模型,并联合工行、宁波银行等推出Finova评测体系。
阿里通义千问7月22日发布Qwen3-235B-A22B-Instruct-2507-FP8旗舰模型升级版,长文本处理能力提升至256K。该非思考模式版本已在魔搭社区和HuggingFace开源平台上线,显著增强复杂任务处理性能。
项目特色包括校企联合培养、跨学科交叉、国际化视野和创新实践导向,学制为两年,目前已启动2026级推免招生工作。
资料显示,MiniMax 由商汤科技的一些前员工于2021年创立,其中包括商汤科技前副总裁、商汤研究院副院长闫俊杰。