13B级别的MoE开源混合推理模型
InfoQ · 2025-06-30 01:26:00
“7.5GB 和 15GB 模型量化之间存在如此显著的视觉差异。
InfoQ · 2025-06-27 11:00:00
“还是不清楚这两个主要协议将如何共存。”
InfoQ · 2025-06-25 05:49:00
小米通过自研推理框架实现了 180 tokens/s 的实时推理性能,借助 LoRA 插件化 + 共享基座模型支持多业务复用,并在推理性能和资源占用上实现了极致优化。
InfoQ · 2025-06-24 14:44:00
设计师节省80%重复劳动~
InfoQ · 2025-06-24 07:36:00
“我们员工从来不是paper-driven的去做研发”
InfoQ · 2025-06-24 07:32:00
查看更多产业动态>>
InfoQ · 2025-06-24 07:30:00
这几天,MiniMax 搞起了技术周,第一天就放出“王炸”,开源了全球首个大规模混合架构推理模型 MiniMax-M1。据最新消息,M1 已经成为全球前二的开源模型。
InfoQ · 2025-06-20 10:05:00
“最令人兴奋的将是产品服务乃至商业模式的创新”
InfoQ · 2025-06-19 03:46:00
随着企业数字化转型步入深水期,网络安全问题也日益复杂。当前,AI 技术正深度融入网络安全领域,形成“攻、防、对抗”三重技术维度。
InfoQ · 2025-06-17 10:14:00
模型训练正从单纯的深度学习作业演变为综合推理训练环境、模拟虚拟机等要素的分布式系统。
InfoQ · 2025-06-12 10:06:00
o3-pro不支持图像生成
InfoQ · 2025-06-12 09:55:00