最新文章

13B级别的MoE开源混合推理模型

InfoQ · 2025-06-30 01:26:00

“7.5GB 和 15GB 模型量化之间存在如此显著的视觉差异。

InfoQ · 2025-06-27 11:00:00

“还是不清楚这两个主要协议将如何共存。”

InfoQ · 2025-06-25 05:49:00

小米通过自研推理框架实现了 180 tokens/s 的实时推理性能，借助 LoRA 插件化 + 共享基座模型支持多业务复用，并在推理性能和资源占用上实现了极致优化。

InfoQ · 2025-06-24 14:44:00

设计师节省80%重复劳动～

InfoQ · 2025-06-24 07:36:00

“我们员工从来不是paper-driven的去做研发”

InfoQ · 2025-06-24 07:32:00

查看更多产业动态>>

InfoQ · 2025-06-24 07:30:00

这几天，MiniMax 搞起了技术周，第一天就放出“王炸”，开源了全球首个大规模混合架构推理模型 MiniMax-M1。据最新消息，M1 已经成为全球前二的开源模型。

InfoQ · 2025-06-20 10:05:00

“最令人兴奋的将是产品服务乃至商业模式的创新”

InfoQ · 2025-06-19 03:46:00

随着企业数字化转型步入深水期，网络安全问题也日益复杂。当前，AI 技术正深度融入网络安全领域，形成“攻、防、对抗”三重技术维度。

InfoQ · 2025-06-17 10:14:00

模型训练正从单纯的深度学习作业演变为综合推理训练环境、模拟虚拟机等要素的分布式系统。

InfoQ · 2025-06-12 10:06:00

o3-pro不支持图像生成

InfoQ · 2025-06-12 09:55:00