Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B
Kimi团队发布开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking,参数为16B但推理时仅激活2.8B。具备强大的多模态推理能力和Agent能力。支持128K上下文窗口,采用宽松的MIT许可证。
“谷歌版MCP”来了!开源A2A,不同厂商Agent也能协作
谷歌推出A2A协议(Agent2Agent),允许不同生态系统中的AI Agent安全协作。通过统一界面,招聘经理可以下达任务给专业Agent寻找合适的候选人,并利用多Agent协同完成复杂工作流。
粉笔CTO:大模型打破教育「不可能三角」,因材施教真正成为可能|中国AIGC产业峰会
的垂直行业当中,开始涌现出AI落地的经典实践案例。 教育领域中,专注于职业教育培训的 粉笔 ,就是其
最强o1也刚刚及格!中科大等团队测试视频CoT推理能力:多数模型不及格
中科大等团队提出VCR-Bench评估基准,用于评价视频理解中的CoT推理能力。该基准包含七个独立评估维度的任务框架,覆盖视觉感知和逻辑推理两大类别。结果显示当前多模态模型在复杂视频推理任务上...
最强视觉生成模型获马斯克连夜关注,吉卜力风格转绘不再需要GPT了
基双子的可灵AI基础模型——文/图生图的可图、文/图生视频的可灵,都重磅升级到2.0版本。 可图2.
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!
复旦大学和美团的研究者们提出UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾图文理解与图像生成任务,并在多个权威评测中取得领先性能表现。
天气预报精准到每条街!这家新型机构携手高校用AI驱动科研范式变革
拥有“独家预报” ——这并非科幻场景,而是上海“扶摇”气象大模型带来的突破。 近日,由上海科学智能研
21岁学生开发AI作弊工具被哥大停学,转身拿下530万美元融资,网友:《黑镜》成真
530万美元融资了呀! 21岁小哥(称他为小李)这几天公布了一则喜讯,他们初创公司Cluely获得来
UC伯克利:让推理模型少思考,准确率反而更高了!
UC伯克利研究发现,强制要求模型跳过思考过程仍能保持或提高推理能力。使用DeepSeek-R1模型,在定理证明任务中仅需30%的Token就能达到与完整思考相同的准确率。