最新更新第1060页
OpenAI推出首个Nano模型:GPT-4.1 ,百万上下文、代码能力大幅超越GPT4.5
OpenAI发布GPT-4.1系列新模型,包括Nano、Mini和GPT-4.1。该系列具有更快、更便宜的处理能力,尤其是GPT-4.1 Nano成为最快的最便宜模型之一。更新的核心是代码能力和指令遵循改进,以及强大的视...
Kimi开源俩轻量级多模态模型,参数仅2.8B 跑赢GPT-4o、Qwen2.5-VL-7B
Kimi团队发布开源的Kimi-VL和Kimi-VL-Thinking多模态模型,参数量分别为28亿激活参数和2.8B。模型在多个基准测试中表现出色,并采用MoE架构提高效率。
10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
CalibQuant团队在InternVL-2.5模型上提出了一种1比特量化方法,通过校准策略缓解了低比特数量化带来的失真问题。实验结果显示,在多种任务和内存限制下,该方法相比基线有显著的性能提升。
独家|2033科技天使轮融资近亿元,打造基于Agent的AIGC内容平台
马宇驰创立的大模型公司2033科技完成天使轮融资,致力于打造AIGC内容平台。NYXverse已登陆Steam进行灰度测试,支持用户创建和互动自己的AI Agent角色。团队由大厂算法、游戏行业资深人士组成。
再见,GPT-4将退出ChatGPT舞台
再见,GPT-4将退出ChatGPT舞台 【TechWeb】近日,OpenAI正式宣布,即将从ChatGPT中移除两年前推出的GPT-4。 自2025年4月30日起,GPT-4将在ChatGPT中退役,并完全被GPT-4o取代。GPT-4 仍将在API...
OpenAI发布GPT-4.1:百万token上下文,全方位碾压4o并且价格更低,GPT-4.5三个月后下线
,分别是 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,它们仅通过 API
Llama 4发布36小时差评如潮!匿名员工爆料拒绝署名技术报告
Meta最新基础模型Llama 4发布后遭遇差评如潮。代码能力受质疑,尤其是经典‘氛围编程’小球测试表现不佳。竞技场排名成绩参差不齐,且存在数据泄露和版权问题的疑虑。
RL for LLMs,强化学习的 Scaling Law 才刚刚起步?
近期研究者通过奖励模型增强通用奖励模型在推理阶段的可扩展性,同时使用强化学习提升LLM性能。然而,当前强化学习算法仍有改进空间,奖励稀疏性是主要难点之一。
Runway上新Gen-4,角色、场景一致性顶尖,我们小测了下可灵1.6
今年以来,各类AI产品和模型层出不穷。近日,Runway发布了其最新研发的Gen-4 AI视频生成模型,实现了高保真度、一致性及指令遵循度的显著提升,并能保持角色、物体和场景的一致性。
1小时AI公开课上线啦~首期课程解密传统企业如何抓住AI革命!
在人工智能技术加速渗透各行各业的今天,《1小时AI公开课》系列直播课程推出,聚焦大模型、Agent、Prompt工程等前沿技术。首期课程将于4月11日晚8点开讲,由AIGC开放社区专家李扬主讲,内容涵盖...
速递|“AI教育卡位战”Anthropic发布"学习模式"Claude,教育版套餐能否实现2025年收入翻倍
Anthropic推出Claude教育版套餐以回应OpenAI ChatGPT计划,该套餐包括学习模式帮助学生批判性思考,并能分析招生趋势和自动化处理咨询。
暴击Manus,拿下1.6亿美元融资,前百度副总裁景鲲带队推出Genspark超级智能体
景鲲发布的Genspark超级智能体采用混合代理系统,整合9个模型和多个数据集,提供快速、可靠且操控性强的AI服务。其功能包括旅行计划制定、个性化视频创作、新闻生成动画视频等。尽管订阅费用较...
马云佩戴阿里新工牌现身杭州园区,出席阿里云15周年庆
4月10日,阿里巴巴创始人马云现身杭州阿里云谷园区。2009年成立的阿里云近期宣布收入达317.42亿元,并发布新模型聚焦推理和全模态融合。阿里的AI赛道持续加码,未来三年将投入超过3800亿元用于...