最新更新第876页
Kimi开源俩轻量级多模态模型,参数仅2.8B 跑赢GPT-4o、Qwen2.5-VL-7B
Kimi团队发布开源的Kimi-VL和Kimi-VL-Thinking多模态模型,参数量分别为28亿激活参数和2.8B。模型在多个基准测试中表现出色,并采用MoE架构提高效率。
10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
CalibQuant团队在InternVL-2.5模型上提出了一种1比特量化方法,通过校准策略缓解了低比特数量化带来的失真问题。实验结果显示,在多种任务和内存限制下,该方法相比基线有显著的性能提升。
独家|2033科技天使轮融资近亿元,打造基于Agent的AIGC内容平台
马宇驰创立的大模型公司2033科技完成天使轮融资,致力于打造AIGC内容平台。NYXverse已登陆Steam进行灰度测试,支持用户创建和互动自己的AI Agent角色。团队由大厂算法、游戏行业资深人士组成。
再见,GPT-4将退出ChatGPT舞台
再见,GPT-4将退出ChatGPT舞台 【TechWeb】近日,OpenAI正式宣布,即将从ChatGPT中移除两年前推出的GPT-4。 自2025年4月30日起,GPT-4将在ChatGPT中退役,并完全被GPT-4o取代。GPT-4 仍将在API...
OpenAI发布GPT-4.1:百万token上下文,全方位碾压4o并且价格更低,GPT-4.5三个月后下线
,分别是 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,它们仅通过 API
又一上海人形机器人加入开源!全套图纸+代码,来自傅利叶
傅利叶发布小人形机器人Fourier N1,采用紧凑型硬件架构设计,拥有23个自由度。能实现最快3.5m/s奔跑、踢足球、上下楼梯等任务,并提供一站式的本体资源包及基础操作软件代码开源。
OpenAI更新:ChatGPT有了完整记忆,可以参考过去所有聊天记录,提供更加个性化回复
ChatGPT新增记忆功能可参考过往聊天记录提供个性化回复,目前已向所有Plus和Pro用户开放。新功能引发热议及实测反馈,既有积极评价也有局限性讨论。OpenAI计划下周发布包括GPT-4.1在内的多款全...
让AI替码农卷复杂任务,贾佳亚团队提出MoTCoder,准确率刷新SOTA
论文提出MoTCoder模型,通过模块化思维显著提升大语言模型在复杂编程任务中的准确率与可维护性。团队已开源代码、模型和数据集供在线体验。
谷歌Veo 2震撼升级,一键get好莱坞级视觉盛宴!全网实测,帧帧丝滑
谷歌Veo 2通过移除背景、插值等功能实现了视频创作的升级,展示了从海底慢动作漂浮到战场史诗旋转的各种创意场景。它能够将普通点子转化为专业级大片效果,吸引了大量用户分享实测作品。
三年营收超4亿!企业级AI独角兽滴普科技冲刺港股IPO,创始人曾任华为和阿里高管|
滴普科技向港交所提交IPO申请,转型成为企业级大模型AI应用解决方案提供商。公司有望成为2025年港股首家企业级AI上市公司。赵杰辉带领团队推出FastAGI方案并实现大规模商业化,公司计划利用募集...
全球首个Linux开发本:50TOPS算力,DeepSeek都配好了,可随地大小开发
全球首个基于Linux的开发本AIBOOK发布,支持多语言开发、大模型训练与推理,并预置了完整的AI开发环境和常用库。它还具备断网开发能力,提供便捷的小助手功能等特性。
为大模型添加多模态能力——Mini DALL·E 3
北京理工大学等4大名校联合发布Mini DALL·E 3,无需额外训练即可为多数主流大模型添加文成图多模态输出能力。该系统由语言模型、路由器、适配器和图像生成模型四大模块组成,实现了用文本生成...
视觉SSL终于追上了CLIP!Yann LeCun、谢赛宁等新作,逆转VQA任务固有认知
研究者提出了一种新的视觉自监督学习模型Web-SSL,它能够在不依赖语言监督的情况下,在大规模数据集上与CLIP模型媲美,并在多种视觉问题解答任务中表现出色。
IC-Light的视频版本来了,RelightVid:强光动态环境下的视频光照编辑神器
复旦大学等机构学者发布视频版本光照编辑成果,支持时序一致性、强光源场景下的高质量光影编辑,构建全新数据集用于评估。
AI 版《猫和老鼠》刷爆外网!零剪辑自动生成,60 秒神作刷新 AI 视频天花板
伯克利、斯坦福联合英伟达的研究成功生成了长达一分钟的流畅视频,且保持一致性和故事完整性。通过引入测试时训练层提升扩散Transformer模型能力,实现了复杂的多场景故事生成。研究使用《猫和...