多模态生成框架新SOTA:文本+空间+图像随意组合,20W+数据开源,复旦腾讯优图出品
复旦大学、腾讯优图实验室等机构的研究人员提出UniCombine框架,能够处理多种条件组合的多条件可控生成任务,并在多个实验中达到SOTA。
中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%
中科大MIRA实验室提出KG-SFT框架,通过结合知识图谱和LLMs提升特定领域性能,显著提高常识问答准确率。
奥特曼最新访谈认可“套壳”:多数改变世界的公司,最初都是这样的
在最新访谈中,OpenAI CEO奥特曼分享了对AI和创业的看法。他指出大多数改变世界的公司都是从传统领域转型而来,并强调当编程成本下降时,全球软件需求会呈指数级增长。奥特曼认为当前世界正处于...
倒计时3天!20余位行业大佬共话AI,中国AIGC产业峰会最全攻略在此
全?这里有全球顶尖防御方案。 想了解AI如何让普通人一键创作音乐? …… 一天时间,带你看尽如何 「
智能体丝滑玩手机,决策延迟0.7秒!MSRA等提出验证器架构,不直接依赖大模型生成最终操作
V-Droid使用验证器驱动架构在移动GUI任务自动化中实现了高成功率和低延迟。通过解析UI界面提取基本操作,并利用精细训练的验证器评估候选动作,V-Droid在多个基准测试中的任务成功率显著提高,...
GPT-4.1偷偷开跑?神秘模型上线三天已被玩疯,网友发现大量OpenAI痕迹
上线仅三天的Optimus Alpha模型已处理772亿Token,性能优异。它在编程、创意写作等方面表现突出,并被怀疑来自OpenAI。
单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点|魔芯科技NTU等出品
CADCrafter团队提出了一种新的图生3D框架,能够直接生成可编辑的CAD工程文件。该方法从图像到CAD模型的转换精度高、表面质量好,并且通过编译器可以得到直接生产加工的3D文件。
装满智能体AI的手机,正在呼唤一个“Type-C时刻”
联发科在天玑9400+中引入多项新技术,提升了AI能力,并发布AI开发套件2.0和Neuron Studio工具集,推动智能体AI在手机上的应用。