量子位的头像-创奇社
这家伙很懒,什么都没有写...
首个个性化对齐大模型问世!可精准识别用户内在动机和偏好,还有百万用户画像开源数据集 蚂蚁&人大-创奇社

首个个性化对齐大模型问世!可精准识别用户内在动机和偏好,还有百万用户画像开源数据集 蚂蚁&人大

价值观对齐训练,但其对齐效果往往会让少数群体的声音被系统性淹没。 那随之而来的问题是, 当大模型服务
32天前
0110
亚马逊云计算Troy Cui:敦煌网飙升AppStore第二,企业如何应对激增流量是关键 中国AIGC产业峰会-创奇社

亚马逊云计算Troy Cui:敦煌网飙升AppStore第二,企业如何应对激增流量是关键 中国AIGC产业峰会

排名第二,面对如此泼天的流量,该用什么“姿势”来接住? 在千变万化、快速发展的生成式AI时代下,如此
刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理-创奇社

刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理

的视频,都可以直接做 推理 和 解析 了! 瞧~只需“喂”上一段 柯南片段 ,AI就摇身一变成“名
AI优化芯片布局,设计阶段即考虑最终性能,中科大华为诺亚新方法入选ICLR 2025 Oral-创奇社

AI优化芯片布局,设计阶段即考虑最终性能,中科大华为诺亚新方法入选ICLR 2025 Oral

中科大王杰教授团队、华为诺亚实验室和天津大学提出了一种新的芯片宏单元布局优化方法LaMPlace,能够在布局阶段就考虑最终性能指标如WNS和TNS,从而缩短设计流程并提高效率。
下周三!20余位行业大佬共话AI,中国AIGC产业峰会最全攻略在此-创奇社

下周三!20余位行业大佬共话AI,中国AIGC产业峰会最全攻略在此

全?这里有全球顶尖防御方案。 想了解AI如何让普通人一键创作音乐? …… 一天时间,带你看尽如何 「
谷歌最新AI芯片打平英伟达B200,专为推理模型打造,最高配每秒42500000000000000000次浮点运算-创奇社

谷歌最新AI芯片打平英伟达B200,专为推理模型打造,最高配每秒42500000000000000000次浮点运算

谷歌发布新款TPU v7芯片,峰值算力达4614TFlops,支持大规模并行处理和高效的内存访问。TPU v7在高带宽内存、低延迟ICN网络方面都有显著提升,并配备增强版SparseCore以支持高级排序和推荐工作...
“谷歌版MCP”来了!开源A2A,不同厂商Agent也能协作-创奇社

“谷歌版MCP”来了!开源A2A,不同厂商Agent也能协作

谷歌推出A2A协议(Agent2Agent),允许不同生态系统中的AI Agent安全协作。通过统一界面,招聘经理可以下达任务给专业Agent寻找合适的候选人,并利用多Agent协同完成复杂工作流。
字节开源新生图模型:一个模型统一所有生图任务,多主体融合效果SOTA​-创奇社

字节开源新生图模型:一个模型统一所有生图任务,多主体融合效果SOTA​

字节团队提出UNO模型,能处理多主体图像生成任务。该模型基于FLUX改进,解决了数据可扩展性和主体可扩展性问题,并在DINO和CLIP得分上达到SOTA水平。
Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B-创奇社

Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B

Kimi团队发布开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking,参数为16B但推理时仅激活2.8B。具备强大的多模态推理能力和Agent能力。支持128K上下文窗口,采用宽松的MIT许可证。
GPT-4o图像生成架构被“破解”了?自回归主干+扩散解码器,还有4o图像生成全面测评基准-创奇社

GPT-4o图像生成架构被“破解”了?自回归主干+扩散解码器,还有4o图像生成全面测评基准

”了! 最近一阵, “万物皆可吉卜力”让GPT-4o的图像生成功能一炮而红 ,人们随之好奇: 4o图
Llama 4发布36小时差评如潮!匿名员工爆料拒绝署名技术报告-创奇社

Llama 4发布36小时差评如潮!匿名员工爆料拒绝署名技术报告

Meta最新基础模型Llama 4发布后遭遇差评如潮。代码能力受质疑,尤其是经典‘氛围编程’小球测试表现不佳。竞技场排名成绩参差不齐,且存在数据泄露和版权问题的疑虑。
200亿机器人独角兽被曝爆雷,官方回应来了-创奇社

200亿机器人独角兽被曝爆雷,官方回应来了

达闼机器人因财务问题陷入困境,公司和创始人回应称情况良好,并表示已解决欠薪问题。尽管市场火热,但具身智能领域仍面临应用和盈利难题。
奥特曼最新访谈认可“套壳”:多数改变世界的公司,最初都是这样的-创奇社

奥特曼最新访谈认可“套壳”:多数改变世界的公司,最初都是这样的

在最新访谈中,OpenAI CEO奥特曼分享了对AI和创业的看法。他指出大多数改变世界的公司都是从传统领域转型而来,并强调当编程成本下降时,全球软件需求会呈指数级增长。奥特曼认为当前世界正处于...
中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%-创奇社

中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%

中科大MIRA实验室提出KG-SFT框架,通过结合知识图谱和LLMs提升特定领域性能,显著提高常识问答准确率。
米哈游蔡浩宇新作iPhone实机演示:10分钟就被AI小美撩到脸红,她的命运由我拯救-创奇社

米哈游蔡浩宇新作iPhone实机演示:10分钟就被AI小美撩到脸红,她的命运由我拯救

米哈游蔡浩宇的AI游戏《Whispers From The Star》曝光实机演示片段。玩家通过多种方式与NPC角色进行沉浸式对话,决定女主角命运。该游戏目前正在进行封闭测试,并支持iPhone 12及以上版本。
智能体丝滑玩手机,决策延迟0.7秒!MSRA等提出验证器架构,不直接依赖大模型生成最终操作-创奇社

智能体丝滑玩手机,决策延迟0.7秒!MSRA等提出验证器架构,不直接依赖大模型生成最终操作

V-Droid使用验证器驱动架构在移动GUI任务自动化中实现了高成功率和低延迟。通过解析UI界面提取基本操作,并利用精细训练的验证器评估候选动作,V-Droid在多个基准测试中的任务成功率显著提高,...
“AI眼镜的终极功能,是AI+社交” 对话影目科技创始人-创奇社

“AI眼镜的终极功能,是AI+社交” 对话影目科技创始人

月,现象级产品Ray-Ban Meta智能眼镜发布,标志着智能眼镜终端不再只是极客的玩具, 而是 可
OpenAI官方基准测试:承认Claude遥遥领先(狗头)-创奇社

OpenAI官方基准测试:承认Claude遥遥领先(狗头)

OpenAI发布PaperBench新基准测试,最新版Claude-3.5-Sonnet在复现ICML2024论文任务中超越其他顶尖大模型。对比去年的MLE-Benchmark,PaperBench更侧重综合能力评估。
10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型-创奇社

10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型

CalibQuant团队在InternVL-2.5模型上提出了一种1比特量化方法,通过校准策略缓解了低比特数量化带来的失真问题。实验结果显示,在多种任务和内存限制下,该方法相比基线有显著的性能提升。
视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成-创奇社

视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成

V²Flow团队发布的新开源框架V²Flow解决了视觉Token与大语言模型词表的不一致问题,实现了高保真自回归图像生成。该技术通过视觉词汇重采样器将视觉内容嵌入到LLM的词汇空间中,并使用掩码自回...