排序
OpenAI前CTO爆炸开局:种子轮开盘20亿美元!0产品0用户估值直奔100亿,GPT论文一作也加入了
OpenAI前CTO Mira Murati的初创公司正在筹集20亿美元种子轮融资,估值可能达到100亿美元。该公司的目标是打造一个能为所有人提供知识和工具的未来,尤其关注科学和编程领域。两位重要成员——GP...
Claude 4六个月内发布!Anthropic联创Kaplan:AGI两三年内到来
Anthropic联合创始人兼首席科学家Jared Kaplan预测人类水平AI可能在2-3年内实现。Kaplan认为模型智能提升、上下文窗口扩展以及强化学习使AI能力快速扩展,Claude 4将在六个月内发布,DeepSeek等...
对标OpenAI,谷歌开源Agent SDK,支持MCP、A2A、5000星
谷歌在Google Cloud Next大会上发布了首个智能体开发套件—ADK。此套件能简化开发复杂流程的智能体,支持双向音频、视频及最新的A2A协议,并兼容超过200个第三方模型。ADK简单介绍仅需6行代码即...
GPT-4.1淘汰了4.5!全系列百万上下文,主打一个性价比
OpenAI发布了GPT-4.1系列模型,相比前代GPT-4.5有显著提升。新版本包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,主打长上下文处理能力和性价比。
多模态生成框架新SOTA:文本+空间+图像随意组合,20W+数据开源,复旦腾讯优图出品
复旦大学、腾讯优图实验室等机构的研究人员提出UniCombine框架,能够处理多种条件组合的多条件可控生成任务,并在多个实验中达到SOTA。
OpenAI正以30亿美元洽谈收购Windsurf,加码Agent赛道
OpenAI正洽谈以30亿美元收购AI编程平台Windsurf,显示其对Agent赛道的决心。Windsurf前身为Codeium,曾获得6500万美元和1.5亿美元融资,估值暴涨至12.5亿美元。Cascade是Windsurf的一大亮点,提...
突破AI视觉“选择性失明”,哈工大首次实现指令驱动的全景式感知
哈工大博士生李俊劼的研究成果GiVE首次实现了指令驱动的全景式感知,解决了传统多模态模型'选择性失明'的问题。通过引入AG-Adapter模块和设计三种专门损失函数,GiVE能灵活调整注意力...
语音合成突破:F5R-TTS首次实现非自回归模型的GRPO优化,零样本克隆性能显著提升
最新研究提出F5R-TTS系统,通过概率化输出和GRPO优化方法成功将强化学习整合到非自回归TTS中,显著提升语音合成质量。
142页长文揭秘DeepSeek-R1「思维大脑」,开启全新「思维链学」研究
142页长文揭秘DeepSeek-R1「思维大脑」,开启全新「思维链学」研究 导读】DeepSeek-R1是近年来推理模型领域的一颗新星,它不仅突破了传统LLM的局限,还开启了全新的研究方向「思维链学」(Thoug...
虚拟动点助力“利亚德集团2025年生态合作伙伴大会”圆满落幕
利亚德集团2025年生态合作伙伴大会在京成功举办,李军携核心管理层参会并分享显示、AI及文旅行业发展趋势。虚拟动点CEO刘耀东代表公司阐述了基于空间计算技术的AI研究成果与布局。
告别一眼假,这下数字人终于「会思考」和「能协同」
哲学家安迪·克拉克提出人类与技术的共生演化,数字人主播通过AI驱动变得拟真且能灵活应变。百度发布慧播星新一代数字人,助力电商直播规模化发展和普惠化,重塑消费者体验,并推动内容创作民主...
近千个反现实视频构建了「不可能」基准,哪个AI不服?来战!
新加坡国立大学的研究团队提出了Impossible Videos概念,构建了包含多种不可能场景的基准IPV-BENCH,用于评测AI视频生成和理解能力。研究发现当前模型在生成和识别不可能事件方面存在挑战,并指...
刚刚,OpenAI 罕见宣布将开源推理模型,DeepSeek 给逼的
刚刚,OpenAI 罕见宣布将开源推理模型,DeepSeek 给逼的 就在刚刚,OpenAI CEO Sam Altman 正式宣布,将在未来几个月内推出一款具备推理能力的强大开放权重语言模型,并期待与开发者共同探索如...
飞桨新一代框架 3.0 正式发布:减少 Llama 预训练 80% 分布式核心代码,R1 满血版单机部署吞吐量翻倍
,飞桨框架 3.0 版本不仅延续了飞桨框架 2.0 系列动静统一、训推一体的特性,更在自动并行、神经