最新更新第114页
视频推理R1时刻,7B模型反超GPT-4o!港中文清华推出首个Video-R1
港中文和清华团队推出Video-R1模型,首次将强化学习的R1范式应用于视频推理领域。通过升级的T-GRPO算法和混合图像视频数据集,Video-R1在视频空间推理测试中超越了GPT-4o,并且全部代码和数据集...
速递|8秒视频只是起点,谷歌Veo 2携8秒720P视频登陆Gemini,硬刚OpenAI Sora
谷歌即将在其Gemini平台上推出新的Veo 2视频生成AI模型,该模型目前仅限于订阅Gemini Advanced的付费用户使用。Gemini Advanced用户可创建720p分辨率8秒的16:9宽高比视频,并通过Gemini的分享按...
多模态生成框架新SOTA:文本+空间+图像随意组合,20W+数据开源,复旦腾讯优图出品
复旦大学、腾讯优图实验室等机构的研究人员提出UniCombine框架,能够处理多种条件组合的多条件可控生成任务,并在多个实验中达到SOTA。
实探|关税风暴下客户仍“顶压下单”,出海企业迎难求变
美国加征高额关税导致中美贸易紧张。为应对风险,不少中国企业转向欧洲、中亚等地市场,并推动供应链转移至东南亚国家。制造业企业需调整全球布局和供应链管理能力。
AI攻占学术圈?一核心期刊:用AI创作论文投稿,将拉黑
《社会科学辑刊》发文谴责用AI生成或辅助创作学术论文的现象,并宣布对查实的论文作者实行黑名单制。该期刊发现3篇投稿有明显的AI创作痕迹,作者均已被纳入黑名单。李学成表示依赖AI会让研究者...
影身智能获千万融资,从工业起步,矢志L4 具身智能普惠化
影身智能获千万融资,从工业起步,矢志L4 具身智能普惠化 4月16日,据硬氪消息,杭州影身智能技术有限公司近日连续完成数千万元种子轮、种子+轮融资。 种子轮由卓源亚洲投资;种子+轮由卓源亚洲...
力压OpenAI谷歌,快手掏出最强视频大模型,可灵2.0一句话搞定特效
可灵AI发布2.0版本,新增多模态信息交互能力及提升生成效果。改进包括更好的语义响应、动态质量和画面美学,同时增强了图像生成模型的能力。
AI活动公告板:4月份这些AI活动值得参加
本月 AI 热点包括Gemini-2.5-Pro和GPT-4发布。值得关注的活动有DeepSeek、Manus、AI开年百日剧变沙龙、七十二小时闭门挑战赛等,涵盖创业者、投资人、开发者等多个群体。