排序
语音合成突破:F5R-TTS首次实现非自回归模型的GRPO优化,零样本克隆性能显著提升
最新研究提出F5R-TTS系统,通过概率化输出和GRPO优化方法成功将强化学习整合到非自回归TTS中,显著提升语音合成质量。
物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架
近日,大连理工大学与莫纳什大学的研究团队提出VLIPP框架,通过引入物理规律提升视频生成的物理真实性。论文指出视频扩散模型在物理场景下表现不佳的原因,并提出两阶段方法,利用视觉语言模型...
「清能互联」完成超2亿元战略融资,专注于能源行业AI化
「清能互联」完成超2亿元战略融资,专注于能源行业AI化 投资界4月21日消息,近日「清能互联」宣布完成超2亿元战略轮融资,领投方包括中国石油昆仑资本、恒旭资本、鹏辉能源;跟投方为广发信德、...
看不懂GitHub代码?刚刚这个AI工具让全球每个GitHub项目开口说话
Cognition Labs发布DeepWiki项目,为GitHub代码仓库提供实时交流、即时更新的文档服务,亮点包括免费、免注册、即刻可用等。
让明星AI分身上综艺,即梦AI算是把“平替”玩明白了
《闪亮的日子》AI特辑通过抖音与大千影业联合出品,展示了多位嘉宾对应的AI数字人形象在平行时空中的不同生活。AI技术使制作过程更加高效,并带来新的内容消费体验。即梦AI数字人功能让真人观察...
生数科技新模型Vidu Q1:超越Runway、Kling位列VBench榜首,动漫视频生成领域全球第一
和表现有点惊人。 没错,它就是生数科技旗下的国产视频大模型Vidu Q1。 在权威评测基准VBenc
聚焦个性化学习,夸克不想做一个千篇一律的“AI+教育”
教育作为大模型天然的应用场景之一,在AI+教育赛道上竞争激烈。夸克学习产品聚焦个性化需求,并通过AI技术提升用户体验,形成以‘AI超级框’为核心入口的学习产品,旨在推动学习场景中的通用能...
我逛了逛 Kimi 的「AI 小红书 」, OpenAI 也想做的 「AI 社交圈」会更好刷吗?
Kimi AI 社区已启动灰度测试,通过智能助手参与内容互动。尽管初期用户不多且内容稀少,但未来可能成为下一个社交平台。
「全挚科技」完成数千万元Pre-A轮融资,同创伟业领投
「全挚科技」完成数千万元Pre-A轮融资,同创伟业领投 投资界(ID:pedaily2012)4月23日消息,工业机器人领域创新企业杭州全挚科技有限公司(以下简称'全挚科技')近日宣布完成数千万元Pre-A轮...
大模型AI软件落地已过验证阶段,代码生成占比明显提升|AI4SE 行业现状调查报告(2024年度)
中国信通院发布《AI4SE行业现状调查报告》,指出软件工程智能化转型势在必行。企业软件研发智能化成熟度普遍处于L2水平,AI技术应用比例显著提升,代码生成占比同比增加6%,测试用例生成效果明...
OpenAI 开源了一款轻量级的终端编码助手:OpenAI Codex CLI
OpenAI 开源了一款轻量级的终端编码助手:OpenAI Codex CLI OpenAI 开源了一款轻量级的终端编码助手:OpenAI Codex CLI。允许在终端上通过自然语言完成代码编写、文件操作和迭代开发,所有操作...
“元宝”杀入好友列表,想和13亿微信用户“交个朋友”
“元宝”杀入好友列表,想和13亿微信用户“交个朋友” 微信可以加“元宝”好友了,全民AI时代或将由此开启。 “元宝”是腾讯元宝App入驻微信的AI助手,日前正式上线可用。这是继今年2月微信宣布...
最强o1也刚刚及格!中科大等团队测试视频CoT推理能力:多数模型不及格
中科大等团队提出VCR-Bench评估基准,用于评价视频理解中的CoT推理能力。该基准包含七个独立评估维度的任务框架,覆盖视觉感知和逻辑推理两大类别。结果显示当前多模态模型在复杂视频推理任务上...