大语言模型共24篇
被《经验时代》刷屏之后,剑桥博士长文讲述RL破局之路-创奇社

被《经验时代》刷屏之后,剑桥博士长文讲述RL破局之路

归来的姿态在 LLM 的后训练时代证明了其巨大价值,Sutton 和 Barto 拿了图灵奖,Dav
机器之心的头像-创奇社机器之心19天前
0306
MSRA首席研究员刘炜清:为每位研究员提供AI科研助理,自动化高门槛、重复性工作|中国AIGC产业峰会-创奇社

MSRA首席研究员刘炜清:为每位研究员提供AI科研助理,自动化高门槛、重复性工作|中国AIGC产业峰会

科学领域正经历一场静默的革命。传统的特征工程、模型训练与迭代优化流程,正被智能化的研发助手所改变。
量子位的头像-创奇社量子位19天前
0259
视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成-创奇社

视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成

V²Flow团队发布的新开源框架V²Flow解决了视觉Token与大语言模型词表的不一致问题,实现了高保真自回归图像生成。该技术通过视觉词汇重采样器将视觉内容嵌入到LLM的词汇空间中,并使用掩码自回...
量子位的头像-创奇社量子位40天前
0140
历史首次!GPT-4.5通过标准图灵测试,靠的竟是"装人设"?-创奇社

历史首次!GPT-4.5通过标准图灵测试,靠的竟是"装人设"?

UC San Diego团队通过实验验证GPT-4.5不仅通过了图灵测试,其表现甚至超过真人。胜率高达73%,远高于对照组人类对手的50%。研究发现人设提示是关键因素。
AI寒武纪的头像-创奇社AI寒武纪40天前
0110
揭秘DeepSeek-R1满血版参数规模:为何它被称为AI性能天花板?-创奇社

揭秘DeepSeek-R1满血版参数规模:为何它被称为AI性能天花板?

本文深度解析DeepSeek-R1满血版参数量的技术突破,结合官方数据与实测对比,揭露其参数架构设计、训练效率优化策略及实际应用场景,帮助开发者理解千亿级参数模型如何突破算力瓶颈。
创奇社的头像-创奇社年费会员创奇社33天前
0110
中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%-创奇社

中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%

中科大MIRA实验室提出KG-SFT框架,通过结合知识图谱和LLMs提升特定领域性能,显著提高常识问答准确率。
量子位的头像-创奇社量子位34天前
0100
DeepSeek开发公司是谁?深度解析背后的技术团队与愿景-创奇社

DeepSeek开发公司是谁?深度解析背后的技术团队与愿景

DeepSeek是由中国人工智能公司深度求索(DeepSeek Inc.)开发的先进大语言模型。本文详细介绍了DeepSeek的背景、技术特点以及公司愿景,帮助读者了解这一AI模型的研发团队及其在行业中的定位。
创奇社的头像-创奇社年费会员创奇社27天前
060
DeepSeek开发公司名称及其背后的技术探索-创奇社

DeepSeek开发公司名称及其背后的技术探索

本文介绍了DeepSeek的开发公司名称及其背景,探讨该公司在人工智能领域的核心技术优势,包括大模型训练、自然语言处理等创新方向,并分析其在行业内的应用前景。
创奇社的头像-创奇社年费会员创奇社27天前
050
Deepseek是什么公司?探索这家AI企业的背景与核心技术-创奇社

Deepseek是什么公司?探索这家AI企业的背景与核心技术

Deepseek是一家专注于人工智能技术研发的创新型企业,致力于自然语言处理、大模型开发及AI应用解决方案。公司核心团队由资深AI专家组成,旗下产品包括对话式AI、代码生成模型等,技术实力获行业...
创奇社的头像-创奇社年费会员创奇社27天前
040
DeepSeek是什么模型?全面解析其架构、特点与应用场景-创奇社

DeepSeek是什么模型?全面解析其架构、特点与应用场景

DeepSeek是由深度求索公司开发的大规模语言模型,专注于高效处理复杂自然语言任务。本文详细介绍了DeepSeek的技术架构、核心特点(如长上下文理解、多模态能力)、开源版本与商业应用,并对比同...
创奇社的头像-创奇社年费会员创奇社27天前
040
Deepseek汉语叫什么?中文名称及技术背景解析-创奇社

Deepseek汉语叫什么?中文名称及技术背景解析

本文介绍了人工智能公司Deepseek的中文名称及其技术背景。Deepseek是一家专注于AI大模型研发的创新企业,其中文名为“深度求索”,体现了其探索人工智能前沿的使命。文章还简要说明了Deepseek的...
创奇社的头像-创奇社年费会员创奇社25天前
030
DeepSeek最强版本解析:性能对比与核心优势-创奇社

DeepSeek最强版本解析:性能对比与核心优势

本文深入分析DeepSeek各版本的技术演进,重点对比当前最强版本的核心能力,包括模型参数规模、多模态支持、推理效率及实际应用表现,帮助用户理解其技术突破与适用场景。
创奇社的头像-创奇社年费会员创奇社25天前
030
满血版DeepSeek模型参数详解 - 性能与架构深度解析-创奇社

满血版DeepSeek模型参数详解 - 性能与架构深度解析

本文详细解析满血版DeepSeek大模型的参数规模、架构设计及性能表现,探讨其在高算力场景下的应用潜力。内容涵盖参数数量、技术亮点、训练数据及与其他主流模型的对比,帮助读者全面了解这一前沿...
创奇社的头像-创奇社年费会员创奇社25天前
010
满血版DeepSeek是什么意思?解析AI模型的性能强化概念-创奇社

满血版DeepSeek是什么意思?解析AI模型的性能强化概念

本文详细解释了“满血版DeepSeek”的含义,探讨其作为AI模型优化版本的性能特点,包括算力增强、参数规模扩展以及应用场景升级。同时对比标准版差异,分析技术实现路径及对用户的实际价值,帮助...
创奇社的头像-创奇社年费会员创奇社25天前
010
DeepSeek开源模型下载指南 | 获取方式、特点与应用场景-创奇社

DeepSeek开源模型下载指南 | 获取方式、特点与应用场景

本文详细介绍DeepSeek开源模型的下载方法,包括官方渠道、技术要求和部署步骤,同时分析其核心功能(如长文本处理、高性能推理)及适用领域(科研、企业开发等)。帮助开发者快速获取并利用这一...
创奇社的头像-创奇社年费会员创奇社25天前
010
DeepSeek官方下载指南 – 最新版本安装方法与使用教程-创奇社

DeepSeek官方下载指南 – 最新版本安装方法与使用教程

本文详细介绍了如何从官方渠道下载DeepSeek AI相关工具,包括网页版、API及客户端版本的获取方式,同时提供安全下载建议和常见问题解答。文章涵盖Windows、Mac及移动端平台的安装步骤,帮助用户...
创奇社的头像-创奇社年费会员创奇社27天前
010
DeepSeek厉害在哪里?全面解析其核心优势与技术特点-创奇社

DeepSeek厉害在哪里?全面解析其核心优势与技术特点

DeepSeek作为一款先进的大语言模型,凭借强大的自然语言处理能力、高效的学习算法和广泛的应用场景成为AI领域的佼佼者。本文从核心技术、应用优势及用户价值等角度,深入分析DeepSeek的独特之处...
创奇社的头像-创奇社年费会员创奇社25天前
010
DeepSeek背后的故事:探索AI研究团队的创新之路与未来愿景-创奇社

DeepSeek背后的故事:探索AI研究团队的创新之路与未来愿景

本文揭秘了DeepSeek背后的研发历程、核心技术突破及团队使命,从大模型训练到开源生态布局,展现其如何通过长期主义推动AI普惠化。文章还探讨了团队面临的挑战与应对策略,并展望了通用人工智能...
创奇社的头像-创奇社年费会员创奇社25天前
010
DeepSeek如何回答问题?原理、能力与使用场景解析-创奇社

DeepSeek如何回答问题?原理、能力与使用场景解析

本文详细解析DeepSeek回答问题的核心机制,包括其基于大语言模型的技术原理、多轮对话与上下文理解能力,以及在不同场景下的应用表现。文章还对比了DeepSeek与传统搜索引擎的差异,并提供了优化...
创奇社的头像-创奇社年费会员创奇社26天前
010
DeepSeek腾讯满血版:AI大模型的技术突破与应用前景-创奇社

DeepSeek腾讯满血版:AI大模型的技术突破与应用前景

本文深入解析DeepSeek与腾讯联合推出的“满血版”AI大模型,探讨其核心技术优势、性能表现及行业应用场景。文章从模型架构、训练数据、算力支持等维度展开,结合实际案例说明其在自然语言处理、...
创奇社的头像-创奇社年费会员创奇社25天前
010