DeepSeek R1共9篇
DeepSeek-R1「内心世界」首次曝光!AI显微镜破解R1大脑,发现神秘推理机制-创奇社

DeepSeek-R1「内心世界」首次曝光!AI显微镜破解R1大脑,发现神秘推理机制

乱语」甚至「故意撒谎」?Goodfire最新发布的开源稀疏自编码器(SAEs),基于DeepSeek
新智元的头像-创奇社新智元22天前
0509
微软开源DeepSeek-R1魔改版:响应99%敏感提示,风险降50%-创奇社

微软开源DeepSeek-R1魔改版:响应99%敏感提示,风险降50%

今天凌晨,微软开源了MAI-DS-R1魔改版,在保留原有推理性能的基础上进行大幅度增强,响应敏感话题提升2倍至99.3%,安全性降低50%。
AIGC开放社区的头像-创奇社AIGC开放社区25天前
03713
微博账号被AI偷窥?官方回应:只抓取公开内容-创奇社

微博账号被AI偷窥?官方回应:只抓取公开内容

微博‘AI智搜’引发隐私争议,部分用户发布拒绝授权声明反对平台使用其公开及私密内容进行分析。事件涉及爬取边界、用户同意以及法律效力等问题。
AI前哨站的头像-创奇社AI前哨站18天前
0356
142页长文揭秘DeepSeek-R1「思维大脑」!开启全新「思维链学」研究-创奇社

142页长文揭秘DeepSeek-R1「思维大脑」!开启全新「思维链学」研究

突破了传统LLM的局限,还开启了全新的研究方向「思维链学」(Thoughtology)。这份长达14
新智元的头像-创奇社新智元21天前
02015
字节新推理模型逆袭DeepSeek,200B参数战胜671B,豆包史诗级加强?-创奇社

字节新推理模型逆袭DeepSeek,200B参数战胜671B,豆包史诗级加强?

字节最新研发的Seed-Thinking-v1.5模型在数学、代码推理任务中表现优异,参数规模较小。该模型通过创新的数据处理方法、强化学习算法及基础设施优化提升了性能,并与其他领先模型进行了对比分析...
量子位的头像-创奇社量子位30天前
0110
不用英伟达GPU!华为盘古Ultra来了:昇腾原生、135B稠密通用大模型-创奇社

不用英伟达GPU!华为盘古Ultra来了:昇腾原生、135B稠密通用大模型

我们知道,如今各大科技公司纷纷发布百亿、千亿级模型。但这些大部分模型训练主要依赖英伟达的 GPU。
机器之心的头像-创奇社机器之心29天前
0110
智谱开源最快大模型-创奇社

智谱开源最快大模型

智谱发布新一代开源模型GLM-4-32B-0414系列,包含基座、推理、沉思模型权重,并遵循MIT License。推理模型GLM-Z1-Air/AirX-0414模型推理速度最高可达200 Tokens/秒,价格仅是DeepSeek-R1的1/30...
财联社AI daily的头像-创奇社财联社AI daily28天前
0100
DeepSeek R1是什么?全面解析DeepSeek R1的核心功能与应用场景-创奇社

DeepSeek R1是什么?全面解析DeepSeek R1的核心功能与应用场景

DeepSeek R1是一款由深度求索(DeepSeek)公司开发的高性能AI模型,专注于自然语言处理(NLP)任务。它具备强大的文本理解与生成能力,适用于智能问答、内容创作、代码生成等多种场景。本文详细...
创奇社的头像-创奇社年费会员创奇社25天前
020
DeepSeek-R1联网满血版:全面解析AI搜索新标杆-创奇社

DeepSeek-R1联网满血版:全面解析AI搜索新标杆

本文深入探讨DeepSeek-R1联网满血版的核心功能与技术优势,包括其强大的联网搜索能力、精准的语义理解及高效的信息整合性能。文章还分析了该版本在行业应用中的潜力,并对比同类工具,帮助用户...
创奇社的头像-创奇社年费会员创奇社25天前
010