DeepSeek是一家在人工智能领域崭露头角的公司,以下是关于它的介绍:
基本信息
● 全称:杭州深度求索人工智能基础技术研究有限公司
● 成立时间:2023年7月17日
● 法定代表人:裴湉
● 股东信息:宁波程恩企业管理咨询合伙企业持股99%,梁文锋持股1%
● 经营范围:工程和技术研究和试验发展;技术服务、技术开发、技术咨询等。
发展历程
● 2024年1月5日,发布首个大模型DeepSeek LLM。
● 2024年5月,开源第二代MoE大模型DeepSeek – V2。
● 2024年9月5日,升级推出DeepSeek V2.5新模型。
● 2024年11月20日,推理模型DeepSeek – R1 – Lite预览版上线。
● 2024年12月26日,模型DeepSeek – V3首个版本上线并开源。
● 2025年1月20日,正式发布DeepSeek – R1模型。
● 2025年1月27日,DeepSeek应用登顶15个国家和地区的苹果应用商店免费APP下载排行榜。
● 2025年1月31日,DeepSeek R1 671b作为英伟达NIM微服务预览版在build.nvidia.com上发布。
● 2025年2月2日,DeepSeek攀升至140个国家的苹果App Store下载排行榜首位,并在美国的Android Play Store中同样占据榜首位置。
主要产品
● DeepSeek LLM:包含670亿参数,在推理、编码等方面有出色表现。
● DeepSeek Coder:一系列代码语言模型,在多种编程语言和基准测试中性能先进。
● DeepSeekMath:以DeepSeek – Coder – v1.5 7B为基础,在竞赛级MATH基准测试中成绩优异。
● DeepSeek – VL:开源视觉-语言模型,在各种视觉任务中能捕捉关键语义和细节信息。
● DeepSeek – VL2:先进的大型混合专家视觉-语言模型,在多种任务中能力卓越。
● DeepSeek – V2:拥有2360亿参数,中文综合能力强,训练效率高。
● DeepSeek – Coder – V2:开源混合专家代码语言模型,在代码特定任务中性能与GPT4 – Turbo相当。
重要说明:本站课程均整理自网络,防止大家被割韭菜 !
本站初心:花更少的米,看韭菜一样的东西,仅学习其中的思路
项目里留下的联系方式最好仅作咨询!收费的一律删除~付费需谨慎!!切记!
创奇社官网:www.cqshe.com 如有解压密码看下载页说明
暂无评论内容