加入网站会员,全站资源免费获取,每日稳定更新中!

微软开源DeepSeek-R1魔改版:响应99%敏感提示,风险降50%

今天凌晨,微软在官网开源了DeepSeek-R1魔改版MAI-DS-R1,在保留原有推理性能的基础上进行了大幅度增强。

尤其是在响应和屏蔽词方面有了显著改进:MAI-DS-R1可以响应99.3%的敏感话题提示,比原版R1提升了2倍,这对于政治学术研究、社会问题、伦理道德研究等帮助巨大;

但在安全风险大幅度降低,比原版R1降低了50%。那些想体验一下“放飞自我”版R1的小伙伴们可以试试这个,非常有意思打开全新世界。

微软开源DeepSeek-R1魔改版:响应99%敏感提示,风险降50%-1

开源地址:https://huggingface.co/microsoft/MAI-DS-R1

Azure地址:https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml

微软在训练MAI-DS-R1的过程中,从大约350000个被屏蔽的主题示例中,收集和筛选查询关键词,将这些关键词转化为多个问题,并翻译成不同语言;

还通过DeepSeek R1和内部模型为这些问题生成答案和思维链。此外,训练数据中还纳入了来自Tulu3 SFT数据集的110K个安全和违规示例,这些示例涵盖了CoCoNot、WildJailbreak和WildGuardMix等内容。

微软开源DeepSeek-R1魔改版:响应99%敏感提示,风险降50%-2

随后,微软对MAI-DS-R1进行了综合评估。在敏感话题响应方面,MAI-DS-R1能够成功响应99.3%的敏感话题提示,这一表现显著优于DeepSeek R1和R1-1776。

在安全性评估方面,MAI-DS-R1在HarmBench评估中表现出色,相比DeepSeek R1和R1-1776,在减少有害内容方面降低了50%风险。这说明虽然MAI-DS-R1能响应更多的敏感话题,但还是在安全控制范围之内。

微软开源DeepSeek-R1魔改版:响应99%敏感提示,风险降50%-3

在推理能力方面,MAI-DS-R1保持了与DeepSeek R1相同的推理能力,在一般知识、推理、数学和编程基准测试中表现非常出色。

图片[4]-微软开源DeepSeek-R1魔改版:响应99%敏感提示,风险降50%-创奇社
微软开源DeepSeek-R1魔改版:响应99%敏感提示,风险降50%-5

在伦理和法律标准方面,MAI-DS-R1在处理非法或不道德的请求时表现得更加谨慎,拒绝生成有害或不当的内容。

此外,MAI-DS-R1在后训练过程中将问题翻译成多种语言,能够更好地适应不同语言环境下的需求。这使得MAI-DS-R1在需要多语言支持的领域,如国际组织、跨国企业、教育机构等,能够提供多语言的高质量回答。

目前,微软已经在huggingface开源了该模型,同时在Azure AI Foundry进行了发布。

(文:AIGC开放社区)

重要说明:本站课程均整理自网络,防止大家被割韭菜 !

本站初心:花更少的米,看韭菜一样的东西,仅学习其中的思路


项目里留下的联系方式最好仅作咨询!收费的一律删除~付费需谨慎!!切记!

创奇社官网:www.cqshe.com 如有解压密码看下载页说明

版权声明 本站仅分享教程,不提供任何指导,不会操作请参考教程说明自行研究,小白请勿下单!
客服不回复任何教程内容相关咨询。
虚拟商品购买须知: 虚拟商品具有可复制性,一经打赏赞助,不支持退款。请谅解,谢谢合作!
本站内容转载于网络,版权归原作者所有,仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任,如果侵犯了您的权益,请联系站长 QQ:2428-6070 进行删除。
THE END
喜欢就支持一下吧
点赞13 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容