
大小:9.9MB 版本:V1.2.2 分类:拍摄美化 更新时间:2026-01-05 15:39:05 md5:a621658c19ff5d65bfac73d47fdb2653
DeepSeek最新版本是一款AI对话类应用,其核心目标是借助智能交互形式,协助用户解决AI及相关领域的知识疑问。用户仅需在该应用中输入问题,AI就能快速给出对应的解答与相关资讯。而自定义接口的设计,让用户不必经历复杂的充值或注册步骤,就能直接使用应用功能,从而显著优化了用户的使用感受。

DeepSeek深度求索是一款AI对话类软件,它能够为你解答各类AI相关知识。无论你想了解什么内容,只需通过该软件进行询问,它就会为你提供解答。这是一个自定义接口,无需充值即可直接使用,十分便捷。
分析用户行为和偏好,推荐最相关的内容和信息。
自动生成高质量的文章和内容。
高效回答用户咨询和问题。
提供编程语言、算法、数据结构等领域的代码示例与调试支持。
进入软件后我们需要完成登录;

未注册的账号将自动完成注册;

登录完毕以后就可以正常使用此软件了。
一、网页端使用
最简便的方式是通过网页使用。你可以直接打开网页,也可以在应用商店里搜索对应的App。
地址:https://chat.deepseek.com/

【深度思考】,就是R1的推理模型,可以自动思考。
使用【联网搜索】功能,就能获取到近期的最新内容,尤其适合用来查看最新发布的新闻。
点击右下角的“选择文件”按钮,可选取图片、文档等各类文件,系统会自动提取所选文件(无论是图片还是文档)中的文字信息。
不过最近Deepseek的服务器访问量有点大,经常会出现服务器故障,导致无法使用。这种情况下我们就需要用到API,但Deepseek API目前也暂时无法使用。
要是你平时玩游戏,或者电脑上配有专门的显卡,完全可以自己在本地进行部署。
如果你没有显卡,也可以借助第三方API来实现需求,它的运行速度相当快,功能也很强大;虽说和自带显卡的性能相比会稍逊一筹,但对于日常使用来说已经完全足够了。
然后使用第三方的客户端连接就可以使用。
二、本地安装Deepseek R1
Ollama本地安装Deepseek R1 模型
Ollama 的官方网址是:https://ollama.com/
打开,然后点击,之后安装到本地。

然后打开Ollama的模型列表,找到DeepSeek R1
https://ollama.com/library/deepseek-r1

像我们普通的电脑,安装1.5B或7B的模型就能使用,之后在【右上角的代码】处复制内容,到命令行里运行即可。

安装需要一些时间,我们稍作等待,等看到“success”字样时,就说明安装成功了。
输入【ollama list】指令,就能查看已安装的模型。

软件安装完成后,我们只能通过命令行来操作,这样会显得格外不方便。
我们需要找到一个第三方客户端。
第三方客户端
客户端推荐了Chatbox和Cherry Studio这两款都很出色的工具,帅客将以Cherry Studio为例进行演示。
Cherry Studio:https://cherry-ai.com/
Cherry Studio 是一款功能十分强大的AI客户端,能够支持国内外众多模型。
还很多提示词,文生图,文档等功能。
按照下面步骤添加即可。
我们在Cherry Studio客户端中,对Ollama已安装的模型进行配置。
默认API地址为:http://localhost:11434/v1
模型名:deepseek-r1:1.5b


第三方API
要是各位的电脑没有GPU,不太建议在本地进行安装,不妨使用API。
我们使用【硅基流动】来给大家举例子。
https://cloud.siliconflow.cn
首先要做的是注册一个账号,注册会赠送14块,这笔钱能用上很长时间。
接着打开【模型广场】,找到Deepseek R1,要复制对应的模型。

接下来打开API Key页面,网址是https://cloud.siliconflow.cn/account/ak,创建一个api-key,之后再打开Cherry Studio。

模型配置完成后,打开聊天界面,在顶部选择R1模型就能使用啦,超方便!

免费API
大家要是想找免费或者价格实惠的选项,可以在这个网站上搜索,这里能对比各类价格。另外,目前还有两种免费的提供方式。
https://openrouter.ai/deepseek/deepseek-r1:free

不过其他提供API的价格依旧十分亲民,大家可以暂且先用着。

不过相比较而言,很多商品的价格还是偏高;等API恢复正常后,价格应该会很快降下来。

Prompt
https://api-docs.deepseek.com/prompt-library

这是deepseek旗下的一个提示词网站,上面收录了不少提示词资源,大家可以借鉴使用。
可以让它生成提示词,还可以扮演各种角色,格式化输出,代码改写,仿写功能。
使用Deepseek R1时,要清晰给出【关键词】,提供相关【上下文】,注意规避【歧义】问题;若内容涉及时效性,需开启联网功能。
设计目标
R1版本属于推理优先类型的模型,其侧重点在于对复杂推理任务的处理,专门为那些需要开展深度逻辑分析与问题解决的场景所设计。
V3版本属于通用型大语言模型,其核心特点体现在可扩展性与高效处理能力上,旨在能够灵活且高效地应用于各类自然语言处理任务。
架构与参数
R1版本采用了强化学习优化的架构设计,同时提供不同规模的蒸馏版本,其参数规模处于15亿至700亿的区间范围内。
V3版本采用混合专家(MoE)架构,模型总参数规模达6710亿,在处理每个token时会激活370亿参数。
训练方法
R1版本在训练过程中重点关注思维链(CoT, chain of thinking)推理能力的培养,其中R1-zero是纯粹通过强化学习来完成训练的,而R1则在R1-zero的基础上额外加入了监督微调(SFT, supervised fine tuning)这一阶段。
V3版本的训练采用混合精度FP8,该训练过程包含三个阶段:一是高质量训练阶段,二是扩展序列长度阶段,三是进行SFT与知识蒸馏的后训练阶段。
性能表现
R1版本在逻辑思维相关的基准测试中展现出优异表现,例如在DROP任务里F1分数取得92.2%的成绩,在AIME2025中的通过率达到79.8%。
V3版本在数学、多语言及编码类任务上展现出出色表现,例如在Cmath测评中获得90.7%的分数,在Human Eval编码任务中的通过率达到65.2%。
应用场景
R1版本适用于学术研究、问题解决类应用程序以及决策支持系统这类需要深度推理的任务,同时也适合当作教育工具,助力学生开展逻辑思维训练。
V3版本:可应用于对话式AI、多语言翻译、内容生成等大规模自然语言处理任务,能为企业提供高效的AI解决方案,以满足多领域的应用需求。
DeepSeek Chat具备多种功能,可支持自然语言处理、问答系统、智能对话、智能推荐、智能写作、智能客服等不同类型的任务。它能够对用户提出的各类问题和需求进行理解与回应,涵盖闲聊、知识查询、任务处理等场景。该系统还提供多语言支持,并且可以依据用户的语气和情绪来调整对话风格。此外,它支持文件上传功能,能够扫描并读取图片或文件中的文字内容。
DeepSeek Coder聚焦于编程领域的代码生成、调试与优化工作。其编程能力得到了明显增强,可针对编程过程中的瓶颈问题给出多种解决办法。同时,它还能支持代码优化和重构相关任务,助力提升代码的可读性与可维护性。此外,该模型的训练成本较为低廉,并且具备大规模数据处理的能力。
DeepSeek R1具备模型蒸馏能力,由此得到的1.5B、7B、8B、14B等小模型十分适配本地部署场景,对于资源相对紧张的中小企业与开发者而言尤为适用。该模型以强化学习(RL)为技术驱动,重点发力数学和代码推理领域,能够支持长链推理(CoT),可有效应对复杂逻辑类任务。
DeepSeek-R1 已正式发布,其性能与 OpenAI o1 正式版处于同一水平。
DeepSeek V3:模型参数量达671亿,其中激活参数为37亿。该模型在14.8万亿高质量token的数据集上完成预训练,性能跻身开源领域的SOTA行列,不仅超过Llama 3.1 405B,还优于GPT-4o等顶尖闭源模型,尤其在数学推理能力上表现亮眼。其训练成本仅约558万美元,较传统大模型实现大幅压缩。此外,DeepSeek V3采用完全开源模式,训练过程的各项细节均对外公开。
DeepSeek V2的参数量达到236亿,其中激活参数为21亿。该模型支持128K的上下文窗口,不仅显存消耗较低,而且每token的成本也实现了大幅下降。
性能对齐 OpenAI-o1 正式版
DeepSeek-R1在后续的训练环节中,大规模应用了强化学习技术,即便标注数据十分有限,也显著增强了模型的推理能力。在数学、代码编写、自然语言推理等各类任务里,其性能与OpenAI o1正式版不相上下。

蒸馏小模型超越 OpenAI o1-mini
我们在开源660B规模的DeepSeek-R1-Zero与DeepSeek-R1两个模型的同时,借助DeepSeek-R1的输出结果,蒸馏出6个小模型并开放给社区使用。其中,32B和70B参数的模型在多项能力维度上,已达成与OpenAI o1-mini对标的效果。

开放的许可证和用户协议
为了促进和激励开源社区与行业生态的发展,在发布并开源R1的过程中,我们也同步对协议授权方面做出了以下调整:
模型开源将统一采用MIT License。此前,我们结合大模型开源的特性,参考行业内的普遍做法,专门引入DeepSeek License为开源社区提供授权服务。不过实际应用发现,非标准化的开源License或许会额外增加开发者的理解难度。因此,本次我们的开源仓库(涵盖模型权重)将统一使用标准化且宽松的MIT License,实现完全开源,不设商用限制,开发者无需申请即可使用。
产品协议中已明确包含“模型蒸馏”相关内容。为了更有力地推动技术的开源与共享,我们决定为用户开展“模型蒸馏”提供支持。目前,我们已对线上产品的用户协议进行更新,清晰地允许用户借助模型输出,通过模型蒸馏等手段来训练其他模型。
DeepSeek App与网页端
你可以登录DeepSeek平台或者打开其App,然后开启“深度思考”模式,这样就能调用最新版本的DeepSeek-R1来完成各种推理类任务了。

可以精准把握和生成自然语言,具备语言翻译、文本摘要、情感分析、命名实体识别等多种功能。
回答各种问题,包括常识性和专业领域的问题。
理解用户语言和意图,提供个性化的对话体验。