黄浦西安网站建设,给网站做接口,wordpress id 缩略图,3000部末年禁止无需下载文章目录 前言一、DeepSeek是什么1. 简介2. 产品版本3. 特征4. 地址链接5. 三种访问方式1. 网页端和APP2. DeepSeek API 二、DeepSeek可以做什么1. 应用场景2. 文本生成1. 文本创作2. 摘要与改写3. 结构化生成 3. 自然语言理解与分析1. 语义分析2. 文本分类3. 知识推理 4. 编程… 文章目录 前言一、DeepSeek是什么1. 简介2. 产品版本3. 特征4. 地址链接5. 三种访问方式1. 网页端和APP2. DeepSeek API 二、DeepSeek可以做什么1. 应用场景2. 文本生成1. 文本创作2. 摘要与改写3. 结构化生成 3. 自然语言理解与分析1. 语义分析2. 文本分类3. 知识推理 4. 编程与代码相关1. 代码生成2. 代码调试3. 技术文档处理 5. 常规绘图1. SVG矢量图2. Mermaid图表3. React图表 三、DeepSeek从入门到精通1. 推理模型2. 快思慢想3. 提示语策略差异4. 关键原则5. 从“下达指令”到“表达需求”6. 任务需求与提示语策略7. 如何向AI表达需求8. 什么是提示语9. 提示语类型10. 提示语示例11. 掌握提示语设计AIGC时代的必备技能12. 提示语的DNA解构强大提示语的基本元素13. 调教AI的秘籍让你的提示语效果倍增的关键策略 四、DeepSeek 赋能职场应用1. 三种模式2. 两种模式对比3. 如何提问两种模型的提示语差异4. 如何使用 DeepSeek 制作可视化图表5. 如何使用 DeepSeek 制作PPT6. 如何使用 DeepSeek 设计海报7. 如何使用 DeepSeek 生成视频8. 如何使用 DeepSeek 批量生成新媒体文案9. 如何使用 DeepSeek 开发AI应用10. 如何使用 DeepSeek 进行市场调查11. 如何使用 DeepSeek 实现人机高效协作 前言
DeepSeek
DeepSeek是一家专注通用人工智能AGI的中国科技公司主攻大模型研发与应用。 一、DeepSeek是什么
1. 简介 DeepSeek 是国内一款开源的大模型主打通用 AI 能力类似于 OpenAI 的 GPT 系列目标是打造国产的、强大的、开放的大语言模型。
DeepSeek 在今年春节期间迅速爆红并凭借强劲的性能获得了大量开发者的关注它最大的特点是开源、使用成本低并且性能不输 ChatGPT。 ai.com 这个域名之前跳转的是 ChatGPT现在跳到 DeepSeek可知 DeepSeek 的火爆程度。 2. 产品版本
DeepSeek 主要有以下几个大模型
DeepSeek R1最新最强大DeepSeek V3DeepSeek Coder V2DeepSeek VLDeepSeek V2DeepSeek CoderDeepSeek MathDeepSeek LLM
以 DeepSeek-R1 为例满血版本为671B性能最强也就是官网部署的版本。 还有几个蒸馏版本 模型规格后面的数字代表模型的参数量而 b 则是指 “billion” 的意思也就是十亿表示这个模型有多少亿个参数 1.5b 有 15 亿个参数671b 是 6710 亿个参数。 参数量直接决定了一个模型的计算能力和硬件需求一般来说 参数越大 代表模型越聪明对复杂问题的处理能力越强但对算力和硬件的要求也越高。参数越小 代表模型越轻量化对算力和硬件的要求越低适合资源受限的设备。 所以一个模型的参数量越大它能处理和生成的内容质量越复杂、越高也更能满足我们的要求不过也需要更多的硬件资源来支撑。 DeepSeek-R1 系列模型的规格划分主要是为了适应不同场景的需求从小到大覆盖了轻量化应用到高算力推理的各种场景。在实际应用中我们需要根据算力、成本、业务需求等综合因素来选择合适的模型。适合自己的才是最好的
参数规模与模型能力
参数规模B Billion/十亿代表模型的复杂度和学习能力参数越多通常理解和生成能力越强。
1.5B - 14B轻量级模型适合基础任务文本生成、简单问答。32B - 70B中等规模平衡性能与资源消耗适合复杂任务逻辑推理、代码生成。
本地部署后跑的就是本地算力了叠加知识库可以实现内部的资料对话式查询资料不上网更加安全可靠。不同模型需要的硬件配置以下可供参考 1.5BCPU最低4核内存8GB硬盘3GB存储空间显卡非必需若GPU加速可选4GB显存适合低资源设备部署等场景。 7BCPU 8核以上内存16GB硬盘8GB显卡8GB显存可用于本地开发测试等场景。 8B硬件需求与7B相近略高适合需更高精度的轻量级任务。 14BCPU 12核以上内存32GB硬盘15GB显卡16GB显存可用于企业级复杂任务等场景。 32BCPU 16核以上内存64GB硬盘30GB显卡24GB显存适合高精度专业领域任务等场景。 70BCPU 32核以上内存128GB硬盘70GB显卡需多卡并行适合科研机构等进行高复杂度生成任务等场景。
3. 特征
DeepSeek 之所以能迅速崛起主要是因为它在技术上有一些独特的优势。
DeepSeek 采用了 Mixture of ExpertsMoE混合专家模型这一架构让它可以在计算资源相对有限的情况下仍然保持高性能实现了它对 OpenAI 的弯道超车。
MoE 的核心思想是 不是所有参数都在每次推理时被激活而是只有一部分专家Experts在工作这样可以减少计算成本同时 提高模型的推理效率。 相比于 OpenAI 的 GPT-4DeepSeek 的 MoE 版本可以用更少的计算量获得接近 GPT-4 级别的性能。与OpenAI-o1的性能对比 DeepSeek 是国产大模型那么它和 GPT-4 的差距在哪里
对比项DeepSeekGPT-4是否开源✅ 开源❌ 闭源中文优化✅ 很强✅ 强代码能力✅ 强✅ 更强推理速度✅ 轻量级 MoE 优势❌ 需要更大计算资源本地部署✅ 可以❌ 不能使用限制✅ 自由可商用❌ 需要 API 访问
DeepSeek 的最大优势是 开源 和 中文优化好比 GPT-4 更适合 本地部署 和 企业使用所以它特别适合 中文 AI 应用、代码辅助开发 等场景。
4. 地址链接
DeepSeek 官网 https://www.deepseek.com/ DeepSeek 可视化聊天 https://chat.deepseek.com/ DeepSeek 开放平台 https://platform.deepseek.com/ DeepSeek 接口文档 https://api-docs.deepseek.com/zh-cn/ DeepSeek 可视化聊天是免费的接入 API 是付费的不过相比 OpenAI 要便宜太多了这也是它的优势。
5. 三种访问方式
DeepSeek的R1和V3模型现已在网页端、APP以及API上全面推出为用户提供多样化的访问途径。这三种访问方式各具特色适用于不同的使用场景。
DeepSeek的网页端是一个用户友好的在线平台用户只需通过浏览器即可轻松访问。该平台设计直观即使是非技术背景的用户也能迅速上手享受DeepSeek带来的便捷服务。
专为移动设备打造的DeepSeek APP则让用户体验更加便捷和个性化。用户可以在智能手机或平板电脑上安装并使用该APP随时随地访问DeepSeek平台享受与网页端相似但更加贴合移动场景的功能和服务。
同时DeepSeek还为开发者提供了强大的API工具。通过API开发者可以轻松地将DeepSeek平台的功能集成到自己的应用程序或系统中实现与平台的无缝对接。利用DeepSeek提供的各种算法和模型开发者可以高效地处理数据、生成对话或实现其他创新功能。
DeepSeek的API也是大语言模型LLM的三板斧 CoT思维链、Prompt Engineering提示工程、Function Calling函数调用。
1. 网页端和APP
开启DeepSeek网页端对话只需访问官网并点击“开始对话”按钮登录后即可与AI进行即时交流。
访问网址 2. 开启DeepSeek APP的访问只需在智能手机或平板电脑上下载安装后打开应用并登录即可。 3. 深度思考R1和联网搜索是什么
DeepSeek的深度思考R1和联网搜索是其两大核心功能这两大功能相辅相成共同构筑了其强大的功能框架。
R1模型在逻辑推理与复杂问题解答方面展现出卓越能力而联网搜索功能则能即时捕获互联网上的最新资讯。 深度推理R1R1模型擅长逻辑推理和复杂问题解答能够处理需要深度思考的任务。 联网搜索允许DeepSeek实时访问互联网上的信息从而为用户提供最新、最准确的内容。
2. DeepSeek API
DeepSeek的API是什么
DeepSeek的API是DeepSeek平台为开发者提供的一种工具它允许开发者将DeepSeek平台的功能集成到自己的应用程序或系统中。
DeepSeek API 使用与 OpenAI 兼容的 API 格式通过修改配置可以使用 OpenAI SDK 来访问 DeepSeek API或使用与 OpenAI API 兼容的软件。
api_key: DeepSeek API Key
base_url: https://api.deepseek.com。2. DeepSeek的API能力有哪些
DeepSeek API支持调用其平台上的多种模型如深度思考R1和智能对话V3等并具备多轮对话能力和对话生成与理解功能为开发者提供强大的智能对话与交互体验。
推理模型deepseek-reasoner
在输出最终回答之前模型会先输出一段思维链内容以提升最终答案的准确性。DeepSeek的 API 向用户开放 deepseek-reasoner 思维链的内容以供用户查看、展示、蒸馏使用。 在每一轮对话过程中模型会输出思维链内容reasoning_content和最终回答content。在下一轮对话中之前轮输出的思维链内容不会被拼接到上下文中如下图所示 多轮对话Multi-round Conversation
DeepSeek多轮对话API 是一个“无状态” API即服务端不记录用户请求的上下文用户在每次请求时需将之前所有对话历史拼接好后传递给对话 API。多轮对话的本质就是提示工程Prompt Engineering。 Function Calling
Function Calling 让模型能够调用外部工具来增强自身能力。DeepSeek当前版本模型 Function Calling 功能效果不稳定会出现循环调用、空回复的情况。DeepSeek正在积极修复中预计将在下一个版本中得到修复。 二、DeepSeek可以做什么
1. 应用场景 直接面向用户或者支持开发者提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景支持联网搜索与深度思考模式同时支持文件上传能够扫描读取各类文件及图片中的文字内容。 2. 文本生成
1. 文本创作
文章/故事/诗歌写作营销文案、广告语生成社交媒体内容如推文、帖子剧本或对话设计
2. 摘要与改写
长文本摘要论文、报告文本简化降低复杂度多语言翻译与本地化
3. 结构化生成
表格、列表生成如日程安排、菜谱代码注释、文档撰写
3. 自然语言理解与分析
1. 语义分析
语义解析情感分析评论、反馈意图识别客服对话、用户查询实体提取人名、地点、事件
2. 文本分类
文本分类主题标签生成如新闻分类垃圾内容检测
3. 知识推理
知识推理逻辑问题解答数学、常识推 理因果分析事件关联性
4. 编程与代码相关
1. 代码生成
根据需求生成代码片段Python、JavaScript自动补全与注释生成
2. 代码调试
错误分析与修复建议代码性能优化提示
3. 技术文档处理
API文档生成代码库解释与示例生成
5. 常规绘图
1. SVG矢量图
基础图形图标简单插图流程图组织架构图
2. Mermaid图表
流程图时序图类图状态图实体关系图思维导图
3. React图表
折线图柱状图饼图散点图雷达图组合图表
三、DeepSeek从入门到精通
当人人都会用AI时你如何用得更好更出彩
1. 推理模型
推理大模型 推理大模型是指能够在传统的大语言模型基础上强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术比如强化学习、神经符号推理、元学习等来增强其推理和问题解决能力。 例如DeepSeek-R1GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 非推理大模型 适用于大多数任务非推理大模型一般侧重于语言生成、上下文理解和自然语言处理而不强 调深度推理能力。此类模型通常通过对大量文本数据的训练掌握语言规律并能够生成合适的内容但缺乏像 推理模型那样复杂的推理和决策能力。 例如GPT-3、GPT-4OpenAIBERTGoogle主要用于语言生成、语言理解、文本分类、翻译 等任务。 维度推理模型通用模型优势领域数学推导、逻辑分析、代码生成、复杂问题拆解文本生成、创意写作、多轮对话、开放性问答劣势领域发散性任务如诗歌创作需要严格逻辑链的任务如数学证明性能本质专精于逻辑密度高的任务擅长多样性高的任务强弱判断并非全面更强仅在其训练目标领域显著优于通用模型通用场景更灵活但专项任务需依赖提示语补偿能力
2. 快思慢想
效能兼顾全局视野
维度概率预测快速反应模型如ChatGPT 4o链式推理(慢速思考模型如OpenAI o1)性能表现响应速度快算力成本低慢速思考算力成本高运算原理基于概率预测通过大量数据训练来快速预测可能 的答案基于链式思维Chain-of-Thought逐步推理 问题的每个步骤来得到答案决策能力依赖预设算法和规则进行决策能够自主分析情况实时做出决策创造力限于模式识别和优化缺乏真正的创新能力能够生成新的创意和解决方案具备创新能力人机互动能力按照预设脚本响应较难理解人类情感和意图更自然地与人互动理解复杂情感和意图问题解决能力擅长解决结构化和定义明确的问题能够处理多维度和非结构化问题提供创造性的解 决方案伦理问题作为受控工具几乎没有伦理问题引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类“概率预测快速反应”模型和“链式推理慢速思考”模型。 前者适合快速反馈处理即时任务后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合适的模型实现最佳效果 3. 提示语策略差异
推理模型
提示语更简洁只需明确任务目标和 需求因其已内化推理逻辑。无需逐步指导模型自动生成结构化 推理过程若强行拆解步骤反而可能限制其能力。
通用模型
需显式引导推理步骤如通过CoT提 示否则可能跳过关键逻辑。依赖提示语补偿能力短板如要求分 步思考、提供示例。
4. 关键原则
模型选择
优先根据任务类型而非模型热度选择如数学任务选推理模型创意任务选通用模型。
提示语设计
推理模型简洁指令聚焦目标信任其内化能力。“要什么直接说”。通用模型结构化、补偿性引导“缺什么补什么”。
避免误区
不要对推理模型使用“启发式”提示如角色扮演可能干扰其逻辑主线。不要对通用模型“过度信任”如直接询问复杂推理问题需分步验证结果。
5. 从“下达指令”到“表达需求”
策略类型定义与目标适用场景示例推理模型适用优势与风险指令驱动直接给出明确步骤或 格式要求简单任务、需快速执行“用Python编写快速排序函 数输出需包含注释。”结果精准高效 ❌ 限制模型自主优化空间需求导向描述问题背景与目标 由模型规划解决路径复杂问题、需模型自主 推理“我需要优化用户登录流程 请分析当前瓶颈并提出3种方 案。”激发模型深层推理 ❌ 需清晰定义需求边界混合模式结合需求描述与关键 约束条件平衡灵活性与可控性“设计一个杭州三日游计划 要求包含西湖和灵隐寺且 预算控制在2000元内。”兼顾目标与细节 ❌ 需避免过度约束启发式提问通过提问引导模型主 动思考如“为什 么”“如何”探索性问题、需模型解 释逻辑“为什么选择梯度下降法解 决此优化问题请对比其他 算法。”触发模型自解释能力 ❌ 可能偏离核心目标
6. 任务需求与提示语策略
任务类型适用模型提示语侧重点示例有效提示需避免的提示策略数学证明推理模型直接提问无需分步引导“证明勾股定理”冗余拆解如“先画图再列公式”数学证明通用模型显式要求分步思考提供示例“请分三步推导勾股定理参考1.画直角三角形…”直接提问易跳过关键步骤创意写作推理模型鼓励发散性设定角色/风格“以海明威的风格写一个冒险故事”过度约束逻辑如“按时间顺序列出”创意写作通用模型需明确约束目标避免自由发挥“写一个包含‘量子’和‘沙漠’ 的短篇小说不超过200字”开放式指令如“自由创作”代码生成推理模型简洁需求信任模型逻辑“用Python实现快速排序”分步指导如“先写递归函数”代码生成通用模型细化步骤明确输入输出格式“先解释快速排序原理再写出代 码并测试示例”模糊需求如“写个排序代码”多轮对话通用模型自然交互无需结构化指令“你觉得人工智能的未来会怎样”强制逻辑链条如“分三点回答”多轮对话推理模型需明确对话目标避免开放发散“从技术、伦理、经济三方面分析 AI的未来”情感化提问如“你害怕AI吗”逻辑分析推理模型直接抛出复杂问题“分析‘电车难题’中的功利主义 与道德主义冲突”添加主观引导如“你认为哪种对”逻辑分析通用模型需拆分问题逐步追问“先解释电车难题的定义再对比 两种伦理观的差异”一次性提问复杂逻辑
7. 如何向AI表达需求
需求类型特点需求表达公式推理模型适配策略通用模型适配策略1.决策需求需权衡选项、评估风险、 选择最优解目标 选项 评估标准要求逻辑推演和量化分析直接建议依赖模型经验归纳2.分析需求需深度理解数据/信息、 发现模式或因果关系问题 数据/信息 分析 方法触发因果链推导与假设验 证表层总结或分类3.创造性需求需生成新颖内容文本/ 设计/方案主题 风格/约束 创新 方向结合逻辑框架生成结构化 创意自由发散依赖示例引导4.验证需求需检查逻辑自洽性、数 据可靠性或方案可行性结论/方案 验证方法 风险点自主设计验证路径并排查 矛盾简单确认缺乏深度推演5.执行需求需完成具体操作代码/ 计算/流程任务 步骤约束 输出格式自主优化步骤兼顾效率 与正确性严格按指令执行无自主优化
8. 什么是提示语 提示语Prompt是用户输入给AI系统的指令或信息用于引导AI生成特定的输出或执行特定的任务。简单来说提示语就是我们与AI“对话”时所使用的语言它可以是一个简单的问题一段详细的指令也可以是一个复杂的任务描述。
提示语的基本结构包括指令、上下文和期望
指令Instruction)这是提示语的核心明确告诉AI你希望 它执行什么任务。上下文Context)为AI提供背景信息帮助它更准确地理 解和执行任务。期望Expectation)明确或隐含地表达你对AI输出的要求 和预期。
9. 提示语类型
指令型提示语直接告诉AI需要执行的任务。问答型提示语向AI提出问题期望得到相应的 答案。角色扮演型提示语要求AI扮演特定角色模拟 特定场景。创意型提示语引导AI进行创意写作或内容生成。分析型提示语要求AI对给定信息进行分析和推 理。多模态提示语结合文本、图像等多种形式的 输入。
10. 提示语示例
11. 掌握提示语设计AIGC时代的必备技能
12. 提示语的DNA解构强大提示语的基本元素
13. 调教AI的秘籍让你的提示语效果倍增的关键策略
四、DeepSeek 赋能职场应用
从提示语技巧到多场景应用
1. 三种模式 基础模型V3通用模型2024.12高效便捷适用于绝大多数任务“规范性”任务 深度思考R1推理模型复杂推理和深度分析任务如数理逻辑推理和编程代码“开放性”任务 联网搜索RAG检索增强生成知识库更新至2024年7月
2. 两种模式对比
3. 如何提问两种模型的提示语差异
基础模型V3“过程-结果”清晰指令深度思考R1目标清晰结果可以模糊推理 RTGO提示语结构 CO-STAR提示语框架 DeepSeek R1提示语技巧开放性
4. 如何使用 DeepSeek 制作可视化图表
5. 如何使用 DeepSeek 制作PPT
6. 如何使用 DeepSeek 设计海报
7. 如何使用 DeepSeek 生成视频
8. 如何使用 DeepSeek 批量生成新媒体文案
9. 如何使用 DeepSeek 开发AI应用
10. 如何使用 DeepSeek 进行市场调查
11. 如何使用 DeepSeek 实现人机高效协作
基本操作技巧提示词、追问逻辑、插件使用
人机协作意识优势不足、取长补短、选择性采纳
能动意识千人千面、洞察能力、思维深度
边界意识学术伦理、新闻伦理、伦理规范 本文的引用仅限自我学习如有侵权请联系作者删除。 参考知识 DeepSeek 是什么扫盲贴 清华大学第一弹DeepSeek从入门到精通 一文搞懂DeepSeek - DeepSeek的三种访问方式