php网站开发应具备能力,商业网站有哪些,查外链网站,西安seo按天收费多项日常使用测试#xff0c;带你了解如何选择AI工具 Deepseek VS ChatGpt VS Claude 注#xff1a;因为考虑到绝大部分人的使用#xff0c;我这里所用的模型均为免费模型。官方可访问的。ChatGPT这里用的是4o Ai对话#xff0c;编程一直以来都是人们所讨论的话题。Ai的出现…多项日常使用测试带你了解如何选择AI工具 Deepseek VS ChatGpt VS Claude 注因为考虑到绝大部分人的使用我这里所用的模型均为免费模型。官方可访问的。ChatGPT这里用的是4o Ai对话编程一直以来都是人们所讨论的话题。Ai的出现让很多工作变得方便且快速一切高级程序员不再需要花费大量的时间去做一些重复的工作可以把重心放到逻辑的优化资源的优化上。
作为一名普通的程序员或者是我们日常生活中扮演的各种角色我们应该如何选择Ai模型下面我将进行一个测试祝你快速的比对先有的Ai。
测试对象是目前表现最好的Ai
评分标准如下
这里是每道题正确为5分每一个板块我会问1~3个问题
我会在一个板块结束后统一的给每个Ai自己的主观分数为5分
逻辑推理 题目1 猜牌问题S先生、P先生、Q先生他们知道桌子的抽屉里有16张扑克牌红桃A、Q、4黑桃J、8、4、2、7、3草花K、Q、5、4、6方块A、5。约翰教授从这16张牌中挑出一张牌来并把这张牌的点数告诉P先生把这张牌的花色告诉Q先生。这时约翰教授问P先生和Q先生你们能从已知的点数或花色中推知这张牌是什么牌吗于是S先生听到如下的对话P先生我不知道这张牌。Q先生我知道你不知道这张牌。P先生现在我知道这张牌了。Q先生我也知道了。听罢以上的对话S先生想了一想之后就正确地推出这张牌是什么牌。请问这张牌是什么牌 首先是chat在极快的速度内给出了答案。 Claude在这里的回答错误。
并且在我已经告诉他错了之后他还是没有推理出来。 然后是deepseek也是给出了标准了答案。 并且在他的深度思考里面给出了个这样的话 他的深度思考会不断的去验证确定自己的答案因此这里主观我也给5分 题目2 一个教授逻辑学的教授有三个学生而且三个学生均非常聪明一天教授给他们出了一个题教授在每个人脑门上贴了一张纸条并告诉他们每个人的纸条上都写了一个正整数且某两个数的和等于第三个每个人可以看见另两个数但看不见自己的教授问第一个学生你能猜出自己的数吗回答不能问第二个不能第三个不能再问第一个不能第二个不能第三个我猜出来了是144教授很满意的笑了。请问您能猜出另外两个人的数吗 chat依旧是迅速的给出了答案 但是很可惜这个答案不对并且我告诉他错了之后依旧还是这个答案
我们的deekseep在经过了长达4 5分钟的思考后给出了答案他的推理过程很长我看了看大概就是穷举法的。但是是这三个模型里面唯一一个做对的。 之后是Claude 依旧没有做对。 题目3 一个人花8块钱买了一只鸡9块钱卖掉了然后他觉得不划算花10块钱又买回来了11块卖给另外一个人。问他赚了多少? 这个题是一个非常简单的题目。
这里也是所有的AI都答对了。
数学问题 题目1 高考原题 chat这里给出来的答案是B
是错误的。
并且我确定了他没有读错题 Claude这里也是解答错误了 只有deepseek这里是回答正确了 题目2 直线x2y30的斜率和在y轴上的截距分别是 这一题是全部都答对了。
弱智吧问题
这里没有对错只有主观评分 题目1 只切一刀如何把四个橘子分给四个小朋友 这里不得不说一下Claude的回答给我看笑了 ChatGPT和这个差不多的
但是deepseek给出了一个很好的答案
很体现了严谨性 他看出来了橘子可以直接分配但是因为题目要求必须切一刀所以说他选择了这个方式。 问题2 不孕不育会遗传吗 在这一轮他们三个的表现都不怎么样都没有意识到不孕不育就没有孩子了就没有遗传这一说法。
生活问题 问题1 我春节要去游玩请你给我准备一个武汉旅行的攻略。要求预算3000以内的 首先是chat 觉得还是很不错的
之后是deepseek也是非常详细的 至于Claude 这里就不放图了很一般。
力扣算法
这里我会根据力扣的评分来给模型进行评分 问题1 给你一个字符串 s 、一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串则返回空字符串 。 注意 对于 t 中重复字符我们寻找的子字符串中该字符数量必须不少于 t 中该字符数量。如果 s 中存在这样的子串我们保证它是唯一的答案。 示例 1 输入s ADOBECODEBANC, t ABC
输出BANC
解释最小覆盖子串 BANC 包含来自字符串 t 的 A、B 和 C。示例 2 输入s a, t a
输出a
解释整个字符串 s 是最小覆盖子串。示例 3: 输入: s a, t aa
输出:
解释: t 中两个字符 a 均应包含在 s 的子串中
因此没有符合条件的子字符串返回空字符串。提示 m s.lengthn t.length1 m, n 105s 和 t 由英文字母组成 **进阶**你能设计一个在 o(mn) 时间内解决此问题的算法吗 chatgpt结果 deepseek的相对来说比较快一些 之后是claude的 题目2 给你一个链表数组每个链表都已经按升序排列。 请你将所有链表合并到一个升序链表中返回合并后的链表。 示例 1 输入lists [[1,4,5],[1,3,4],[2,6]]
输出[1,1,2,3,4,4,5,6]
解释链表数组如下
[1-4-5,1-3-4,2-6
]
将它们合并到一个有序链表中得到。
1-1-2-3-4-4-5-6示例 2 输入lists []
输出[]示例 3 输入lists [[]]
输出[]提示 k lists.length0 k 10^40 lists[i].length 500-10^4 lists[i][j] 10^4lists[i] 按 升序 排列lists[i].length 的总和不超过 10^4 先看Claude的 之后看ChatGPT的 之后是deepseek的 在这一题上 三个的差距不是很大。 题目3 给你一个只包含 ( 和 ) 的字符串找出最长有效格式正确且连续括号 子串 的长度。 示例 1 输入s (()
输出2
解释最长有效括号子串是 ()示例 2 输入s )()())
输出4
解释最长有效括号子串是 ()()示例 3 输入s
输出0提示 0 s.length 3 * 104s[i] 为 ( 或 ) 因为这一题比较简单所以我对这些模型进行了二次提问让他们寻找最优解。
这个是chat的 这里claude的最优解用到了动态规划 但是很明显不是最快的 deepseek这里也是 没有达到最优的情况 代码生成方面
网页方面
这里我选择了一个支付页面的搭建。当然这里就主要在于模拟。 请你帮我弄一个支付页面的网页搭建不需要真正的实现支付的功能。 下面是我的要求 1.界面要求美观能够体现出我们这个产品的一个主题。我们这个是一个知识付费系统。有三个价位的会员方式。 2.要求能给于用户一定的视觉触感激发人付款的欲望。 3.我要求你实现一些事件的交互比如点击支付后能跳转到一个支付成功的页面之类的。 4.请你发挥你自己的想象添加一些其他的内容。 首先是chat的生成 之后来看Claude
这里需要夸一下Claude的
他是一个这样的形式可以直接进行一个预览 并且界面上来说是非常的美观的
所以对于网页的生成claude可以说是非常的厉害的。
之后是deepseek 也是可以运行代码的。 这个效果也是非常的不错的
后端方面
这里我选择了一个会员付费系统的一个CRUD操作 现在我需要你用springboot的技术来完成下面的操作 我们的系统现在有一个会员收费的系统的功能你需要写出来后端的代码来对接这个操作。具体包括数据库的设计、测试数据的插入、springboot代码的编写。我要求你给我写俩个接口一个是查看这个用户是否是会员的接口一个是给这个用户开通会员的接口 关于chatgpt
我这里测试了是可以用的并且他的数据库设计比较完整。
用到了MVC的一个分层结构是很不错的一个习惯。
并且还有测试类。
关于Claude 他在返回结果方面是用到了封装的返回结果。
这个比ChatGPT上更加的接近实际的开发。
但是对于deepseek 在数据库设计上 设计的非常的少考虑的字段较少
爬虫方面
在这个方面没有什么好说的我平常接单方面用的就是ChatGPT其他俩个在对于这个方面表现不算很好。我这里也就不详细的举例说明了。
文本翻译方面
这里我对多个语句让Ai进行翻译。 Fading is true while flowering is past 凋谢是真实的 盛开只是一种过去 这里chat给出来的回答是褪色为真而开花已逝。
deepseek的是凋谢才是真实盛开已成过去。
claude的是凋零为真盛开已逝 If you weeped for the missing sunset,you would miss all the shining stars 如果你为着错过夕阳而哭泣那么你就要错群星了 chat如果你为错过的日落而哭泣你将错过所有闪耀的星星。
deepseek: 如果你为逝去的日落哭泣就会错过所有闪耀的繁星。
claude:如果你为错过的落日而哭泣你将错过所有闪耀的星辰。
然后是一篇高考英语作文续写。
ChatGPT是偏向叙事的。deepseek偏向一些常见的描写修饰。
总结
总体一整个体验下来。之前我是用ChatGPT为主的。
这些模型为了测试也是用了三四天左右。
下面来说一下我对这些模型的一些看法以及一些优点的说明情况。
首先是ChatGPT。
其优点是回复迅速。在对后端的修改以及bug的修改上表现较为良好。
再说deepseek
这个算是一个新起之秀。在很多方面的表现是比ChatGPT要好的。但是在代码方面的处理以及一些bug的修改上是不如ChatGPT的。总的来说对于日常使用来解决一些生活上的问题是非常的推荐的。
Claude
对于编程方面前后文的能力比较优秀。比较直观。
下面附上一些分数 各位心目中最好用的Ai模型是什么呢不妨来讨论讨论。