Web编程云测试排名:DeepSeek

- 编辑:admin -

Web编程云测试排名:DeepSeek

克劳德(Claude),不稳定节目的国王? ?大型模型竞技场的最新战斗报告已发布,新版本的Depeeek R1在Web编程中排名第一,击败Claude Opus 4。必须知道Claudeopus4被认为是“世界上最强的编码模型”。那么我可以通过编程击败Claude Opus 4吗? DeepSeek-R1-0528的起源是什么?他可能认为这是他查看名称时版本的一个小更新,但实际上,这与LiveCodeBench中的OpenAi O3 -Alcio大致相当,甚至许多互联网用户都推测他是传奇的R2。从这个角度来看,在编程方面似乎并不容易混淆。不用说,让我们看一下康康的DepSeek-R1-0528。让我们尝试一下。 DeepSeek-R1-0528是在DeepSeek官方网站,应用程序和迷你计划(Deta Thoughtlado)上启动的。在这里,您将直接访问官方网站进行体验。测试1:为太阳系创建动画应用程序。快速单词是:为太阳能系统创建动画应用程序,并使用网络搜索。经过49秒的思考,DepSeek-R1-0528给出了Python代码。在代码VS中执行它之后,结果如下:显示可以独立执行的动画,但页面相对粗糙。但是,更改其他快速单词显然有所不同。将太阳能系统模拟三分。在短短34秒内,DePseek-R1-0528阐明了该设计的想法。关键是,这次您只需单击即可直接进行操作,而您无需单独打开自己的编辑器。 (执行功能感觉就像打开一个盲盒,不一定可见)。还有动画和互动。效果是:EVEL〜测试2:它将直接发送到前端网页的创建。接下来,要求DeepSeek生成一个具有AGI主题的网站。这是一些快速的词S:设计一个以人工智能(AGI)为主题的网站。这包括三个概念上的部分:“共享知识”,“社区”和“未来创造”。每个部分必须配备相应的图标和简短描述。一般风格是现代的,并且在技术上充满着重点,重点是Agi的创新和协作精神。使用HTML,CSS和JavaScript实施交互和视觉效果。在考虑23秒后,DePseek-R1-0528给出了一个只需单击即可执行的HTML代码。测试3:创建具有美丽图形和控件的俄罗斯方块功能齐全的版本。创建具有美丽图形和控件的俄罗斯方块的完整版本。您可以看到DepSeek -R1-0528在考虑12秒后,给出了Python代码。执行的结果如下:这无疑是一个俄罗斯方块的迷你游戏,但是基本演示中存在明显的错误,而交互式按钮丢失了。我试图继续提高在Depseek中吹了,但我第二次失败了。改进的游戏仍然无法正常工作(始终通过墙壁),也没有实现明确需要的交互式特征。在简单的先前测试中,总结为开源模型,DeepSeek R1的新版本实际上在编程功能方面取得了巨大进步,但仍然有一个改进的余地。但是,老实说,对于我国的普通用户来说,这显然更友好(与Claude模型相比,它是免费的,更易于)。除了更新编程功能列表外,DePeeek的新版本还被选为最佳开源文本模型。根据麻省理工学院的许可,它占据了列表中的第六个Lugar,而开源之间则是第一个。在细分领域,它在难度和数学上排名第五,在S.模型中占据了第四位,开放了一个非常有能力的球员新的Kimi模型刚刚赢得了SOTA代码的开源。这是Kimi-Dev,这是一种只有72B参数的开源代码模型,在SWE银行验证中获得了60.4%的开源Cale。编程级别不仅比上一个DeepSeek-R1更强大,而且性能比封闭的代码模型更好。那么,如果您不知道它到底是什么,会发生什么?