刚刚,Cursor AI宣布已集成Claude 3.7 Sonnet,并更新了用户界面,使其更加简洁易用。此外,Cursor还引入了跨聊天对话功能,能够自动总结聊天摘要并继承到新开的聊天窗口中,进一步提升了用户体验。
早些时候,Anthropic公司正式发布其最新推理模型——Claude3.7Sonnet。这款模型以其创新的设计理念和显著提升的编程能力,迅速成为行业焦点。Claude3.7Sonnet的核心创新在于其将快速回答与深度思考能力融合于一体,模拟人类大脑的思维方式,为用户提供更流畅的交互体验。
在实际应用中,用户可以选择标准模式,快速获取答案,或切换至扩展思考模式,让模型在回答前进行自我反思。这种模式特别适用于数学、物理和编程等复杂任务,能够提供更准确和深入的解答。通过API,用户还可以精确控制模型的思考预算,最高可达128K token,从而在速度、成本和答案质量之间找到最佳平衡点。与传统模型不同,Claude3.7Sonnet更注重实际商业应用,而非单纯竞赛表现。
在编程领域,Claude3.7Sonnet的表现尤为突出。在一项编程测试中,Sonnet以70.3%的高分领先于其他知名模型,如OpenAI的o1、o3-mini和DeepSeek R1,后者的得分仅在49%左右。这一结果表明,Anthropic有意将Sonnet定位为一款强大的编码AI,专注于提升编程能力,以满足开发者在复杂代码库处理和全栈更新方面的需求。
Claude3.7Sonnet现已全面上线,支持免费版、专业版、团队版和企业版,并可在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。不过,免费用户目前无法使用扩展思考模式。在定价方面,Sonnet3.7与前代模型保持一致:每百万输入token收费3美元,每百万输出token收费15美元,包括思考token。
除了在编程能力上的提升,Claude3.7Sonnet在其他领域也展现了卓越的性能。例如,在TAU-bench测试中,Sonnet在零售场景中达到了81.2%的准确率,在航空场景中达到了58.4%,全面领先其他模型。此外,Sonnet还在指令理解、推理能力、多模态处理和代码编写等方面表现出色,尤其是在开启扩展思考模式后,在数学和科学问题上的表现更是突飞猛进。
本文来源于#站长之家,由@tom 整理发布。如若内容造成侵权/违法违规/事实不符,请联系本站客服处理!
该文章观点仅代表作者本人,不代表本站立场。本站不承担相关法律责任。
如若转载,请注明出处:https://www.zhanid.com/news/3317.html