Qwen3.7-Max علی‌بابا با ۱۵۴۱ امتیاز در Code Arena رتبه دوم جهانی برنامه‌نویسی را کسب کرد؛ فقط پشت سر Claude 3.5 و بازتعریف بهره‌وری با وظایف خودکار ۳۵ ساعته

اخبار هوش مصنوعیزمان: ۵ خرداد ۱۴۰۵مطالعه: 4 دقیقه مطالعه16 بازدید

گزارش AIbase: در ۲۶ مه، رتبه‌بندی معتبر جهانی برنامه‌نویسی Code Arena جدیدترین نتایج خود را منتشر کرد. Qwen3.7-Max علی‌بابا با امتیاز قدرتمند ۱۵۴۱، جایگاه دوم جهانی را به دست آورد و تنها مدل‌های سری Claude را پشت سر خود دید و به معیار جدیدی برای مدل‌های بزرگ داخلی تبدیل شد.

گزارش AIbase: در ۲۶ مه، رتبه‌بندی معتبر جهانی برنامه‌نویسی Code Arena جدیدترین نتایج خود را منتشر کرد. Qwen3.7-Max علی‌بابا با امتیاز قدرتمند ۱۵۴۱، جایگاه دوم جهانی را به دست آورد و تنها مدل‌های سری Claude را پشت سر خود دید و به معیار جدیدی برای مدل‌های بزرگ داخلی در زمینه برنامه‌نویسی تبدیل شد. این دستاورد از چندین مدل پیشرفته از جمله GPT-5.5 و Gemini3.5Flash پیشی گرفت و نشان‌دهنده یک پیشرفت قابل توجه برای هوش مصنوعی چین در کدنویسی عامل‌محور (Agentic Coding) و وظایف بلندمدت است.

قدرت برنامه‌نویسی در رتبه دوم جهانی، جایگاه اول داخلی تثبیت شد

بر اساس آخرین رتبه‌بندی Code Arena، Qwen3.7-Max عملکرد فوق‌العاده‌ای را در سناریوهای برنامه‌نویسی واقعی، به ویژه در تولید کد پیچیده، اشکال‌زدایی، پروژه‌های چندفایلی و گردش‌کارهای فراخوانی ابزار، از خود نشان داد و رقابت‌پذیری بالایی را به نمایش گذاشت. تحلیل AIbase نشان می‌دهد که این رتبه‌بندی نه تنها توانایی کدنویسی تک‌مرحله‌ای مدل را منعکس می‌کند، بلکه کارایی کلی آن را در فرآیندهای واقعی توسعه نرم‌افزار برجسته می‌سازد و به سطحی مناسب برای پروژه‌های در سطح تولید (production-level) رسیده است.

طراحی شده برای تولید: قابلیت‌های عامل بلندمدت ۳۵ ساعته برجسته است

بزرگترین ویژگی برجسته Qwen3.7-Max، طراحی عامل‌محور (Agent-oriented) آن است، به ویژه در اجرای وظایف خودکار بلندمدت برتری دارد:

پشتیبانی از وظایف خودکار پیوسته برای ۳۵ ساعت
تکمیل بیش از ۱۰۰۰ فراخوانی ابزار
می‌تواند پروژه‌ای را که در ابتدا به یک چرخه توسعه دو هفته‌ای نیاز داشت، تنها در چند ساعت فشرده کند

این مدل در سناریوهای واقعی مانند بهینه‌سازی پیچیده هسته و استدلال چندمرحله‌ای بلندمدت عملکرد خوبی دارد و قابلیت‌های حفظ زمینه و تصحیح خطا را در طول زمان حفظ می‌کند که بهره‌وری توسعه‌دهندگان و شرکت‌ها را به شدت بهبود می‌بخشد. AIbase اشاره کرد که این قابلیت عامل بلندمدت یک شاخص کلیدی برای گذار مدل‌های بزرگ از «دستیار» به «همکار» است.

سازگاری قوی بین‌فریمورکی، مزایای قابل توجه هزینه-عملکرد

Qwen3.7-Max از فریمورک‌های عامل مختلفی پشتیبانی می‌کند، از جمله سازگاری با پروتکل Anthropic، که امکان ادغام بی‌درز با ابزارهای موجود مانند Claude Code را فراهم می‌آورد. در عین حال، این مدل مزایای آشکاری در کنترل هزینه نیز دارد و انتخابی متعادل از عملکرد بالا و مقرون‌به‌صرفه بودن را به توسعه‌دهندگان ارائه می‌دهد.

AIbase معتقد است که با انتشار Qwen3.7-Max، آستانه ابزارهای برنامه‌نویسی هوش مصنوعی بیشتر کاهش یافته است. چه برای نمونه‌سازی اولیه فرانت‌اند، مهندسی پیچیده بک‌اند، یا فرآیندهای خودکارسازی فول‌استک، دوران کمک کارآمدتر هوش مصنوعی فرا خواهد رسید. این نه تنها به نفع توسعه‌دهندگان داخلی است، بلکه پویایی جدیدی را به کاربرد جهانی هوش مصنوعی تزریق می‌کند.

در آینده، AIbase...