شرکت Anthropic، یکی از شرکتهای پیشرو در صنعت مدلهای بزرگ ایالات متحده، امروز در نیمهشب مدل بزرگ Claude Opus 4.8 را رسماً منتشر کرد. با این حال، در حالی که این مدل به نتایج برجستهای در چندین رتبهبندی دست یافته است، بسیاری از کاربران و توسعهدهندگان گزارش کردهاند که دارای مشکلات «سردرگمی شناختی» است.
یک کاربر اینترنتی از طریق آزمایش API دریافت که وقتی از مدل در مورد هویتش سوال میشود، به اشتباه ادعا میکند که «Qwen» یا «DeepSeek» از علیبابا است؛ دو مدل بزرگ متنباز اصلی در چین.
آزمایش API باعث ناهنجاری شناختی میشود
در مورد این پدیده، برخی از کاربرانی که در رابط وب آزمایش میکردند، گفتند که نمیتوانند آن را بازتولید کنند و معتقد بودند که مدل، مدلهای بزرگ چینی را تقطیر نکرده است. با این حال، توسعهدهندگان مربوطه توضیح دادند که مکالمه رابط وب دارای دستورات سیستمی سختگیرانهای بود که این ناهنجاری را پنهان میکرد.
در مقابل، در آزمایش API سطح پایین و بدون هیچ محدودیتی، این مشکل به طور مکرر بازتولید شد. این به طور مستقیم نشان میدهد که مدل بزرگ رده بالای ایالات متحده احتمالاً مقدار زیادی از دادههای تولید شده از مدلهای بزرگ متنباز چینی را برای «تقطیر» در طول آموزش یا تنظیم دقیق استفاده کرده است.
رفتار متناقض، انتقاد از استانداردهای دوگانه را برمیانگیزد
این حادثه جنجال بزرگی در جامعه فناوری ایجاد کرد، عمدتاً به این دلیل که Anthropic قبلاً تمایل شدیدی به «ضد چین» نشان داده بود. این شرکت زمانی با وزارت دفاع ایالات متحده و سایر بخشها برای تدوین قوانینی همکاری کرد و تلاش نمود تا «تقطیر مدل بزرگ» را به عنوان یک حمله خصمانه تعریف کند.
آنها نه تنها از دولت ایالات متحده خواستند تا محدودیتهای تراشه و نرمافزاری را بر صنعت هوش مصنوعی چین افزایش دهد، بلکه یک هدف استراتژیک را برای دستیابی به دو سال برتری نسبت به چین در هوش مصنوعی تا سال ۲۰۲۸ پیشنهاد کردند. اکنون، مدل شاخص آنها در حال تقطیر مدلهای بزرگ چینی گرفتار شده است که به طعنه استانداردهای دوگانه آنها را آشکار میکند.
