فناوری

جدیدترین هوش مصنوعی علی بابا GPT-3.5، کلود در تست های چندگانه معیار

جدیدترین هوش مصنوعی علی بابا GPT-3.5، کلود در تست های چندگانه معیار

این توصیه سرمایه گذاری نیست. نویسنده در هیچ یک از سهام ذکر شده هیچ سمتی ندارد. Wccftech.com یک خط مشی اخلاقی و افشای اطلاعات دارد.

خواب دیدی تعبیرش رو نمی دونی کلیک کن

در سال 2024 که شروعی قدرتمند برای رقابت جهانی هوش مصنوعی است، گروه غول فناوری چینی علی بابا نیز آخرین نسخه از مدل هوش مصنوعی Qwen خود را اعلام کرده است. به غیر از ChatGPT OpenAI که شناخته شده ترین A.I است. ربات چت در جهان، مدل‌های دیگری مانند Meta’s Llama و شریک آمازون Anthropic’s Claude گزینه‌هایی هستند که مصرف‌کنندگان و کسب‌وکارها هنگام انتخاب یک A.I از آن‌ها برخوردار هستند. پلت فرم برای نیازهای آنها.

اخبار روز فناوری رو اینجا ببین

آخرین نسخه Qwen Alibaba Qwen 1.5 است و طبق معیارهای به اشتراک گذاشته شده در پلتفرم رسانه اجتماعی X، این مدل در برخی امتیازات معیار ChatGPT و Claude را شکست می دهد.

Alibaba Qwen 1.5 Beats Claude and ChatGPT در معیارهای چندگانه تست سیالیت آموزشی

درست مانند سیستم‌عامل‌هایی که روی رایانه‌ها یا تلفن‌های هوشمند اجرا می‌شوند، مدل هوش مصنوعی نیز یک نرم‌افزار است. این به مهندسان و تحلیلگران نرم‌افزار اجازه می‌دهد تا عملکرد آن را ارزیابی کنند، و وقتی نوبت به آخرین Qwen 1.5 Alibaba می‌رسد، برخی امتیازات نشان می‌دهد که عملکرد آن بهتر از Anthropic’s Claude و OpenAI ChatGPT است.

معیارهایی که سیستم‌های عامل را آزمایش می‌کنند، توانایی آن‌ها را برای پردازش دستورالعمل‌ها و اجرای برنامه‌ها ارزیابی می‌کنند، و معیارهایی که برای مدل‌های هوش مصنوعی معمولاً حول آن‌ها می‌چرخند و توانایی مدل‌ها برای تولید خروجی را آزمایش می‌کنند.

دو معیار از این قبیل MT-bench و Alapaca-Eval هستند و امتیازات به اشتراک گذاشته شده در X نشان می دهد که یک نوع از Qwen 1.5 Alibaba در آنها از ChatGPT و Claude پیشی گرفته است. MT-bench توانایی مدل‌ها را برای پاسخ دادن به مجموعه‌ای از سؤالات از پیش تعریف‌شده آزمایش می‌کند که نه تنها به دنبال متمایز کردن آن از ربات چت است، بلکه سعی می‌کند تعیین کند که آیا مدل می‌تواند در یک محیط گفت‌وگوی سخت که شامل دو طرف به سرعت درگیر می‌شود، «پایه خود را حفظ کند». با یکدیگر.

نمرات بنچمارک نشان می‌دهد که Qwen چهارمین امتیاز برتر در MT-bench بود، و تنها از GPT-4 Turbo و دو نسخه اول GPT-4، یعنی نسخه‌های 0613 و 0314 عقب بود.

Alapaca-Eval معیاری است که از یک مدل مرجع برای تقلید از تعاملات انسانی و تعیین میزان یک A.I استفاده می کند. مدل در حال آزمایش نتایجی را مطابق با خط پایه ارائه می دهد. همچنین به کاربران یک تابلوی امتیاز برای پیگیری تست‌هایشان ارائه می‌کند، و معیارهای امروزی نشان می‌دهند که عملکرد Alapaca-Eval Qwen 1.5 تنها از GPT-4 Turbo و HuggingFace Yi-34B مبتنی بر نیویورک عقب‌تر است.

Qwen1.5 یکی از بزرگترین مدل های منبع باز در نوع خود است و توسط منابع محاسباتی عظیم علی بابا پشتیبانی می شود. یک A.I منبع باز، مانند نرم افزار منبع باز، کد خود را در دسترس کاربران و توسعه دهندگان قرار می دهد تا بتوانند مدل را درک کنند و انواع خود را بسازند. Llama متا، که در نمرات امروز نیز وجود دارد، نیز یک مدل منبع باز است.

شروع سال 2024 تمرکز مشهوری از سوی وال استریت و شرکت ها بر روی A.I داشته است. گزارش‌های درآمد غول‌های فناوری بزرگ مانند متا، مایکروسافت و آلفابت همگی بر روی A.I متمرکز شده‌اند. مارک زاکربرگ، رئیس متا، قصد دارد امسال صدها هزار پردازنده گرافیکی بخرد تا لاما را تقویت کند، و در تماس با درآمد شرکت، مدیر اجرایی توضیح داد که تصمیم او برای افزایش ظرفیت محاسباتی در متا به دنبال نظارت‌های قبلی است که منجر به کمبود ظرفیت شرکت شد.

به طور مشابه، درآمد حاصل از سازندگان تراشه و طراحان TSMC و AMD نیز شاهد ابراز خوش بینی مدیران آنها نسبت به آینده A.I بوده اند. مدیریت TSMC مطمئن است که این شرکت برای به دست آوردن هر گونه A.I از جایگاه ثابتی برخوردار است. تقاضا، در حالی که AMD بر این عقیده است که A.I. می تواند تا پایان دهه به صدها میلیارد دلار تبدیل شود.

این داستان را به اشتراک بگذارید

< استفاده از xlink:href="#icn-shareFacebook"/> فیس بوک

< استفاده از xlink:href="#icn-shareTwitter"/> توییتر

این نوشته به صورت خودکار نوشته شده اگر مشکلی در کلمه اعم از همه چیز باشد ما را حتما از طریق نظرات باخبر کنید تا رسانه بتواند بهترین اطلاعات عمومی را بدهد

‫0/5 ‫(0 نظر)

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا