پیام سپاهان

آخرين مطالب

انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است علمی

انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است
  بزرگنمايي:

پیام سپاهان - دیجیاتو / این مدل جدید باوجود اندازه کوچک‌تر عملکردی بهتر از DeepSeek R1 دارد.
متا همچنان درگیر پاسخ به پرسش‌ها و انتقادات درباره خانواده مدل‌های جدید Llama 4 است اما شرکت انویدیا با معرفی مدل زبان بزرگ (LLM) متن‌باز و قدرتمند، توجه‌ها را به خود جلب کرده است. این مدل که Llama-3.1 Nemotron Ultra نام دارد، بر پایه نسخه قبلی مدل‌های Llama-3.1-405B-Instruct متا توسعه یافته و به گفته انویدیا، عملکردی نزدیک به برترین مدل‌های موجود دارد.
مدل Llama-3.1-Nemotron-Ultra-253B-v1 با 253 میلیارد پارامتر برای وظایفی مانند استدلال پیشرفته، پیروی از دستورات و ایفای نقش دستیار هوش مصنوعی طراحی شده است.
این مدل نخستین‌ بار مارس در کنفرانس سالانه GTC انویدیا معرفی شده بود و اکنون کامل و متن‌باز در پلتفرم Hugging Face در دسترس قرار گرفته است. کد مدل، وزن‌ها و داده‌های پس از آموزش آن نیز عمومی منتشر شده‌اند.

پیام سپاهان


بازار


مدل جدید انویدیا با استفاده از فرایند جستجوی معماری عصبی (NAS) توسعه یافته که در آن نوآوری‌هایی مانند حذف لایه‌های توجه، شبکه‌های Fused feedforward و فشرده‌سازی متغیر در ساختار مدل اعمال شده‌اند. این معماری به گونه‌ای طراحی شده که مدل با کاهش مصرف حافظه و منابع محاسباتی، همچنان کیفیت خروجی بالایی ارائه دهد و بتوان آن را فقط با 8 کارت گرافیک H100 اجرا کرد.
علاوه‌بر H100، این مدل با معماری‌های پیشرفته‌تر انویدیا مانند B100 و Hopper نیز سازگار بوده و در حالت‌های دقت BF16 و FP8 عملکرد مطلوبی دارد.
انویدیا برای ارتقای توانایی‌های مدل از فرایند پس‌آموزش چندمرحله‌ای بهره برده که شامل آموزش نظارت‌شده در حوزه‌هایی مانند ریاضی، تولید کد، چت و استفاده از ابزارها بوده است. همچنین برای بهبود عملکرد در دنبال‌کردن دستورات و توانایی استدلال، از الگوریتم GRPO (بهینه‌سازی نسبی سیاست گروهی) استفاده شده است.
عملکرد مدل جدید انویدیا در برابر رقبا


مدل جدید انویدیا در آزمون‌های معتبر مختلف عملکرد خیره‌کننده‌ای داسته است. برای مثال، در آزمون MATH500، عملکرد مدل از 80.40 درصد در حالت عادی به 97 درصد در حالت استدلال افزایش یافته است. همچنین در آزمون AIME25، امتیاز آن از 16.67 درصد به 72.50 درصد و در LiveCodeBench از 29.03 درصد به 66.31 درصد رسیده است.
این مدل در پاسخ به پرسش‌های عمومی (GPQA) در حالت استدلال فعال به امتیاز 76.01 درصد دست یافته که از DeepSeek R1 (با امتیاز 71.5 درصد) پیشی گرفته است. همچنین در آزمون IFEval برای پیروی از دستورات، امتیاز 89.45 درصد در برابر 83.3 درصد رقیب ثبت شده و در LiveCodeBench نیز اندکی بهتر عمل کرده است.
البته باید توجه کرد که مدل DeepSeek R1 در برخی آزمون‌های ریاضی سنگین همچنان بهتر عمل می‌کند، ازجمله در AIME25 با امتیاز 79.8 درصد برابر 72.50 درصد مدل انویدیا.
این مدل از زبان‌های متعددی ازجمله انگلیسی، آلمانی، فرانسوی، ایتالیایی، پرتغالی، هندی، اسپانیایی و تایلندی پشتیبانی می‌کند و برای کاربردهایی مانند چت‌بات، ساخت عامل‌های هوش مصنوعی، تولید کد و تولید با روش بازیابی-افزوده (RAG) قابل‌استفاده است.

لینک کوتاه:
https://www.payamesepahan.ir/Fa/News/954565/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

هدف‌گذاری یک میلیارد دلاری صادرات در فولاد مبارکه؛ به 50 کشور دنیا صادرات داریم

صادرات فولاد مبارکه با تمرکز بر بازار‌های آفریقایی و شرق آسیا دنبال می‌شود

لحظه حیاتی ریاض

پوستر گل‌گهر برای نبرد صنعتی‌ها؛ احترام به مقام کارگر!

یک گیمر ژاپنی توانست در 15 دقیقه نسخه سوییچ 2 از Zelda: BotW را تمام کند!

آیا جانشین آیفون 16e سال آینده از راه می‌رسد؟

نسخه ویژه «اچ‌ام‌دی فیوژن» و «اچ‌ام‌دی 3210» در رنگ‌های آبی و اناری بارسلونا عرضه شد

پیش به سوی تغییر توازن در قفقاز

رسوایی در بندر

انگیزه‌‏های مخالفان موفقیت مذاکرات ایران و آمریکا

ایده «کشور مستقل» برای آمریکا بسیار خطرناک است

80 درصد ایرانیان موافق مذاکره با آمریکا با حفظ دستاوردهای موشکی و هسته‌ای هستند

صداوسیما دنبال کارشکنی در مذاکرات بود

بحران در شبه‌قاره هند و دست خالی آمریکا

چرخش به سمت صهیون!

ارائه خدمات خانه‌های معلم استان اصفهان در بخش رزرو تالار و سالن های پذیرایی با 30 درصد تخفیف ویژه فرهنگیان تا پایان شهریور

تصویب الحاق250هکتار از اراضی ملی شهرهای بوکان و مهاباد به محدوده شهری

ضرورت احیای جایگاه تاریخی صنعت ابریشم در لنگرود

انتظار متقاضیان پروژه گل نرگس اصفهان در تحویل مسکن 14 ساله شد

خوشبختی واقعی چیه؟

اولین بخشش خدا چیست؟

لنوو رقیب مک مینی را با جدیدترین پردازنده اینتل معرفی کرد

سامسونگ احتمالاً برای توسعه تراشه‌های اگزینوس از هوش مصنوعی متا استفاده می‌کند

اعتراف پوتین درباره نظامیان کره شمالی

پرداخت 716 هزار تومان به حداقل‌بگیران تامین اجتماعی تمدید نمی شود؟

تصادف در جاده قدیم قم ـ کاشان سه فوتی و سه مصدوم بر جای گذاشت

ذخیره خون اصفهان به بیش از حد ایده‌آل رسید

مراسمات گرامیداشت مقام معلم باید ویژه معلمان باشد / کرامت معلمین خط قرمز ماست

برخورد سواری روآ با تاکسی سمند در محور قم- کاشان 3 فوتی و 3 مجروح داشت

تاریخچه رقابت های کشتی فرنگی قهرمانی کشور از 1380 تا 1389

ذخیره خون اصفهان به بیش از حد ایده آل رسید

شعرخوانی زیبای دکتر کاکاوند

داستانک/ قرض و خدا

پس‌زمینه متحرک جدید DOOM Slayer برای ایکس باکس منتشر شد

شیائومی با بهبودهای مهیج در دوربین، عکاسی موبایل را متحول می‌کند

ضعف اطلاع‌رسانی

بندر؛ یک روز پس از فاجعه

روایت استاندار پیشین هرمزگان از انفجار اسکله بندرعباس

احتمالات یک فاجعه

پیام تسلیت مدیرعامل سازمان منطقه آزاد کیش در پی حادثه تلخ بندر شهید رجایی بندرعباس

ارائه خدمات خانه‌های معلم استان اصفهان با 30 درصد تخفیف ویژه فرهنگیان تا پایان شهریور

رعایت دقیق قوانین و فرآیندها برای جلوگیری از تخلفات در آموزش و پرورش ضروری است

همکاری مسئولین و مردم برای پیشرفت پروژه‌های نهضت توسعه عدالت آموزشی ضروری است

سرمایه‌گذاری 5 میلیارد دلاری گروه فولاد مبارکه در سرتاسر کشور

بازدید معاون اول رئیس‌جمهور از غرفه گروه فولاد مبارکه در هفتمین نمایشگاه بین‌المللی توانمندی‌های صادراتی ایران

دیدار مدیرعامل گروه فولاد مبارکه و رئیس هیات‌ عامل ایمیدرو با محوریت توسعه همکاری‌های صادراتی

خواب تو را میبینم!

مشخصات و قیمت ساعت هواوی واچ 5 لو رفت

دست‌اندازهای توافق تهران و واشنگتن

ایران مایل به یک توافق موقت است