پیام سپاهان

آخرين مطالب

آپدیت 2025 دیپ سیک؛ هوش مصنوعی جنجالی چینی قدرتمندتر و بهینه‌تر شد علمی

آپدیت 2025 دیپ سیک؛ هوش مصنوعی جنجالی چینی قدرتمندتر و بهینه‌تر شد
  بزرگنمايي:

پیام سپاهان - زومیت / دیپ‌سیک نسخه‌ی بهبودیافته‌ی مدل زبانی بزرگ V3 را تحت مجوز متن‌باز MIT و با قدرت بیشتر از نسخه‌ی قبلی منتشر کرد.
دیپ‌سیک، استارتاپ پرحاشیه‌ی چینی، نسخه‌ی بهبودیافته‌ی مدل زبانی بزرگ DeepSeek-V3 را تحت مجوز متن‌باز (اوپن‌سورس) MIT منتشر کرد.
نسخه‌ی جدید در سکوت خبری منتشر شده و دیپ‌سیک هیچ بیانیه‌ای را در دسترس رسانه‌ها قرار نداده است. به‌علاوه، فایل Readme مدل جدید، فعلاً خالی است (این فایل معمولاً شامل مخازنی از کد و توضیحات مربوط‌ به تغییرات مدل می‌شود).
بازار
دیپ‌سیک V3، مدل زبانی بزرگ متن‌باز، زمستان سال گذشته در دسترس قرار گرفت و قلب تپنده‌ی دیپ‌سیک R1 به‌حساب می‌آید (R1 مدلی استدلالی است که دیپ‌سیک را بر سر زبان‌ها انداخت و حواشی گسترده‌ای را ایجاد کرد).
دیپ‌سیک V3 مدلی همه‌منظوره است که به‌طور خاص برای وظایف استدلالی بهینه نشده است، بااین‌حال می‌تواند مسائل ریاضی را حل کند و کد بنویسد.
تا به امروز، مدل V3 تحت یک مجوز سفارشی متن‌باز در دسترس بود؛ بااین‌حال به‌لطف تغییرات جدید، مدل قدرتمند دیپ‌سیک از این پس تحت مجوز MIT ارائه می‌شود. بدین ترتیب توسعه‌دهندگان می‌توانند بدون هیچ‌ محدودیتی، از این مدل هوش مصنوعی در پروژه‌های تجاری استفاده کنند و حتی سراغ اصلاح‌کردنش بروند.
کارشناسان می‌گویند مدل جدید دیپ‌سیک قدرتمندتر از نمونه‌ی قبلی شده است و منابع سخت‌افزاری کمتری را درگیر می‌کند.
اکثر مدل‌های زبانی بزرگ و پیشرفته، صرفاً با کارت‌های گرافیک کلاس دیتاسنتر پتانسیل اصلی خودشان را به‌نمایش می‌گذارند. اونی هانون، دانشمند تحقیقاتی تیم یادگیری ماشین اپل، می‌گوید که نسخه‌ی جدید دیپ‌سیک V3 را روی مک استودیو اجرا کرده و این مدل توانسته است در هر ثانیه تقریباً 20 توکن خروجی ارائه دهد که بسیار قابل توجه به نظر می‌رسد.
مک استودیو مورد استفاده، قوی‌ترین نمونه‌ی آن کامپیوتر بود و درحال‌حاضر حدود 9٬500 دلار قیمت دارد. دانشمند اپل می‌گوید اجرای دیپ‌سیک روی مک استودیو نیازمند یک‌سری تکنیک خاص ازجمله کوانتش چهار بیتی بود. این تکنیک که برای بهینه‌سازی مدل‌های زبانی بزرگ استفاده می‌شود، میزان درگیرشدن حافظه را کم می‌کند و تأخیر را پایین می‌آورد، اما بهای استفاده از آن، کاهش دقت خروجی است.
ظاهراً نسخه‌ی جدید دیپ‌سیک V3 در زمینه‌ی کدنویسی عملکرد بهتری نسبت‌ به مدل قبلی دارد. بر اساس یک تست غیررسمی و مستقل، دیپ‌سیک V3 جدید به امتیاز 60 درصد در بنچمارک دست پیدا کرد که چند درصد بهتر از نسخه‌ی قبلی است. البته دیپ‌سیک V3 جدید ضعیف‌تر از مدل استدلالی Qwen-32B ظاهر شد. V3 با وجود تمامی بهبودهایش همچنان در پشت سر مدل پرچمدار R1 قرار می‌گیرد.
مدل زبانی دیپ‌سیک V3 شامل 671 میلیارد پارامتر است، اما به هنگام پاسخ به پرسش‌ها تنها 37 میلیارد از آن‌ها را استفاده می‌کند. این ساختار غیرمنتظره، به دیپ‌سیک V3 امکان می‌دهد که عملکرد مناسب را با منابع سخت‌افزاری کمتر از سایر مدل‌های زبانی ارائه دهد (مدل‌های دیگر معمولاً تمامی پارامترهایشان را فعال می‌کنند).
دیپ‌سیک می‌گوید V3 بهینه‌تر از R1 است و هزینه‌های نهایی سازمان‌ها را پایین‌تر می‌آورد. نسخه‌ی اولیه‌ی دیپ‌سیک V3 بر پایه‌ی دیتاستی از 14٫8 تریلیون توکن آموزش داده شد.

لینک کوتاه:
https://www.payamesepahan.ir/Fa/News/950676/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

بیانیه حوزه بسیج شهدای شهرداری اصفهان به‌مناسبت روز جهانی قدس

دست پر «جمالی‌نژاد» در مدیریت استان اصفهان؛ از پیگیری ویژه پروژه‌های آب تا مسائل اقتصادی

اپل تاریخ برگزاری WWDC 2025 را اعلام کرد

خروج تریلی از جاده در مسیر تربت جام - نصرآباد + فیلم

برگزاری دومین دوره از مسابقات ملی تفسیر قرآن "مشکات النور" در عراق

عکس/سفره هفت سین به سبک نفس بازغی

لزوم توسعه و فعال‌بودن باغ فدک در تمام ایام سال

از ظرفیت اتوبوس‌های گردشگری اصفهان به‌طور کامل استفاده نمی‌شود

رتبه اول فولاد مبارکه در معاملات رینگ صنعتی بورس کالا طی سال 1403

رئیس انجمن زغالسنگ ایران درگذشت

فولادینفو : عرضه محصولات صادراتی فولاد مبارکه در بورس کالا

رکورد تولید روزانه آهن اسفنجی در فولاد مبارکه شکسته شد

به این شعر زیبا گوش دهید

پرچمدار بعدی اوپو باتری بسیار بزرگ‌تری خواهد داشت

حسگر اثرانگشت در اندروید 16 بدون روشن کردن صفحه‌نمایش کار خواهد کرد

نسخه‌ای کمیاب از Apple-1 با قیمت 375 هزار دلار فروخته شد

تاشدنی‌های جدید سامسونگ با بتای سوم One UI 7 به ویژگی Audio Eraser مجهز می‌شوند

معمار تحریم ایران: مسیر اختلافات واشنگتن و تهران به کجا ختم می‌شود؟

طوفان سکه در سال03/ بازده سکه در بازار چقدر بود؟

اهدای 62 هزار بسته معیشتی بین مددجویان اصفهانی

اصفهان نیازمند هتل‌های بیشتر برای تقویت صنعت گردشگری است

آرزوی به حقیقت پیوسته فرزندان شهیدان جمشیدی و دشتبان در هیاهوی بازار اصفهان

غزلی زیبا از مولانا

داستانک/سیرت زیبا

سامسونگ قیمت مانیتور Odyssey 3D را اعلام کرد؛ تماشای محتوای سه‌بعدی بدون عینک

چرا ایران باید هر دو گزینه مذاکره و جنگ را جدی بگیرد؟

صدور هشدار سطح زرد بارندگی برای پنج شنبه

سرقت چک 600میلیاردی از صاحب کارخانه در خمینی شهر

برپایی نمایشگاه اقوام ایرانی در شهرضا

خدمت در هلال احمر مصداق بارز عمل صالح است

جای خالی متولی بافت تاریخی اصفهان در باغ فدک احساس می‌شود

رژه اقتدار دریایی در یادمان اروندکنار برگزار می شود

کشف 26 هزار لیتر گازوییل قاچاق

لزوم توجه به مدل‌های اقتصادی برای باغ فدک

تصویر نادیده از فروغ فرخزاد در کنار سفره هفت سین

هواوی حالا شرکت جدیدی برای تولید خودرو رده‌بالا دارد

علت تأخیر عرضه پیکسل 9a مشکل گرمای بیش از حد این گوشی است

نشنال اینترست: آیا تحریم‌های جدید ترامپ جریان نفت ایران را قطع می‌کند؟

اعلام حضور اصفهانی‌ها در راهپیمایی روز قدس

خلاقیت پلیس راه اصفهان برای کاهش تصادفات + فیلم

هوش مصنوعی و انرژی خورشیدی مصداق سرمایه‌گذاری برای تولید است

ضرورت آگاه‌سازی مسافران درباره شرایط اسکان و تغییرات جوی

حفظ سلامت گردشگران در اولویت است

حکایتی شنیدنی از شهید بلخی

هدست واقعیت ترکیبی ویوو رونمایی شد؛ رقیب چینی اپل ویژن پرو

ریاست‌ جمهوری ترامپ؛ عصر طلایی برای آمریکا یا عصر سیاه برای جهان؟

وال استریت ژورنال: اروپا به دنبال سپر هسته‌ای خود است

تهران مخوف

حقوق بیمه بیکاری در سال 1404؛ جزئیات، شرایط و نحوه محاسبه

مراسم سالگرد شهادت سرداران زاهدی و حجازی پنج شنبه در اصفهان