چینیها رقیب قدرتمند ChatGPT را خلق کردند
اقتصادی
بزرگنمايي:
پیام سپاهان - گجت نیوز / محققان چینی موفق شدند رقیب قدرتمند هوش مصنوعی چت GPT بهنام DeepSeek را در مدت 2 ماه بسازند آن را بهصورت رایگان در اختیار کاربران بگذارند.
یک آزمایشگاه هوش مصنوعی مستقر در چین به نام DeepSeek، مدل زبانی بزرگ و متنباز خود را با عنوان DeepSeek-V3 عرضه کرده است. این مدل که در مدت زمان کوتاه 2 ماهه و با صرف بودجهای معادل 5.58 میلیون دلار توسعه یافته، به عنوان یک رقیب مقرونبهصرفه اما قدرتمند چت GPT، محصول شرکت OpenAI، مطرح شده است. این اتفاق، نه تنها دانشمندان حوزه هوش مصنوعی را به هیجان آورده، بلکه نگرانیهای جدی را در میان شرکتهای فناوری سیلیکون ولی ایجاد کرده است.
رقیب قدرتمند چت GPT از راه رسید
مدل DeepSeek-V3 توانسته عملکردی در حد GPT-4o شرکت OpenAI و Claude Sonnet 3.5 شرکت آنتروپیک داشته باشد و در برخی کارها مثل حل مسئله، برنامهنویسی و محاسبات ریاضی، از مدلهایی مانند Llama 3.1 شرکت متا و Qwen2.5 شرکت علیبابا عملکرد بهتری داشت.
البته ماجرا به همینجا ختم نمیشود. مدلی حتی پیشرفتهتر با نام DeepSeek-R1 روز دوشنبه (20 ژانویه) رونمایی شد. R1 نیز در بسیاری از این آزمونها از مدل o1 جدید ChatGPT پیشی گرفته است. این در حالیست که هزینههای آموزش و اجرای آن بسیار کمتر از سایر مدلها بوده و بخشهایی از کد آن به صورت متنباز در دسترس عموم قرار گرفته است. علاوه بر این، برای آموزش این مدل از تعداد بسیار کمتری واحد پردازش گرافیکی (GPU) استفاده شده است. این پیشرفت، متخصصان هوش مصنوعی را شگفتزده کرده و احتمال سبقت گرفتن مدلهای هوش مصنوعی چینی از رقبای آمریکایی را تقویت کرده است.
ساتیا نادلا، مدیرعامل مایکروسافت و یکی از شرکای کلیدی OpenAI، در نشست جهانی اقتصاد در داووس سوئیس در 22 ژانویه، بر اهمیت توجه جدی به تحولات چین در حوزه هوش مصنوعی تأکید کرد.
مدلهای استدلالی مانند R1 و o1، نسخه ارتقایافته LLMهای استاندارد هستند که با استفاده از تکنیکی به نام «زنجیره تفکر»، توانایی ارزیابی مجدد استدلالهای خود را دارند. به عبارت دیگر، این مدلها میتوانند به عقب برگشته و منطق خود را بررسی کنند تا به نتایج دقیقتری دست پیدا کنند. این ویژگی باعث شده است که مدلهای استدلالی در میان محققان و مهندسینی که به دنبال کاربرد هوش مصنوعی در کار خود هستند، بسیار محبوب شوند.
برخلاف مدل زبانی بسته O1 چت GPT، مدل DeepSeek یک مدل متنباز است و با وجود اینکه دادههای آموزشی آن همچنان اختصاصی هستند، اما این مدل به کاربران اجازه میدهد تا به درون الگوریتم آن دسترسی پیدا کرده و تغییراتی در آن اعمال کنند. علاوه بر این مزیت، هزینه استفاده از DeepSeek به طور قابل توجهی کمتر از O1 بوده و حدود 27 برابر ارزانتر است. بودجه توسعه این مدل به مراتب کمتر از دهها یا حتی صدها میلیون دلاری است که رقبا برای آموزش مدلهای خود هزینه کردهاند.
از طرفی، محدودیتهای صادراتی ایالات متحده که دسترسی شرکتهای چینی به تراشههای محاسباتی هوش مصنوعی را محدود کرده، باعث شده تا توسعهدهندگان DeepSeek با بهرهگیری از الگوریتمهای هوشمندتر و کارآمدتر، کمبود قدرت محاسباتی را جبران کنند. مهندسان DeepSeek ادعا میکنند که با استفاده از تنها 2000 پردازنده گرافیکی انویدیا، به نتایج مشابهی دست یافتهاند که ChatGPT برای پردازش دادههای آموزشی خود به حدود 10000 عدد از این پردازندهها نیاز داشت.
با این حال، هنوز مشخص نیست که این دستاوردها تا چه اندازه به کاربردهای عملی منجر خواهد شد و آیا DeepSeek صرفاً برای کسب امتیاز در آزمونهای مقایسهای بهینه شده است یا خیر. جامعه علمی و سرمایهگذاران حوزه هوش مصنوعی با دقت این موضوع را دنبال میکنند.
لینک کوتاه:
https://www.payamesepahan.ir/Fa/News/935564/