شباهت 74 درصد از پاسخهای دیپسیک به ChatGPT؛ احتمال نقض حقوق مالکیت جدی شد
علمی
بزرگنمايي:
پیام سپاهان - دیجیاتو / نتایج تحقیق حاضر میتواند پیامدهای مهمی برای حقوق مالکیت فکری، قانونگذاری و توسعه هوش مصنوعی در آینده داشته باشد.
بررسی جدیدی نشان میدهد 74.2 درصد متنهایی که مدل هوش مصنوعی دیپسیک تولید میکند، از نظر سبک نگارش شباهت قابلتوجهی به خروجیهای ChatGPT دارند. این یافتهها میتوانند نشانهای از این باشند که DeepSeek در فرایند آموزش خود از خروجیهای OpenAI استفاده کرده است.
براساس گزارش سایت «Forbes»، این تحقیق را شرکت Copyleaks، فعال در حوزه شناسایی محتوای مبتنیبر هوش مصنوعی، انجام داده است. به گفته این شرکت، نتایج این تحقیق میتواند پیامدهای مهمی برای حقوق مالکیت فکری، قانونگذاری و توسعه هوش مصنوعی در آینده داشته باشد.
شباهت سبک نگارش دیپسیک به OpenAI
در این بررسی، Copyleaks از فناوری غربالگری و الگوریتمهای دستهبندی استفاده کرده تا اثر انگشت سبکی (Stylistic Fingerprint) مدلهای زبانی مختلف، ازجمله OpenAI، کلود، جمینای، LLaMA و DeepSeek را شناسایی کند. این دستهبندی با روش رأیگیری اجماعی انجام شده تا احتمال خطا به حداقل برسد و دقت افزایش یابد.

بازار
![]()
نتیجه قابلتوجه این بود که متنهایی که بیشتر مدلها تولید کرده بودند، سبک منحصربهفردی داشتند اما بخش چشمگیری از خروجیهای DeepSeek از نظر سبک، مشابه خروجیهای OpenAI شناسایی شد.
«شای نیسان»، رئیس بخش علم داده Copyleaks، در گفتگویی ایمیلی توضیح داده این مطالعه را میتوان شبیه کار یک کارشناس خطشناسی دانست که تلاش میکند نویسنده یک متن دستنویس را با مقایسه آن با دستخطهای دیگران شناسایی کند. نتایج این تحقیق، تعجبآور و بسیار مهم است.
احتمال نقض حقوق مالکیت فکری OpenAI
نیسان تأکید دارد که این شباهت قطعیترین مدرک برای استفاده مستقیم دیپسیک از خروجیهای OpenAI نیست، اما سؤالات جدی درباره فرایند آموزش و منابع داده این مدل ایجاد میکند.
اگر مشخص شود که DeepSeek بدون مجوز از متون ساخته OpenAI برای آموزش مدل خود استفاده کرده، پیامدهای حقوقی مهمی در نقض مالکیت فکری و تخلف از شرایط خدمات OpenAI خواهد داشت. نبود شفافیت درباره دادههای آموزشی در صنعت هوش مصنوعی، این چالش را عمیقتر و نیاز به چارچوبهای نظارتی مشخص برای افشای منابع آموزشی را برجستهتر میکند.
چالش اخلاقی و قانونی
هرچند خود OpenAI نیز بابت استفاده از محتوای وب بدون اجازه صریح با انتقاداتی مواجه بوده، شباهت سبک دیپسیک به ChatGPT ابعاد تازهای به این بحث اضافه میکند. در نبود رویههای حقوقی مشخص، پیگیری قانونی چنین مواردی دشوار است اما ابزارهایی مانند شناسایی اثر انگشت سبکی میتوانند نشانهای قدرتمند برای ردیابی و بررسی تخلفات احتمالی باشند.
بااینکه برخی کارشناسان احتمال میدهند مدلهای زبانی بهدلیل استفاده از دادههای مشابه بهتدریج به سبکهای نزدیک به هم برسند، Copyleaks میگوید روش اجماعی آنها مخصوص تشخیص تفاوتهای سبکی ظریف طراحی شده و این شباهت را نمیتوان صرفاً ناشی از همپوشانی دادهها دانست.
نیسان در پایان تأکید کرده باوجود اشتراک احتمالی در دادههای آموزشی، معماری مدل، روشهای تنظیم دقیق (Fine-tuning) و تکنیکهای تولید محتوا در هر مدل منحصربهفرد است. همین موضوع باعث میشود اثر انگشت سبکی هر مدل با دیگری متفاوت باشد.
هنوز مشخص نیست DeepSeek واقعاً از خروجیهای OpenAI بدون مجوز استفاده کرده یا خیر اما این پرسشها قطعاً در آینده نزدیک بخشی جدی بحثهای توسعه و تنظیمگری هوش مصنوعی خواهند بود. DeepSeek تاکنون به درخواستها ارائه توضیحات پاسخ نداده است.
-
چهارشنبه ۱۵ اسفند ۱۴۰۳ - ۲۱:۳۶:۵۰
-
۱۶ بازديد
-

-
پیام سپاهان
لینک کوتاه:
https://www.payamesepahan.ir/Fa/News/945430/