پیام سپاهان

آخرين مطالب

هوش مصنوعی پاسخی برای پرسش‌های تاریخی ندارد اقتصادی

هوش مصنوعی پاسخی برای پرسش‌های تاریخی ندارد
  بزرگنمايي:

پیام سپاهان - ایسنا / هوش مصنوعی ممکن است در کارهای خاصی مانند کدنویسی یا تولید پادکست، عملکرد خوبی داشته باشد اما یک پژوهش جدید نشان داده است که هوش مصنوعی برای قبول شدن در یک امتحان تاریخ سطح بالا مشکل دارد.
گروهی از پژوهشگران یک معیار جدید را برای آزمایش سه مدل زبانی بزرگ «چت‌جی‌پی‌تی-4»(GPT-4) شرکت «اوپن‌ای‌آی»(OpenAI)، «لاما»(Llama) شرکت «متا»(Meta) و «جمینای»(Gemini) گوگل درباره پرسش‌های تاریخی ایجاد کرده‌اند. این معیار موسوم به «Hist-LLM»، درستی پاسخ‌ها را بر اساس بانک اطلاعات تاریخ جهانی «سشات»(Seshat) آزمایش می‌کند که یک پایگاه داده گسترده از دانش تاریخی است و نام ایزدبانوی خرد مصر باستان را دارد.
به نقل از تک کرانچ، پژوهشگران مؤسسه پژوهشی «Complexity Science Hub» مستقر در اتریش، نتایج این بررسی را ناامیدکننده خواندند. مدل زبانی که بهترین عملکرد را داشت، «GPT-4 Turbo» بود، اما دقت آن فقط حدود 46 درصد تخمین زده شد که خیلی بیشتر از دقت حدس زدن تصادفی نیست.

«ماریا دل ریو چانونا»(Maria del Rio-Chanona)، دانشیار علوم رایانه «کالج دانشگاهی لندن»(UCL) و از پژوهشگران این پروژه گفت: نکته اصلی پژوهش ما این است که اگرچه مدل‌های زبانی بزرگ، چشمگیر هستند، اما هنوز عمق لازم را برای درک تاریخ پیشرفته ندارند. آنها برای حقایق اساسی، عالی هستند، اما وقتی صحبت از پژوهش‌های تاریخی دقیق‌تر در سطح دکتری به میان می‌آید، هنوز به کارآیی لازم نرسیده‌اند.
پژوهشگران پرسش‌های تاریخ را که مدل‌های زبانی بزرگ در پاسخ دادن به آنها اشتباه کرده بودند، در اختیار تک‌ کرانچ گذاشتند. به عنوان مثال، آنها از GPT-4 Turbo پرسیده بودند که آیا «زره فلس» در یک دوره زمانی خاص در مصر باستان وجود داشته است یا خیر و مدل زبانی بزرگ پاسخ مثبت داد. این درحالی بود که زره فلس 1500 سال پس از آن دوره در مصر ظاهر شد.
چرا مدل‌های زبانی بزرگ در پاسخ دادن به پرسش‌های تاریخی بد عمل می‌کنند؛ در حالی که می‌توانند در پاسخ دادن به پرسش‌های بسیار پیچیده در مواردی مانند کدنویسی بسیار خوب باشند؟ چانونا پاسخ داد: احتمالا به این دلیل است که مدل‌های زبانی بزرگ تمایل دارند از داده‌های تاریخی بسیار برجسته برون‌یابی کنند و بازیابی دانش تاریخی مبهم‌تر را دشوار می‌دانند.
به عنوان مثال، پژوهشگران از GPT-4 پرسیدند که آیا مصر باستان در طول یک دوره تاریخی خاص، ارتش ثابت حرفه‌ای داشته است یا خیر. در حالی که پاسخ صحیح منفی است، GPT-4 به اشتباه پاسخ مثبت داد. این پاسخ احتمالا به این دلیل داده شده که اطلاعات عمومی زیادی درباره سایر امپراتوری‌های باستانی مانند ایران مبنی بر داشتن ارتش‌ ثابت وجود دارد.
چانونا گفت: اگر 100 بار به شما A و B و 1 بار C گفته شود و سپس درباره C از شما پرسیده شود، ممکن است A و B را به خاطر بسپارید و سعی داشته باشید از آن استنباط کنید.
پژوهشگران تمایلات دیگری را نیز درباره مدل‌های زبانی بزرگ شناسایی کردند؛ از جمله این که مدل‌های شرکت اوپن‌ای‌آی و لاما درباره مناطق خاصی مانند جنوب صحرای آفریقا عملکرد بدتری داشتند. این نشان‌دهنده سوگیری‌های احتمالی در داده‌های آموزشی آنهاست.
«پیتر تورچین»(Peter Turchin)، سرپرست این پژوهش گفت: نتایج نشان می‌دهند که مدل‌های زبانی بزرگ هنوز در برخی حوزه‌های خاص نمی‌توانند جایگزین انسان باشند.
با وجود این، پژوهشگران هنوز امیدوارند که مدل‌های زبانی بزرگ در آینده بتوانند به مورخان کمک کنند. آنها در حال کار کردن روی اصلاح معیار خود با گنجاندن داده‌های بیشتر درباره مناطق کمتر ارائه‌شده و افزودن پرسش‌های پیچیده‌تر هستند.
در مقاله این پژوهش آمده است: اگرچه نتایج ما مناطقی را برجسته می‌کنند که مدل‌های زبانی بزرگ به بهبود یافتن در آنها نیاز دارند، اما این نتایج بر پتانسیل این مدل‌ها برای کمک به پژوهش‌های تاریخی نیز تأکید می‌کنند.

لینک کوتاه:
https://www.payamesepahan.ir/Fa/News/933398/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

گذر صنایع‌دستی نقطه عطف توسعه گردشگری و حفظ هویت تاریخی اصفهان است

لیگ برتر هندبال| سپاهان در صدر از مس فاصله گرفت

جمع آوری 1000 تن رسوبات از حوضچه‌های ترسیب سد چم آسمان

کاهش هزینه‌های جاری و افزایش بهره‌وری سازمان‌ها در بودجه 1404 شهرداری اصفهان

پیروزی مقتدرانه نفت و طبیعت در لیگ برتر بسکتبال

اصفهان یکی از شهرهای یادگیرنده پیشرو در ایران است

اعلام برنامه قطعی برق برخی مناطق قم در روز سه شنبه

درصدد استفاده بهینه از عنوان‌های جهانی اصفهان هستیم

تعیین تکلیف دولت درباره قیمت جدید بنزین سوپر/ قیمت بنزین سوپر وارداتی با دلار آزاد چقدر می‌شود؟

اقدامات موثر فولادمبارکه در تقویت حوزه‌ های حمل‌ و نقلی و دانشی/راه اندازی معادن کوچک

شکست خانگی «گلنور» دربرابر «پایش پارت»

ستاره محبوب گاریدو در اصفهان نیمکت نشین می شود؟!

خلاصه پالایش نفت اصفهان 0 – ایرالکو اراک 1

سخنان دلنشین اردشیر رستمی

شعر انتخابی فرزانه سعادت‌مند در مرحلهٔ پنجم رقابت شاعران فصل سوم

تاشدنی مورد انتظار اوپو فایند N5 با نسخه ضعیف‌شده اسنپدراگون 8 الیت در گیک‌بنچ

بازی Party Animals بالاخره به پلی‌استیشن 5 می‌آید؛ تریلر آن را ببینید

از هوش مصنوعی برای اصلاح لهجه بازیگران فیلم The Brutalist استفاده شده است

بازی/ Homescapes؛ عمارتی باصفا بسازید

شاید ریلمی GT 7 ارزان‌ترین گوشی دنیا با تراشه پرقدرت اسنپدراگون 8 الیت باشد

اندیشکده استیمسون: چرا می‌توان به ترامپ دوم خوش‌بین بود؟

کج‌راهه در «شهرداری تهران»

موسویان: اولین گام ترامپ باید توافق هسته‌ای جدید با ایران باشد

سونامی جراحی‌های زیبایی در میان زنان و دختران

چشم‌انداز مقاومت فلسطین در غزه

2.5 همت سرمایه‌گذاری داخلی در منطقه آزاد اروند در نیمه نخست امسال جذب شد

طرح سوال از وزیر آموزش‌وپرورش در خصوص وضعیت مدارس شهرک شهید کشوری اصفهان

اقدام به کشف استعدادهای برتر قرآنی در سراسر کشور کنید

ورود بانوان به بازی پرسپولیس-ذوب‌آهن ممنوع شد | اطلاعیه هیئت فوتبال اصفهان

هواشناسی کاشان و اصفهان طی 24 آینده | پیش بینی وضعیت آب و هوا اصفهان فردا سه شنبه 2 بهمن ماه 1403

مهاجم مغضوب پرسپولیسی‌ها به اصفهان رفت

طرح سوال از وزیر آموزش و پرورش در خصوص وضعیت مدارس شهرک شهید کشوری اصفهان

کشف 4 میلیاردی کالای قاچاق در نطنز

بازهم درهای ورزشگاه به روی زنان هوادار بسته شد!

ذوب‌آهن اصفهان متعهد به مسئولیت‌های اجتماعی و کاهش آلایندگی

اقدامات ذوب‌آهن اصفهان در تولیدات جدید و تأثیر آن بر محیط زیست

آمادگی شهر اصفهان برای راه‌اندازی فروشگاه شهرهای عضو شبکه شهرهای خلاق در حوزه صنایع دستی

عکس/غزل شاکری و همسرش در جلفای اصفهان

آنچه برای فولاد مبارکه اهمیت دارد، تعالی در تمامی ابعاد است

گشت و گذار در پاتوق‌های یخ نوردی اطراف پایتخت

سود دی ماه 1403صندوق گنجینه زرین شهر پرداخت شد

جای خالی هواداران خانم در دیدار ذوب‌آهن و پرسپولیس

فولاد مبارکه دومین شرکت سودآور ایران شد

فروش بلیط بازی پرسپولیس و ذوب آهن + قیمت

برگزاری جلسه راهبری مدیرعامل ، معاونین ، مدیران و سرپرستان ذوب‌آهن اصفهان

اصفهان در مسیر افتخارآفرینی گام برمی‌دارد/ نگاه یونسکو شهرداری محور است

تولید و لزوم همدلی و تلاش جهادی کارکنان برای بهبود شرایط ذوب‌آهن اصفهان

تجمع بازنشستگان مخابرات در آذربایجان شرقی، کردستان، ایلام، تهران، اصفهان و کرمانشاه

شبکه شهرهای خلاق ایران باید هدفمندتر عمل کند

خبر وحشتناک برای هواداران پرسپولیس