پیام سپاهان

آخرين مطالب

OpenAI مدل‌های گفتاری و نوشتاری جدیدی برای ایجنت‌های هوش مصنوعی معرفی کرد علمی

OpenAI مدل‌های گفتاری و نوشتاری جدیدی برای ایجنت‌های هوش مصنوعی معرفی کرد
  بزرگنمايي:

پیام سپاهان - دیجیاتو / البته OpenAI در حال حاضر قصد ندارد این مدل‌های جدید را به صورت عمومی منتشر کند.
OpenAI از ارتقاء مدل‌های هوش مصنوعی خود در زمینه تبدیل گفتار به متن و متن به گفتار خبر داد. این مدل‌های جدید که به API این شرکت اضافه شده‌اند، نسبت به نسخه‌های قبلی پیشرفت‌های قابل‌توجهی داشته‌اند و قابلیت‌های بیشتری را در اختیار توسعه‌دهندگان قرار می‌دهند.
به گفته OpenAI، این مدل‌های جدید بخشی از چشم‌انداز بزرگ‌تر این شرکت برای ساخت سیستم‌های خودکار یا «عامل‌های هوشمند» هستند که می‌توانند به‌طور مستقل وظایف مختلفی را برای کاربران انجام دهند. «اولیویه گودمن»، مدیر محصول اوپن‌ای‌آی، در این باره به TechCrunch توضیح داده که این ایجنت‌ها می‌توانند به‌عنوان چت‌بات‌هایی عمل کنند که با مشتریان یک کسب‌وکار تعامل می‌کنند. او پیش‌بینی کرد که در ماه‌های آینده شاهد ظهور تعداد بیشتری از این عامل‌ها خواهیم بود.
مدل تبدیل متن به گفتار OpenAI
مدل جدید تبدیل متن به گفتار OpenAI با نام gpt-4o-mini-tts، نه تنها گفتاری طبیعی‌تر و با جزئیات بیشتر تولید می‌کند، بلکه قابلیت تنظیم دقیق‌تری نیز دارد. توسعه‌دهندگان می‌توانند با استفاده از دستورات زبان طبیعی، نحوه بیان متن را کنترل کنند.
به‌عنوان مثال، می‌توان از این مدل خواست که مانند یک «دانشمند دیوانه» یا با صدایی آرام و شبیه به یک معلم صحبت کند. یک نمونه از صداهای تولید شده توسط این مدل را در ادامه می‌توانید بشنوید:

بازار


«جف هریس»، یکی از اعضای تیم محصول OpenAI، تأکید کرده که هدف این است که توسعه‌دهندگان بتوانند هم «تجربه صوتی» و هم «زمینه» را به دلخواه خود تنظیم کنند. او می‌گوید:
«در موقعیت‌های مختلف، شما نمی‌خواهید که صدایی یکنواخت و بدون احساس شنیده شود. مثلاً اگر در یک تجربه پشتیبانی مشتری هستید و می‌خواهید صدای ربات عذرخواهی کند، می‌توانید به مدل دستور دهید که این احساس را در صدا لحاظ کند.»
مدل‌های تبدیل گفتار به متن
OpenAI همچنین دو مدل جدید تبدیل گفتار به متن با نام‌های gpt-4o-transcribe و gpt-4o-mini-transcribe را معرفی کرده است که جایگزین مدل قدیمی Whisper می‌شوند. این مدل‌های جدید که روی مجموعه‌ داده‌های صوتی متنوع و باکیفیت آموزش دیده‌اند، می‌توانند صداهای با لهجه‌های مختلف و حتی در محیط‌های شلوغ را با دقت بیشتری تشخیص دهند.
هریس همچنین اشاره کرده که این مدل‌ها کمتر از Whisper دچار خطاهای «توهم» می‌شوند. مدل Whisper گاهی اوقات کلمات یا حتی جملات کاملی را که وجود نداشتند، به متن اضافه می‌کرد که این موضوع می‌توانست مشکلاتی را ایجاد کند. او می‌گوید:
«این مدل‌ها در مقایسه با Whisper بهبود چشمگیری داشته‌اند. دقت مدل‌ها برای ایجاد یک تجربه صوتی قابل اعتماد کاملاً ضروری است و دقت در اینجا به این معناست که مدل‌ها کلمات را به درستی تشخیص می‌دهند و جزئیاتی که نشنیده‌اند را به متن اضافه نمی‌کنند.»


بااین‌حال، دقت این مدل‌ها ممکن است بسته به زبانی که تبدیل می‌شود، متفاوت باشد.
برخلاف رویه گذشته، OpenAI قصد ندارد این مدل‌های جدید تبدیل گفتار به متن خود را به‌صورت عمومی منتشر کند. این شرکت پیش‌تر نسخه‌های جدید Whisper را تحت مجوز MIT برای استفاده تجاری منتشر می‌کرد. هریس توضیح داده که مدل‌های جدید بسیار بزرگ‌تر از Whisper هستند و بنابراین برای انتشار عمومی مناسب نیستند. او می‌گوید:
«این مدل‌ها از نوعی نیستند که بتوانید به راحتی روی لپ‌تاپ خود اجرا کنید. ما می‌خواهیم اگر چیزی را به‌صورت متن‌باز منتشر می‌کنیم، با دقت این کار را انجام دهیم و مدلی را ارائه کنیم که واقعاً برای آن نیاز خاص مناسب باشد.»

لینک کوتاه:
https://www.payamesepahan.ir/Fa/News/949537/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

نجات جان 2 مسافر در باغ فدک اصفهان + تصاویر

دومین شب قدر در جوار گلستان شهدای اصفهان

سوال بیست‌ویکمین روز مسابقه طرح «زندگی با آیه‌ها» + فیلم

تجربه سفر یک‌روزه به کوهپایه اصفهان در نوروز 1404

شعرخوانی جالب دکتر کاکاوند

کامپیوتر بسیار قدیمی اپل 1 با قیمت 375 هزار دلار در مزایده فروخته شد

اپل خالق هدست ویژن پرو را مسئول توسعه سیری کرد

این سیستم دوربین ویوو X200 Ultra است

سوال روز بیست و یکم مسابقه «زندگی با آیه‌ها» در هرمزگان

ندای الغوث نطنزی‌ها در شب شهادت امیرالمومنین

هواشناسی امروز؛ 2 فروردین| ادامه بارش های بهاری

سوال روز بیست و یکم مسابقه زندگی با آیه‌ها در اصفهان

مسابقه زندگی با آیه ها در گلستان؛ سوال روز بیست ویکم

اسکان 100 هزار مسافر در شهر اصفهان طی 7 روز

المان‌های نوروزی مبارکه، رونق‌بخش بهار طبیعت و قرآن

نجوای «بِکَ یاالله» شب زنده داران کرمانی در دومین شب قدر

سفره هفت سین ساده پریناز ایزدیار / عکس

داستانک/ صاحب رستوران

متا مشغول آزمایش کامنت‌های نوشته شده با هوش مصنوعی در اینستاگرام است

تعرفه واردات تلفن همراه در سال 1404 مشخص شد

اندیشکده آمریکایی: حمله به ایران اشتباهی خطرناک است

تجلیل محمد کبیری از پاکبانان کیش: "کیش با تلاش شما، کیش می‌ماند"

احیای شب بیست و یکم ماه مبارک رمضان - اصفهان

هوای بارانی اصفهان سالم است

آماده‌باش 470 تیم امدادی در ارائه خدمات فوریتی/ بارش‌ رگباری و وزش تندباد در راه اصفهان

آلودگی هوای اصفهان امروز شنبه 2 فروردین 1404+ شاخص کیفی به تفکیک مناطق

استقرار 6 اتوبوس گردشگری در باغ فدک/«پارک آموزش ترافیک فدک» آماده بهره‌برداری است

خواندن؛ بهترین لذت گوته

پرپلکسیتی می‌خواهد تیک‌تاک را بخرد و الگوریتمش را متن‌باز کند

بیشترین تصادف‌های نوروز در اصفهان مربوط به جاده نایین - اردستان است

کاهش 10 درجه‌ای دما در آغاز بهار اصفهان

روند خدمات‌رسانی به مسافران نوروزی در اصفهان مثبت ارزیابی شده است

آخرین وضعیت مناطق زلزله‌زده در اصفهان

امدادرسانی به 73 خودرو در جاده‌های اصفهان

گامی برای بهبود فضای مجازی با رفع فیلتر دو سکوی خارجی

فارن پالیسی: آیا دولت ترامپ در حال تغییر نظم بین المللی است؟

جدول ساعت کار موظفی و تعطیلی کارگران در 1404

سازماندهی «کوه‌یاران» در پارک کوهستانی صفه

شب‌زنده‌داران حرم شاهچراغ (ع) در سوگ امام علی اشک ماتم ریختند + فیلم

عزاداری شب‌زنده‌داران در سوگ شهادت امام علی (ع) در حرم شاهچراغ + فیلم

شعری از راهان پارسی، شرکت‌کنندۀ فصل چهارم سرزمین شعر

سرویس اپل TV Plus ظاهراً سالیانه یک‌میلیارد دلار به اپل ضرر می‌زند

مشخصات و طراحی آنر 400 لایت لو رفت

739 واحد خون در شب 21 ماه مبارک رمضان در استان اصفهان اهدا شد

قربانیان سفره هفت سین! | رنجی که تحمل می‌کنند و…

طرز تهیه جواهر پلو مجلسی و لذیذ

سردار آزمون و خانواده اش کنار هفت سین+عکس

نوای «الغوث الغوث» شب زنده داران در شهر کریمه اهل بیت طنین انداز شد

قربانیان سفره هفت سین

عکس | قاب عاشقانه سردار آزمون و خانواده‌اش کنار سفره هفت‌سین