پیام سپاهان

آخرين مطالب

OpenAI مدل‌های گفتاری و نوشتاری جدیدی برای ایجنت‌های هوش مصنوعی معرفی کرد علمی

OpenAI مدل‌های گفتاری و نوشتاری جدیدی برای ایجنت‌های هوش مصنوعی معرفی کرد
  بزرگنمايي:

پیام سپاهان - دیجیاتو / البته OpenAI در حال حاضر قصد ندارد این مدل‌های جدید را به صورت عمومی منتشر کند.
OpenAI از ارتقاء مدل‌های هوش مصنوعی خود در زمینه تبدیل گفتار به متن و متن به گفتار خبر داد. این مدل‌های جدید که به API این شرکت اضافه شده‌اند، نسبت به نسخه‌های قبلی پیشرفت‌های قابل‌توجهی داشته‌اند و قابلیت‌های بیشتری را در اختیار توسعه‌دهندگان قرار می‌دهند.
به گفته OpenAI، این مدل‌های جدید بخشی از چشم‌انداز بزرگ‌تر این شرکت برای ساخت سیستم‌های خودکار یا «عامل‌های هوشمند» هستند که می‌توانند به‌طور مستقل وظایف مختلفی را برای کاربران انجام دهند. «اولیویه گودمن»، مدیر محصول اوپن‌ای‌آی، در این باره به TechCrunch توضیح داده که این ایجنت‌ها می‌توانند به‌عنوان چت‌بات‌هایی عمل کنند که با مشتریان یک کسب‌وکار تعامل می‌کنند. او پیش‌بینی کرد که در ماه‌های آینده شاهد ظهور تعداد بیشتری از این عامل‌ها خواهیم بود.
مدل تبدیل متن به گفتار OpenAI
مدل جدید تبدیل متن به گفتار OpenAI با نام gpt-4o-mini-tts، نه تنها گفتاری طبیعی‌تر و با جزئیات بیشتر تولید می‌کند، بلکه قابلیت تنظیم دقیق‌تری نیز دارد. توسعه‌دهندگان می‌توانند با استفاده از دستورات زبان طبیعی، نحوه بیان متن را کنترل کنند.
به‌عنوان مثال، می‌توان از این مدل خواست که مانند یک «دانشمند دیوانه» یا با صدایی آرام و شبیه به یک معلم صحبت کند. یک نمونه از صداهای تولید شده توسط این مدل را در ادامه می‌توانید بشنوید:

بازار


«جف هریس»، یکی از اعضای تیم محصول OpenAI، تأکید کرده که هدف این است که توسعه‌دهندگان بتوانند هم «تجربه صوتی» و هم «زمینه» را به دلخواه خود تنظیم کنند. او می‌گوید:
«در موقعیت‌های مختلف، شما نمی‌خواهید که صدایی یکنواخت و بدون احساس شنیده شود. مثلاً اگر در یک تجربه پشتیبانی مشتری هستید و می‌خواهید صدای ربات عذرخواهی کند، می‌توانید به مدل دستور دهید که این احساس را در صدا لحاظ کند.»
مدل‌های تبدیل گفتار به متن
OpenAI همچنین دو مدل جدید تبدیل گفتار به متن با نام‌های gpt-4o-transcribe و gpt-4o-mini-transcribe را معرفی کرده است که جایگزین مدل قدیمی Whisper می‌شوند. این مدل‌های جدید که روی مجموعه‌ داده‌های صوتی متنوع و باکیفیت آموزش دیده‌اند، می‌توانند صداهای با لهجه‌های مختلف و حتی در محیط‌های شلوغ را با دقت بیشتری تشخیص دهند.
هریس همچنین اشاره کرده که این مدل‌ها کمتر از Whisper دچار خطاهای «توهم» می‌شوند. مدل Whisper گاهی اوقات کلمات یا حتی جملات کاملی را که وجود نداشتند، به متن اضافه می‌کرد که این موضوع می‌توانست مشکلاتی را ایجاد کند. او می‌گوید:
«این مدل‌ها در مقایسه با Whisper بهبود چشمگیری داشته‌اند. دقت مدل‌ها برای ایجاد یک تجربه صوتی قابل اعتماد کاملاً ضروری است و دقت در اینجا به این معناست که مدل‌ها کلمات را به درستی تشخیص می‌دهند و جزئیاتی که نشنیده‌اند را به متن اضافه نمی‌کنند.»


بااین‌حال، دقت این مدل‌ها ممکن است بسته به زبانی که تبدیل می‌شود، متفاوت باشد.
برخلاف رویه گذشته، OpenAI قصد ندارد این مدل‌های جدید تبدیل گفتار به متن خود را به‌صورت عمومی منتشر کند. این شرکت پیش‌تر نسخه‌های جدید Whisper را تحت مجوز MIT برای استفاده تجاری منتشر می‌کرد. هریس توضیح داده که مدل‌های جدید بسیار بزرگ‌تر از Whisper هستند و بنابراین برای انتشار عمومی مناسب نیستند. او می‌گوید:
«این مدل‌ها از نوعی نیستند که بتوانید به راحتی روی لپ‌تاپ خود اجرا کنید. ما می‌خواهیم اگر چیزی را به‌صورت متن‌باز منتشر می‌کنیم، با دقت این کار را انجام دهیم و مدلی را ارائه کنیم که واقعاً برای آن نیاز خاص مناسب باشد.»

لینک کوتاه:
https://www.payamesepahan.ir/Fa/News/949537/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

کشاورزی اصفهان باید پابرجا بماند| ضرورت برندنیگ زعفران نصف جهان و بازاریابی مناسب

آموزش آشپزی / طرز تهیه جواهرپلو مجلسی

دانلود آواز باشکوه معین با آهنگ کعبه !

آغاز توزیع 20 هزار بسته هدیه گردشگری کاشان در نوروز 1404

6 دلیل مهاجرت ثروتمندان به امارات/ بهترین کشورها برای سرمایه داران کدام است؟

زیبایی شبنم قلی خانی کنار میز هفت سین + عکس

دیدار مدیر کل بنیاد مازندران از سه خانواده سه شهیدی

دیدار مدیر عامل بیمه دی کشور و مدیر کل بنیاد مازندران با والدین شهید گشت نورد در ساری

ورود توده‌های گردوخاک از جنوب غربی کشور از 3 فروردین ماه

شعری از سمانه خلف‌زاده، شرکت‌کنندۀ فصل چهارم سرزمین شعر

تبلت آنر پد X9a با نمایشگر 11.5 اینچی و باتری 8300 میلی‌آمپرساعتی معرفی شد

بنچمارک‌های گلکسی A56 سامسونگ با Exynos 1580

تراشه A20 اپل احتمالاً با فرایند 2 نانومتری ساخته می‌شود

مبلغ یارانه نقدی در سال 1404 چند هزار تومان است؟

کلنگ‌زنی نخستین پروژه سرمایه‌گذاری کشور سال 1404 در برخوار با حضور معاون رئیس جمهور

استان‌های خراسان، اصفهان، یزد و تهران در بحران آب + ویدیو

احداث ناحیه صنعتی پوشاک، کیف و کفش کشور نخستین پروژه سرمایه‌گذاری در راستای فرمایش مقام معظم رهبری است

تصاویر / قافله عزای حضرت علی(ع) در بازار اصفهان

فرماندار بهارستان مسافران را به پیوستن به «پویش نه به تصادف» دعوت کرد

شعر زیبای دکتر کاکاوند در مورد چای سرد

گوشی ریلمی V70 و V70s با مقاومت نظامی در چین معرفی شدند

یاهو نشریه تک‌کرانچ را به شرکت سرمایه‌گذاری خصوصی Regent فروخت

اردوغان در استانبول به‌دنبال چه چیزی است؟

وقتی سخنگوی کاخ سفید فرانسوی‌ها را تحقیر کرد (زیرنویس فارسی)

آغاز فعالیت پلیس اسکوترسوار در اصفهان

خبر جدید از زلزله نطنز

نقش‌آفرینی صنعت در اقتصاد ملی با تداوم توسعه و نوآوری

90 آتش‌نشان در باغ فدک مستقر شده‌اند

اصفهان با آمادگی کامل پذیرای مسافران نوروزی از سراسر کشور است

شاعرانه/ جهان و هرچه در او هست ملک شیرخداست

شاعرانه/ باز آمدم چون عیدِ نو، تا قفلِ زندان بشکنم

تراشه هواوی Pura X تأیید شد

ایلان ماسک: تسلا امسال 5 هزار ربات انسان‌نمای اپتیموس وارد بازار می‌کند

آمازون 47 درصد تخفیف برای جدیدترین آیپد اپل در نظر گرفت

توالی خشکسالی و سیلاب در بهار 1404

ماه دوم 1403؛ سقوط بال‌گرد رییس جمهور در ورزقان

خیز نوعثمانی‌ها برای مصادره نوروز!

پیام تسلیت رییس بنیاد شهید و امور ایثارگران در پی درگذشت مادر شهیدان والامقام «رحیمی»

زاینده‌رود؛ رودخانه‌ای که زاینده بود

پایانه‌های اصفهان در تعطیلات نوروز میزبان اجرای آئین‌های سنتی و مذهبی است

راه‌اندازی مسیر پروازی مشهد – کاشان – مشهد هواپیمایی چابهار

اسکان 57 هزار مسافر نوروزی در مدارس اصفهان

نطنز باز هم لرزید

زلزله نطنز خسارتی نداشت

21 هزار پرونده صنفی در تعزیرات حکومتی اصفهان باز شد

قاب عاشقانه و سه نفره سردار آزمون کنار سفره هفت‌سین

ذخیره سد زاینده‌رود به 162 میلیون مترمکعب رسید

زلزله دوباره در نطنز

نطنز بازهم لرزید

نظنز دوباره لرزید

ویکی پدیاجستجو