به گزارش خبرگزاری مهر به نقل ازتک کرانچ، GPT‑Realtime‑۲ یک مدل صوتی جدید اوپن ای آی است که برای ایجاد شبیه سازی های صوتی واقع گرایانه که قادر به محاوره با کاربر هستند، ساخته شده است. با این وجود اپ مذکور برخلاف نسخه های پیشین(GPT-Realtime-۱.۵)، این ابزار با قابلیت استدلال چت جی پی تی ۵ ساخته شده که به گفته اوپن ای آی برای اجرای دستورهای پیچیده تر کاربران ساخته شده است.
این شرکت همچنین ابزار « GPT‑Realtime‑Translate» را راه انداز می کند که سرویس ترجمه لحظه ای را فراهم می کند که در مکالمه با کاربر همگام است. این ویژگی شامل ۷۰ زبان ورودی است. این موارد شامل زبان های قابل درک برای مدل و ۱۳ زبان خروجی است که محتوا را به گوینده منتقل میکند، است.
همچنین این شرکت یک قابلیت رونویسی است که GPT-Realtime-Whisper نامیده می شود و به کاربران امکان تبدیل سخن به متن به طور زنده را می دهد.
سازنده چت جی پی تی در این باره می گوید: مدلهایی که ما در حال عرضه آنها هستیم، صدا را در لحظه از تماس و پاسخ ساده به رابطهای صوتی منتقل میکنند که واقعاً کارایی دارند. این مدل ها می توانند گوش دهند، استدلال، ترجمه، رونویسی کنند و همزمان با پیشرفت مکالمه، عمل کنند.
هدف این به روز رسانی ها شرکت هایی هستند که می خواهند قابلیت های سرویس به مشتریان را گسترش دهند. با این وجود اوپن ای آی اشاره می کند ویژگی های جدید در حوزه های مختلفی از جمله آموزش، رسانه، رویدادها و غیره کاربرد دارد.