قابلیتهای صوتی و تصویری جدیدی برای ChatGPT معرفی شدند
منبع: https://rasanika.com
OpenAI از قابلیتهای صوتی و تصویری جدیدی برای ChatGPT رونمایی کرد. بهعنوان مثال، اکنون میتوانید مسائل ریاضی که بهصورت کتبی نوشته شدهاند را به این چتبات هوش مصنوعی ارائه کنید تا ChatGPT آن را بهصورت مرحلهبهمرحله حل کند.
بخشی از رویداد امروز OpenAI به قابلیتهای جدید ChatGPT اختصاص داده شد.
در ابتدا قابلیتهای صوتی این چتبات نمایش داده شد و مهندسین OpenAI از آن خواستند تا یک داستان درباره رباتها بسازد و آن را تعریف کند. نکته قابلتوجه دیگر اینکه در طول تعریف این داستان، «میرا موراتی»، مدیر ارشد فناوری OpenAI از آن خواست تا داستان را با صدای یک ربات واقعی تعریف کند و ChatGPT نیز بلافاصله صدای خود را تغییر داد.
علاوه بر این، هوش مصنوعی ChatGPT اکنون به دوربین گوشی کاربران نیز دسترسی دارد و میتواند براساس محتواهایی که از طریق دوربین تماشا میکند، وظایفی را انجام دهد.
برای نمایش این قابلیت، تیم OpenAI معادله ریاضی را روی کاغذ نوشتند و آن را به ChatGPT نشان دادند تا به حل آن کمک کند. در پاسخ، ChatGPT به جای ارائه پاسخ نهایی، آنها را راهنمایی کرد تا بهصورت گامبهگام پاسخ مسئله خود را پیدا کنند.
OpenAI که در همین رویداد از نسخه دسکتاپ ChatGPT رونمایی کرده بود، در این آزمایش به سراغ قابلیتهای مربوط به کدنویسی چتبات خود رفت و این مدل هوش مصنوعی توانست درباره کدهای در حال نوشتن در محیط دسکتاپ، اطلاعاتی ارائه کند و مشکلات احتمالی موجود در آنها را به کاربر اعلام کند.
علاوه بر این ، چتبات همچنین قادر به بررسی چارتها و ارائه بازخورد و اطلاعات واقعی درباره آنها است.
پس از آن، نوبت به قابلیتهای ترجمه ChatGPT رسید که با بهبودهای جدیدی همراه شده است.
در طول این رویداد، تیم OpenAI تواناییهای ChatGPT بهعنوان یک ابزار ترجمه همزمان را نشان دادند. هوش مصنوعی این شرکت، ابتدا کلماتی را به زبان ایتالیایی از موراتی دریافت کرد و سپس آنها را به انگلیسی تبدیل کرد. پس از آن نیز موراتی یک پاسخ انگلیسی به آن ارائه کرد و ChatGPT پاسخ او را به زبان ایتالیایی شرح داد.
بهنظر میرسد که OpenAI با ارائه این قابلیت، یک دستیار ترجمه مهم برای مسافران ارائه کرده است.
یکی از دیگر ویژگیهای معرفیشده مهم ChatGPT امکان تشخیص احساسات مانند شاد یا غمگینبودن با نگاهکردن به چهره کاربران از طریق دوربین است. البته این قابلیت طی چند هفته آینده عرضه خواهد شد.
OpenAI در طول این رویداد، همچنین از مدل هوش مصنوعی GPT-4o رونمایی کرد. طبق ادعای OpenAI، این مدل در درک و بحث در مورد تصاویری که توسط کاربران به اشتراک میگذارند بسیار بهتر از مدلهای موجود دیگر عمل میکند. بهعنوان مثال، با آن میتوان از یک منو به زبان دیگری عکس گرفت و از GPT-4o درخواست کرد تا آن را ترجمه کند.
در آینده نیز با کمک این مدل میتوان در موارد جالبتوجه دیگری نیز کمک گرفت. بهعنوان مثال، میتوان به ChatGPT یک بازی ورزشی زنده را نشان داد تا قوانین آن را برای شما توضیح دهد.