قابلیت‌های صوتی و تصویری جدیدی برای ChatGPT معرفی شدند

لوگوی چت جی پی تی رسانیکامنبع: https://rasanika.com

OpenAI از قابلیت‌های صوتی و تصویری جدیدی برای ChatGPT رونمایی کرد. به‌عنوان مثال، اکنون می‌توانید مسائل ریاضی که به‌صورت کتبی نوشته شده‌اند را به این چت‌بات هوش مصنوعی ارائه کنید تا ChatGPT آن را به‌صورت مرحله‌به‌مرحله حل کند.

بخشی از رویداد امروز OpenAI به قابلیت‌های جدید ChatGPT اختصاص داده شد.

در ابتدا قابلیت‌های صوتی این چت‌بات نمایش داده شد و مهندسین OpenAI از آن خواستند تا یک داستان درباره ربات‌ها بسازد و آن را تعریف کند. نکته قابل‌توجه دیگر اینکه در طول تعریف این داستان، «میرا موراتی»، مدیر ارشد فناوری OpenAI از آن خواست تا داستان را با صدای یک ربات واقعی تعریف کند و ChatGPT نیز بلافاصله صدای خود را تغییر داد.

علاوه بر این، هوش مصنوعی ChatGPT اکنون به دوربین گوشی کاربران نیز دسترسی دارد و می‌تواند براساس محتواهایی که از طریق دوربین تماشا می‌کند، وظایفی را انجام دهد.

برای نمایش این قابلیت، تیم OpenAI معادله ریاضی را روی کاغذ نوشتند و آن را به ChatGPT نشان دادند تا به حل آن کمک کند. در پاسخ، ChatGPT به جای ارائه پاسخ نهایی، آن‌ها را راهنمایی کرد تا به‌صورت گام‌به‌گام پاسخ مسئله خود را پیدا کنند.

OpenAI که در همین رویداد از نسخه دسکتاپ ChatGPT رونمایی کرده بود، در این آزمایش به سراغ قابلیت‌های مربوط به کدنویسی چت‌بات خود رفت و این مدل هوش مصنوعی توانست درباره کدهای در حال نوشتن در محیط دسکتاپ، اطلاعاتی ارائه کند و مشکلات احتمالی موجود در آن‌ها را به کاربر اعلام کند.

علاوه بر این ، چت‌بات همچنین قادر به بررسی چارت‌ها و ارائه بازخورد و اطلاعات واقعی درباره آن‌ها است.

پس از آن، نوبت به قابلیت‌های ترجمه ChatGPT رسید که با بهبودهای جدیدی همراه شده است.

در طول این رویداد، تیم OpenAI توانایی‌های ChatGPT به‌عنوان یک ابزار ترجمه همزمان را نشان دادند. هوش مصنوعی این شرکت، ابتدا کلماتی را به زبان ایتالیایی از موراتی دریافت کرد و سپس آن‌ها را به انگلیسی تبدیل کرد. پس از آن نیز موراتی یک پاسخ انگلیسی به آن ارائه کرد و ChatGPT پاسخ او را به زبان ایتالیایی شرح داد.

به‌نظر می‌رسد که OpenAI با ارائه این قابلیت، یک دستیار ترجمه مهم برای مسافران ارائه کرده است.

یکی از دیگر ویژگی‌های معرفی‌شده مهم ChatGPT امکان تشخیص احساسات مانند شاد‌ یا غمگین‌بودن با نگاه‌کردن به چهره کاربران از طریق دوربین است. البته این قابلیت طی چند هفته آینده عرضه خواهد شد.

OpenAI در طول این رویداد، همچنین از مدل هوش مصنوعی GPT-4o رونمایی کرد. طبق ادعای OpenAI، این مدل در درک و بحث در مورد تصاویری که توسط کاربران به اشتراک می‌گذارند بسیار بهتر از مدل‌های موجود دیگر عمل می‌کند. به‌عنوان مثال، با آن می‌توان از یک منو به زبان دیگری عکس گرفت و از GPT-4o درخواست کرد تا آن را ترجمه کند.

در آینده نیز با کمک این مدل می‌توان در موارد جالب‌توجه دیگری نیز کمک گرفت. به‌عنوان مثال، می‌توان به ChatGPT یک بازی ورزشی زنده را نشان داد تا قوانین آن را برای شما توضیح دهد.