اپل به پیشرفت‌‌های جدیدی در توسعه مدل‌های هوش مصنوعی چندوجهی دست یافت

هوش مصنوعی اپل

محققان اپل توضیح می‌دهند:

«ما نشان داده‌ایم که برای پیش‌آموزش چندوجهی در مقیاس بزرگ، استفاده از ترکیبی دقیق از تصویر-کپشن، متن-تصویر مداخله‌ای و داده‌های فقط متنی برای دستیابی به نتایج پیشرفته بسیار مهم است.»

با آموزش مدل‌ها براساس مجموعه داده‌های متنی که اطلاعات بصری و زبانی را شامل می‌شوند، این مدل‌های اپل موسوم به MM1 توانستند در وظایفی مانند نوشتن شرح تصاویر، پاسخ‌گویی به سؤالات بصری و استنتاج زبان طبیعی برتری داشته باشند. محققان همچنین متوجه شدند که انتخاب رمزگذار تصویر و وضوح تصاویر ورودی تأثیر زیادی روی عملکرد مدل‌ها دارد.

به گفته آن‌ها، بزرگ‌ترین مدل MM1 با 30 میلیارد پارامتر، توانایی خیره‌کننده‌ای در درک زمینه تصاویر از خود نشان داده است که با این شرایط، می‌تواند براساس تصاویر ورودی، استدلال چندمرحله‌ای داشته باشد.

منبع


کامنت ها