اپل به پیشرفتهای جدیدی در توسعه مدلهای هوش مصنوعی چندوجهی دست یافت
منبع: https://rasanika.com
محققان اپل توضیح میدهند:
«ما نشان دادهایم که برای پیشآموزش چندوجهی در مقیاس بزرگ، استفاده از ترکیبی دقیق از تصویر-کپشن، متن-تصویر مداخلهای و دادههای فقط متنی برای دستیابی به نتایج پیشرفته بسیار مهم است.»
با آموزش مدلها براساس مجموعه دادههای متنی که اطلاعات بصری و زبانی را شامل میشوند، این مدلهای اپل موسوم به MM1 توانستند در وظایفی مانند نوشتن شرح تصاویر، پاسخگویی به سؤالات بصری و استنتاج زبان طبیعی برتری داشته باشند. محققان همچنین متوجه شدند که انتخاب رمزگذار تصویر و وضوح تصاویر ورودی تأثیر زیادی روی عملکرد مدلها دارد.
به گفته آنها، بزرگترین مدل MM1 با 30 میلیارد پارامتر، توانایی خیرهکنندهای در درک زمینه تصاویر از خود نشان داده است که با این شرایط، میتواند براساس تصاویر ورودی، استدلال چندمرحلهای داشته باشد.
منتشر شده در رسانیکا، پلتفرم اشتراکگذاری محتوا
ثبتشده توسط:
کامنت ها