Phi-3-vision معرفی شد؛ مدل هوش مصنوعی مایکروسافت برای درک تصاویر و نمودارها
مایکروسافت به تازگی از مدل هوش مصنوعی Phi-3-vision رونمایی کرده که میتواند به تصاویر نگاه کرده و درباره آنها اطلاعاتی به شما ارائه کند. این مدل 4.2 میلیارد پارامتری اکنون در اختیار توسعهدهندگان قرار گرفته و در آینده برای عموم کاربران منتشر خواهد شد. جزئیات بیشتر درباره مدل Phi-3-vision را در ادامه این نوشتار از . بخوانید.
بر اساس گزارش mspoweruser مایکروسافت نسخه جدیدی از مدل زبانی کوچک Phi-3 خود را معرفی کرد که Phi-3-vision نام دارد. این نسخه جدید میتواند به تصاویر نگاه کند و درباره آن اطلاعاتی به شما ارائه کند.
Phi-3-vision یک مدل چندوجهی بوده و میتواند هم متن و هم تصاویر را درک کند و بهترین استفاده را در گوشیهای موبایل ارائه میکند. مایکروسافت میگوید Phi-3-vision که اکنون بهصورت پیشنمایش عرضه شده است، یک مدل 4.2 میلیارد پارامتری است که میتواند وظایف استدلال بصری کلی مانند پرسیدن سؤال در مورد نمودارها یا تصاویر را انجام دهد.
البته Phi-3-vision به مراتب بسیار کوچکتر از سایر مدلهای هوش مصنوعی متمرکز بر تصویر مانند DALL-E یا Stable Diffusion است. برخلاف آن مدلها، Phi-3-vision توانایی تولید تصویر ندارد، اما میتواند محتوای یک تصویر را درک کند و آن را برای کاربر تجزیهوتحلیل کند.
مایکروسافت در ماه آوریل مدل هوش مصنوعی Phi-3-mini را معرفی کرد. کوچکترین مدل خانواده Phi-3 با 3.8 میلیارد پارامتر در اختیار کاربران قرار گرفته است. همچنین خانواده هوش مصنوعی Phi-3 شامل دو مدل دیگر Phi-3-small با 7 میلیارد پارامتر و Phi-3-medium با 14 میلیارد پارامتر است.
Phi-3-vision اکنون بهصورت پیش نمایش در دسترس است و درباره زمان عرضه جهانی آن اطلاعاتی وجود ندارد. سایر اعضای این خانواده نیز از طریق کتابخانه مدل Azure در دسترس هستند.
منبع: https://www.shahrsakhtafzar.com/fa/news/50919-microsoft-announces-phi-3-vision-a-new-multimodal