متا از مدل هوش مصنوعی LLaMA 2 Long رونمایی کرد؛ بهتر از GPT-3.5 Turbo
به تازگی متا بیسر و صدا از مدل هوش مصنوعی LLaMA 2 Long رونمایی کرده است. این مدل هوش مصنوعی در زمینه پاسخگویی به سوالات و درخواست طولانی کاربران مهارت دارد و بهتر از بسیاری از رقبای خود مانند GPT-3.5 Turbo و Claude 2 عمل میکند. جزئیات بیشتر را در ادامه این نوشتار از . بخوانید.
مدل هوش مصنوعی LLaMA 2 Long نسخه دیگری از مدل LLaMA 2 است که در تابستان امسال از راه رسید. مدل جدید هوش ممصنوعی متا میتواند دادهها ار از منابع مختلف دریافت و عملیاتهای مختلفی نظیر کدنویسی، فهم زبان، استدلال و محاوره را انجام دهد.
پیشتر اعلام شده بود که مدل هوش مصنوعی LLaMA 2 متا امکان بهرهمندی کاربران از مزیتهای هوش مصنوعی را بدون نیاز به اینترنت فراهم میکند. این مدل بهصورت متنباز بوده از طریق پلتفرم مایکروسافت Azure و AWS آمازون و دیگر سرویسدهندگان هوش مصنوعی در دسترس کاربران قرار میگیرد.
قابلیتهای مدل هوش مصنوعی LLaMA 2 Long
اما مدل هوش مصنوعی LLaMA 2 Long یک قابلیت ویژه دارد. این مدل بیش از همه روی متون طولانی آموزش دیده و میتواند حجم زیادی اطلاعات را از کاربر گرفته و آن را مدیریت کند. مدل LLaMA 2 Long میتواند بهتر از مدلهایی مثل GPT-3.5 Turbo و Claude 2 عمل کند.
بر اساس اعلام interestingengineering پژوهشگران متا برای آموزش این مدل هوش مصنوعی از 7 تا 70 میلیارد پارامتر استفاده کردهاند. سپس 400 میلیارد توکن داده دیگر شامل متونی طولانیتر به این ترکیب اضافه شد.
متا مدعی است که مدل LLaMA 2 Long میتواند سؤالاتی با طول 200 هزار کاراکتر که معادل یک کتاب 40 صفحهای است را درک کرده و پاسخهای باکیفیت بدهد. دانشمندان میگویند LLaMA 2 Long گامی به سمت ساخت مدلهای هوش مصنوعی جامع و همهمنظوره است که میتوانند به نیازهای مختلف کاربر پاسخ بدهند.
در همین رابطه بخوانید:
– مدل هوش مصنوعی بی نیاز از اینترنت LLaMA 2 معرفی شد
علاوه بر این متا میگوید LLaMA 2 را متنباز کرده است تا ایمنی این مدل هوش مصنوعی را ارتقا دهد. این شرکت معتقد است که با این کار، توسعهدهندگان و محققان میتوانند این مدل زبانی بزرگ را آزمایش کنند و مشکلات آن را بیابند.
منبع: https://www.shahrsakhtafzar.com/fa/news/47653-llama-2-long-outperforms-other-ai-models-in-long-queries