با هوش مصنوعی گوگل، کتاب داستان رایگان اختصاصی فرزند خود را بسازید (+ آموزش ساخت Storybook گوگل)
تصور کنید تنها با چند جمله ساده، بتوانید داستانی تصویری خلق کنید؛ داستانی با سبک هنری مورد علاقهتان، از انیمه گرفته تا فیلمهای به سبک بره ناقلا یا حتی با تصاویری که خودتان به سیستم میدهید! این دقیقاً همان ابزاری است که گوگل در ابزار تازه خود با عنوان کتاب داستان یا Storybook ارائه کرده؛ قابلیتی در دستیار هوش مصنوعی جمنای که هم هیجانانگیز است و هم گاهی عجیب!
در ادامه موج خروشانی که شرکتها برای افزودن قابلیتها و ابزارهای جدید به چتباتهای هوش مصنوعی خود دنبال میکنند، این بار شرکت گوگل را در رأس اخبار با یک ابزار جذاب میبینیم؛ این بار با ویژگی Storybook در چتبات هوش مصنوعی Gemini. قابلیتی که قرار است فقط با چند خط توضیح شما، یک کتاب داستان ۱۰ صفحهای با تصاویر رنگارنگ تحویل دهد. ایدهای فوقالعاده بهویژه برای والدینی که دنبال داستانهای سفارشی برای بچهها هستند.
برای ورود به صفحه استوری بوک گوگل کلیک کنید.
قابلیت استوری بوک گوگل چیست؟
این ابزار با ترکیب مدل زبانی مولد (LLM) و مدلهای تولید تصویر (Text-to-Image) کار میکند؛ همان تکنیکی که در ابزارهای گرافیکی جدید مثل Imagen یا حتی رقبای مستقیمی مثل DALL·E دیدهایم. گوگل با Storybook میخواهد کاری کند که شما سبک تصویر مورد علاقهتان را انتخاب کنید؛ از انیمه گرفته تا کلیمیشن (پویانمایی با خمیر) یا حتی کمیک.
حتی میتوانید تصویری مرجع را برای جمنای آپلود کنید تا این چتبات بر اساس آن تصویرسازی کرده و داستانسرایی کند. نکته جالب اما آنجاست که با لحن و بیانی مانند قصهگوهای حرفهای میتوانید صوت داستان را هم از Gemini تحویل بگیرید.
ایده جذاب، اما نتایج عجیب!
تا به اینجای قصه باید گفت که همهچیز روی کاغذ عالی است، اما نگاهی به نمونههای تولیدشده نشان میدهد این ابزار هنوز با یک مشکل قدیمی دستبهگریبان است: توهمات بصری یا همان خطاهای خلاقانه مدلهای هوش مصنوعی. برای مثال، یکی از کاربران داستانی درباره یک گربهماهی در آکواریوم نوشته ولی نتیجه آن بیشتر به سبک داستانهای ترسناک میخورد تا داستانی برای یک کودک؛ این کاربر گزارش کرده که خروجی گوگل، تصویری از یک ماهی با یک دست انسانی تولید کرده است؛ بله ماهییی که بازو انسانی دارد!
برای مثال میتوانید در این لینک، داستانی که ما برای پسر بچهای که در پارک نزدیک منزل خود با ابزاری از یک تمدن فضایی روبرو میشود را از گوگل خواستیم، بخوانید.
در داستانی دیگر، تصویر «سس اسپاگتی» بهجای یک غذای خوشطعم، بیشتر شبیه یک صحنه جرم کارتونی شده. یا در تصویری از یک مادر و پسر که مشغول تماشای تلویزیون بودند، صفحه نمایش در سمت اشتباهی قاب تصویر قرار گرفته است. حتی در ویدیوی رسمی گوگل، زنی در حال «ساخت سفینه فضایی» نشان داده میشود، اما با آچاری در دست که به بدنهای نامعلوم ضربه میزند. صحنهای که بیشتر به رؤیای یک نقاش سوررئالیست میماند تا یک تصویر واقعی.
البته در تستهایی که ما در شهر سختافزار انجام دادیم نیز ظاهراً مشکل دیگر، پشتیبانی از زباتهای با خطالرسم راست به چپ است و در بخش نگارش این زبانها مشکل نمایش وجود خواهد داشت. همچنین وقتی قصهگوی فارسی را انتخاب کنید در ادای آوای برخی کلمات و حرکات فتحه و ضمه و کسره نیز اشتباهاتی وجود دارد که پیش از این نیز در موتورهای مولد صوت وابسته به گوگل و بسیاری از شرکتها دیده بودیم.
چرا این اتفاق میافتد؟
برای درک مشکل، باید به محدودیتهای فنی نگاه کنیم. مدل Storybook بر پایه معماری دیفیوژن (Diffusion) ساخته شده است. این مدلها در ترکیب مفاهیم خوب هستند، اما پاشنه آشیل آنها زمانی است که باید بین منطق تصویری و خلاقیت توازن برقرار کنند. دلیل این خطاها آن است که مدل درک عمیقی از روابط فیزیکی یا عملکردی اشیا ندارد و فقط دادهها را تقلید میکند.
حتی وقتی تصویری بهعنوان مرجع آپلود میکنید، خروجی الزاماً دقیق نیست. در مثال دیگری گزارش شده که یک کاربر تصویری از گربه کارتونی موردعلاقهاش را بارگذاری کرده و از سیستم خواسته تا همان را در داستان بیاورد. اما تصویر خروجی نه از نظر رنگ و نه فرم به نسخه اصلی نزدیک نبودهاند. این نشان میدهد که جمنای هنوز در بازشناسی ویژگیهای سطح بالا دارای مشکلات عمیق است.
چطور استوری بوک برای کودک خود بسازیم؟
به بیان ساده، هیچ کار خاصی نیاز نیست. فقط کافیست وارد این لینک شده و پس از لاگین کردن در حساب گوگل خود، داستانی که در نظر دارید را در چند کلمه بگویید.
در نظر داشته باشید که هر چه توضیحات بیشتری بدهید، داستان خلق شده توسط جمنای، به ایده شما نزدیکتر خواهد بود.
همچنین در صفحه باز شده میتوانید با کلیک روی دکمه + تصویر مورد نظر شخصیت داستان خود را نیز برای گوگل ارسال کنید.
فعلاً اگر قصد دارید با Gemini یک کتاب داستان برای فرزندتان بسازید، آماده باشید که شاید ماهی شما یک بازو داشته باشد و سس اسپاگتیتان شبیه جنایتکار حرفهای شود! با این وجود شاید بهتر باشد خودتان هم امتحانش کنید.
منبع: https://www.shahrsakhtafzar.com/fa/news/57158-google-storybook-announced