Lee Unkrichیکی از انیماتورهای شاخص و مهم استودیو پیکسار است و بزرگترین موفقیت خود را به پویانمایی ” کوکو” مدیون است. زمانیکه لی به عنوان یک دانش آموز سال هفتم در مدرسه تحصیل میکرد عکسی از یک لوکوموتیو را روی اولین رایانه مدرسه خود مشاهده کرد که برای او شگفت انگیز بود و اگرچه اطلاعاتی در زمینه هوش مصنوعی و خلاقیت نداشت، اما فکر میکرد که خلق چنین اثری همانند یک جادو است.
بعدها لی یاد گرفت که آثار هنری دیجیتالی به راحتی و تنها از طریق بیان خلق نمیشوند و در عوض، بسیاری از متخصصان دست به دست هم میدهند تا با توسعه برنامه های مختلف در زمینه طراحی و در نهایت طراحی و رندر گرفتن این تصاویر را بسازند.
حالا لی داستان ما بزرگ شده و با هوش مصنوعی DALLE_E سر و کار دارد که میتواند بر مبنای منابع هنری انسانی و تنها از طریق دستور، آثاری پیچیدهتر از یک قطار را خلق کند و در شبکههای اجتماعی مختلف به اشتراک گذاشته شود.
زمانیکه او برای اولین بار از این هوش مصنوعی استفاده میکند، دوباره شگفتی و هیجان کودکی به زندگی او برمیگردد و دیگر از او دور نمیشود. وقتی که از نتیجه دستور خود خروجی میگیرد به یکباره شوکه میشود و با اشک هایی در چشم به خود میگوید که این معجزه است.
ماشینها و هوش مصنوعی به شکل غیرقابل باوری از حد عملکرد خود پا را فراتر گذشتهاند. در چند سال گذشته، بر این باور بودیم که رایانه و هوش مصنوعی نمیتواند به قدری پیشرفت کند که از خلاقیت خود استفاده کند یا از اثری الهام بگیرد، اما به یکباره میلیونها انسان در سطح جهان در حال استفاده از هوش مصنوعیهای مبتنی بر تولید تصاویر هستند و از آنها برای آراستن محتواهای اینترنتی، عکس پروفایل و حتی پوستر استفاده میکنند.
تمامی کاربران این هوش مصنوعی همانند لی متخصص هنر و کارگردان پویانمایی داستان اسباب بازی های ۳ و کوکو نیستند که برنده جایزه اسکار باشند و همین دلیل برای بسیاری از فعالان حوزه هنر و سینما جالب و گاهی تکان دهنده است.
محتوایی که توسط هوش مصنوعی روی صفحه نمایش داده میشود از نظر عمق واقعیت بسیار عجیب است. به همین دلیل است که بسیاری از کاربران شبکههای اجتماعی و حتی هنرمندان هنگام مشاهده چنین آثاری شوکه میشوند.
در حال حاضر، چهار سرویس هوش مصنوعی به نام های Midjourney, Stable Diffusion, Artbreeder و DALL-E روزانه بیش از ۲۰ میلیون عکس را تولید میکنند. با قلم طراحی که هوش مصنوعی به دست دارد باید انتظار آن را داشته باشیم که تا چند سال آینده زندگی ما به یک شگفتانه تبدیل شود و هر چه از عمر هوش مصنوعی میگذرد، مهارتها و خلاقیت به شکل سریعتر و غنیتری رشد میکنند.
با وجود اینکه هوش مصنوعی در این زمینه به خوبی عمل میکند، اما آنها به گونهای عجیب و غریب و بیگانه هستند که حتی سازندگان هم درک درستی از رازهای آنها ندارند. به عنوان نمونه، آنها تصاویری را میسازند که به ذهن هیچ انسانی خطور نمیکند و حتی جزییاتی در آثار آنها نهفته است که هیچ هنرمندی نمیتواند آنرا تصور کند.
آنها همچنین قادر هستند تا از یک دستور و توصیف، تصاویر متنوعی را تولید کنند که تکرار در آنها بسیار اندک است. در نهایت، آنها از یک نقطه قوت بهره میبرند: هوش مصنوعی های تولید تصویر میتوانند آثاری مرتبط به توضیحات قابل فهم را تولید کنند که در مقابل میتواند کاملا غیر منتظره باشد.
زمانیکه با هیجان و خوشحالی منتظر تولید تصویر توسط هوش مصنوعی هستیم، در واقعیت فراموش میکنیم که ما به آنها خلاقیتی را اعطا کردیم که تا دیروز از داشتن آن حس غرور داشتیم و اکنون ممکن است به یکباره به این نتیجه برسیم که هوش مصنوعی یکی از عناصر اصلی در خلقت انسان را اذعان خود کرده و هرچقدر که میگذرد فاصله هنرمندان با هوش مصنوعی بیشتر میشود.
چه کسی میتواند در معیارهایی مانند، سرعت، به صرفه بودن و مقیاس با هوش مصنوعی رقابت کند؟ به گفته نویسنده وبسایت Wired، او ۶ ماه از زمان خود را صرف استفاده از هوش مصنوعی تولید تصویر کرد و حتی بعضی شب ها را نخوابید تا خلاقیتهای بیشتری را مشاهده کند و طعم شیرین زیبایی را بچشد.
او پس از مصاحبه با سازندگان هوش مصنوعیهای تولید تصویر، خاطرنشان کرد که هوش مصنوعی میتواند نگرش و نحوه تولید هنر را اصلاح کند و هیچ هنرمندی قرار نیست از کار خود استعفا دهد یا به دلیل عملکرد قوی هوش مصنوعی به صنعت دیگری مهاجرت کند.
اقرار نیست اگر بگوییم که تصاویر تولید شده به لطف همکاری انسان و هوش مصنوعی خلق میشوند. یکی از رازهای پنهان در نحوه عملکرد هوش مصنوعی این است که حتی بهترین برنامهها هم تنها از طریق نوشتن دستور تصویر تولید نمیکنند و بلکه از همان دستورات برای برقراری ارتباط با انسان ها بهره میبرند.
پروسه تولید هر تصویر توسط هر نفر و در هر ساعت با هر دستور متفاوت باعث میشود تا تمامی دادههای جمع آوری شده به پیشرفت عملکرد هوش مصنوعی و یادگیری ماشین بدل شود و این پروسه همچنان ادامه خواهد داشت.
هوش مصنوعی های تولید تصویر حاصل ازدواج دو فناوری انقلابی و جدا از هم هستند. یکی از آنها فناوری تاریخی Deep learning neural است که میتواند تصاویر واقع گرایانه و منطقی را تولید کند. دیگر عضو جدایی ناپذیر این داستان مدلهای زبان طبیعی هستند که میتوانند به عنوان رابط موتورهای تولید تصویر مورد استفاده قرار بگیرند.
بنابراین، این دو فناوری تبدیل به تولید کننده تصویر شدند و سپس محققان اینترنت را برای یافتن عکسهایی همانند، کپشنها و عکسهای مجاور متن جستجو کردند و از میلیاردها مدل برای اتصال شکل های ظاهری به کلمات و کلمه به اشکال استفاده کردند.
با این ترکیب، کاربران میتوانند تصویر مشاهده شده خود را با کلمات و دستورهای مختلف توصیف کنند و سپس هوش مصنوعی نیز تصویری مرتبط با دستورات را برای آنها تولید میکند.
دانشمندان حال حاضر گوگل مدلهای محاسباتی را اختراع کردهاند که در هسته تولید کنندههای تصاویر امروزی قرار دارد، اما بدلیل نگرانیهای این شرکت درباره نحوه برخورد و استفاده کاربران، هنوز از آن پرده برداری نشده است.
بدون شک، هر ۴ پلتفرم تولید عکس که مورد استفاده بسیاری از کاربران قرار میگیرند به عنوان یک استارت آپ شناخته میشوند که هیچ میراثی برای محافظت از خود ندارند. Midjourney یک استارت آپ تازه تاسیس است که توسط دیوید هولز بنیان گذاری شد.
رابط این هوش مصنوعی و کاربران یک سرور دیسکورد فوق العاده شلوغ است و تمامی دستورها و کارها از مردم شروع شده است. DALL_E دومین هوش مصنوعی تولید تصویر است که محصول سازمان غیرانتفاعیOpen AI، ایلان ماسک و سایر اعضا است. Stable Diffusion نیز در سال ۲۰۲۲ و توسط Emad Mostaque توسعه یافت که به عنوان یک کارآفرین اروپایی از او یاد میشود.
Stable Diffusion برعکس سایر موارد، یک پروژه متن باز است که هرشخصی میتواند نرم افزار آنرا دانلود کند و روی سیستم عامل خود استفاده کند. این ویژگی متمایز باعث شده تا کاربران بیشتر از قبل با هوش مصنوعی تعامل داشته باشند و هوش مصنوعیهای تولید تصویر به شکل اجتماعی توزیع شود.
چرا بسیاری از مردم نسبت به استفاده از هوشهای مصنوعی رغبت نشان میدهند؟ بسیاری از عکسها به دلایل مشابهی تولید میشوند و آن هم زیبایی و لذت بردن از هنر است. هوشهای مصنوعی تولید تصویر هیچگاه آثار تکراری خلق نمیکنند و مخصوصا به گونهای توسعه یافتهاند که میتوانند با یادگیری از دستورات آثاری جدید و شگفت انگیزی را خلق کنند که علاقمند و حتی هنرمند نمیتواند همانند آنرا تصور کنند.
همانند سایر هنرها، تصاویر نیز میتوانند شفابخش و و زنده باشند. مردم همانطور که بخشی از وقت خود را صرف دیدن فیلم و حتی طراحی در روزهای تعطیل میکنند، میتوانند به تولید تصاویر مختلف بپردازند و آنها را در اینترنت و شبکههای اجتماعی مختلف به اشتراک بگذارند.
این ۴ هوش مصنوعی پذیرای تمامی ایدههای واقعی و تخیلی شما هستند؛ به عنوان نمونه، میتوانید شمایل موجودات بهشتی و حتی شخصیتهای خشن را در سر بپرورانید و سپس آنها را در قالب نوشتاری به هوش مصنوعی خود ارائه دهید تا نتیجههای مختلفی را دریافت کنید.
Holz که خالق Midijourney است میگوید:
بخش قابل توجهی از استفاده روزانه کاربران از هوشهای مصنوعی تولید تصویر به منظور ” هنر درمانی” است.
این تصاویر اگرچه ممکن است از لحاظ هنری بسیار فریبنده و زیبا نباشند، اما از لحاظ درک و محتوای عمیق میتواند نظر بسیاری از کاربران را به خود جلب کنند. آثار هنری به ما کمک میکنند تا بفهمیم چه چیزی در سر و زندگی مردم میگذرد.
ماشینها میتوانند طیف گستردهای از انواع تصاویر فانتزی را تولید کنند، ولی شرکت سازنده دسترسی به محتوای جنسی و خشونت را برای کاربران منع کرده است. با این وجود، دسترسی به این هوش مصنوعی روی دسکتاپ یکی از اتفاقات جالب است و کاربران میتوانند از آن روی فوتوشاپ نیز استفاده کنند.
تصاویر تولید شده همچنین میتوانند برای سایر مصارف نیز کاربردی باشند. به عنوان نمونه، شما در حال جمع آوری و نوشتن گزارشی مبنی بر بازیافت تجهیزات پلاستیکی بیمارستانها و استفاده دوباره هستید. در این حالت اگرچه، میتوانید برای بخش تصاویر سراغ مواردی بروید که توسط انسانها طراحی شدهاند، اما تصاویر تولید شده توسط هوش مصنوعی از مواردی هستند که به راحتی منظور شما را درک میکنند و تصویری مناسب با مضمون شما تولید میکنند.
چیزی که ما از هوش مصنوعی میدانیم این است که آنها در زمینه همکاری و کارهای مشارکتی عالی هستند. در گذشته بسیاری بر این باور بودند که هوش مصنوعی با پیشرفت فناوری شغل بسیاری از مردم را میگیرد و ما بخش قابل توجهی از زندگی را در خانههای خود میگذرانیم.
به عنوان نمونه، در سال ۱۸۰۰ و با رشد فناوری عکاسی، بسیاری از جواب این سوال واهمه داشتند که آیا تصاویر پورتره که توسط هنرمندان کشیده میشود را کنار خواهیم گذاشت و در این حوزه جایی برای انسانها نیست؟ اما جواب این سوال به هیچ وجه به نه بدل نشد و تاریخ نگاری به نام Hans Rossboom تنها یک نقاش را یافت که کار خود را برای همیشه ترک کرده بود.
اگر اینگونه فکر کنیم، بنابراین باید حوزه عکس برداری را با در نظر گرفتن میلیاردها تلفن همراه، فناوریهای جدید و ۹۵ میلیون عکس آپلود شده در یک روز در اینستاگرام تعطیل کنیم.
از اینرو، بهتر است به جای ترسیدن از هوش مصنوعی و تولید افکار منفی به این موضوع فکر کنیم که هوش مصنوعی به ما چه چیزی یاد میدهد؟ یکی از بزرگترین دستاوردهای انسان پس از توسعه این نوع از هوشهای مصنوعی خلاقیت است.
خلاقیت بنیادیتر از آن چیزی است که ما تصور میکنیم و یک نوع آگاهی مستقل است. ما میتوانیم خلاقیت را در زمینههای مختلفی مانند: دیپ لرنینگ و شبکه عصبی بکار بگیریم. الگوریتمهای الگوی تشخیص دادههای بزرگ برای مهندسین این پروسه الزامی خواهند بود و بدون توقف به ما کمک خواهند کرد.
محققان فعال در زمینه خلاقیت به مفهومی فوق العاده ارزشمند و تاثیر گذار در سطح جهان به نام ” خلاقیت سطح بالا” دست یافته اند که ارزش آن به اندازه DNA شگفت انگیز، و به اندازه تابلو گویرنیکای پیکاسو تکان دهنده است. این دستاورد کمیاب و خاص، انسان را از مسیر پایهای و بنیادین لمس میکند و دورتر از آن چیزی است که حتی هوش مصنوعی بتواند آنرا حس کند.
برای برقراری ارتباط عمیق با یک انسان میبایست از خلاقیت استفاده کنیم و نباید خلاقیت سطح بالا را با خلاقیت سطح متوسط و پایین اشتباه بگیریم. خلاقیت معمولی و کوچک از مواردی هستند که هنرمندان، طراحان و مردم از آنها برای تولید آثار خود استفاده میکنند و با طراحی لوگو و حتی جلد کتاب هنر خود را به نمایش میگذارند.
بنابراین، اکثر هنرهای انسان از گذشته تا حال در زیر مجموعه خلاقیت سطح پایین قرار میگیرند و این دقیقا چیزی است که هوش مصنوعی به آن نیاز دارد.
برای اولین بار در تاریخ، انسانها میتوانند از خلاقیت در ابعاد مختلف استفاده کنند و از سرعت، قیمت کمتر و مقیاس آن لذت ببرند. امروزه برای دستیابی به خلاقیت تنها نیاز به کد و کلمه درست و بهینه دارید تا شما را به خواسته هایتان برساند و شما را نسبت به دیگران متمایز کند.
منبع : Wired