کارنگ رسانه اقتصاد نوآوری است. در کارنگ ما تلاش داریم کسبوکارهای نوآور ایرانی، استارتاپها، شرکتهای دانشبنیان و دیگر کسبوکارها کوچک و بزرگی که در بخشهای مختلف اقتصاد نوآوری در حال ارائه محصول و خدمت هستند را مورد بررسی قرار دهیم و از آینده صنعت، تولید، خدمات و دیگر بخشهای اقتصاد بگوییم. کارنگ رسانهای متعلق به بخش خصوصی ایران است.
کمپانی هوش مصنوعی OpenAI محصول جدید خود یعنی Sora را معرفی کرد. این کمپانی پیش از این با عرضه عمومی ChatGPT توجه بسیاری را به خود جلب کرده بود. با اینکه محصولات دیگری در زمینه هوش مصنوعی مولد، پیش از ChatGPT معرفی شده بودند، ولی این محصول توانست بخش قابل توجهی از مردم را متوجه هوش مصنوعی کند.
درباره محصول جدید این کمپانی هم انتظار میرود توجه بسیاری از مردم معطوف به ابزارهای تولید ویدیو از روی متن شود. آنگونه که این کمپانی مدعی شده، Sora یک مدل هوش مصنوعی است که میتواند صحنههای واقعی و تخیلی را از روی دستورالعملهای متنی خلق کند.
پیش از این، خلق عکسهای مصنوعی مبتنی بر هوش مصنوعی سروصدای زیادی به راه انداخته بود. در این زمینه کمپانی Midjourney یکی از شناختهشدهترین ابزارهای تبدیل متن به عکس را عرضه کرده است. با گسترش استفاده از ابزارهای Midjourney مسائل اخلاقی در زمینه خلق ویدیوهای مبتنی بر هوش مصنوعی سروصدای زیادی به پا کرده است. اکنون و در آستانه انتخابات ریاستجمهوی آمریکا عرضه Sora هم احتمالاً سروصدای زیادی به پا خواهد کرد.
در صفحه Sora در وبسایت این کمپانی نوشته شده که تمام ویدیوها را مدل هوش مصنوعی تولید کرده و هیچ دستکاری و تغییری در آنها صورت نگرفته است. همین گزاره باعث شده بسیاری این ویدیوها را خیرهکننده بدانند. بهعنوان نمونه ویدیویی که در ادامه مشاهده میکنید با این دستور ساخته شده است:
Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
نمونههای بسیار زیادی مشابه این ویدیو در صفحه Sora در وبسایت ChatGPT قابل مشاهده است. ویدیوهایی که در سبک واقعگرا، انیمیشن، تاریخی و… هستند و در یک کلام «خیرهکننده»اند و باورنکردنی. در یک سال گذشته توسعه شدید هوش مصنوعی و عرضه محصولات متعدد پرسشهای بسیاری را ایجاد کرده است. حالا و با این محصول به نظر میرسد پرسشهای بیشتری مطرح شود که این پیشرفتها قرار است تا کجا ادامه یابند.
اگر بخواهیم دانستههایمان درباره Sora را مرور کنیم باید زیر این چند مورد را خط بکشیم:
- Sora توان خلق ویدیوهایی تا حداکثر یک دقیقه را دارد؛ کمپانی مدعی شده Sora توانایی ساخت صحنههای پیچیده با چند کاراکتر، نمایش انواع حرکات و جزئیات دقیق سوژه و پسزمینه را دارد.
- Sora تلاش میکند کاراکترهایی خلق کند که عاری از احساسات نباشند؛ هرچند توجه به جزئیات نشان میدهد این ویدیوها مصنوعی هستند.
- Sora میتواند ویدیو را از روی عکس تولید کند و حتی ویدیوهای موجود را ترمیم کند.
- Sora میتواند ویدیوهایی با وضوح حداکثر 1080p تولید کند.
- Sora در حال حاضر بهصورت محدود در دسترس کاربران قرار گرفته تا توسط آنها ارزیابی شود.
پیش از این کسبوکارهایی مانند Runway و Pika مدلهای تبدیل متن به ویدیوی خود را عرضه کرده بودند؛ گوگل هم با Lumiere پا در این میدان گذاشته بود که ابزارهای متن به ویدئو و امکان خلق ویدیو از روی عکس را عرضه کرده است. OpenAI در یک گزارش فنی درباره Sora توضیح داده و به نظر میرسد از دیگر کسبوکارهای پیشرو در این حوزه توجه بیشتری را به خودش جلب کند.
شما چه فکر میکنید؟ محصول Sora را چگونه ارزیابی میکنید؟ آیا این محصولات میتوانند تأثیر جدی بر آینده نزدیک کسبوکارها داشته باشند؟ ایدههای خود را با ما در میان بگذارید.