کارنگ، رسانه اقتصاد نوآوری ایران
رسانه اقتصاد نوآوری ایران

کمپانی خالق ChatGPT از Sora رونمایی کرد: خلق ویدیو از روی متن

کمپانی هوش مصنوعی OpenAI محصول جدید خود یعنی Sora را معرفی کرد. این کمپانی پیش از این با عرضه عمومی ChatGPT توجه بسیاری را به خود جلب کرده بود. با اینکه محصولات دیگری در زمینه هوش مصنوعی مولد، پیش از ChatGPT معرفی شده بودند، ولی این محصول توانست بخش قابل توجهی از مردم را متوجه هوش مصنوعی کند.

درباره محصول جدید این کمپانی هم انتظار می‌رود توجه بسیاری از مردم معطوف به ابزارهای تولید ویدیو از روی متن شود. آن‌گونه که این کمپانی مدعی شده، Sora یک مدل هوش مصنوعی است که می‌تواند صحنه‌های واقعی و تخیلی را از روی دستورالعمل‌های متنی خلق کند.

پیش از این، خلق عکس‌های مصنوعی مبتنی بر هوش مصنوعی سروصدای زیادی به راه انداخته بود. در این زمینه کمپانی Midjourney یکی از شناخته‌شده‌ترین ابزارهای تبدیل متن به عکس را عرضه کرده است. با گسترش استفاده از ابزارهای Midjourney مسائل اخلاقی در زمینه خلق ویدیو‌های مبتنی بر هوش مصنوعی سروصدای زیادی به پا کرده است. اکنون و در آستانه انتخابات ریاست‌جمهوی آمریکا عرضه Sora هم احتمالاً سروصدای زیادی به پا خواهد کرد.

در صفحه Sora در وب‌سایت این کمپانی نوشته شده که تمام ویدیوها را مدل هوش مصنوعی‌ تولید کرده و هیچ‌ دستکاری و تغییری در آنها صورت نگرفته است. همین گزاره باعث شده بسیاری این ویدیوها را خیره‌کننده بدانند. به‌عنوان نمونه ویدیویی که در ادامه مشاهده می‌کنید با این دستور ساخته شده است:

Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

نمونه‌های بسیار زیادی مشابه این ویدیو در صفحه Sora در وب‌سایت ChatGPT قابل مشاهده است. ویدیوهایی که در سبک واقع‌گرا، انیمیشن، تاریخی و… هستند و در یک کلام «خیره‌کننده»‌اند و باورنکردنی. در یک سال گذشته توسعه شدید هوش مصنوعی و عرضه محصولات متعدد پرسش‌های بسیاری را ایجاد کرده است. حالا و با این محصول به نظر می‌رسد پرسش‌های بیشتری مطرح شود که این پیشرفت‌ها قرار است تا کجا ادامه یابند.

اگر بخواهیم دانسته‌هایمان درباره Sora را مرور کنیم باید زیر این چند مورد را خط بکشیم:

  • Sora توان خلق ویدیوهایی تا حداکثر یک دقیقه را دارد؛ کمپانی مدعی شده Sora توانایی ساخت صحنه‌های پیچیده با چند کاراکتر، نمایش انواع حرکات و جزئیات دقیق سوژه و پس‌زمینه را دارد.
  • Sora تلاش می‌کند کاراکترهایی خلق کند که عاری از احساسات نباشند؛ هرچند توجه به جزئیات نشان می‌دهد این ویدیوها مصنوعی هستند.
  • Sora می‌تواند ویدیو را از روی عکس تولید کند و حتی ویدیوهای موجود را ترمیم کند.
  • Sora می‌تواند ویدیوهایی با وضوح حداکثر 1080p تولید کند.
  • Sora در حال حاضر به‌صورت محدود در دسترس کاربران قرار گرفته تا توسط آنها ارزیابی شود.

پیش از این کسب‌وکارهایی مانند Runway و Pika مدل‌های تبدیل متن به ویدیوی خود را عرضه کرده بودند؛ گوگل هم با Lumiere پا در این میدان گذاشته بود که ابزارهای متن به ویدئو و امکان خلق ویدیو از روی عکس را عرضه کرده است. OpenAI در یک گزارش فنی درباره Sora توضیح داده و به نظر می‌رسد از دیگر کسب‌وکارهای پیشرو در این حوزه توجه‌ بیشتری را به خودش جلب کند.

شما چه فکر می‌کنید؟ محصول Sora را چگونه ارزیابی می‌کنید؟ آیا این محصولات می‌توانند تأثیر جدی بر آینده نزدیک کسب‌وکارها داشته باشند؟ ایده‌های خود را با ما در میان بگذارید.

لینک کوتاه: https://karangweekly.ir/1up6
نظر شما درباره موضوع

آدرس ایمیل شما منتشر نخواهد شد.