টেক্সট থেকে ভিডিও তৈরির এআই মডেল আনছে ওপেনএআই

ওপেনএআই আরও যোগ করে, একটি একক ভিডিও’র মধ্যেই একাধিক দৃশ্য তৈরি করতে পারবে সফটওয়্যারটি।

প্রযুক্তি ডেস্ক
Published : 17 Feb 2024, 11:06 AM
Updated : 17 Feb 2024, 11:06 AM

এআই কোম্পানি ওপেনএআই এমন এক সফটওয়্যার নিয়ে কাজ করছে, যেখানে বিভিন্ন টেক্সট প্রম্পটের ভিত্তিতে এক মিনিট দীর্ঘ ভিডিও বানানো সম্ভব।

‘সোরা’ নামের এ সফটওয়্যারের কথা গেল বৃহস্পতিবার জানিয়েছে মাইক্রোসফট সমর্থিত কোম্পনিটি। বর্তমানে এটি ‘রেড টিমিং’ প্রক্রিয়ার জন্য উন্মুক্ত আছে, যার সহায়তায় এআই ব্যবস্থাটির বিভিন্ন ত্রুটি শনাক্ত করা যাবে। এ ছাড়া, মডেলটি ব্যবহারের সম্ভাব্য ফিডব্যাক পেতে ভিজুয়াল শিল্পী, ডিজাইনার ও চলচ্চিত্র নির্মাতাদের জন্যেও এটি উন্মুক্ত বলে এক বিবৃতিতে বলেছে ওপেনএআই।

“সোরা একাধিক চরিত্র ও বিভিন্ন ধরনের মোশন দিয়ে বিভিন্ন জটিল দৃশ্যপট তৈরি করতে সক্ষম, যেখানে ভিডিও’র মূল বিষয় ও ব্যাকগ্রাউন্ডের খুঁটিনাটিও বেশ নিখুঁত,” উল্লেখ রয়েছে কোম্পানির বিবৃতিতে।

ওপেনএআই আরও যোগ করে, একটি একক ভিডিও’র মধ্যেই একাধিক দৃশ্য তৈরি করতে পারবে সফটওয়্যারটি।

টেক্সট প্রম্পট থেকে ভিডিও তৈরি বাদেও সোরার মাধ্যমে কোনো স্থির ছবিকে অ্যানিমেট করার সুবিধাও মিলবে বলে এক ব্লগ পোস্টে বলেছে কোম্পানিটি।

এ সফটওয়্যারের আগে ২০২২ সালের শেষের দিকে চ্যাটজিপিটি নামের চ্যাটবট এনেছিল ওপেনএআই। এর পর থেকেই জেনারেটিভ এআই প্রযুক্তি নিয়ে আলোড়ন সৃষ্টি হয়েছে, যার মাধ্যমে ইমেইল তৈরির ও বিভিন্ন কোড ও কবিতা লেখার সুবিধা পেয়ে থাকেন ব্যবহারকারী।

এদিকে, গত বছর নিজস্ব ইমেজ জেনারেশন মডেল ‘ইমু’তে দুটি এআই ফিচার যোগ করেছে সামাজিক যোগাযোগ মাধ্যম জায়ান্ট মেটা, যেখানে টেক্সট প্রম্পট থেকে ভিডিও তৈরি ও এডিট করার সুবিধা মেলে।

জেনারেটিভ এআই খাতকে দ্রুতই নতুন রূপ দেওয়ার লক্ষ্যে মাইক্রোসফট, গুগল ও অ্যামাজনের সঙ্গেও প্রতিযোগিতায় নামার লক্ষ্য নিয়েছে ফেইসবুকের মালিক কোম্পানিটি।

রয়টার্স প্রতিবেদনে বলেছে, সোরা নিয়ে এখনও কাজ চলছে। পাশাপাশি, এআই মডেলটি বিভিন্ন প্রম্পটের মূল বিষয় বুঝতে এমনকি বিভিন্ন সুনির্দিষ্ট ক্যামেরা অ্যাঙ্গেল বোঝার ক্ষেত্রেও সমস্যায় পড়তে পারে।

ওপেনএআই, তারা বিভিন্ন এমন টুলও তৈরি করছে, যেগুলো সোরার মাধ্যমে তৈরি করা ভিডিওগুলো শনাক্ত করতে পারবে।