টেক

ভিডিওতে মানুষের কাজ দেখে শিখবে রোবট

এই গবেষণায় ব্যবহৃত রোবটগুলো দুইশ ঘণ্টা দীর্ঘ পরীক্ষায় ১২টি নতুন কাজ শিখেছে। এই কাজগুলো অবশ্য সহজ ছিল। এর মধ্যে ছিল ক্যান খোলা ও ফোন ধরার মতো বিষয়াদি।

ছবি: শিখার ব্যাহল

প্রযুক্তি ডেস্ক

বিডিনিউজ টোয়েন্টিফোর ডটকম

Published : 23 Jun 2023, 02:23 PM

Updated : 23 Jun 2023, 02:23 PM

বিজ্ঞানীরা এমন ধরনের নতুন রোবট বানিয়েছেন, যা মানুষের করা কাজের ভিডিও দেখেই বিভিন্ন নতুন দক্ষতা অর্জন করতে পারে।

যুক্তরাষ্ট্রের ‘কার্নেগি মেলন ইউনিভার্সিটি (সিএমইউ)’র গবেষক দল এমন এক নতুন মডেল তৈরি করেছেন, যা ভিডিও দেখার মাধ্যমেই রোবটগুলোকে ড্রয়ার খোলা ও ছুরি ওঠানোর মতো বিভিন্ন কাজ করার সুযোগ দেয়।

‘ভিজুয়াল-রোবটিক্স ব্রিজ (ভিআরবি)’ নামের এই ব্যবস্থায় মানব নজরদারির প্রয়োজন নেই। কেবল ২৫ মিনিটেই বিভিন্ন নতুন দক্ষতা শেখা যায় এতে।

???? Robotics often faces a chicken and egg problem: no web-scale robot data for training (unlike CV or NLP) b/c robots aren't deployed yet & vice-versa.

Introducing VRB: Use large-scale human videos to train a *general-purpose* affordance model to jumpstart any robotics paradigm! pic.twitter.com/csbvsfswuG
— Deepak Pathak (@pathak2206) June 13, 2023

“ভিডিও দেখে মানুষ কোথায় ও কীভাবে বিভিন্ন বস্তুর সঙ্গে কেমন আচরণ হবে সেটা শিখতে পারে রোবট।” --বলেন ‘সিএমইউ’র রোবটিক বিভাগের সহকারি অধ্যাপক দিপক পাঠক।

“এই অর্জিত জ্ঞান থেকে আমরা এমন এক মডেলের প্রশিক্ষণ দিতে পারি, যা দুটো রোবটকে ভিন্ন ভিন্ন পরিবেশে একই ধরনের কাজ করার সক্ষমতা দেবে।”

ভিআরবি মডেল রোবটকে ভিডিওতে দেখানো কার্যক্রম শেখার সুযোগ দেয়। এমনকি সেটা ভিন্ন কোনো পরিবেশে হলেও।

মডেলটি কাজ করে ড্রয়ারের হাতল বা ছুরির বাটের মতো বিভিন্ন ‘কনটাক্ট পয়েন্ট’ শনাক্তের মাধ্যমে। পাশাপাশি, কাজটি করার জন্য দরকারি গতিও বোঝার চেষ্টাও করে এটি।

“আমরা রোবটটিকে ক্যাম্পাসের আশপাশে নিয়ে যাওয়ার পর এটি সব ধরনের কাজই করেছে।” --বলেন সিএমএইউ’র রোবটিক্স বিভাগে অধ্যয়নরত পিএইচডি ছাত্র শিখার ব্যাহল।

“রোবট কৌতুহুলবশত এই মডেল ব্যবহার করে তার আশপাশের জগত ঘুরে দেখতে পারে। আর কেবল নিজের বাহু নাড়ানোর বদলে আগের চেয়ে বেশি সরাসরি উপায়ে যোগাযোগ স্থাপন করতে পারে।”

“এর সহায়তায় ইন্টারনেট ও ইউটিউবে থাকা ভিডিও’র বিশাল সংগ্রহ থেকে বিভিন্ন কার্যক্রম শেখার সুযোগ পেতে পারে রোবট।”

এই গবেষণায় ব্যবহৃত রোবটগুলো দুইশ ঘণ্টা দীর্ঘ পরীক্ষায় ১২টি নতুন কাজ শিখেছে বলে প্রতিবেদনে উল্লেখ করেছে ব্রিটিশ সংবাদপত্র দ্য ইন্ডিপেন্ডেন্ট।

এই সকল কাজই অবশ্য তুলনামূলক সহজ ছিল। এর মধ্যে ছিল ক্যান খোলা ও ফোন ধরার মতো বিষয়াদি। আর এখন গবেষকরা এমন এক ভিআরবি মডেল তৈরির পরিকল্পনা করছেন, যা রোবটকে একইসঙ্গে একাধিক কাজ করার সুবিধা দেবে।

‘অ্যাফোর্ড্যান্সেস ফ্রম হিউম্যান ভিডিও অ্যাজ আ ভার্সেটাইল রিপ্রেজেন্টেশন ফর রোবটিক্স’ শিরোনামের এক গবেষণাপত্রে এই গবেষণার বিস্তারিত উল্লেখ রয়েছে। আর এ মাসে কানাডার ভ্যাঙ্কুভারে ‘কনফারেন্স অন ভিশন অ্যান্ড প্যাটার্ন রেকগনিশন’ শীর্ষক আয়োজনে দেখানো হবে এটি।