এই গবেষণায় ব্যবহৃত রোবটগুলো দুইশ ঘণ্টা দীর্ঘ পরীক্ষায় ১২টি নতুন কাজ শিখেছে। এই কাজগুলো অবশ্য সহজ ছিল। এর মধ্যে ছিল ক্যান খোলা ও ফোন ধরার মতো বিষয়াদি।
Published : 23 Jun 2023, 02:23 PM
বিজ্ঞানীরা এমন ধরনের নতুন রোবট বানিয়েছেন, যা মানুষের করা কাজের ভিডিও দেখেই বিভিন্ন নতুন দক্ষতা অর্জন করতে পারে।
যুক্তরাষ্ট্রের ‘কার্নেগি মেলন ইউনিভার্সিটি (সিএমইউ)’র গবেষক দল এমন এক নতুন মডেল তৈরি করেছেন, যা ভিডিও দেখার মাধ্যমেই রোবটগুলোকে ড্রয়ার খোলা ও ছুরি ওঠানোর মতো বিভিন্ন কাজ করার সুযোগ দেয়।
‘ভিজুয়াল-রোবটিক্স ব্রিজ (ভিআরবি)’ নামের এই ব্যবস্থায় মানব নজরদারির প্রয়োজন নেই। কেবল ২৫ মিনিটেই বিভিন্ন নতুন দক্ষতা শেখা যায় এতে।
???? Robotics often faces a chicken and egg problem: no web-scale robot data for training (unlike CV or NLP) b/c robots aren't deployed yet & vice-versa.
— Deepak Pathak (@pathak2206) June 13, 2023
Introducing VRB: Use large-scale human videos to train a *general-purpose* affordance model to jumpstart any robotics paradigm! pic.twitter.com/csbvsfswuG
“ভিডিও দেখে মানুষ কোথায় ও কীভাবে বিভিন্ন বস্তুর সঙ্গে কেমন আচরণ হবে সেটা শিখতে পারে রোবট।” --বলেন ‘সিএমইউ’র রোবটিক বিভাগের সহকারি অধ্যাপক দিপক পাঠক।
“এই অর্জিত জ্ঞান থেকে আমরা এমন এক মডেলের প্রশিক্ষণ দিতে পারি, যা দুটো রোবটকে ভিন্ন ভিন্ন পরিবেশে একই ধরনের কাজ করার সক্ষমতা দেবে।”
ভিআরবি মডেল রোবটকে ভিডিওতে দেখানো কার্যক্রম শেখার সুযোগ দেয়। এমনকি সেটা ভিন্ন কোনো পরিবেশে হলেও।
মডেলটি কাজ করে ড্রয়ারের হাতল বা ছুরির বাটের মতো বিভিন্ন ‘কনটাক্ট পয়েন্ট’ শনাক্তের মাধ্যমে। পাশাপাশি, কাজটি করার জন্য দরকারি গতিও বোঝার চেষ্টাও করে এটি।
“আমরা রোবটটিকে ক্যাম্পাসের আশপাশে নিয়ে যাওয়ার পর এটি সব ধরনের কাজই করেছে।” --বলেন সিএমএইউ’র রোবটিক্স বিভাগে অধ্যয়নরত পিএইচডি ছাত্র শিখার ব্যাহল।
“রোবট কৌতুহুলবশত এই মডেল ব্যবহার করে তার আশপাশের জগত ঘুরে দেখতে পারে। আর কেবল নিজের বাহু নাড়ানোর বদলে আগের চেয়ে বেশি সরাসরি উপায়ে যোগাযোগ স্থাপন করতে পারে।”
“এর সহায়তায় ইন্টারনেট ও ইউটিউবে থাকা ভিডিও’র বিশাল সংগ্রহ থেকে বিভিন্ন কার্যক্রম শেখার সুযোগ পেতে পারে রোবট।”
এই গবেষণায় ব্যবহৃত রোবটগুলো দুইশ ঘণ্টা দীর্ঘ পরীক্ষায় ১২টি নতুন কাজ শিখেছে বলে প্রতিবেদনে উল্লেখ করেছে ব্রিটিশ সংবাদপত্র দ্য ইন্ডিপেন্ডেন্ট।
এই সকল কাজই অবশ্য তুলনামূলক সহজ ছিল। এর মধ্যে ছিল ক্যান খোলা ও ফোন ধরার মতো বিষয়াদি। আর এখন গবেষকরা এমন এক ভিআরবি মডেল তৈরির পরিকল্পনা করছেন, যা রোবটকে একইসঙ্গে একাধিক কাজ করার সুবিধা দেবে।
‘অ্যাফোর্ড্যান্সেস ফ্রম হিউম্যান ভিডিও অ্যাজ আ ভার্সেটাইল রিপ্রেজেন্টেশন ফর রোবটিক্স’ শিরোনামের এক গবেষণাপত্রে এই গবেষণার বিস্তারিত উল্লেখ রয়েছে। আর এ মাসে কানাডার ভ্যাঙ্কুভারে ‘কনফারেন্স অন ভিশন অ্যান্ড প্যাটার্ন রেকগনিশন’ শীর্ষক আয়োজনে দেখানো হবে এটি।