এবার ভিডিওতে আলাদা করা যাবে নির্দিষ্ট কথা

ভীড়ের মধ্যে ছবি তোলার সময় অনেক ব্যক্তির মধ্য থেকে একজন বা কোনো একটি বস্তুকে ফোকাস করে ছবি তুলতে পারার প্রযুক্তি প্রায় অধিকাংশ স্মার্টফোন ক্যামেরাতেই আছে। এভাবে ছবি তোলা যায়, কিন্তু ভীড়ে অনেকের মধ্যে একজনের বক্তব্য কী আলাদাভাবে নেওয়া যাবে?

প্রযুক্তি ডেস্কবিডিনিউজ টোয়েন্টিফোর ডটকম
Published : 13 April 2018, 12:28 PM
Updated : 13 April 2018, 12:28 PM

এ প্রশ্নের ইতিবাচক জবাব দেওয়ার সুযোগ এনে দিয়েছে ওয়েব জায়ান্ট গুগলের গবেষকদের বানানো নতুন এক কৃত্রিম বুদ্ধিমত্তা বা এআই ব্যবস্থা, খবর আইএএনএস-এর। কোলাহলপূর্ণ পরিবেশে নির্দিষ্ট কোনো একজনের কথায় মনযোগ দেওয়ার ক্ষেত্রে কম্পিউটারের মানুষের মতো ক্ষমতা না থাকায় নতুন এই এআই ব্যবস্থাকে গুরুত্বপূর্ণ হিসেবে উল্লেখ করা হয়েছে প্রতিবেদনটিতে। এই ব্যবস্থা কোলাহলের মধ্যে নির্দিষ্ট কোনো ব্যক্তির বলা কথা ছাড়া অন্য সব শব্দ ‘নীরব’ করে দিতে পারবে।

চলতি সপ্তাহে গুগল রিসার্চ-এর সফটওয়্যার প্রকৌশলী ইনবার মোসেরি এবং ওরান ল্যাং এক ব্লগ পোস্টে বলেন, স্বয়ংক্রিয় বক্তব্য পৃথকীকরণ- একটি অডিও সিগ্যালকে তার নির্দিষ্ট একটি শব্দ উৎসে আলাদা করা কম্পিউটারগুলোর জন্য একটি ‘উল্লেখযোগ্য চ্যালেঞ্জ’ ছিল। 

একটি অডিও ট্র্যাক থাকা সাধারণ কোনো ভিডিওতে এই প্রক্রিয়া কাজ করে। ভিডিওতে শুধু যে ব্যক্তির কথা শোনা দরকার তার চেহারা সিলেক্ট করে দিলেই হবে।

নতুন গবেষণা প্রতিবেদনে গবেষকরা একটি ডিপ লার্নিং অডিও-ভিজুয়াল মডেল উপস্থাপন করেছেন। এই মডেল অন্যান্যদের বলা কথা আর ব্যাকগ্রাউন্ডের শব্দের মিশ্রণ থেকে একটি নির্দিষ্ট শব্দের সিগন্যাল আলাদা করতে পারবে। মোসেরি এবং ল্যাং বলেন, “এই কাজে আমরা অন্যান্য শব্দ এড়িয়ে নির্দিষ্ট মানুষের বক্তব্যের আওয়াজ বাড়িয়ে কম্পিউটারে ভিডিও বানাতে সক্ষম।”