এ প্রশ্নের ইতিবাচক জবাব দেওয়ার সুযোগ এনে দিয়েছে ওয়েব জায়ান্ট গুগলের গবেষকদের বানানো নতুন এক কৃত্রিম বুদ্ধিমত্তা বা এআই ব্যবস্থা, খবর আইএএনএস-এর। কোলাহলপূর্ণ পরিবেশে নির্দিষ্ট কোনো একজনের কথায় মনযোগ দেওয়ার ক্ষেত্রে কম্পিউটারের মানুষের মতো ক্ষমতা না থাকায় নতুন এই এআই ব্যবস্থাকে গুরুত্বপূর্ণ হিসেবে উল্লেখ করা হয়েছে প্রতিবেদনটিতে। এই ব্যবস্থা কোলাহলের মধ্যে নির্দিষ্ট কোনো ব্যক্তির বলা কথা ছাড়া অন্য সব শব্দ ‘নীরব’ করে দিতে পারবে।
চলতি সপ্তাহে গুগল রিসার্চ-এর সফটওয়্যার প্রকৌশলী ইনবার মোসেরি এবং ওরান ল্যাং এক ব্লগ পোস্টে বলেন, স্বয়ংক্রিয় বক্তব্য পৃথকীকরণ- একটি অডিও সিগ্যালকে তার নির্দিষ্ট একটি শব্দ উৎসে আলাদা করা কম্পিউটারগুলোর জন্য একটি ‘উল্লেখযোগ্য চ্যালেঞ্জ’ ছিল।
একটি অডিও ট্র্যাক থাকা সাধারণ কোনো ভিডিওতে এই প্রক্রিয়া কাজ করে। ভিডিওতে শুধু যে ব্যক্তির কথা শোনা দরকার তার চেহারা সিলেক্ট করে দিলেই হবে।
নতুন গবেষণা প্রতিবেদনে গবেষকরা একটি ডিপ লার্নিং অডিও-ভিজুয়াল মডেল উপস্থাপন করেছেন। এই মডেল অন্যান্যদের বলা কথা আর ব্যাকগ্রাউন্ডের শব্দের মিশ্রণ থেকে একটি নির্দিষ্ট শব্দের সিগন্যাল আলাদা করতে পারবে। মোসেরি এবং ল্যাং বলেন, “এই কাজে আমরা অন্যান্য শব্দ এড়িয়ে নির্দিষ্ট মানুষের বক্তব্যের আওয়াজ বাড়িয়ে কম্পিউটারে ভিডিও বানাতে সক্ষম।”