যন্ত্রের সঙ্গে বাংলায় কথোপকথন

বিশ্বের বিভিন্ন দেশ ডিজিটালাইজেশনের অংশ হিসাবে ভার্চুয়াল অ্যাসিস্ট্যান্টসহ নানা ক্ষেত্রে নিশ্চিত করেছে নিজেদের ভাষার পর্যাপ্ত ব্যবহার।

আশফাক সফলআশফাক সফল
Published : 18 Feb 2024, 07:53 PM
Updated : 18 Feb 2024, 07:53 PM

বছরখানেক আগেই বাসায় প্রাক-স্কুলগামী বাচ্চাদের দেখেছিলাম স্মার্টফোনে ইউটিউব থেকে নিজের পছন্দমতো কার্টুন আর গান খুঁজে বের করতে। তখন তারা কোনো শব্দ লেখা তো দূরে থাক; বর্ণমালাই ঠিকমতো পারে না। কিন্তু ইউটিউবের ভয়েস সার্চ আর স্মার্ট ফোনের গুগল অ্যাসিস্ট্যান্টের ব্যবহার ঠিকই শিখে গেছে। ফলে রাতে মোবাইলের টর্চ জ্বালানো অথবা চটজলদি কাউকে কল করা তাদের জন্য খেলাধুলার মতোই আনন্দের।

হয়তোবা নিজেদের সন্তানদের স্মার্টফোনের সঙ্গে স্মার্ট আচরণ অথবা বঙ্গদেশের আমজনতা হবার কারণেই ঘটনাগুলো ছিল বিস্ময়কর। ইন্টারনেট ঘেঁটে দেখা গেল, সিরি বা এলেক্সার সঙ্গে আরও অনেকেই আছে শিশুদেরকে সঙ্গ দিতে। এমনকি বয়স্ক বা অসুস্থ মানুষদের জন্য আছে আরও কিছু ভার্চুয়াল অ্যাসিস্ট্যান্ট। তবে সর্বকাজের কাজী গুগলের সঙ্গে তাল মিলিয়ে যেমন সিরি আর এলেক্সা আছে; তেমনি আছে বিক্সবি, কর্টানাসহ আর অনেকেই। আবার অত্তার, ফায়ার-ফ্লাইসহ অনেকগুলো তৈরি করা হয়েছে বিশেষ বিশেষ কাজের জন্য।

ভার্চুয়াল বা ডিজিটাল অ্যাসিস্ট্যান্ট, যে নামেই বলি না কেন; এগুলোর অনেকগুলো বড় মাপের ভাষাবিদও। ইংরেজির বাইরে ভালোই পারে ইউরোপের বেশ কিছু ভাষা। ভালো মানের প্রায় সবগুলো ডিজিটাল অ্যাসিস্ট্যান্ট ইংরেজির পাশাপাশি স্প্যানিশ, ফ্রেঞ্চ, জার্মান, চায়নিজ, জাপানিজ, রাশিয়ান ইত্যাদি ভাষাতে ভালোই কথাবার্তা বলতে পারে। আর লেখালেখি পারে প্রায় শ’খানেক ভাষায়। এছাড়া বিভিন্ন দেশে নিজেদের অবকাঠামো ও প্রয়োজনীয়তার ওপর নির্ভর করে বিভিন্ন প্রকার ডিজিটাল অ্যাসিস্ট্যান্ট তৈরি হচ্ছে।

এই জাতীয় টুল বা সফটওয়্যার তৈরির ক্ষেত্রে দুটি বিষয় গুরুত্বপূর্ণ। এক, কৃত্রিম বুদ্ধিমত্তার (আর্টিফিশিয়াল ইন্টেলিজেন্স) ব্যবহার, আর দুই, কম্পিউটারের মনুষ্য ভাষা বোঝার ক্ষমতা (ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং বা এনএলপি)। অবশ্য ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং নিজেও আর্টিফিশিয়াল ইন্টেলিজেন্সের এক ধরনের প্রয়োগ বিশেষ। ভেঙ্গে বললে কৃত্রিম বুদ্ধিমত্তার সাহায্যে কম্পিউটার বা যন্ত্রকে মানুষের মতো করে মানুষের ভাষা ব্যবহার করার দক্ষতা তৈরি করে দেয়ার পদ্ধতি হচ্ছে ‘ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেস’। যেহেতু কম্পিউটার নিজে সংখ্যা (আরও ভেঙ্গে বললে শুধুমাত্র ‘০’ এবং ‘১’) বোঝে; মানুষের ভাষা তার কাছে ছিল দুর্বোধ্য। একটা সময় তার দৌড় ছিল মানুষ ইংরেজি ভাষায় কিছু লিখলে সেটা ছাপানো বা একই জাতীয় শব্দ খুঁজে বের করা পর্যন্ত। কিন্তু পরে কম্পিউটারের লোকালাইজেশনের ফলে ইংরেজির পাশাপাশি অন্য ভাষাতেও দক্ষতা আসে। তবে বেশিরভাগ গবেষণা পশ্চিমা বিশ্বে হওয়ার কারণে বাংলা ভাষার ডিজিটালাইজেশন বেশ পিছিয়ে ছিল শুরু থেকে। এখনো তথ্য-প্রযুক্তির ক্ষেত্রে বাংলা ভাষার প্রয়োগ বেশ দুর্বল। কি-বোর্ড তৈরি আর সফটওয়্যারের ইন্টারফেসে বাংলা যুক্ত করা পর্যন্তই। তবে সাম্প্রতিক সময়ে বাংলা এনএলপি বিষয়ক কিছু কাজ হচ্ছে।

বাংলা এনএলপি-এর ক্ষেত্রে সব থেকে জটিল সমস্যাটি হচ্ছে ভাষা হিসাবে বাংলা ভাষার শব্দাবলীর অর্থের ব্যাপকতা। যেমন ‘মোটা’ শব্দটা শুনলে আমরা সাধারণভাবে ‘স্থূল’ বা ‘বড় আকৃতি’ বুঝলেও ক্ষেত্র বিশেষে ‘খারাপ’ অর্থ হিসাবেও ব্যবহার হয়। যেমন ধরা যাক “কাউকে মোটা কথা বলা উচিত না”। অথবা ‘চাল’ শব্দের ক্ষেত্রেও এমন ঘটে। “তার চালটা ভালো”; কথ্য ভাষায় এই বাক্যের একাধিক অর্থ আছে।

অন্যদিকে বাংলার লিখিত রূপের কমবেশি সুগঠিত ব্যাকরণ থাকলেও, হাল আমলে কথ্য ভাষা গঠনের দিকে থেকে প্রায় লাগাম ছাড়া। প্রচুর পরিমাণে আমদানি হচ্ছে বিদেশি শব্দ, আর সেই সঙ্গে নিজেদের উদ্ভাবিত (বিশেষ করে তরুণ সমাজের) শব্দ তো আছেই। অনেক সময় কোনটা কোনটা বিশেষণ আর কোনটা ক্রিয়া সেটা বোঝাও কঠিন। এছাড়া, বড় শহরসহ শিক্ষা প্রতিষ্ঠানগুলোতে বিভিন্ন অঞ্চলের মানুষের মিথস্ক্রিয়ায় এক ধরনের ‘মিশ্র আঞ্চলিক প্রমিত’ ভাষা গড়ে উঠছে। এর ফলাফল, উচ্চারণ ও গঠনের দিকে থেকে কথ্য ভাষাকে বিশ্লেষণ করা কঠিন হয়ে পড়ছে।

এনএলপির জন্য আরেকটি কঠিন বিষয় হচ্ছে, পর্যাপ্ত পরিমাণ তথ্যের অভাব। ইংরেজি বা অন্যান্য পশ্চিমা ভাষায় যে পরিমাণ বই-পুস্তক-নথি ডিজিটালাইজ হয়েছে তার তুলনায় বাংলা ভাষার রসদ খুবই কম। এক্ষেত্রে তথ্য গ্রহণ করে সিদ্ধান্ত নেয়ার জন্য ডিজিটাল অ্যাসিস্ট্যান্টগুলো ঘুরে-ফিরে ইংরেজি ভাষাভিত্তিক রসদের ওপর নির্ভর করছে। ফলে ডিজিটাল অ্যাসিস্ট্যান্টের সিদ্ধান্তের যথার্থতা এবং উপযোগিতা কমছে।

আশার কথা হলো, সম্প্রতি বাংলা ভাষাভিত্তিক বেশ কিছু কাজ দেখা যাচ্ছে। ২০১৯ সালে ইউনাইটেড ইউনিভার্সিটির একদল গবেষক IEEE (Institute of Electrical and Electronics Engineers) থেকে প্রকাশিত এক গবেষণাপত্রে ‘অধীতী’ নামে একটি ভার্চুয়াল অ্যাসিস্ট্যান্টের রূপরেখা প্রণয়ন করেন। ওই সময়ের তথ্য মতে ‘অধীতী’র ত্রুটিহীনতা ছিল ৯৪ শতাংশ পর্যন্ত, অন্যদিকে একই সময়ে গুগল অ্যাসিস্ট্যান্টের ত্রুটিহীনতা ছিল ৯০ শতাংশের আশপাশে। অবশ্য গুগল অ্যাসিস্ট্যান্ট যে পরিমাণ তথ্য ও উপাত্ত নিয়ে কাজে করতে পারত এবং প্রতিনিয়ত নতুন তথ্য সংগ্রহ করত, তার তুলনায় এই মডেল অন্যান্য ভার্চুয়াল অ্যাসিস্ট্যান্টের ওপর অনেক বেশি নির্ভরশীল ছিল। ২০২২ সালে ইন্টারন্যাশনাল জার্নাল অব কম্পিউটার অ্যাপ্লিকেশানে প্রকাশিত আরেকটি গবেষণাপত্রে ‘সহকারী’ নামে একটি ডেক্সটপভিত্তিক ভার্চুয়াল অ্যাসিস্ট্যান্টের প্রস্তাবনা করা হয়। ‘কনভলিউশনাল নিউরাল নেটওয়ার্ক’ তত্ত্বের ওপর ভিত্তি করে এটিকে নকশা করা হয়।

সরকারি পর্যায়ে ২০২৩ সালে ‘সাথী’ নামে একটি ভার্চুয়াল অ্যাসিস্ট্যান্ট আলোচনায় আসে। এ সম্পর্কে তথ্য ও যোগাযোগ প্রযুক্তি বিভাগের তৎকালীন প্রতিমন্ত্রী (বর্তমানে ডাক, টেলিযোগাযোগ ও তথ্যপ্রযুক্তি মন্ত্রণালয়ের প্রতিমন্ত্রী) জুনাইদ আহমেদ পলক জানান, স্মার্ট নাগরিকের জন্য স্মার্ট সংযোগের ধারনার ওপর ভিত্তি করে ‘সাথী’ নামক ভার্চুয়াল অ্যাসিস্ট্যান্ট অ্যাপটি তৈরি করে হচ্ছে। টেলিযোগাযোগ নিয়ন্ত্রক সংস্থা বিটিআরসির অর্থায়নে অ্যাপটি তৈরি করছে এসপায়ার টু ইনোভেট (এটুআই)। পরিকল্পনা অনুযায়ী সরকারের সকল ডিজিটাল সার্ভিস, পেমেন্ট সুবিধা ইত্যাদি এতে সংযুক্ত থাকবে। এর ফলে নাগরিকগণ আগের চেয়ে সহজে মোবাইল ব্যবহার করে বিভিন্ন সেবা নিতে পারবে। ভবিষ্যতে ‘সাথী’ মোবাইল সিমের সঙ্গে ‘একীভূত’ করা হবে, এর ফলে ইন্টারনেট ব্যবহার না করেই মোবাইলে অ্যাপটি ইন্সটল করা যাবে। ২০২৩ সালে অ্যাপটি চালু হবার কথা থাকলেও, এখন পর্যন্ত আমজনতার কাছে এসে পৌঁছায়নি।

বিশ্বের বিভিন্ন দেশ ডিজিটালাইজেশনের অংশ হিসাবে ভার্চুয়াল অ্যাসিস্ট্যান্টসহ নানা ক্ষেত্রে নিশ্চিত করেছে নিজেদের ভাষার পর্যাপ্ত ব্যবহার। শুধু স্মার্টফোন না, ডেক্সটপসহ নানা রকমের গৃহস্থালি উপকরণ পরস্পরের সঙ্গে ইন্টারনেট অব থিংস বা আইওটি প্রযুক্তির মাধ্যমে যুক্ত হয়েছে, আর ভার্চুয়াল অ্যাসিস্ট্যান্টের সাহায্যে নিয়ন্ত্রণ করা যাচ্ছে সেগুলো। এ যেন কল্প-বিজ্ঞানের বইয়ের পাতা থেকে ভার্চুয়াল অ্যাসিস্ট্যান্ট উঠে এসেছ আমাদের সঙ্গী হতে। তাই তো এখন সময় নতুন এই বন্ধুদের বাংলায় কথা বলার।

চলুন, যন্ত্রের সঙ্গে কথা বলি বাংলায়!