বিশ্বের বিভিন্ন দেশ ডিজিটালাইজেশনের অংশ হিসাবে ভার্চুয়াল অ্যাসিস্ট্যান্টসহ নানা ক্ষেত্রে নিশ্চিত করেছে নিজেদের ভাষার পর্যাপ্ত ব্যবহার।
Published : 19 Feb 2024, 12:53 AM
বছরখানেক আগেই বাসায় প্রাক-স্কুলগামী বাচ্চাদের দেখেছিলাম স্মার্টফোনে ইউটিউব থেকে নিজের পছন্দমতো কার্টুন আর গান খুঁজে বের করতে। তখন তারা কোনো শব্দ লেখা তো দূরে থাক; বর্ণমালাই ঠিকমতো পারে না। কিন্তু ইউটিউবের ভয়েস সার্চ আর স্মার্ট ফোনের গুগল অ্যাসিস্ট্যান্টের ব্যবহার ঠিকই শিখে গেছে। ফলে রাতে মোবাইলের টর্চ জ্বালানো অথবা চটজলদি কাউকে কল করা তাদের জন্য খেলাধুলার মতোই আনন্দের।
হয়তোবা নিজেদের সন্তানদের স্মার্টফোনের সঙ্গে স্মার্ট আচরণ অথবা বঙ্গদেশের আমজনতা হবার কারণেই ঘটনাগুলো ছিল বিস্ময়কর। ইন্টারনেট ঘেঁটে দেখা গেল, সিরি বা এলেক্সার সঙ্গে আরও অনেকেই আছে শিশুদেরকে সঙ্গ দিতে। এমনকি বয়স্ক বা অসুস্থ মানুষদের জন্য আছে আরও কিছু ভার্চুয়াল অ্যাসিস্ট্যান্ট। তবে সর্বকাজের কাজী গুগলের সঙ্গে তাল মিলিয়ে যেমন সিরি আর এলেক্সা আছে; তেমনি আছে বিক্সবি, কর্টানাসহ আর অনেকেই। আবার অত্তার, ফায়ার-ফ্লাইসহ অনেকগুলো তৈরি করা হয়েছে বিশেষ বিশেষ কাজের জন্য।
ভার্চুয়াল বা ডিজিটাল অ্যাসিস্ট্যান্ট, যে নামেই বলি না কেন; এগুলোর অনেকগুলো বড় মাপের ভাষাবিদও। ইংরেজির বাইরে ভালোই পারে ইউরোপের বেশ কিছু ভাষা। ভালো মানের প্রায় সবগুলো ডিজিটাল অ্যাসিস্ট্যান্ট ইংরেজির পাশাপাশি স্প্যানিশ, ফ্রেঞ্চ, জার্মান, চায়নিজ, জাপানিজ, রাশিয়ান ইত্যাদি ভাষাতে ভালোই কথাবার্তা বলতে পারে। আর লেখালেখি পারে প্রায় শ’খানেক ভাষায়। এছাড়া বিভিন্ন দেশে নিজেদের অবকাঠামো ও প্রয়োজনীয়তার ওপর নির্ভর করে বিভিন্ন প্রকার ডিজিটাল অ্যাসিস্ট্যান্ট তৈরি হচ্ছে।
এই জাতীয় টুল বা সফটওয়্যার তৈরির ক্ষেত্রে দুটি বিষয় গুরুত্বপূর্ণ। এক, কৃত্রিম বুদ্ধিমত্তার (আর্টিফিশিয়াল ইন্টেলিজেন্স) ব্যবহার, আর দুই, কম্পিউটারের মনুষ্য ভাষা বোঝার ক্ষমতা (ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং বা এনএলপি)। অবশ্য ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং নিজেও আর্টিফিশিয়াল ইন্টেলিজেন্সের এক ধরনের প্রয়োগ বিশেষ। ভেঙ্গে বললে কৃত্রিম বুদ্ধিমত্তার সাহায্যে কম্পিউটার বা যন্ত্রকে মানুষের মতো করে মানুষের ভাষা ব্যবহার করার দক্ষতা তৈরি করে দেয়ার পদ্ধতি হচ্ছে ‘ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেস’। যেহেতু কম্পিউটার নিজে সংখ্যা (আরও ভেঙ্গে বললে শুধুমাত্র ‘০’ এবং ‘১’) বোঝে; মানুষের ভাষা তার কাছে ছিল দুর্বোধ্য। একটা সময় তার দৌড় ছিল মানুষ ইংরেজি ভাষায় কিছু লিখলে সেটা ছাপানো বা একই জাতীয় শব্দ খুঁজে বের করা পর্যন্ত। কিন্তু পরে কম্পিউটারের লোকালাইজেশনের ফলে ইংরেজির পাশাপাশি অন্য ভাষাতেও দক্ষতা আসে। তবে বেশিরভাগ গবেষণা পশ্চিমা বিশ্বে হওয়ার কারণে বাংলা ভাষার ডিজিটালাইজেশন বেশ পিছিয়ে ছিল শুরু থেকে। এখনো তথ্য-প্রযুক্তির ক্ষেত্রে বাংলা ভাষার প্রয়োগ বেশ দুর্বল। কি-বোর্ড তৈরি আর সফটওয়্যারের ইন্টারফেসে বাংলা যুক্ত করা পর্যন্তই। তবে সাম্প্রতিক সময়ে বাংলা এনএলপি বিষয়ক কিছু কাজ হচ্ছে।
বাংলা এনএলপি-এর ক্ষেত্রে সব থেকে জটিল সমস্যাটি হচ্ছে ভাষা হিসাবে বাংলা ভাষার শব্দাবলীর অর্থের ব্যাপকতা। যেমন ‘মোটা’ শব্দটা শুনলে আমরা সাধারণভাবে ‘স্থূল’ বা ‘বড় আকৃতি’ বুঝলেও ক্ষেত্র বিশেষে ‘খারাপ’ অর্থ হিসাবেও ব্যবহার হয়। যেমন ধরা যাক “কাউকে মোটা কথা বলা উচিত না”। অথবা ‘চাল’ শব্দের ক্ষেত্রেও এমন ঘটে। “তার চালটা ভালো”; কথ্য ভাষায় এই বাক্যের একাধিক অর্থ আছে।
অন্যদিকে বাংলার লিখিত রূপের কমবেশি সুগঠিত ব্যাকরণ থাকলেও, হাল আমলে কথ্য ভাষা গঠনের দিকে থেকে প্রায় লাগাম ছাড়া। প্রচুর পরিমাণে আমদানি হচ্ছে বিদেশি শব্দ, আর সেই সঙ্গে নিজেদের উদ্ভাবিত (বিশেষ করে তরুণ সমাজের) শব্দ তো আছেই। অনেক সময় কোনটা কোনটা বিশেষণ আর কোনটা ক্রিয়া সেটা বোঝাও কঠিন। এছাড়া, বড় শহরসহ শিক্ষা প্রতিষ্ঠানগুলোতে বিভিন্ন অঞ্চলের মানুষের মিথস্ক্রিয়ায় এক ধরনের ‘মিশ্র আঞ্চলিক প্রমিত’ ভাষা গড়ে উঠছে। এর ফলাফল, উচ্চারণ ও গঠনের দিকে থেকে কথ্য ভাষাকে বিশ্লেষণ করা কঠিন হয়ে পড়ছে।
এনএলপির জন্য আরেকটি কঠিন বিষয় হচ্ছে, পর্যাপ্ত পরিমাণ তথ্যের অভাব। ইংরেজি বা অন্যান্য পশ্চিমা ভাষায় যে পরিমাণ বই-পুস্তক-নথি ডিজিটালাইজ হয়েছে তার তুলনায় বাংলা ভাষার রসদ খুবই কম। এক্ষেত্রে তথ্য গ্রহণ করে সিদ্ধান্ত নেয়ার জন্য ডিজিটাল অ্যাসিস্ট্যান্টগুলো ঘুরে-ফিরে ইংরেজি ভাষাভিত্তিক রসদের ওপর নির্ভর করছে। ফলে ডিজিটাল অ্যাসিস্ট্যান্টের সিদ্ধান্তের যথার্থতা এবং উপযোগিতা কমছে।
আশার কথা হলো, সম্প্রতি বাংলা ভাষাভিত্তিক বেশ কিছু কাজ দেখা যাচ্ছে। ২০১৯ সালে ইউনাইটেড ইউনিভার্সিটির একদল গবেষক IEEE (Institute of Electrical and Electronics Engineers) থেকে প্রকাশিত এক গবেষণাপত্রে ‘অধীতী’ নামে একটি ভার্চুয়াল অ্যাসিস্ট্যান্টের রূপরেখা প্রণয়ন করেন। ওই সময়ের তথ্য মতে ‘অধীতী’র ত্রুটিহীনতা ছিল ৯৪ শতাংশ পর্যন্ত, অন্যদিকে একই সময়ে গুগল অ্যাসিস্ট্যান্টের ত্রুটিহীনতা ছিল ৯০ শতাংশের আশপাশে। অবশ্য গুগল অ্যাসিস্ট্যান্ট যে পরিমাণ তথ্য ও উপাত্ত নিয়ে কাজে করতে পারত এবং প্রতিনিয়ত নতুন তথ্য সংগ্রহ করত, তার তুলনায় এই মডেল অন্যান্য ভার্চুয়াল অ্যাসিস্ট্যান্টের ওপর অনেক বেশি নির্ভরশীল ছিল। ২০২২ সালে ইন্টারন্যাশনাল জার্নাল অব কম্পিউটার অ্যাপ্লিকেশানে প্রকাশিত আরেকটি গবেষণাপত্রে ‘সহকারী’ নামে একটি ডেক্সটপভিত্তিক ভার্চুয়াল অ্যাসিস্ট্যান্টের প্রস্তাবনা করা হয়। ‘কনভলিউশনাল নিউরাল নেটওয়ার্ক’ তত্ত্বের ওপর ভিত্তি করে এটিকে নকশা করা হয়।
সরকারি পর্যায়ে ২০২৩ সালে ‘সাথী’ নামে একটি ভার্চুয়াল অ্যাসিস্ট্যান্ট আলোচনায় আসে। এ সম্পর্কে তথ্য ও যোগাযোগ প্রযুক্তি বিভাগের তৎকালীন প্রতিমন্ত্রী (বর্তমানে ডাক, টেলিযোগাযোগ ও তথ্যপ্রযুক্তি মন্ত্রণালয়ের প্রতিমন্ত্রী) জুনাইদ আহমেদ পলক জানান, স্মার্ট নাগরিকের জন্য স্মার্ট সংযোগের ধারনার ওপর ভিত্তি করে ‘সাথী’ নামক ভার্চুয়াল অ্যাসিস্ট্যান্ট অ্যাপটি তৈরি করে হচ্ছে। টেলিযোগাযোগ নিয়ন্ত্রক সংস্থা বিটিআরসির অর্থায়নে অ্যাপটি তৈরি করছে এসপায়ার টু ইনোভেট (এটুআই)। পরিকল্পনা অনুযায়ী সরকারের সকল ডিজিটাল সার্ভিস, পেমেন্ট সুবিধা ইত্যাদি এতে সংযুক্ত থাকবে। এর ফলে নাগরিকগণ আগের চেয়ে সহজে মোবাইল ব্যবহার করে বিভিন্ন সেবা নিতে পারবে। ভবিষ্যতে ‘সাথী’ মোবাইল সিমের সঙ্গে ‘একীভূত’ করা হবে, এর ফলে ইন্টারনেট ব্যবহার না করেই মোবাইলে অ্যাপটি ইন্সটল করা যাবে। ২০২৩ সালে অ্যাপটি চালু হবার কথা থাকলেও, এখন পর্যন্ত আমজনতার কাছে এসে পৌঁছায়নি।
বিশ্বের বিভিন্ন দেশ ডিজিটালাইজেশনের অংশ হিসাবে ভার্চুয়াল অ্যাসিস্ট্যান্টসহ নানা ক্ষেত্রে নিশ্চিত করেছে নিজেদের ভাষার পর্যাপ্ত ব্যবহার। শুধু স্মার্টফোন না, ডেক্সটপসহ নানা রকমের গৃহস্থালি উপকরণ পরস্পরের সঙ্গে ইন্টারনেট অব থিংস বা আইওটি প্রযুক্তির মাধ্যমে যুক্ত হয়েছে, আর ভার্চুয়াল অ্যাসিস্ট্যান্টের সাহায্যে নিয়ন্ত্রণ করা যাচ্ছে সেগুলো। এ যেন কল্প-বিজ্ঞানের বইয়ের পাতা থেকে ভার্চুয়াল অ্যাসিস্ট্যান্ট উঠে এসেছ আমাদের সঙ্গী হতে। তাই তো এখন সময় নতুন এই বন্ধুদের বাংলায় কথা বলার।
চলুন, যন্ত্রের সঙ্গে কথা বলি বাংলায়!