Published : 05 Apr 2026, 10:39 AM
নিজস্ব প্রযুক্তিতে শক্তিশালী তিনটি এআই মডেল উন্মোচন করল মাইক্রোসফট। টেক্সট, ভয়েস ও ভিডিও তৈরি করতে পারা এসব মডেল দিয়ে গুগল ও অন্যান্য প্রতিদ্বন্দ্বীদের সরাসরি চ্যালেঞ্জ জানাল কোম্পানিটি।
বৃহস্পতিবার এই তিন নতুন এআই মডেল আনার ঘোষণা দিয়েছে মাইক্রোসফট এআই।
ব্রিটিশ প্রযুক্তি সাইট টেকক্রাঞ্চ প্রতিবেদনে লিখেছে, এ পদক্ষেপের মাধ্যমে ইঙ্গিত মেলে, ওপেনএআইয়ের সঙ্গে পার্টনারশিপ থাকার পরও অন্যান্য প্রতিযোগী কোম্পানির সঙ্গে পাল্লা দিতে এআই প্রযুক্তি তৈরির কাজও চালিয়ে যাচ্ছে মাইক্রোসফট।
কোম্পানিটি বলেছে, ‘এমএআই-ট্রান্সক্রাইব-১’ নামের মডেলটি ২৫টি ভিন্ন ভাষার কথাকে টেক্সটে রূপান্তর করতে পারে এবং মডেলটি মাইক্রোসফটের ‘অ্যাজিউর ফাস্ট’ পরিষেবার তুলনায় ২.৫ গুণ দ্রুত।
‘এমএআই-ভয়েস-১’ হচ্ছে একটি অডিও তৈরির মডেল, যা কেবল এক সেকেন্ডে ৬০ সেকেন্ডের অডিও তৈরি করতে পারে এবং এর মাধ্যমে ব্যবহারকারীরা নিজেদের পছন্দমতো কণ্ঠস্বর বা ‘কাস্টম ভয়েস’ তৈরি করে নিতে পারবেন।
অন্যদিকে, ‘এমএআই-ইমেজ-২’ হচ্ছে ভিডিও তৈরির মডেল। গেল মাসে এ মডেলটি প্রথমবার ‘এমএআই প্লেগ্রাউন্ড’ নামের নতুন এক এলএলএম টেস্টিং সফটওয়্যারে চালু হয়েছিল।
এখন তিনটি মডেলই ‘মাইক্রোসফট ফাউন্ড্রি’তে পাওয়া হচ্ছে। এ ছাড়া ট্রান্সক্রিপশন ও ভয়েস মডেল দুটি এখন থেকে এমএআই প্লেগ্রাউন্ডেও ব্যবহার করা যাবে।
এসব মডেল মাইক্রোসফটের ‘এমএআই সুপারইন্টেলিজেন্স’ দল তৈরি করেছে। মাইক্রোসফট এআইয়ের সিইও মুস্তাফা সুলেইমানের নেতৃত্বে এ এআই গবেষণা দলটি ২০২৫ সালের নভেম্বরে গঠিত হয়েছে।
এক ব্লগ পোস্টে সুলেইমান লিখেছেন, “মাইক্রোসফট এআইতে আমরা ‘হিউম্যানিস্ট এআই’ তৈরি করছি। আমাদের এআই মডেল তৈরির দৃষ্টিভঙ্গি কিছুটা ভিন্ন, এখানে মানুষকে কেন্দ্রে রাখা হয়েছে এবং মানুষ আসলে যেভাবে যোগাযোগ করে তার ওপর ভিত্তি করেই আমরা এসব মডেলকে ব্যবহারিক কাজের উপযোগী করে প্রশিক্ষণ দিয়েছি। খুব শিগগিরই আপনারা আরও নতুন কিছু মডেল ‘ফাউন্ড্রি’ এবং সরাসরি মাইক্রোসফটের বিভিন্ন পণ্য ও অভিজ্ঞতায় দেখতে পাবেন।”
এলএলএম বা লার্জ ল্যাঙ্গুয়েজ মডেলের এই ভিড় ঠাসা বাজারে মাইক্রোসফটের দাবি, তাদের এসব মডেলের বিক্রির প্রধান হাতিয়ার হবে সাশ্রয়ী মূল্য। কারণ, গুগল ও ওপেনএআইয়ের বিভিন্ন এআই মডেলের চেয়ে এগুলো সাশ্রয়ী।
‘এমএআই-ট্রান্সক্রাইব-১’ ব্যবহারের খরচ শুরু হচ্ছে প্রতি ঘণ্টায় ০.৩৬ ডলার থেকে। ‘এমএআই-ভয়েস-১’ মডেলটির খরচ প্রতি ১০ লাখ ক্যারেক্টারের জন্য ২২ ডলার।
এদিকে, ‘এমএআই-ইমেজ-২’ ব্যবহারের ক্ষেত্রে প্রতি ১০ লাখ টেক্সট ইনপুট টোকেনের জন্য ৫ ডলার এবং প্রতি ১০ লাখ ইমেজ আউটপুট টোকেনের জন্য ৩৩ ডলার থেকে খরচ শুরু হবে।