আপনি এখন বাংলা ভাষায় একটা মেশিনকে কমান্ড দিতে পারেন। আর সেই মেশিন আপনার কথা মত কাজ করবে, টাইপ করবে, সার্চ করবে ইত্যাদি।

বাংলা ভাষার উপরে সবচাইতে ব্যয়বহুল এবং সবচাইতে গুরুত্বপূর্ণ গবেষণার নাম হচ্ছে বাংলা ভয়েস রিকগনিশন বা মেশিন দিয়ে বাংলা কথা শুনে বুঝতে পারার গবেষণা।

এই গবেষণার ফলাফল হচ্ছে আপনি এখন বাংলা ভাষায় একটা মেশিনকে কমান্ড দিতে পারেন। আর সেই মেশিন আপনার কথা মত কাজ করবে, টাইপ করবে, সার্চ করবে ইত্যাদি।

মানুষের সাথে মেশিনের এই যোগাযোগ হচ্ছে বাংলা ভাষাকে ভবিষ্যতের জন্য তৈরি করার গুরুত্বপূর্ণ একটা স্টেপ। এই গবেষণায় আমেরিকা প্রবাসী বাংলাদেশী কিংবা কলকাতার বাঙালীদের অংশগ্রহণ থাকলেও, রাষ্ট্র হিসেবে বাংলাদেশের কিংবা ভারতের কোনো পুঁজি কিংবা কোনো রাজনৈতিক অংশগ্রহণ নেই।

কারণ বাংলা ভাষা নিয়ে এই মহা কর্মযজ্ঞ গুগল, ফেইসবুক এবং মাইক্রোসফট করে যাচ্ছে তাদের নিজের মত করে, তাদের নিজের ব্যবসার স্বার্থে।

ভয়েস রিকগনিশন হচ্ছে যেকোনো ভাষা সংক্রান্ত সবচাইতে কঠিন টেকনোলজি। এর কারণটা বলছি।

ধরেন, বাংলা ভাষায় ১০,০০০ শব্দ আছে। এই ১০,০০০ শব্দ আঞ্চলিকতা এবং বাচনভঙ্গির তারতম্যের কারণে ২৫ কোটি বাঙালি কয়েক হাজার কোটি ভাবে উচ্চারণ করবে।

অর্থাৎ প্রতিটা বাংলা শব্দের কমপক্ষে কয়েক হাজার এবং কোনো কোনো ক্ষেত্রে কয়েক লক্ষ উচ্চারণের তারতম্য থাকবে।

উচ্চারণের ভিন্নতায় একই বাংলা শব্দের হাজারো রূপ রেকর্ড করে সাউন্ড ওয়েভের ইলেকট্রনিক লাইব্রেরি বানাতে হবে শুরুতে ভয়েস রিকগনিশনের প্রথম ধাপে।

তারপরে মেশিন লার্নিং কিংবা আরো অত্যাধুনিক কোনো টেকনোলজি দিয়ে যেকোনো উচ্চারণের একটা বাংলা শব্দ শুনলেই সেই শব্দটি লিখতে ও বুঝতে পারতে হবে গুগল কিংবা ফেইসবুককে।

শুধু উচ্চারণ না। আপনি যে ফোন ব্যবহার করছেন, যে কম্পিউটার ব্যবহার করছেন, যে পরিবেশে কথা বলছেন, আপনার ব্যাকগ্রাউন্ড নয়েজ, মাইক্রোফোন থেকে আপনার দূরত্ব, এবং মাইক্রোফোনের কোয়ালিটির উপরে আপনার উচ্চারিত শব্দের কোয়ালিটি ভিন্ন ভিন্ন হবে। এই সাউন্ড কোয়ালিটির পার্থক্য অগ্রাহ্য করে, এবং আপনার ভয়েসের উচ্চারণগুলোকে ঠিক মতো কাপচার করে গুগলের ভয়েস ডিটেকশন সফটওয়্যার ঠিক ধরে নেবে আপনি ঠিক কী বলতে চাচ্ছেন।

এই টেকনোলজি হচ্ছে মূলত একটা লাইব্রেরির ব্যবসা। যত লক্ষ লক্ষ মানুষ গুগলের কিংবা ফেইসবুকের তৈরি বাংলা লেখার ভয়েস কিবোর্ড ব্যবহার করবেন তত বেশি করে এই কোম্পানিগুলোর বাংলা সাউন্ডের লাইব্রেরি বাড়তে থাকবে, পরিশুদ্ধ হতে থাকবে।

এই সমৃদ্ধ সাউন্ড লাইব্রেরি পরবর্তীতে ব্যবহার হবে অটোমেটিক ট্রান্সলেশনের কাজে, যেখানে আপনি বাংলা ভাষায় কথা বলতে থাকলে, মেশিনের মাধ্যমে অনর্গল ইংরেজি বা অন্য যে কোনো ভাষায় কথা বের হতে থাকবে। মানে দোভাষীর কাজ আর কি।

আগামী কয়েক দশকে যে ড্রাইভার বিহীন গাড়ি, প্লেন, ড্রোন, জাহাজ, বাসায় কাজ করার রোবট, ইন্ডাস্ট্রিয়াল রোবট থেকে শুরু করে যে কোনো মেশিন এর সাথে বাংলা ভাষায় কথা বলার প্রয়োজন হবে, তার পেছনে থাকবে এই সাউন্ড লাইব্রেরি।

নতুন কোনো কোম্পানি নতুন করে লক্ষ লক্ষ বাঙালির উচ্চারণ ও শব্দগত পার্থক্য রেকর্ড করে লাইব্রেরি বানাতে শুরু করতে করতে, গুগলের লাইব্রেরি আরো এগিয়ে যাবে, আরো পরিশুদ্ধ হবে, আরো ইউজার ফ্রেন্ডলি হবে। এ কারণে এ ধরনের ইন্টেলেকচুয়াল প্রপার্টি বা লাইব্রেরি নির্ভর ব্যবসায় একবার কেউ এগিয়ে গেলে তাকে ফেলে দেওয়া খুব কঠিন হয়ে যায়।

হার্ডওয়ার নকল করে বানানো খুব সহজ। কিন্তু এ ধরনের সফটওয়্যার বা লাইব্রেরি নির্ভর ব্যবসা নকল করে বানানো ততটাই কঠিন।

অর্থাৎ আগামী শত বছরের জন্যে বাংলা ভাষাকে নতুন টেকনোলজি ফ্রন্টিয়ারে নিয়ে যাওয়ার কাজটি করবে বাংলাদেশ বা কলকাতা থেকে সাত হাজার মাইল দূরে অবস্থিত কিছু ক্যাপিটালিস্ট, প্রাইভেট কম্পানি, যার সুফল ভোগ করবেন আপনি। অনেকটা ফ্রিতেই।