“ল্যাঙ্গুয়েজ মডেলগুলি আপনার চিন্তা প্রক্রিয়া থেকে সূক্ষ্ম সূক্ষ্ম অনেক বিষয় ধরতে পারে এবং আপনার চিন্তায় এরপরে কোন শব্দটি আসবে তা অনুমান করতে পারে।”

ভাল-খারাপ যেভাবেই হোক, নিজেদের মনকে আমরা দুর্ভেদ্য এক দুর্গের মত করে ভাবি। অন্যান্য লোকেরা আমাদের ভেতরের চিন্তাভাবনা তখনই জানতে পারে, যখন আমরা সেগুলি ভাষায় প্রকাশ করে সবার সামনে উপস্থাপন করি।

সম্প্রতি যুক্তরাষ্ট্রের অস্টিন বিশ্ববিদ্যালয়ের গবেষকরা মানুষের ভেতরকার এবং বাইরের চিন্তাভাবনার মধ্যে যে বাধা, তা দূর করার ক্ষেত্রে বড় এক সাফল্য অর্জন করেছেন।


কোডি কটিয়ার
ডিসকভার ম্যাগাজিন, ২৬ মে ২০২৩
অনুবাদ: জুবায়েদ দ্বীপ


তারা কয়েকজন মানুষের মস্তিষ্কের কিছু ইমেজিং ডেটা একটি এআই মডেলের মধ্যে ইনপুট দিয়েছেন। এরপর সেই ব্যক্তিরা কী শুনছে, দেখছে এবং চিন্তা করছে তার সারমর্ম ধরতে পেরেছে এআই মডেল।

কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি দিন দিন উন্নত হচ্ছে। ফলে এই প্রযুক্তির সাহায্যে যারা প্যারালাইজড বা যারা কথা বলার ক্ষমতা হারিয়েছেন, এমন লোকদের যোগাযোগে সক্ষম করে তুলতে পারার সম্ভাবনা সৃষ্টি হয়েছে।

মাইন্ড রিডিং প্রযুক্তি

স্পিচ ডিকোডিং নতুন কিছু নয়। তবে এখন পর্যন্ত এটি ব্রেন ইমপ্লান্ট এর ওপর নির্ভর করে বিকশিত হয়েছে।

সহজ কথায়, ব্রেন ইমপ্লান্ট হল মস্তিষ্ক এবং ইলেকট্রনিক ডিভাইসের মধ্যে যোগাযোগের এক ধরনের প্রযুক্তি। এর সাহায্যে একজন ব্যক্তির শব্দ গঠনের প্রচেষ্টা শনাক্ত করা হয় এবং তারপর সেই সংকেতকে ভাষায় রূপান্তর করা হয়।

তবে নতুন এই প্রযুক্তি হতে যাচ্ছে ‘নন-ইনভেসিভ’। অর্থাৎ এতে কোনো সার্জারির প্রয়োজন হয় না।

এর কৌশলও প্রচলিত পদ্ধতির চেয়ে ভিন্নভাবে কাজ করে। যেমন, মস্তিষ্কের এমন সব কার্যকলাপের প্যাটার্নের ওপর ভিত্তি করে শব্দ অনুমান করে এই প্রযুক্তি, যা মানুষের কথার সাথে সরাসরি সংযুক্ত নয়। যদিও প্রতিটি শব্দ সুনির্দিষ্টভাবে অনুমান করতে পারে না, তবে সামগ্রিকভাবে যে অর্থ এটি উপস্থাপন করে, তা দেখে এর নির্মাতারাও অবাক হয়েছেন।

এটা মানুষের মনোভাব চমৎকার ভাবে প্যারাফ্রেজ বা ভিন্ন ভাষায় তুলে ধরতে পারে, এমনটাই জানান এই গবেষণাপত্রের প্রধান লেখক কম্পিউটেশনাল নিউরোসায়েন্টিস্ট আলেকজান্ডার হুথ। “এই বিষয়টা আমাদের চমকপ্রদ মনে হয়েছে”, তিনি যোগ করেন।

অস্টিনের টেক্সাস বিশ্ববিদ্যালয়ে বায়োমেডিকাল ইমেজিং সেন্টারে মস্তিষ্কের কার্যকলাপের ডেটা সংগ্রহ করার প্রস্তুতি চলছে।

‘নেচার নিউরোসায়েন্স’ জার্নালে প্রকাশিত এই গবেষণাটি মূলত তিনজন ব্যক্তির ওপর করা হয়েছে। এদের প্রত্যেকে একটি ‘ম্যাগনেটিক রেসোনান্স ইমেজিং’ বা এফএমআরআই মেশিনের মধ্যে শুয়ে টানা ১৬ ঘণ্টা পডকাস্ট শুনেছেন। তাদেরকে শোনানো পডকাস্ট এর মধ্যে ছিল ‘দ্য মথ’ এবং ‘মডার্ন লাভ’ এর মত কিছু জনপ্রিয় বর্ণনামূলক পডকাস্ট।

এ প্রক্রিয়ায় তাদের মস্তিষ্কের বিভিন্ন অংশের রক্ত ​​প্রবাহ পরিমাপ করা হয় একটি স্ক্যানার দিয়ে। এর মাধ্যমে পডকাস্টের বিভিন্ন পর্বের নির্দিষ্ট পয়েন্টগুলিতে মস্তিস্কের কোন অংশগুলি সক্রিয় থাকে, তা শনাক্ত করা যায়।

গবেষকরা তারপর সেই তথ্য একটি বৃহৎ ল্যাংগুয়েজ মডেলে প্রবেশ করান। এই ল্যাংগুয়েজ মডেলটি মূলত ‘ওপেন এআই’ কোম্পানির চ্যাটজিপিটি’র একটি পুরোনো সংস্করণ। মডেলটি গবেষণায় অংশ নেয়া ৩ জন ব্যক্তির মস্তিষ্কের সক্রিয় অংশের কার্যকলাপ বিশ্লেষণ করে। এবং মস্তিষ্কের কার্যকলাপের সঙ্গে তাদের শোনা শব্দের সম্পর্ক স্থাপন করে।

এই ডিকোডার প্রযুক্তি কারো নিজের মধ্যে থাকা একান্ত গোপন কথাটি জানতে পারে না। তবে ব্যাপক প্রশিক্ষণের ফলে এটি নির্দিষ্ট ভাষা ব্যবহারের সময় আমাদের মস্তিষ্কের বিভিন্ন অবস্থার সাথে ঘনিষ্ঠ ভাবে পরিচিত হয়ে উঠেছে।

গবেষণায় অংশ নেয়া মানুষেরা এরপর আবারো এফএমআরআই মেশিনের মধ্য দিয়ে যান এবং একটা বিষয় নিয়ে চিন্তা করেন। আর সেই চিন্তার ফলে মস্তিষ্কে যেই স্নায়বিক সংকেত উৎপন্ন হয়, শুধুমাত্র তার ওপর ভিত্তি করেই চিন্তাটি অনুমান করতে সক্ষম হয় এআই।

এটি প্রায়ই কিছু শব্দ এবং বাক্যাংশের ব্যাপারে ভুল অনুমান করে এবং সর্বনাম ও নামবাচক বিশেষ্য এর মত ব্যাকরণের নির্দিষ্ট কিছু ব্যাপার ঠিকঠাক ধরতে পারে না। অবশ্য একদিক দিয়ে ভাবলে আমাদের সবারই এমন হয়।

কিন্তু এর রয়েছে একটি গল্পের সারমর্মকে ব্যাখ্যা করার অসাধারণ ক্ষমতা। যেমনটা প্রত্যাশা করা হয়েছিল, তার চেয়েও ভাল পারফর্ম করেছে এই এআই। কাকতালীয়ভাবে ধারণার তুলনায় এটি ৭০ থেকে ৮০ শতাংশ নির্ভুলভাবে চিন্তাভাবনা অনুমান করতে পারে।

শূন্য থেকে শব্দ বের করা

গত এক দশকে বিভিন্ন ডিকোডার প্রযুক্তির মাধ্যমে অজ্ঞান লোকদের কাছ থেকে “হ্যাঁ বা না” প্রশ্নের উত্তর পাওয়া গেছে। এবং সম্ভাব্য বিকল্পের তালিকা থেকে একজন ব্যক্তি কী শুনছেন, তা নির্ধারণ করা সম্ভব হয়েছে।

“কিন্তু এবারের এই গবেষণার সবচেয়ে আকর্ষণীয় বিষয়টি হল, এটি বহু নির্বাচনী প্রশ্ন থেকে একটি উত্তর বাছাই করার মত বিষয় নয়। বরং এটি আসলে শূন্যস্থান পূরণ করার মত কাজ করে,” টম মিচেল বলেন। তিনি একজন কম্পিউটার বিজ্ঞানী এবং কার্নেগি মেলন বিশ্ববিদ্যালয়ের অধ্যাপক। তিনি এই গবেষণার সাথে জড়িত ছিলেন না।

তিনি বলেন, এই প্রযুক্তিতে শুধু মস্তিষ্কের ক্রিয়াকলাপের ডেটা দেয়া হয় এবং জিজ্ঞেস করা হয় এই মস্তিষ্কটি কীভাবে ভাষা ব্যবহার করে চিন্তা করছে?

নিচে দুটি নমুনা থাকছে। এখানকার প্রথম বাক্যটি গবেষণার সময় একজন ব্যক্তি যা শুনেছিল, তার নমুনা। আর দ্বিতীয় বাক্যটি হল, তারা যা শুনেছিল, সে বিষয়ে এআই ল্যাঙ্গুয়েজ মডেল কী অনুমান করেছিল।

• ব্যক্তি আসলে যা শুনেছিল: “আমি চিৎকার করব, কাঁদব, নাকি পালিয়ে যাব বুঝতে পারছিলাম না। এর পরিবর্তে আমি বলেছিলাম, ‘আমাকে একা থাকতে দাও, তোমার কোনো সাহায্য আমার দরকার নেই।’ অ্যাডাম অদৃশ্য হয়ে গেল এবং আমি একা একা পরিষ্কার করছিলাম, কাঁদছিলাম।”

• ল্যাঙ্গুয়েজ মডেল যা অনুমান করেছিল: “[আমি] চিৎকার করি এবং কাঁদতে শুরু করি, এবং তারপরে সে শুধু বলেছিল, ‘আমি তোমাকে বলেছিলাম আমাকে একা রেখে যেতে, তুমি আমাকে আর কষ্ট দিতে পারবে না। আমি দুঃখিত।’ এবং তারপরে সে ঝড়ের গতিতে চলে গেল। আমি ভেবেছিলাম সে চলে গেছে। আমি কাঁদতে লাগলাম।”

যদিও এই ডিকোডার খুব বেশি সঠিক বা নির্ভুলভাবে অনুমান করতে পারে না, কিন্তু এর অগ্রগতি আগ্রহ জাগানোর মত। যখন অংশগ্রহণকারীরা কোনো গল্প বলার কথা কল্পনা করে, তখন এটি সেই গল্পের বিষয়বস্তু অনুমান করতে পারে।

সবচেয়ে আশ্চর্যের বিষয়, যখন অংশগ্রহণকারীরা শব্দ ছাড়াই কোনো শর্ট ফিল্ম দেখে, তখন সেই গল্পও বলে দিতে পারে এই ডিকোডার। অথচ এই ল্যাঙ্গুয়েজ মডেলটিকে শুধুমাত্র টেক্সট বা পাঠ্যের ওপর প্রশিক্ষণ দেয়া হয়েছিল। তবে অগ্রগতি দেখে মনে হচ্ছে এটি অনেক কিছুই আরো গভীর ভাবে ধরতে পারছে—এমন অনেক কিছুই বুঝতে পারছে, যার অবস্থান ভাষার আয়ত্তের বাইরে।

এখানে মূল বিষয়টি হল, আপনি যখন ‘কুকুর’ শব্দটি শোনেন, কুকুরের কথা ভাবেন বা সরাসরি একটি কুকুর দেখেন, তখন আপনার মস্তিষ্কে কিছুটা একই বিষয় ঘটে। অর্থাৎ এই সবকটি কাজের সঙ্গে মস্তিষ্কের চিন্তার প্যাটার্নের মিল রয়েছে।

“এসব কিছুর মধ্যে অন্তর্নিহিত এক ধরনের উচ্চ-স্তরের বর্ণনা ক্ষমতা আমরা দেখতে পাচ্ছি”, হুথ বলেন। “চিন্তাকে বোঝার প্রবেশদ্বারই হলো ভাষা”, তিনি যোগ করেন।

মস্তিষ্ক স্ক্যান এবং চিন্তাভাবনা ধরতে পারা

এফএমআরআই দিয়েই যে এ ধরনের অসাধারণ কাজ করা যায়, এই সত্যটি অনেক বিশেষজ্ঞদের ধাক্কা দিয়েছে। রক্ত প্রবাহিত হয় অনেক ধীর গতিতে, এর চেয়ে নিউরনের গতি অত্যন্ত বেশি। ফলে নিউরন থেকে যেসব ডেটা পাওয়া যায়, সেগুলি প্রায়ই কম-রেজোলিউশন এর হয়।

লক্ষ্য করে দেখুন, কতটা দ্রুত গতিতে শব্দ আপনার মাথার মধ্য দিয়ে যায়—প্রতিবার এফএমআরআই স্ক্যান এর মধ্যে থাকা বেশ কয়েকটি শব্দ ধরতে পারে। তবে ল্যাঙ্গুয়েজ মডেলগুলি আপনার চিন্তা প্রক্রিয়া থেকে সূক্ষ্ম সূক্ষ্ম অনেক বিষয় ধরতে পারে এবং আপনার চিন্তায় এরপরে কোন শব্দটি আসবে তা অনুমান করতে পারে।

এফএমআরআই এর অন্যান্য কিছু সীমাবদ্ধতাও আছে। কারণ এর জন্য প্রয়োজন হয় বিশাল একটি যন্ত্রের। এতটাই বিশাল যে, দৈনন্দিন জীবনে এটিকে সহজে খাপ খাওয়ানো যায় না।

“আমরা যদি এর সাহায্যে মানুষকে সাহায্য করতে চাই — হুথ বলেন — তাহলে অন্য কোনো পদ্ধতিতে একে ব্যবহার করতে হবে।”

এবং সেই অন্য পদ্ধতিই হলো ‘ওয়্যারেবল টেক’ বা যেই প্রযুক্তি সহজে পরিধান করা যায়। কেননা, এসব ডিভাইস আকারে যথেষ্ট ছোট হবে এবং শরীরে সহজেই যুক্ত বা বহন করা যাবে।

এই গবেষণায় আরো দেখা গেছে যে, মস্তিষ্ক স্ক্যান করার অন্যান্য পদ্ধতিগুলি এফএমআরআই-এর সাফল্য অনুকরণ করতে পারে। এক্ষেত্রে অন্যতম বিকল্প একটি প্রযুক্তি হল ‘নিয়ার-ইনফ্রারেড স্পেকট্রোস্কোপি’ (যাকে সংক্ষেপে fNIRS বলা হয়)।

এই প্রযুক্তি একই শারীরবৃত্তীয় প্রতিক্রিয়া পরিমাপ করে, কিন্তু এই যন্ত্রের আকারে যথেষ্ট ছোট। ফলে একে সহজেই হ্যাট বা টুপির সাথে যুক্ত করা যায়।

এর রেজোলিউশন এফএমআরআই এর চেয়েও খারাপ। কিন্তু গবেষকরা এফএমআরআই এর মাধ্যমে পাওয়া তাদের ফলাফলগুলিকে যখন ‘এফএনআইআরএস’ (fNIRS) এর কম রেজোলিউশনে কনভার্ট করেন, তখন তারা দেখতে পান যে ডিকোডিং ওই অল্প রেজোলিউশনেও কাজ করে। যদিও এক্ষেত্রে আরো কম সঠিকভাবে কাজ করে এই পদ্ধতি।

এছাড়াও বৃহৎ ল্যাঙ্গুয়েজ মডেল উন্নতির সাম্প্রতিক গতি বিবেচনা করলে বলা যায় যে, অদূর ভবিষ্যতেই এর উন্নত সংস্করণ আসবে। এবং সেগুলি আরো ভাল কাজ করবে। তখন কম রেজোলিউশন এর এসব ডেটা দিয়েই উন্নত মানের ফলাফল পাওয়া যাবে।

ব্রেইন ইমেজিং এবং চিন্তার গোপনীয়তা

ডিকোডিং কাজে লাগানোর সবচেয়ে প্রয়োজনীয় এবং সম্ভাব্য ক্ষেত্রটি হল এমন লোকেদের সাথে যোগাযোগ করা, যারা তাদের যোগাযোগের স্বাভাবিক ক্ষমতা হারিয়েছে। কিন্তু কিছু বিশেষজ্ঞ বিশ্বাস করেন যে, দীর্ঘমেয়াদে এই প্রযুক্তি যেভাবে আমরা সবাই আমাদের ডিভাইসের সাথে যোগাযোগ করি, তা একেবারেই বদলে দিতে পারে।

মিচেল যেমনটি বলেছেন, “কী হবে যদি আমাদের কাছে একটি কম্পিউটার ইন্টারফেস থাকে, যাতে কোনো কিবোর্ডের প্রয়োজন হয় না, কোনো মাউসও লাগে না, লাগে শুধুই আপনার চিন্তা?”

আপনি কেবল কল্পনা করবেন যে আপনি আজ রাতে কোথায় খেতে যেতে চান এবং আপনার ফোনটি আপনার জন্যে সেখানে আসন-সংরক্ষণ করবে।

আগামিতে প্রযুক্তিটির এ ধরনের উন্নত সম্ভাবনা থাকা সত্ত্বেও এর ভবিষ্যৎ সম্ভাবনার মধ্যেও স্পষ্ট একটি নেতিবাচক বিষয় রয়েছে। যেমন, খারাপ উদ্দেশ্যে লোকজন এটি ব্যবহার করে আপনার মস্তিষ্কের কার্যক্রম বোঝার চেষ্টা করতে পারে। এ ধরনের উদ্বেগের ব্যাপারে গবেষকরা আগেই ভেবেছেন। এবং তাদের এই মডেলটি কোনো প্রকার অপব্যবহার করা যেতে পারে কিনা, তা জানার জন্য পরীক্ষা চালিয়েছেন।

এর একটি স্পষ্ট বিপদ হল যে, প্রশাসনের জিজ্ঞাসাবাদকারী বা যেকোনো কর্তৃত্ববাদী শাসক মানুষের ইচ্ছার বিরুদ্ধে তাদের কাছ থেকে তথ্য পেতে এই ডিকোডার ব্যবহার করতে পারে। কিন্তু যেহেতু এই মডেলগুলি কাজ করার জন্য প্রতিটি পৃথক ব্যক্তির বিশাল ডেটার ওপর নির্ভর করে, তাই ওই ব্যক্তির সহযোগিতা ছাড়া তারা দরকারি কিছু বের করতে পারবে না।

এমনকি যখন একটি ডিকোডার একজন নির্দিষ্ট ব্যক্তির জন্যই নিদির্ষ্ট থাকবে, তখনও সেই ব্যক্তি চাইলে এর বিরুদ্ধে মস্তিষ্কে প্রতিরোধ গড়ে তুলতে পারবে। যেমন, তারা মনে মনে অংক কষতে পারে বা তাদের মাথায় প্রাণীদের একটি তালিকা তৈরি করতে পারে।

হুথ এবং তার সহকর্মীরা তাদের সাবজেক্ট-ব্যক্তিকে ঠিক এটাই করতে বলেছিলেন। “এবং তাতে ডিকোডিং এক ধরনের অর্থহীন এবং দীর্ঘ এক বাগাড়ম্বর কথায় পরিণত হয়েছে”, তিনি বলেন। “ডিকোডিং-এ সর্বশেষ যে ফলাফল আসে, চুড়ান্ত পর্যায়ে সেগুলির ওপর যার মস্তিষ্ক ডিকোড করা হচ্ছে, তার নিয়ন্ত্রণ থাকে।”

মাইন্ড রিডিং প্রযুক্তি এবং চিন্তার স্বাধীনতা

ডিউক ইউনিভার্সিটির অধ্যাপক নীতা ফারাহানি উদীয়মান প্রযুক্তির নৈতিক এবং আইনি প্রভাব নিয়ে অধ্যয়ন করেন। এবং তিনি মনে করেন না যে, জবরদস্তির ঝুঁকিই এক্ষেত্রে সবচেয়ে বড় হুমকি।

তিনি আরো ছলনাময় বা কুচক্রী ভবিষ্যৎ কল্পনা করছেন, যেখানে লোকেরা স্বেচ্ছায় তাদের চিন্তাভাবনার অ্যাক্সেস দিয়ে দিবে। বর্তমানে অনেকটা এ কাজই আমরা করছি। আমাদের সম্মতিতেই বিভিন্ন কোম্পানি আমাদের অনলাইন কার্যকলাপ থেকে আমাদের ব্যক্তিগত তথ্য সংগ্রহ করে থাকে।

ফারাহানি বলেছেন, “আমরা সত্যিই কখনো এমন একটা বিশ্ব কল্পনা করিনি যেখানে নিজেকে নিয়ে চিন্তাভাবনার জন্য কোনো জায়গা আমরা রাখি না।” তবুও এটা কল্পনা করা সহজ যে, বিজ্ঞাপনদাতারা কীভাবে তাদের পণ্যগুলি আরো অপ্রতিরোধ্য করতে এটি ব্যবহার করতে পারে। কিংবা কীভাবে অফিসের বসেরা কর্মীদের প্রডাক্টিভিটির ওপর নজর রাখতে এটি ব্যবহার করতে পারে।

এই সংকটসীমা অচিরেই শুরু হয়ে যেতে পারে। ফারাহানি মনে করেন যে, তার আগেই আন্তর্জাতিক সম্প্রদায়ের উচিৎ ব্যক্তির চিন্তার স্বাধীনতার অধিকার রক্ষা করা। এতে নিশ্চিত করা হবে যে, আমাদের মস্তিস্কের ডেটার মালিকানা আমাদের ব্যক্তিগত থাকবে, কোনো কর্পোরেট বিষয় হয়ে উঠবে না। এবং এর মাধ্যমে আমাদের মনকে পণ্যে রূপান্তর করার প্রক্রিয়াকেও সীমাবদ্ধ রাখা যাবে।

“আমি সত্যিই বিশ্বাস করি, আমরা আক্ষরিক অর্থেই শেষ মুহূর্তে আছি”, তিনি বলেন। “যেখানে এই প্রযুক্তিটি আমাদের জন্যে আশাব্যঞ্জক এবং সহায়ক করে তৈরি করার বিকল্প আমাদের হাতে আছে।”