Author : Prateek Tripathi

Expert Speak Digital Frontiers
Published on Mar 24, 2026 Updated 0 Hours ago

ফ্রন্টিয়ার এআই মডেলের তুলনায় উল্লেখযোগ্যভাবে কম দক্ষ হওয়া সত্ত্বেও ওয়েট-স্পার্স ট্রান্সফরমারের মতো যান্ত্রিক ব্যাখ্যাযোগ্যতা মডেলগুলি শিল্পে ব্যবহার বৃদ্ধি এবং এআই-এর উপর সামাজিক আস্থা প্রতিষ্ঠার ক্ষেত্রে প্রচুর লাভ এনে দিতে পারে।

ওয়েট-স্পার্স ট্রান্সফরমার এবং এআই উন্নয়নের ভবিষ্যৎ

যদিও জেনারেটিভ আর্টিফিশিয়াল ইন্ট্যালিজেন্স (এআই) এবং লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম)-‌এর অসাধারণ উত্থান বিভিন্ন ক্ষেত্রের মধ্যে বিশাল সংখ্যক অভিনব প্রয়োগ নিয়ে এসেছে, তবুও এই মডেলগুলির অভ্যন্তরীণ কার্যকারিতা মূলত অজানা রয়ে গিয়েছে, যা এগুলিকে পক্ষপাত, বিভ্রম ও ব্যাকডোর-‌সহ বিভিন্ন হুমকির সামনে অরক্ষিত বলে চিহ্নিত করেছে। এই ক্ষেত্রে, ওপেনএআই-এর ওয়েট-স্পার্স ট্রান্সফরমার মডেলের উপর অভিনব কাজ উৎসাহব্যঞ্জক এবং তথাকথিত "এআই ব্ল্যাক বক্স" সমস্যার একটি কার্যকর সমাধান দিতে পারে। যদিও জিপিটি-৫-এর মতো উন্নত এলএলএম-এর ক্ষমতার সঙ্গে কোনওভাবেই তুলনীয় নয়, তবুও ওয়েট-স্পার্স ট্রান্সফরমারগুলি বর্তমান এআই মডেলগুলির অপারেশনাল ভিত্তিকে ঘিরে রহস্যের নতুন অন্তর্দৃষ্টি প্রদান করতে পারে, যার ফলে এআই ব্যবহারের জন্য আরও নিরাপদ ও বিশ্বাসযোগ্য ভবিষ্যতের পথ প্রশস্ত হয়।

ডেন্স নেটওয়ার্কস, ওজন এবং ট্রান্সফরমার

নিউরাল নেটওয়ার্কগুলিতে একাধিক স্তরে সাজানো নোড বা নিউরন থাকে, যা বিভিন্ন ধরন পর্যালোচনা করে ভবিষ্যদ্বাণী করে। এই নোডগুলির বেশিরভাগই সংলগ্ন স্তরগুলিতে অন্য সকলের সঙ্গে সংযুক্ত থাকে, যার ফলে "ডেন্স নেটওয়ার্কস" তৈরি হয়। এই নোডগুলির মধ্যে সংযোগের শক্তি ওজন এবং পক্ষপাত নামক সংখ্যাসূচক মান দ্বারা নির্ধারিত হয়, যা ত্রুটি হ্রাস করার জন্য পুনরাবৃত্তিমূলকভাবে সমন্বিত করা হয়। প্রতিটি নোড তার আগত সংযোগগুলিতে একটি ওজন নির্ধারণ করে, যা একটি নির্দিষ্ট নিম্নসীমার মান অতিক্রম করলে ডেটা দিয়ে গুণ করা হয়; অন্যথায়, এটি শূন্যে সেট করা হয়। পরবর্তীকালে, ওজনযুক্ত ইনপুটগুলিকে একটি পক্ষপাতের সঙ্গে যুক্ত করা হয় এবং চূড়ান্ত পূর্বাভাস দেওয়ার জন্য একটি অ্যাক্টিভেশন ফাংশনের মধ্য দিয়ে প্রেরণ করা হয়।

চিত্র ১: একটি নিউরাল নেটওয়ার্কের মৌলিক কাঠামো
Weight Sparse Transformers And The Future Of Ai Development
সূত্র: মিডিয়াম

জেনারেটিভ এআই মূলত "ট্রান্সফরমার transformer,  " নামে পরিচিত একটি নির্দিষ্ট নিউরাল নেটওয়ার্ক স্থাপত্যের উপর কাজ করে, যা ২০১৭ সালে তৈরি হয়েছিল এবং নিউরাল নেটওয়ার্ক ও মেশিন লার্নিংয়ের জন্য একটি বিবর্তনমূলক পদক্ষেপ ছিল, যা অবশেষে চ্যাটজিপিটি-র মতো এলএলএম-এর দিকে চালিত করে।

ব্ল্যাক বক্স সমস্যা

জেনারেটিভ এআই এবং এলএলএম-এর একটি প্রধান সমস্যা হল যে তারা মূলত ব্ল্যাক বক্স হিসেবে কাজ করে। এর কারণ হল ট্রান্সফরমার মডেলগুলি ডেন্স নেটওয়ার্ক দ্বারা গঠিত, যা নোডের একটি বিশাল সংগ্রহ নিয়ে গঠিত। এগুলি জটিল উপায়ে নিজেদের মধ্যে যোগাযোগ করে, প্রতিটি নোড একাধিক ভিন্ন বৈশিষ্ট্য উপস্থাপন করে — এই ঘটনাটি সুপারপজিশন নামে পরিচিত। ফলস্বরূপ, ট্রান্সফরমার মডেলগুলি আসলে কীভাবে কাজ করে তা বোঝা এবং বিভ্রম ও পক্ষপাতের মতো অসঙ্গতির পিছনের সঠিক কারণটি আলাদা করা অবিশ্বাস্যভাবে চ্যালেঞ্জিং, যা একাধিক ক্ষেত্রে প্রযুক্তির জন্য অবিশ্বাস্যভাবে ক্ষতিকারক প্রমাণিত হয়েছে। উদাহরণস্বরূপ, এর সবচেয়ে কুখ্যাত উদাহরণগুলির মধ্যে একটি ঘটেছিল ২০২৩ সালে, যখন গুগলের বার্ড চ্যাটবট ভুলভাবে বলেছিল যে জেমস ওয়েব স্পেস টেলিস্কোপই প্রথম পৃথিবীর সৌরজগতের বাইরের কোনও গ্রহের ছবি তুলেছিল, যার ফলে পরবর্তীকালে এর মূল সংস্থা অ্যালফাবেট বাজার মূল্যে ১০০ বিলিয়ন মার্কিন ডলারেরও বেশি হারাতে বাধ্য হয়।


এআই মডেলগুলিকে আরও ভালোভাবে বোঝার প্রচেষ্টা "যান্ত্রিক ব্যাখ্যাযোগ্যতা" নামে পরিচিত একটি ক্ষেত্র তৈরির দিকে চালিত করে, যার লক্ষ্য ডেন্স নিউরাল নেটওয়ার্কগুলিকে বিপরীতভাবে প্রকৌশলী করা এবং তাদের অন্তর্নিহিত অ্যালগরিদমগুলিকে মানুষের বোধগম্য ধারণায় রূপান্তরিত করা।



এআই মডেলগুলিকে আরও ভালোভাবে বোঝার প্রচেষ্টা "যান্ত্রিক ব্যাখ্যাযোগ্যতা" নামে পরিচিত একটি ক্ষেত্র তৈরির দিকে চালিত করে, যার লক্ষ্য ডেন্স নিউরাল নেটওয়ার্কগুলিকে বিপরীতভাবে প্রকৌশলী করা এবং তাদের অন্তর্নিহিত অ্যালগরিদমগুলিকে মানুষের বোধগম্য ধারণায় রূপান্তরিত করা। যদিও যান্ত্রিক ব্যাখ্যাযোগ্যতা অর্জনের জন্য বেশ কয়েকটি প্রচেষ্টা করা হয়েছে, তবে এখনও পর্যন্ত কোনওটিই বিশেষভাবে সফল হয়নি।

ওয়েট-স্পার্স ট্রান্সফরমার

সাম্প্রতিক একটি গবেষণাপত্রে, ওপেনএআই "ওয়েট-স্পার্স ট্রান্সফরমার" ধারণাটি চালু করেছে, যা ট্রান্সফরমার মডেলগুলি কীভাবে কাজ করে তা বোঝা অনেক সহজ করে তোলে। এটি এই কাজটি করে ট্রান্সফরমারগুলিকে এমন সব সহজ, হস্তনির্মিত কাজের জন্য প্রশিক্ষণ দিয়ে যেখানে বেশিরভাগ ওজন শূন্য। উদাহরণস্বরূপ, নিযুক্ত কাজের মধ্যে একটি ছিল বাক্যের শেষে সমাপনী উদ্ধৃতি চিহ্ন যোগ করা।

এটি সরল, সূক্ষ্ম-দানাযুক্ত বা "স্পার্স" সার্কিটের দিকে চালিত করে যেখানে নোডগুলিতে সরল এবং ব্যাখ্যাযোগ্য সংযোগের সংখ্যা উল্লেখযোগ্যভাবে হ্রাস পায়, যার ফলে সুপারপজিশন দ্বারা সৃষ্ট জটিলতা সীমিত হয়। অতএব, স্পার্স সার্কিটগুলি মূলত সীমিত সংখ্যক সংযোগ নিয়ে গঠিত নোডগুলিকে নিয়ে তৈরি জটবিহীন নিউরাল নেটওয়ার্কের দিকে চালিত করে।

চিত্র ২: ডেন্স বনাম স্পার্স সার্কিট
Weight Sparse Transformers And The Future Of Ai Development
সূত্র: ওপেনএআই

তবে, ওয়েট-স্পার্স ট্রান্সফরমারগুলির জন্য একটি মূল্য দিতে হয়। তারা মূলত ব্যাখ্যাযোগ্যতার জন্য ক্ষমতা বিনিময় করে, যা তুলনীয় ক্ষমতার ডেন্স মডেলের তুলনায় এগুলিকে ১০০ থেকে ১০০০ গুণ কম দক্ষ করে তোলে।

সুবিধা এবং অসুবিধা

যদিও এই নতুন শ্রেণির স্পার্স মডেলগুলিকে ওপেনএআই-এর জিপিটি-৩-এর ক্ষমতা স্তরের বাইরে নিয়ে যাওয়া অসম্ভব, তবুও তারা এআই মডেলগুলির  ভবিষ্যৎ সম্পর্কে কিছু আকর্ষণীয় সম্ভাবনা উপস্থাপন করে। এর মূল কারণ হল ওপেনএআই গবেষণা দল ব্রিজ ব্যবহারের মাধ্যমে ওয়েট-স্পার্স ট্রান্সফরমারগুলিকে ডেন্স মডেলের সঙ্গে সংযুক্ত করতে সক্ষম হয়েছে। এর অর্থ হল তারা ফ্রন্টিয়ার মডেলগুলির অভ্যন্তরীণ কার্যকারিতা ব্যাখ্যা করতে সক্ষম হতে পারে, যদিও তারা নিজেরা সেগুলির স্তরে পৌঁছতে পারে না। তার উপর, একটি স্পার্স ব্রিজড মডেলকে প্রশিক্ষিত করা যেতে পারে সম্ভাব্যভাবে প্রতারণা, প্রত্যাখ্যান এবং লক্ষ্য-সন্ধানের মতো সংকীর্ণ কিন্তু গুরুত্বপূর্ণ কার্য বিতরণে, যা এআই সুরক্ষা হুমকি মোকাবিলায় অবিশ্বাস্যভাবে কার্যকর হতে পারে।

যদিও বিদ্যমান এলএলএম-এর একটি কার্যকর বিকল্প নয়, তবুও বিদ্যমান এআই মডেলগুলির আরও ব্যাপক ধারণা অর্জনের দৃষ্টিকোণ থেকে ওয়েট-স্পার্স ট্রান্সফরমারগুলি অত্যন্ত সহায়ক হতে পারে।

সুতরাং, যদিও বিদ্যমান এলএলএম-এর একটি কার্যকর বিকল্প নয়, তবুও বিদ্যমান এআই মডেলগুলির আরও ব্যাপক ধারণা অর্জনের দৃষ্টিকোণ থেকে ওয়েট-স্পার্স ট্রান্সফরমারগুলি অত্যন্ত সহায়ক হতে পারে। তার উপর, বাণিজ্যিক দৃষ্টিকোণ থেকে এগুলি কম প্রাসঙ্গিক হতে পারে, তবে ওজন-বিচ্ছিন্ন ট্রান্সফরমারের মতো যান্ত্রিক ব্যাখ্যাযোগ্যতা মডেলগুলি এআই ব্ল্যাক বক্স খোলার জন্য এবং কার্যকরী স্তরে কীভাবে কাজ করে তা উন্মোচনের জন্য অপরিহার্য। এটি বোঝা এবং সম্ভাব্যভাবে হ্যালুসিনেশনের মতো সমস্যাগুলি দূর করা অত্যন্ত গুরুত্বপূর্ণ, যা জেনারেটিভ এআই-এর কার্যকারিতা এবং প্রয়োগযোগ্যতাকে মারাত্মকভাবে বাধাগ্রস্ত করছে, যার ফলে ভবিষ্যতের অগ্রগতির উপযোগিতা সীমিত হচ্ছে।

এআই উন্নয়ন এবং গ্রহণের ভবিষ্যতের উপর প্রভাব

বর্তমানে এআই গ্রহণের ক্ষেত্রে একটি মৌলিক সমস্যা হল যে, এআই মডেলগুলি ক্রমাগত বিভ্রমের মতো নিরাপত্তা হুমকিতে ভুগছে, যা শেষ পর্যন্ত তাদের অভ্যন্তরীণ ক্রিয়াকলাপ অনুধাবনের অভাব থেকে উদ্ভূত হয়। এর ফলে বেশ কয়েকটি উদাহরণ দেখা গিয়েছে যেখানে এআই চ্যাটবটগুলি অপ্রত্যাশিত এবং এমনকি বিদ্বেষপূর্ণভাবে কাজ করেছে, যার মধ্যে ব্যবহারকারীদের অপরাধ করার জন্য ইঙ্গিত দেওয়াও অন্তর্ভুক্ত। এরকম একটি ঘটনা টেক্সাসের ১৭ বছর বয়সী এক কিশোরের সঙ্গে সম্পর্কিত, যে ক্যারেক্টর.এআই চ্যাটবট থেকে এই ইঙ্গিতপূর্ণ মন্তব্য পেয়েছিল যে তার স্ক্রিন টাইম সীমিত করার জন্য তার বাবা-মাকে হত্যা করা উচিত। এই মডেলগুলির দ্বারা সৃষ্ট সামাজিক বিপন্নতার বাইরে, এটি একই সঙ্গে প্রযুক্তির উপর শিল্পের আস্থা গড়ে তোলার প্রচেষ্টার জন্য বেশ ক্ষতিকারক হয়েছে, যার ফলে ব্যাপক আকারের শিল্পক্ষেত্রে ব্যবহার মারাত্মকভাবে ব্যাহত হয়েছে।


এই প্রেক্ষাপটে, যদিও এআই উন্নয়নের জন্য উদীয়মান পদ্ধতিগুলিকে — যেমন যান্ত্রিক ব্যাখ্যাযোগ্যতা এবং গ্লাস-‌বক্স মডেল  — ফ্রন্টিয়ার মডেলগুলির তুলনায় বাণিজ্যিকভাবে কম লাভজনক বলে মনে হতে পারে, তারা মানুষের আস্থা তৈরি করতে এবং এআই ব্যবহার বৃদ্ধিতে গুরুত্বপূর্ণ ভূমিকা পালন করতে পারে। এটি বিনিয়োগকারীদের আস্থা বজায় রাখার জন্য গুরুত্বপূর্ণ, এবং এআই-‌এর জন্য একটি নিরাপদ ও পূর্বাভাসযোগ্য ভবিষ্যৎ নির্দেশনায় ব্যাপকভাবে সাহায্য করতে পারে। আরও গুরুত্বপূর্ণ বিষয় হল, এআই দ্বারা সৃষ্ট অস্তিত্বগত হুমকি মোকাবিলায় তারা অনেক দূর এগিয়ে যেতে পারে, কারণ নীতিগতভাবে এই মডেলগুলি ব্যবহার করে দূষিত এবং ত্রুটিপূর্ণ আউটপুটগুলিকে কার্যকরভাবে মোকাবিলা করা এবং নির্মূল করা যেতে পারে।



বর্তমানে বাণিজ্যিকভাবে কম লাভজনক হওয়া সত্ত্বেও, ওয়েট-স্পার্স ট্রান্সফরমারের মতো যান্ত্রিক ব্যাখ্যাযোগ্যতা মডেলগুলিতে বিনিয়োগ করা হলে তার মাধ্যমে জাতীয় ‌এআই লক্ষ্যগুলির একটি মৌলিক নীতি তৈরি হওয়া উচিত, এবং সেইসঙ্গেই তা ক্রমবর্ধমান উন্নত এলএলএম এবং জেনারেটিভ এআই মডেলগুলির মাধ্যমে এআই আধিপত্য অর্জনের পথ তৈরি করবে। 


উপসংহার

যদিও এআই-এর মানবিক ক্ষমতা বৃদ্ধির জন্য একটি গুরুত্বপূর্ণ হাতিয়ার হিসেবে গড়ে ওঠার ঐতিহাসিক সম্ভাবনা রয়েছে, তবে এর প্রকৃত কার্যকারিতা সম্পর্কে মৌলিক ধারণার অভাবের কারণে এটি মারাত্মকভাবে প্রতিবন্ধী। যদিও বেশিরভাগ দেশ দ্বারা অনুসরণ করা বর্তমান এআই উন্নয়ন মডেলগুলি সমকক্ষদের ছাড়িয়ে যাওয়া এবং প্রতিযোগিতামূলক সুবিধা অর্জনের উপর খুব বেশি নির্ভর করে — বিশেষ করে প্রযুক্তির দ্বৈত-ব্যবহারের প্রকৃতির কারণে — বাস্তবতা হল যে কোনও প্রযুক্তি মানুষের আস্থা অর্জন না করে সত্যিকার অর্থে অগ্রগতি করতে পারে না। ফলস্বরূপ, বর্তমানে বাণিজ্যিকভাবে কম লাভজনক হওয়া সত্ত্বেও, ওয়েট-স্পার্স ট্রান্সফরমারের মতো যান্ত্রিক ব্যাখ্যাযোগ্যতা মডেলগুলিতে বিনিয়োগ করা হলে তার মাধ্যমে জাতীয় ‌এআই লক্ষ্যগুলির একটি মৌলিক নীতি তৈরি হওয়া উচিত, এবং সেইসঙ্গেই তা ক্রমবর্ধমান উন্নত এলএলএম এবং জেনারেটিভ এআই মডেলগুলির মাধ্যমে এআই আধিপত্য অর্জনের পথ তৈরি করবে । এআই উপযোগিতা এবং ব্যবহারের ভবিষ্যৎ ভারসাম্যের মধ্যে ঝুলে আছে।



প্রতীক ত্রিপাঠী অবজারভার রিসার্চ ফাউন্ডেশনের সেন্টার ফর সিকিউরিটি, স্ট্র্যাটেজি অ্যান্ড টেকনোলজি (সিএসএসটি)-র অ্যাসোসিয়েট ফেলো।

The views expressed above belong to the author(s). ORF research and analyses now available on Telegram! Click here to access our curated content — blogs, longforms and interviews.

Author

Prateek Tripathi

Prateek Tripathi

Prateek Tripathi is an Associate Fellow  at the Centre for Security, Strategy and Technology. His work focuses on an emerging technologies and deep tech including quantum ...

Read More +