উন্নয়নশীল বিশ্বে কৃত্রিম বুদ্ধিমত্তা-১১ || ড. আনিস রহমান

স্বল্প-সম্পদ ভাষা ডিজিটাল অন্তর্ভুক্তি: কৃত্রিম বুদ্ধিমত্তার মাধ্যমে ভাষাগত বৈষম্য দূরীকরণ

. নাগরিক সেবায় এআই অনুবাদ এবং আঞ্চলিক ভাষার প্রভাব

একটি দেশের সুশাসন অন্তর্ভুক্তিমূলক উন্নয়নের জন্য সরকারি সেবা জনগণের নিজস্ব ভাষায় পৌঁছানো অপরিহার্য। ভাষাগত বাধার কারণে গ্রামীণ জনগোষ্ঠী অনেক সময় সরকারি সুযোগ-সুবিধা থেকে বঞ্চিত হয়। এই সমস্যা সমাধানে এআই অনুবাদ এবং চ্যাটবটের প্রয়োগ এখন আর কেবল প্রমিত বাংলার মধ্যে সীমাবদ্ধ নেই, বরং এটি স্থানীয় উপভাষায় সেবা প্রদানের দিকে ধাবিত হচ্ছে। বাংলাদেশের জাতীয় হেল্পলাইন ৩৩৩ এই অন্তর্ভুক্তিতে এক অনন্য উদাহরণ সৃষ্টি করেছে। ঘূর্ণিঝড় বা মহামারির মতো দুর্যোগকালীন সময়ে প্রান্তিক মানুষের কাছে তথ্য পৌঁছে দিতে এই হেল্পলাইনটি গুরুত্বপূর্ণ ভূমিকা পালন করে। বর্তমানে ভয়েস-ভিত্তিক এআই সিস্টেমগুলো মানুষের মৌখিক প্রশ্ন সরাসরি বুঝতে পারছে এবং স্বাভাবিক মানুষের মতো কথোপকথন করতে সক্ষম হচ্ছে। এর ফলে যাদের ইন্টারনেটে টাইপ করার বা স্মার্টফোন ব্যবহার করার দক্ষতা নেই, তারাও কেবল ফোনে কথা বলে সরকারি তথ্য সেবা নিতে পারছেন।

নাগরিক সেবায় এআই-এর আরও একটি গুরুত্বপূর্ণ দিক হলো আইনি প্রশাসনিক নথিপত্রের সহজ অনুবাদ। আইনি ভাষা বা লিগ্যাল টার্মগুলো সাধারণ মানুষের কাছে অত্যন্ত জটিল মনে হতে পারে। লার্জ ল্যাঙ্গুয়েজ মডেল ব্যবহার করে এই জটিল শব্দগুলোকে সহজবোধ্য আঞ্চলিক বাংলায় রূপান্তর করা সম্ভব হচ্ছে, যা সাধারণ মানুষকে আইনি অধিকার সম্পর্কে সচেতন করে তোলে। আইনি এনএলপি প্রযুক্তির মাধ্যমে মামলার অবস্থা পর্যবেক্ষণ এবং রায়ের বিশ্লেষণ করা সহজতর হচ্ছে। এছাড়া প্রতিবন্ধী ব্যক্তিদের অন্তর্ভুক্তিতেও এআই অনুবাদ এক শক্তিশালী হাতিয়ার। দৃষ্টিপ্রতিবন্ধী ব্যক্তিদের জন্য সরকারি ওয়েবসাইট নথিপত্রকে অডিওতে রূপান্তর করার জন্য উন্নত টেক্সট-টু-স্পিচ মডেল ব্যবহৃত হচ্ছে। স্ক্রিন রিডার এবং ভয়েস কমান্ড প্রযুক্তির মাধ্যমে এখন একজন বিশেষ চাহিদাসম্পন্ন নাগরিকও স্বাধীনভাবে সরকারি সেবা গ্রহণ করতে পারছেন। নাগরিক সেবায় এআই-এর প্রয়োগের পেছনে যে প্রযুক্তিগত ভিত্তি কাজ করছে, তা মূলত ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (ঘখচ) এবং কৃত্রিম বুদ্ধিমত্তার বিভিন্ন শাখার সমন্বয়। নিচে এর মূল বৈজ্ঞানিক প্রযুক্তিগত দিকগুলো সংক্ষেপে ব্যাখ্যা করা হলো:

. স্পিচ-টু-টেক্সট (ঝঞঞ) অটোমেটিক স্পিচ রিকগনিশন (অঝজ) - উপরোল্লিখিত ভয়েস-ভিত্তিক এআই সিস্টেমগুলো মূলত অঝজ প্রযুক্তির ওপর ভিত্তি করে কাজ করে।

প্রক্রিয়া: এটি মানুষের কণ্ঠস্বরকে (অডিও সংকেত) ডিজিটাল ডেটায় রূপান্তর করে। বর্তমানের ঞৎধহংভড়ৎসবৎ-নধংবফ আর্কিটেকচার (যেমন: ঙঢ়বহঅও-এর ডযরংঢ়বৎ বা ওয়েভ-টু-ভেক মডেল) আঞ্চলিক উপভাষার ভিন্নধর্মী উচ্চারণ বাচনভঙ্গি শনাক্ত করতে সক্ষম। চ্যালেঞ্জ: আঞ্চলিক ভাষার ক্ষেত্রে মূল চ্যালেঞ্জ হলোকোড-মিক্সিংএবং বিভিন্ন ডায়ালেক্টের ভিন্নতা। আধুনিক এআই মডেলগুলো বিপুল পরিমাণ মাল্টি-লিঙ্গুয়াল ডেটাসেটের ওপর প্রশিক্ষিত হওয়ায় এই বাধা অতিক্রম করতে পারছে।

. লার্জ ল্যাঙ্গুয়েজ মডেল (খখগ) কন্টেক্সচুয়াল আন্ডারস্ট্যান্ডিং - জটিল আইনি বা প্রশাসনিক নথিপত্র সহজ করার ক্ষেত্রে খখগ (যেমন: এচঞ-, খষধসধ-) ব্যবহৃত হচ্ছে।

প্রক্রিয়া: এগুলো মূলত অঃঃবহঃরড়হ গবপযধহরংস ব্যবহার করে একটি বাক্যের প্রতিটি শব্দের পারস্পরিক সম্পর্ক গভীর অর্থ বিশ্লেষণ করে। প্যারফ্রেজিং সিমপ্লিফিকেশন: আইনি ভাষার জট খুলতে মডেলগুলোকে 'ওহংঃৎঁপঃরড়হ ঞঁহরহম'-এর মাধ্যমে এমনভাবে প্রশিক্ষণ দেওয়া হয়, যাতে তারা মূল আইনি তথ্যের শুদ্ধতা বজায় রেখে সেটিকে সাধারণ মানুষের বোধগম্য ভাষায় (চষধরহ খধহমঁধমব) রূপান্তর করতে পারে।

. ন্যাচারাল ল্যাঙ্গুয়েজ আন্ডারস্ট্যান্ডিং (ঘখট) চ্যাটবট - নাগরিক হেল্পলাইনের চ্যাটবটগুলো কেবল কি-ওয়ার্ড খোঁজে না, বরং ব্যবহারকারীর উদ্দেশ্য বা 'ওহঃবহঃ' বুঝতে পারে।

প্রক্রিয়া: এগুলো ঘধসবফ ঊহঃরঃু জবপড়মহরঃরড়হ (ঘঊজ) ব্যবহার করে ইউজারের প্রশ্ন থেকে নির্দিষ্ট তথ্য (যেমন: মামলার নম্বর, সেবা বা তারিখ) আলাদা করে নেয়। ডায়ালগ ম্যানেজমেন্ট সিস্টেমের মাধ্যমে এটি একটি স্বাভাবিক কথোপকথন বজায় রাখে।

. টেক্সট-টু-স্পিচ (ঞঞঝ) অ্যাক্সেসিবিলিটি প্রযুক্তি - দৃষ্টিপ্রতিবন্ধী নাগরিকদের জন্য ব্যবহৃত প্রযুক্তিটি হলো ঘবঁৎধষ ঞবীঃ-ঃড়-ঝঢ়ববপয (ঘঞঞঝ)

প্রক্রিয়া: পুরনো দিনের রোবোটিক কণ্ঠস্বরের পরিবর্তে, বর্তমানে ডধাবঘবঃ বা এঅঘ (এবহবৎধঃরাব অফাবৎংধৎরধষ ঘবঃড়িৎশং) ভিত্তিক মডেল ব্যবহার করা হয়। এগুলো মানুষের স্বাভাবিক আবেগ, কথা বলার ছন্দ এবং যতিচিহ্ন বুঝে অডিও তৈরি করে, ফলে এটি শুনতে অনেক বেশি প্রাণবন্ত মনে হয়।

. লিগ্যাল এনএলপি (খবমধষ ঘখচ) - আইনি নথিপত্র বা রায়ের বিশ্লেষণের জন্য খবমধষ ঘখচ একটি বিশেষ ক্ষেত্র।

প্রক্রিয়া: এখানে ঝবহঃরসবহঃ অহধষুংরং এবং অৎমঁসবহঃ গরহরহম প্রযুক্তি ব্যবহার করা হয়। এটি নথিপত্রের বিশাল ভান্ডার থেকে প্রাসঙ্গিক তথ্য খুঁজে বের করে, যা প্রশাসনিক কাজের গতি বহুগুণ বাড়িয়ে দেয়।

প্রযুক্তিগত সারসংক্ষেপ: নাগরিক সেবায় এই রূপান্তরটি মূলত তিনটি প্রযুক্তির সফল সংমিশ্রণ: . ইনপুট লেয়ার: অঝজ এবং ভয়েস কমান্ড প্রযুক্তি। . প্রসেসিং লেয়ার: খখগ-ভিত্তিক অর্থ বিশ্লেষণ এবং আইনি ভাষার সরলীকরণ। . আউটপুট লেয়ার: উন্নত ঞঞঝ সিস্টেমের মাধ্যমে অডিও সেবা প্রদান।

এই প্রযুক্তিগুলো ডেটা ডেমোক্রাটাইজেশন নিশ্চিত করছে, যেখানে প্রযুক্তির অভাবী বা প্রান্তিক মানুষও কেবল কণ্ঠস্বরের মাধ্যমে রাষ্ট্রের জটিল প্রশাসনিক কাঠামোর সঙ্গে সংযুক্ত হতে পারছে।

. গ্রামীণ স্বাস্থ্যসেবায় উপভাষাভিত্তিক ডিজিটাল ডায়াগনস্টিকস

গ্রামীণ স্বাস্থ্যসেবা বাংলাদেশের মতো উন্নয়নশীল দেশের জন্য একটি বড় চ্যালেঞ্জ। দক্ষ চিকিৎসকের অভাব এবং চিকিৎসাকেন্দ্রের দূরত্ব অনেক সময় জীবনহানির কারণ হয়ে দাঁড়ায়। এই সংকট মোকাবিলায় এআই এবং এনএলপি প্রযুক্তি জীবনদায়ী ভূমিকা পালন করছে। বিশেষ করে যখন এআই মডেলগুলো স্থানীয় ভাষায় কথা বলতে পারে, তখন স্বাস্থ্যকর্মীদের পক্ষে কাজ করা অনেক সহজ হয়ে যায়। প্রত্যন্ত অঞ্চলের একটি ক্লিনিকে কর্মরত স্বাস্থ্যকর্মী যখন তার স্মার্টফোনটি ব্যবহার করে একটি অসুস্থ শিশুর কাশির আওয়াজ শুনে তাৎক্ষণিক রোগ শনাক্ত করতে পারেন, তখন এটি মূলত অডিও প্রসেসিং এবং এনএলপি- এক চমৎকার সমন্বয়। এখানে এআই মডেলটি কেবল শব্দই শুনছে না, বরং স্থানীয় ভাষার টানে বলা উপসর্গগুলোও বুঝতে সক্ষম হচ্ছে।

পোর্টেবল এআই-আল্ট্রাসাউন্ড ডিভাইস বা এক্স-রে বিশ্লেষণকারী টুলগুলো এখন সরাসরি বাংলায় বা স্থানীয় উপভাষায় নির্দেশনা দিতে পারছে। ভারতের -সঞ্জীবনী বা বাংলাদেশের বিভিন্ন টেলিমেডিসিন প্ল্যাটফর্মে এআই-এর ব্যবহারের ফলে রোগীরা তাদের নিজস্ব ভাষায় চিকিৎসকের সাথে কথা বলতে পারছেন। প্রেসক্রিপশন বা রোগের বিবরণ যখন একজন রোগী তার নিজের ভাষায় পান, তখন চিকিৎসার ভুল হওয়ার সম্ভাবনা অনেকাংশে কমে যায়। এছাড়া যক্ষ¥ বা ডায়াবেটিসের মতো রোগ শনাক্তকরণে কৃত্রিম বুদ্ধিমত্তা এখন বিশেষজ্ঞ চিকিৎসকের মতোই নির্ভুলভাবে রিপোর্ট বিশ্লেষণ করতে পারছে। এই ধরণের প্রযুক্তিগত বিপ্লব গ্রামীণ স্বাস্থ্যসেবাকে আরও গণতান্ত্রিক এবং সহজলভ্য করে তুলছে।

Related Posts