কানাইঘাট নিউজ ডেস্ক:
২০১৬ সালে ৩৫ বছরের কম বয়সী সেরা ৩৫ জন উদ্ভাবকের সম্মাননায় ভূষিত
হয়েছেন বাঙালি তরুণ এহসান হক। বিশ্বখ্যাত কারিগরি বিশ্ববিদ্যালয়
যুক্তরাষ্ট্রের ম্যাসাচুসেটস ইনস্টিটিউট অব টেকনোলজির (এমআইটি) জার্নাল
টেকনোলজি রিভিউ এ সম্মাননা ঘোষণা করে।
এহসানের বানানো মাক (MACH-My Automated Conversation coacH) ও লিসা (LISSA-Live Interactive Social Skills Assistant) প্রোগ্রাম তাৎক্ষণিকভাবে বলে দিতে পারে একজন মানুষ কথার মধ্যে কতবার 'এ্যা, আহহহ' ইত্যাদি বলেছে। কথা বলার সময় তার শারীরিক অঙ্গভঙ্গি স্বাভাবিক না আরোপিত। তার শব্দ প্রক্ষেপণ কী যথাযথ?
এমআইটি মিডিয়া ল্যাবে কাজ করার সময় এহসান প্রথমে বানান মাক, যা এমআইটির শিক্ষার্থীদের সাক্ষাৎকারে দক্ষতা বাড়াতে সাহায্য করে। পরে সেটিকে বিকশিত করে ভিন্নভাবে সক্ষম কিংবা অটিস্টিক ব্যক্তিদের সহায়তা করার জন্য তৈরি করেছেন লিসা।
এর আগে এই সম্মাননা যারা পেয়েছেন তাদের মধ্যে আছেন গুগলের দুই প্রতিষ্ঠাতা সের্গেই ব্রিন ও ল্যারি পেজ, ফেসবুকের মার্ক জাকারবার্গ, আইম্যাক ও আইপ্যাডের ডিজাইনার জোনাথন আইভ, লিনাক্সের জনক লিনাস টরভাস, ইয়াহুর সহপ্রতিষ্ঠাতা জেরি ইয়াং, টুইটারের জ্যাক ডরসে প্রমুখ। বলা যায় এমআইটির এই তালিকার অনেকেই পরবর্তী সময়ে বিশ্বকে বদলে দেওয়ায় নেতৃত্ব দিয়েছেন।
মুখ নাকি মনের আয়না! মুখাবয়ব দেখে তাই হয়তো বোঝা যায় মানুষের মনের নিশানা। ফুর্তিতে থাকলে মানুষের মুখ হয়ে ওঠে হাস্যোজ্জ্বল। আবার উল্টোটা হয় মন খারাপ থাকলে। তবে মুখাবয়বের সঙ্গে আবেগের সম্পর্ক যা-ই হোক, মানুষের বানানো যন্ত্র কি তার মুখাবয়বকে বুঝতে পারবে? মুখের মাংসপেশির নড়াচড়া, ভ্রু কোঁচকানো বা একটু ঠোঁট চেপে ধরা থেকে কি মানুষটি হাসছে কি না, তা বোঝা যাবে?
মানুষে মানুষে কথোপকথন বা আলাপচারিতা অনেকটা দ্বৈত নাচের মতো। আমরা একে অন্যের কথাবার্তা, আকার-ইঙ্গিত, ভাবভঙ্গি বুঝে কথার পিঠে কথা বলে আলাপচারিতাকে এগিয়ে নিয়ে যাই। যদিও আলাপচারিতার এই ‘মুদ্রা’ বা কৌশল কোথাও লেখা নেই, কেউ জানে না, কিন্তু সবাই (মানুষ) বোঝে। সহজ নয় বলেই তো কাজটি করার জন্য এমআইটির টিআর৩৫-এ নির্বাচিত হয়েছেন এহসান হক।
ব্যবসায়ী বাবা এনামুল হক ও মা প্রয়াত সৈয়দা লুৎফে সাবার তিন সন্তানের একজন এহসান হক! পড়াশোনা ঢাকার উদয়ন স্কুল এবং পরে ঢাকা কলেজে। এরপরই যুক্তরাষ্ট্রের পেনসিলভানিয়া স্টেট ইউনিভার্সিটি থেকে কম্পিউটার ইঞ্জিনিয়ারিংয়ে স্নাতক। ইউনিভার্সিটি অব মেমফিস থেকে ইলেকট্রিক্যাল ইঞ্জিনিয়ারিংয়ে স্নাতকোত্তর। ২০০৮ সাল থেকে এমআইটির বিখ্যাত মিডিয়া ল্যাবে কাজ করেন—মানুষের মুখাবয়ব ও কণ্ঠ বিশ্লেষণ করে যন্ত্রকে মানুষের আবেগ শনাক্ত করতে সাহায্য করা নিয়ে।
২০০৯ সালে ওয়াল্ট ডিজনির গবেষণাগারে প্রথম স্বয়ংক্রিয় রোবট—যা দেখতে, শুনতে এবং নিজের সিদ্ধান্ত নিতে সক্ষম—তৈরিতে সাহায্য করেছেন। ২০১০ সালে আইবিএম ওয়াটসন গবেষণাগারে তৈরি করেন বুদ্ধিমান বিজ্ঞাপন যন্ত্র, যা পথে চলতে থাকা মানুষের গতিবিধি, লিঙ্গ, বয়স, পরনের কাপড়ের রং ও ধরন বুঝে মানানসই বিজ্ঞাপন প্রচার করে!
মানুষের মুখাবয়ব পর্যালোচনা করে মানুষের অভিব্যক্তি নির্ণয় করার কাজটি কেমন করে হয়, সেটি ব্যাখ্যা করে এহসান বললেন, 'মূল কথাটি সোজা, উদাহরণের মাধ্যমে শিক্ষা'। যেমন মানুষের মুখটা অধিকাংশ ক্ষেত্রেই বলের মতো গোলাকার। কিন্তু তারপরও একটা অস্পষ্ট ছবিতে একজন মানুষের মুখ আর ফুটবল পাশাপাশি রাখলে আমরা খুব সহজেই বলে দিতে পারি কোনটা ফুটবল এবং কোনটা মানুষের মুখ। মানুষের পক্ষে এই কাজটা খুব সহজেই করে ফেলা সম্ভব, কারণ আমরা ছোটবেলা থেকে মানুষের মুখ দেখে অভ্যস্ত। ঠিক তেমনিভাবে মেশিনকে অনেকগুলো মানুষের মুখের ছবি উদাহরণ হিসেবে দেওয়া হলে আধুনিক গাণিতিক পরিভাষা ব্যবহার করে মেশিনের পক্ষেও মানুষের চেহারা শনাক্ত করা সম্ভব। তবে কাজটি মোটেই সোজা নয়।
এরপর ২০১৩ সালে তৈরি করেন 'মুড মিটার', যা মানুষের চেহারা দেখে বলে দেয় রাগ না খুশি। ২০১৩ সালে এমআইটি থেকে পিএইচডি করার পর যোগ দেন ইউনিভার্সিটি অব রসেস্টারে। এখন সেখানে কম্পিউটার বিজ্ঞান বিভাগের সহকারী অধ্যাপক হিসেবে কাজ করছেন।
এহসানের বানানো মাক (MACH-My Automated Conversation coacH) ও লিসা (LISSA-Live Interactive Social Skills Assistant) প্রোগ্রাম তাৎক্ষণিকভাবে বলে দিতে পারে একজন মানুষ কথার মধ্যে কতবার 'এ্যা, আহহহ' ইত্যাদি বলেছে। কথা বলার সময় তার শারীরিক অঙ্গভঙ্গি স্বাভাবিক না আরোপিত। তার শব্দ প্রক্ষেপণ কী যথাযথ?
এমআইটি মিডিয়া ল্যাবে কাজ করার সময় এহসান প্রথমে বানান মাক, যা এমআইটির শিক্ষার্থীদের সাক্ষাৎকারে দক্ষতা বাড়াতে সাহায্য করে। পরে সেটিকে বিকশিত করে ভিন্নভাবে সক্ষম কিংবা অটিস্টিক ব্যক্তিদের সহায়তা করার জন্য তৈরি করেছেন লিসা।
এর আগে এই সম্মাননা যারা পেয়েছেন তাদের মধ্যে আছেন গুগলের দুই প্রতিষ্ঠাতা সের্গেই ব্রিন ও ল্যারি পেজ, ফেসবুকের মার্ক জাকারবার্গ, আইম্যাক ও আইপ্যাডের ডিজাইনার জোনাথন আইভ, লিনাক্সের জনক লিনাস টরভাস, ইয়াহুর সহপ্রতিষ্ঠাতা জেরি ইয়াং, টুইটারের জ্যাক ডরসে প্রমুখ। বলা যায় এমআইটির এই তালিকার অনেকেই পরবর্তী সময়ে বিশ্বকে বদলে দেওয়ায় নেতৃত্ব দিয়েছেন।
মুখ নাকি মনের আয়না! মুখাবয়ব দেখে তাই হয়তো বোঝা যায় মানুষের মনের নিশানা। ফুর্তিতে থাকলে মানুষের মুখ হয়ে ওঠে হাস্যোজ্জ্বল। আবার উল্টোটা হয় মন খারাপ থাকলে। তবে মুখাবয়বের সঙ্গে আবেগের সম্পর্ক যা-ই হোক, মানুষের বানানো যন্ত্র কি তার মুখাবয়বকে বুঝতে পারবে? মুখের মাংসপেশির নড়াচড়া, ভ্রু কোঁচকানো বা একটু ঠোঁট চেপে ধরা থেকে কি মানুষটি হাসছে কি না, তা বোঝা যাবে?
মানুষে মানুষে কথোপকথন বা আলাপচারিতা অনেকটা দ্বৈত নাচের মতো। আমরা একে অন্যের কথাবার্তা, আকার-ইঙ্গিত, ভাবভঙ্গি বুঝে কথার পিঠে কথা বলে আলাপচারিতাকে এগিয়ে নিয়ে যাই। যদিও আলাপচারিতার এই ‘মুদ্রা’ বা কৌশল কোথাও লেখা নেই, কেউ জানে না, কিন্তু সবাই (মানুষ) বোঝে। সহজ নয় বলেই তো কাজটি করার জন্য এমআইটির টিআর৩৫-এ নির্বাচিত হয়েছেন এহসান হক।
ব্যবসায়ী বাবা এনামুল হক ও মা প্রয়াত সৈয়দা লুৎফে সাবার তিন সন্তানের একজন এহসান হক! পড়াশোনা ঢাকার উদয়ন স্কুল এবং পরে ঢাকা কলেজে। এরপরই যুক্তরাষ্ট্রের পেনসিলভানিয়া স্টেট ইউনিভার্সিটি থেকে কম্পিউটার ইঞ্জিনিয়ারিংয়ে স্নাতক। ইউনিভার্সিটি অব মেমফিস থেকে ইলেকট্রিক্যাল ইঞ্জিনিয়ারিংয়ে স্নাতকোত্তর। ২০০৮ সাল থেকে এমআইটির বিখ্যাত মিডিয়া ল্যাবে কাজ করেন—মানুষের মুখাবয়ব ও কণ্ঠ বিশ্লেষণ করে যন্ত্রকে মানুষের আবেগ শনাক্ত করতে সাহায্য করা নিয়ে।
২০০৯ সালে ওয়াল্ট ডিজনির গবেষণাগারে প্রথম স্বয়ংক্রিয় রোবট—যা দেখতে, শুনতে এবং নিজের সিদ্ধান্ত নিতে সক্ষম—তৈরিতে সাহায্য করেছেন। ২০১০ সালে আইবিএম ওয়াটসন গবেষণাগারে তৈরি করেন বুদ্ধিমান বিজ্ঞাপন যন্ত্র, যা পথে চলতে থাকা মানুষের গতিবিধি, লিঙ্গ, বয়স, পরনের কাপড়ের রং ও ধরন বুঝে মানানসই বিজ্ঞাপন প্রচার করে!
মানুষের মুখাবয়ব পর্যালোচনা করে মানুষের অভিব্যক্তি নির্ণয় করার কাজটি কেমন করে হয়, সেটি ব্যাখ্যা করে এহসান বললেন, 'মূল কথাটি সোজা, উদাহরণের মাধ্যমে শিক্ষা'। যেমন মানুষের মুখটা অধিকাংশ ক্ষেত্রেই বলের মতো গোলাকার। কিন্তু তারপরও একটা অস্পষ্ট ছবিতে একজন মানুষের মুখ আর ফুটবল পাশাপাশি রাখলে আমরা খুব সহজেই বলে দিতে পারি কোনটা ফুটবল এবং কোনটা মানুষের মুখ। মানুষের পক্ষে এই কাজটা খুব সহজেই করে ফেলা সম্ভব, কারণ আমরা ছোটবেলা থেকে মানুষের মুখ দেখে অভ্যস্ত। ঠিক তেমনিভাবে মেশিনকে অনেকগুলো মানুষের মুখের ছবি উদাহরণ হিসেবে দেওয়া হলে আধুনিক গাণিতিক পরিভাষা ব্যবহার করে মেশিনের পক্ষেও মানুষের চেহারা শনাক্ত করা সম্ভব। তবে কাজটি মোটেই সোজা নয়।
এরপর ২০১৩ সালে তৈরি করেন 'মুড মিটার', যা মানুষের চেহারা দেখে বলে দেয় রাগ না খুশি। ২০১৩ সালে এমআইটি থেকে পিএইচডি করার পর যোগ দেন ইউনিভার্সিটি অব রসেস্টারে। এখন সেখানে কম্পিউটার বিজ্ঞান বিভাগের সহকারী অধ্যাপক হিসেবে কাজ করছেন।
খবর বিভাগঃ
তথ্য প্রযুক্তি
বিশেষ খবর
0 comments:
পাঠকের মতামতের জন্য কানাইঘাট নিউজ কর্তৃপক্ষ দায়ী নয়