ComputerTechnology

ওসিআর কি? | কম্পিউটার কীভাবে আপনার হাতের লেখা চিনতে পারে?

ওসিআর কীভাবে কাজ করে?

বন্ধুর হাতের লেখা পড়তে গিয়ে কি দাঁত মুখ ভেঙ্গে যায় আপনার? তারপরেও আপনার নিজেকে ভাগ্যবান মনে করা উচিৎ, কেনোনা আপনি কোন পোস্ট অফিসে চাকরী করেন না—যেখানে প্রতিদিন হাজার হাজার হাতের লেখা চিঠি আদান প্রদান করা হয়। আমাদের আজকের জীবন ধীরেধীরে সম্পূর্ণরূপে কম্পিউটার নির্ভর হয়ে পড়ছে, তাই সত্যিই মানুষ আর কম্পিউটারের মধ্যে ভালো বোঝাবুঝি জ্ঞান থাকা প্রয়োজন। প্রায় প্রত্যেক প্রকারের কম্পিউটারের সাথে কথা বলার জন্য আমরা “কীবোর্ড” বা “মাউস” ব্যবহার করে থাকি, যাতে তারা সহজেই বুঝতে পারে যে আমরা তাদের দ্বারা কি করাতে চাচ্ছি। কিন্তু কোন কম্পিউটারকে যখন সরাসরি কোন বই পড়তে বলবো বা হাতের লেখা কোন চিঠি পড়তে বলবো, তখন তা সম্পূর্ণ করতে কম্পিউটারকে আরো বেশি খাটনি করতে হবে। আর এখানেই অপটিক্যাল ক্যারেক্টার রেকগনেশন বা ওসিআর কাজ করতে চলে আসে। এটি একধরণের কম্পিউটার প্রোগ্রাম বা সফটওয়্যার, যা স্বয়ংক্রিয়ভাবে কোন প্রিন্ট করা টেক্সট বা হ্যান্ড রাইটিং বিশ্লেষণ করতে পারে এবং এটিকে এমন একটি রূপে নিয়ে যায়, যাতে কম্পিউটার তা সহজেই বুঝতে পারে। আপনার সেলফোনে যে হ্যান্ড রাইটিং কীবোর্ড রয়েছে, সেটিও ওসিআর ব্যবহার করেই কাজ করে। কিন্তু কীভাবে এটি কাজ করে? চলুন বিস্তারিত জেনে নেওয়া যাক।

এই আর্টিকেলের বিষয়বস্তু সমূহ

ওসিআর কি?

এই লেখাগুলো যখন আপনি কম্পিউটার স্ক্রীনে বা মোবাইল স্ক্রীনে পড়ছেন, তখন আপনার চোখ এবং আপনার মস্তিষ্ক অবিরত অপটিক্যাল ক্যারেক্টার রেকগনেশন পদ্ধতি ব্যবহার করছে, এমনকি আপনাকে বিন্দুমাত্র না টের পাইয়েই। আপনার চোখ এই স্ক্রীনের সাদাকালো প্যাটার্নকে কাজে লাগিয়ে বিভিন্ন ক্যারেক্টার যেমন অক্ষর, সংখ্যা, এবং বিভিন্ন বিরাম চিহ্ন চেনার চেষ্টা করছে এবং আপনার মস্তিষ্ক সেই অক্ষর, সংখ্যা, এবং বিভিন্ন বিরাম চিহ্ন গুলোকে একত্র করে লেখা গুলো পড়ার চেষ্টা করছে।

কম্পিউটারও এই কাজটি করতে পারে, কিন্তু মানুষের মতো এতো সহজে করতে পারেনা। প্রথম সমস্যাটি হলো মানুষের মতো কম্পিউটারের কোন চক্ষু থাকেনা, সুতরাং আপনি যদি কম্পিউটার দিয়ে কোন পুরাতন বই বা আপনার হাতের লেখা পড়াতে চান, তবে সেটি অপটিক্যাল স্ক্যানার বা ডিজিটাল ক্যামেরা দিয়ে স্ক্যান করে সেটিকে ইমেজ রূপে প্রদর্শন করাতে হবে। এই পদ্ধতিতে আপনি যে পেজটি তৈরি করবেন, তা একটি গ্রাফিক ফাইল হিসেবে তৈরি হবে (সাধারনত জেপ্যাগ ফাইল হয়ে থাকে)। কিন্তু কম্পিউটারের কাছে আপনার ছবি বা সুন্দরবনের ছবির মধ্যে কোন পার্থক্য নেই, অর্থাৎ কম্পিউটার কোন গ্রাফিক বা ফটোগ্রাফের পিক্সেল প্যাটার্ন থেকে কোন অর্থ বের করতে পারেনা। কম্পিউটারের কাছে কোন টেক্সট ভর্তি পেজ থাকার কোন মূল্যই নেই, কেনোনা আপনি যেভাবে কোন পেজ পড়তে পারেন, কম্পিউটার কখনোই তা সেভাবে পড়তে পারেনা। ওসিআর প্রোগ্রাম কোন ইমেজ থেকে তার টেক্সট সরাসরি টেক্সট হিসেবে পরিণত করে—অথবা বলতে পারেন এটি কোন ইমেজ বা হাতের লেখা থেকে টেক্সট গুলোকে TXT বা DOC ফাইল হিসেবে সংরক্ষন করে।

ওসিআর কীভাবে কাজ করে?

মনেকরুন আমাদের জীবন অনেক সহজ এবং আমাদের বর্ণমালাতে শুধু একটি মাত্র অক্ষর রয়েছে “A”। এখন যদি আপনি চিন্তা করে দেখেন, তবে দেখতে পাবেন, মাত্র একটি অক্ষর থাকার পরেও ওসিআর কে অনেক সমস্যা পোহাতে হবে—কেনোনা প্রত্যেকটি ব্যক্তি এই “A” কে সম্পূর্ণ আলাদা আলাদাভাবে লিখবে। এমনকি যদি আপনি কম্পিউটার প্রিন্টেড টেক্সটের কথা বলেন, তো সেখানেও সমস্যা রয়েছে—কেনোনা আলাদা আলাদা বই এবং ডকুমেন্ট আলাদা আলাদা মুদ্রাক্ষর (ফন্ট) ব্যবহার করে লেখা হয়, সুতরাং এই অক্ষর “A” কে সম্পূর্ণ আলাদা আলাদা ভাবে লেখ হবে।

তাহলে ওসিআর কীভাবে লেখা গুলোকে চিনতে পারবে? বিস্তৃতভাবে বলতে গেলে, আসলে দুইটি পদ্ধতি রয়েছে কাজ করার জন্য। এক হলো, প্রত্যেকটি অক্ষরকে এদের সম্ভাব্য সকল প্যাটার্নে (প্যাটার্ন রেকগনেশন) চিনে রাখা এবং আরেকটি হলো প্রত্যেকটি অক্ষরের প্রত্যেকটি লাইন, প্রত্যেকটি সূক্ষ্ম রেখা (ফিচার ডিটেকশন) মনে রেখে ঐ অক্ষরকে চিনতে পারা।

প্যাটার্ন রেকগনেশন

যদি প্রত্যেকে কোন অক্ষর যেমন “A” কে একদম একইভাবে লেখে, তবে কম্পিউটারের তা চিনতে অনেক সহজ হয়ে যাবে। তাহলে শুধুমাত্র কম্পিউটার তার জমা থাকা “A” এর সাথে স্ক্যান করা “A” মিল করবে, যদি দুইটিই মিলে যায়, তো হয়ে গেলো কাজ।

কিন্তু এখন প্রশ্ন হলো, আপনি কীভাবে সকলকে একই হাতের লেখা শেখাবেন? ১৯৬০ সালের দিকে ব্ল্যাঙ্ক চেক লেখার জন্য এক স্পেশাল ফোন উন্নতিকরণ করা হয়েছিলো, যার নাম “OCR-A”। তখন প্রত্যেকটি চেকে একই ফন্ট ব্যবহার করা হতো, ফলে অপটিক্যাল ক্যারেক্টার রেকগনেশন বা ওসিআর সহজেই সেই ফন্ট বুঝতে পারতো। কিন্তু বর্তমানে পৃথিবী জুড়ে বিভিন্ন বই বা ডকুমেন্ট প্রিন্ট করতে একই ফন্ট ব্যবহার করা হয়না, এবং কখনোই কারো হাতের লেখা কারো সাথে মিল হয়না। এই সমস্যা থেকে নিস্তার পাওয়ার উপায় হলো প্রত্যেকটি অক্ষরকে চেনার জন্য ওসিআর প্রোগ্রামকে বিশেষভাবে প্রশিক্ষণ দেওয়া, যাতে কোন অক্ষর চিনতে প্রোগ্রাম নাম্বার ব্যবহার করে। জনপ্রিয় ফন্ট গুলোর বিপরিতে প্রোগ্রাম একটি নাম্বারের সারী মনে রাখে এবং স্ক্যান করার সময় সেই নাম্বার গুলো ডিকোড করে অক্ষরগুলো চেনার চেষ্টা করে। এই পদ্ধতিতে আপনার লেখা অক্ষর যে শতভাগ চিনতে পারা যাবে, এতে কোন নিশ্চয়তা নেই।

ফিচার ডিটেকশন

ফিচার ডিটেকশনকে ইনটেলিজেন্ট ক্যারেক্টার রেকগনেশন বা আইসিআর ও বলা হয়ে থাকে। এটি কোন ক্যারেক্টারকে চেনার জন্য সবচাইতে ব্যস্তব বুদ্ধি সম্পন্ন পদ্ধতি। এখন মনেকরুন, আপনি নিজেই ওসিআর কম্পিউটার প্রোগ্রাম, আপনার সামনে একসাথে অনেক গুলো অক্ষর রেখে দেওয়া হলো, যেখানে বিভিন্ন অক্ষর বিভিন্ন ফন্ট ব্যবহার করে লেখা। তাহলে আপনি এই অক্ষর গুলোকে কীভাবে চিনতে পারবেন? এরা সবাইতো আলাদা ধরনে লেখা!

আপনার কাজকে সহজ করার জন্য আপনি একটি চমৎকার নিয়ম বের করতে পারেন। যখন আপনি দুইটি বাঁকানো লাইন দেখতে পাবেন এবং দেখবেন যে আরেকটি লাইন উপরের দিকে সেই দুইটি লাইনের সাথে সংযুক্ত হয়েছে, এবং বাঁকানো লাইন দুটি হেলিয়ে খাঁড়াভাবে রয়েছে এবং আরেকটি লাইন সমতলভাবে উপরের দিকে বা মাঝখানে এসে একত্রিত হয়েছে, তখন আপনি সহজেই বুঝে যাবেন যে এই অক্ষরটি হলো “A”। আর এই পদ্ধতি ব্যবহার করে আপনি বেশিরভাগই বড় হাতের অক্ষর চিনতে পারবেন, এতে কোন যায় আসেনা যে অক্ষরটি কোন ফন্ট ব্যবহার করে লেখা রয়েছে। সরাসরি কোন অক্ষরের সম্পূর্ণ প্যাটার্ন মনে না রেখে সেই অক্ষটির প্রত্যেকটি লাইন প্রত্যেকটি সূক্ষ্ম রেখা এবং তাদের অবস্থানের ধারণা রাখলেই খুব সহজে কোন অক্ষর চিনতে পারা সম্ভব। বেশিরভাগ আধুনিক ওসিআর প্রোগ্রাম প্যাটার্ন রেকগনেশন পদ্ধতির চাইতে ফিচার ডিটেকশন পদ্ধতিই বেশি ব্যবহার করে। কিছু প্রোগ্রাম নিউরাল নেটওয়ার্ক (এটি এমন পদ্ধতি, যেখানে কম্পিউটার প্রোগ্রাম স্বয়ংক্রিয়ভাবে মানুষের মস্তিকের মতো কাজ করতে পারে) ব্যবহার করে কাজ করে। নিউরাল নেটওয়ার্ক নিয়ে খুব শীঘ্রই নতুন একটি পোস্ট লিখে ফেলবো।

হ্যান্ড রাইটিং রেকগনেশন কীভাবে কাজ করে?

লেজার প্রিন্টার দিয়ে কম্পিউটার টেক্সট প্রিন্ট করে তা রেকগনেশন করা কম্পিউটারের কাছে তুলনামূলকভাবে অনেক সহজ। কিন্তু কম্পিউটার যখন মানুষের হাতের টেরামেরা লেখা পড়তে চায়, তখন কম্পিউটারের ১২টা বেজে যায়। মানুষের ব্রেইন এক্ষেত্রে যেকোনো কম্পিউটার থেকে অনেক আগে কাজ করে, আমরা দুনিয়ার সবচাইতে খারাপ হাতের লেখাটি সম্পূর্ণ বুঝতে না পারলেও অনুমান করতে পারি, আমরা যেকোনো অক্ষরকে ফিচার ডিটেকশন পদ্ধতি ব্যবহার করে চেনার চেষ্টা করি, আমাদের মস্তিষ্কে লেখক এবং কি লেখা থাকতে পারে সে বিষয়ের উপর ধারণা থাকে। কিন্তু কম্পিউটারটার এতোটা বুদ্ধিমত্তার সাথে কখনোই কাজ করতে পারেনা।

আপনি যখন ট্যাবলেট কম্পিউটার বা স্মার্টফোনের হ্যান্ড রাইটিং কীবোর্ড দিয়ে কিছু লেখেন, সেটা কম্পিউটারের কাছে সনাক্ত করা অনেক সহজ হয়ে থাকে। যদি আপনি “A” লেখার চেষ্টা করেন, তখন টাচস্ক্রীন আপনার টানা রেখা অনুভব করে, প্রথমে আপনি একটি লম্বা বাঁকা রেখা আঁকেন তারপরে আরেকটি লম্বা বাঁকা রেখা এবং শেষে আরেকটি সমতল রেখা এনে মিলিয়ে দেন। এখানে কম্পিউটার সমজেই বুঝতে পারে কোন রেখা কীভাবে আঁকা হয়েছিলো এবং আঁকার পরে এটিকে “A” অক্ষরে প্রকাশিত করে। কম্পিউটার এক্ষেত্রে ফিচার ডিটেকশন পদ্ধতি ব্যবহার করে। কিন্তু কোন কাগজের উপরে কোন এব্রোথেব্রো হাতের লেখা চিনতে পারা এতো সহজ কাজ হয়ে ওঠেনা। কোন হাতের লেখা কম্পিউটারকে চিনতে পাড়ার জন্য এক নির্দিষ্ট নিয়ম মেনে তবেই লিখতে হয়, আর এই লেখার নিয়মকে কম্ব ফিল্ডস বলা হয়।

ওসিআর এর সুবিধা সমূহ

কোন প্রিন্ট করা পেজকে যদি মেশিন রীডআবোল করা সম্ভব হয়, তবে এথেকে আপনি সেই সমস্থ জিনিষ করতে পারবেন যা আগে কখনোই করতে পারতেন না। আপনি কীওয়ার্ড ব্যবহার করে কোন টেক্সট বা অক্ষর অনুসন্ধান করতে পারবেন। প্রিন্ট করা পেজ থেকে টেক্সট গুলোকে ওয়ার্ড প্রসেসিং সফটওয়্যার দ্বারা এডিট করতে পারবেন, টেক্সট গুলোকে ওয়েবপেজে পরিণত করতে পারবেন। সম্পূর্ণ পেজের টেক্সট গুলোকে কম্প্রেস করে সেভ করার জায়গা বাঁচাতে পারবেন। তাছাড়া প্রিন্ট পেজ থেকে টেক্সট গুলো ব্যবহার করে মেইল পাঠাতে পারবেন। মেশিন রীডআবোল টেক্সট গুলো যেকোনো স্ক্রীন রিডার সহজেই পড়তে এবং বুঝতে পারবে।

শেষ কথা

আপনি হয়তো ভাবছেন যে, ওসিআর আজকের আবিষ্কার হওয়া কোন প্রযুক্তি! আসলে এই প্রযুক্তি এবং এর কাজ করার পদ্ধতি নতুন নয় ১৯২৮ সাল থেকে এই প্রযুক্তি চলে আসছে। তবে সামনে হয়তো এতে আরো উন্নতি আনা সম্ভব হতে পারে। আপনি যদি মেশিন লার্নিং নিয়ে এবং আর্টিফিশিয়াল ইন্টেলিজেন্স নিয়ে আমার লেখা পোস্ট গুলো না পড়ে থাকেন, তবে পড়ে আসতে পারেন, সেখানে অনেক মজার তথ্য খুঁজে পাবেন। আশা করছি আজকের পোস্ট আপনাদের কাছে চরম লেগেছে, তাই যেকোনো প্রশ্নে এবং মতামত জানাতে নিচে আমাকে কমেন্ট করুন। পোস্টটি শেয়ার করার মাধ্যমে আপনার বন্ধুদেরও প্রযুক্তির আলোয় আলোকিত করতে সাহায্য করুন। ধন্যবাদ 🙂

Related Articles

Leave a Reply

Your email address will not be published.

Back to top button