Linear vs. Logistic Regression – কোনটি কখন ইউজ করবো ?
Confused Between Linear vs. Logistic Regression……..???
আপনি একা নন।
Meet Tanjim, নতুন ডেটা অ্যানালিস্ট, সবে জবে ঢুকেছে। প্রথম কাজেই ম্যানেজার দিলেন দুটো টাস্কঃ
১: পরের সপ্তাহে কতজন কাস্টমার অর্ডার করবে, সেটা প্রেডিক্ট করা।
২: এখনকার ইউজারদের মধ্যে কারা ইমেইল আনসাবস্ক্রাইব করবে, সেটা Identify করা।
তানজিম একটু চিন্তায় পড়ে গেল- “দুইটাতেই কি একই মডেল ইউজ করবো?”
— যদি আপনি ডেটা সায়েন্সে নতুন হন, আপনিও কখনও না কখনও হয়ত এমন ভেবেছেন। চলেন এই কনফিউশন আজকে শেষ করি।
কীভাবে বুঝবেন কখন কোনটা ব্যবহার করবো……?
ধরেন, আপনি একটা ক্লাসের ৫০ জন স্টুডেন্ট নিয়ে কাজ করতে চাচ্ছেন, দুইটা প্রশ্নের উত্তর খুঁজা মূল উদ্দেশ্য-
একজন ছাত্র এক্সামে কত নাম্বার পাবে?
সে পাশ করবে নাকি ফেল?
দেখতে দুটো প্রশ্ন কাছাকাছি হলেও, এনালাইসিস করতে দরকার হবে একদম আলাদা মডেল।
Linear Regression → যখন আউটপুট সংখ্যা
যেমন: ৭৫ মার্ক, ৩০০০ টাকা, ৪৫ মিনিট।
আপনি যদি এমন কিছু প্রেডিক্ট করতে চান, তাহলে Linear Regression আপনার বন্ধুর মতো।
কিছু রিয়েল উদাহরণ:
Student Performance: একজন স্টুডেন্ট কত ঘন্টা পড়ছে, ক’টা মক টেস্ট দিচ্ছে — এগুলোর বেসিসে SSC রেজাল্ট কেমন হতে পারে প্রেডিক্ট করা।
Ride Fare Prediction: ঢাকার এক রাইডশেয়ারিং অ্যাপে — দূরত্ব, সময় আর ট্রাফিক দেখে ভাড়া অনুমান করা।
Sales Forecasting: বা ধরুন, একটা লোকাল ই-কমার্স সাইটে—এড বাজেট আর ভিজিটর কাউন্ট দেখে পরের মাসের সেলস ফোরকাস্ট করা
Key Point: You’re answering “How much?”, not “Yes/No”.
এক কথায় — continuous outcome মানে হলো এমন কিছু, যা সংখ্যা আকারে বের হয়।
Logistic Regression → যখন উত্তর হবে হ্যাঁ/না বা ক্যাটাগরি
এখন ধরুন আপনি জানতে চান —
এই ছাত্র পাশ করবে? নাকি ফেল করবে?
এখানে কোনো সংখ্যা নেই — বরং উত্তর হিসেবে আসবে একটা “ক্লাস” বা ক্যাটাগরি। তখন কাজে আসবে Logistic Regression।
Examples:
Customer Churn: কাস্টমারের usage patterns আর complaints দেখে বুঝতে পারা যে সে কি সার্ভিস নেওয়া বন্ধ করে দিবে কিনা।
Loan Approval: কোনো লোন অ্যাপ্লিক্যান্টের ইনকাম, credit score আর past history দেখে প্রেডিক্ট করা যে সে কি ডিফল্ট করবে নাকি।
Email Campaign: আপনার ইমেইল ক্যাম্পেইনে ইউজার ক্লিক করবে নাকি করবে না
Admission Test Outcome: মক টেস্টের উপর ভিত্তি করে প্রেডিক্ট করা –কে কে পাশ করবে?
Key Point: এইবার আপনি খুঁজছেন: “হ্যাঁ বা না?”
মানে binary outcome — যেখানে উত্তর হয় ১ বা ০।
তাহলে সিদ্ধান্ত নেবেন কীভাবে?
কাজ শুরুর আগেই নিজেকে প্রশ্ন করুন–
“আমার টার্গেটটা আসলে কী??????”
If it’s a number → Linear Regression
If it’s a category → Logistic Regression
Akaademy স্টুডেন্টদের ক্ষেত্রে এই বেসিকটা আমরা সব সময় ক্লিয়ার করে দেওয়ার চেষ্টা করি। এখানে শুধু টুল নয় বরং শেখানো হয় কিভাবে একজন data analyst হিসেবে আপনি চিন্তা করবেন আর right model পিক করা মোস্ট important স্কিল। মনে রাখবেনঃ The right algorithm always begins with the right mindset.