BBA
Archive
📐

Distance Formula (KNN)

Step-by-step Euclidean distance calculations

1. Target Data (নতুন Sample)

2. K Value (Neighbors)

3. Sample Points

1.
2.

Step 1: Distance formula ব্যবহার করবো

KNN এ সাধারণত Euclidean distance ব্যবহার করা হয়।

d = √(x₂ - x₁)² + (y₂ - y₁)²

💡 সহজ ব্যাখ্যা:

  • (x₁, y₁) হলো আমাদের Target Data বা নতুন Point।
  • (x₂, y₂) হলো আগে থেকে দেয়া Sample Data
  • আমরা প্রতিটি Sample এর সাথে নতুন Point টির x এবং y এর পার্থক্য (বিয়োগফল) বের করে বর্গ (square) করি, তারপর যোগ করে রুট (square root) করে Distance বের করি।

এই formula দিয়ে নতুন point থেকে সব sample এর distance বের করবো।

Step 2: সব sample এর distance বের করি

নতুন point = (3, 7)

Sample 1 → (7, 7) → Bad

💡 ধাপ: প্রথমে X এর পার্থক্য (73 = 4) এবং Y এর পার্থক্য (77 = 0) বের করে বর্গ (square) করা হলো।

Distance

= √[(73)² + (77)²]

= √[16 + 0]

= √16

= 4

Sample 2 → (7, 4) → Bad

💡 ধাপ: প্রথমে X এর পার্থক্য (73 = 4) এবং Y এর পার্থক্য (47 = -3) বের করে বর্গ (square) করা হলো।

Distance

= √[(73)² + (47)²]

= √[16 + 9]

= √25

= 5

Step 3: Exam Answer Format (Summary Table)

পরীক্ষার খাতায় ঠিক এই ফরম্যাটে টেবিল করে উত্তর লিখলে ভালো নম্বর পাওয়া যাবে:

NameX ValueY ValueClassDistance
Sample 177Bad√[(73)² + (77)²] = 4
Sample 274Bad√[(73)² + (47)²] = 5

Conclusion (for K = 3)

যেহেতু K = 3, তাই আমরা সবচেয়ে কাছের (কম distance) 3 টি neighbor বা sample নিবো:

  • 1Sample 1 — Distance: 4 (Bad)
  • 2Sample 2 — Distance: 5 (Bad)

✅ চূড়ান্ত সিদ্ধান্ত (Final Prediction):

উপরের এই 3 টি Nearest Neighbors এর মধ্যে যে Label টি সবচেয়ে বেশিবার আছে (Majority Vote), আমাদের নতুন Point টির Label ও সেটিই হবে!