Classification چیست؟
فرض کنید مدیریت یک بانک به عهده شما است که ۱۰۰ هزار مشتری دارد و میخواهید به یک سری از مشتریانِ خود وام دهید. طبیعتاً به افرادی وام را خواهید داد که شانس برگرداندن وام توسط آنها بیشتر است. هر کدام از این افراد نیز، دارای خصوصیات مختلفی هستند.
Classification چیست؟
برای مثال:
- آیا این شخص خانه دارد یا نه؟
- این شخص دارای اتومبیل شخصی هست یا خیر؟
- حقوق دریافتیِ این شخص چقدر است؟
- و…
حال فرض کنید این بانک دارای یک سابقهی ۱۰ هزارتایی از مشتریانی است که وام گرفتهاند که یا توانستهاند برگردانند یا خیر. این افراد به دو دسته (۲ کلاس) تقسیم شدهاند، یا توانستهاند وام خود را بازگردانند (کلاسِ ۱) یا خیر (کلاسِ ۲). همانطور که گفتیم این افراد خصوصیات یا ویژگیهای مختلفی داشتهاند. پس نگاهی به جدول زیر بیندازید:
تفسیر Classification چیست؟
تفسیر این جدول که نوعی ماتریس است، ساده است. همانطور که مشاهده میکنید، شخص شمارهی ۱، دارای منزل است، 2فرزند دارد، حقوق ماهیانه ۸۰۰ هزار تومان دارد و یک اتومبیل از خود دارد. در ستون آخر مشاهده میکنید که این شخص توانسته وام خود را برگرداند. شخص شماره ۲ و ۳ هم به همین ترتیب است یعنی توانستهاند وام خود را برگردانند. ولی شخص شمارهی ۴، با ویژگیهایی که دارد، نتوانسته وام دریافتی خود را بازگرداند. این سه مورد از ۱۰ هزار مشتری مختلفی است که در پایگاه دادهی بانک ذخیره شدهاند. همانطور که مشاهده میکنید، در جدول بالا، هر سطر نمایشگر یک فرد خاص است. به این فرد خاص، یک رکورد یا یک sample یا یک tuple گفته میشود. و هر ستون نمایشگر یک ویژگی است. به ویژگیها در دادهکاوی اصطلاحاً بٌعد (dimension) نیز گفته میشود. مثلاً دادههای موجود در تصویر بالا، ۴بعدی است چون ۴ ویژگی (ستون) دارد. توجه کنید که ستون آخر، ستون lableهای ماست که مشخص میکند یک نمونهی خاص، در هر سطر به کدام دسته (class) تعلق دارد. در این مثال ما ۲ دسته یا ۲ طبقه (class) داریم. کسانی که وام خود را پس دادهاند، و کسانی که وام خود را پس ندادهاند. الگوریتمهای یادگیری ماشین و دادهکاوی که عمل طبقهبندی را انجام میدهند میتوانند این جدول را به عنوان ورودی قبول کنند و از این جدول و ویژگیهای آن، الگوی موجود در هر طبقه یا class را یاد بگیرند؛ سپس اگر یک نمونهی جدید که طبقهی آن را نمیدانیم به الگوریتمی که یادگرفته است داده شود، این الگوریتم میتواند این نمونهی جدید را به طبقههای احتمالاً درست طبقهبندی یا classification کند.
در ارتباط با شاخههای مختلف هوش مصنوعی در این لینک بیشتر بخوانید.
ارسال پاسخ