شما در این تمرین قصد دارید که دیتاستهای تایتانیک را تجزیه و تحلیل کرده و میزان بقای مسافران در عرشههای مختلف را بسنجید و ببینید که آیا میتوانید فرضیهای را مبنی بر کم بودن احتمال زنده ماندن مسافران در عرشههای پایینتر را اثبات کنید یا نه؟!
در این تمرین، ما سعی می کنیم که یک دیتاست را بارگذاری کرده و با انتخاب فیچرِ هدف مناسب، ماتریس هدف و ماتریس فیچرها را ایجاد کنیم.
توجه:
در انتخاب فیچرِ هدف این مورد را به یاد داشته باشید: فیچرِ هدف، همان خروجی یا نتیجهای هست که قرار است دادهها را با محوریت آن تفسیر کنیم. به عنوان مثال در جدول دادهی گل زنبق، فیچرِ هدف را گونهی گل تعیین کرده و مابقی فیچرها را با محوریت آن تفسیر کردیم.
برای تکمیل این تمرین مراحل زیر را دنبال کنید:
1- دیتاستِ titanic را با استفاده از کتابخانه seaborn بارگذاری کنید. چند ردیف اول باید به صورت زیر باشند:
2- فیچرِ هدف مورد نظر خود را انتخاب کنید.
3- ماتریسِ فیچرها و ماتریسِ هدف را ایجاد کنید. مطمئن شوید که دادههای ماتریس فیچرها را در متغیری با نام: " X " و دادههای ماتریس هدف را در متغیر دیگری با نام: " Y " ذخیره میکنید.
4- ابعاد هر یک از ماتریسها را چاپ کنید.
ابعاد ماتریسهای شما باید با مقادیر زیر مطابقت داشته باشد:
Jupyter Notebook
Features matrix: (891, 14)
Target matrix: (891,)