علم داده به رشد و توسعهی خود ادامه میدهد و ما در این مسیر شاهد ظهور ابزارهای جدیدی خواهیم بود. در این مقاله میخواهم به شما 9 کتابخانهی بسیار کاربردی پایتون را معرفی کنم. این کتابخانهها کمک بزرگی به من کردهاند و میخواهم آنها را با شما به اشتراک بگذارم. کتابخانههای زیر به 3 دسته تقسیم میشوند:
- استقرار مدل
- مدلسازی داده
- آنالیز دادههای اکتشافی
1. استقرار مدل
Kedro
علم داده به علم کامپیوتر خیلی وابسته بوده، به همین خاطر در حال همگرا شدن با متدهای مهندسی نرمافزار است. با تکامل پیدا کردن علم داده، راهکارهای جدیدی نیز در این زمینه ایجاد خواهد شد. Kedro یکی از این راهکارها به شمار میآید.
Kedro یک ابزار برای توسعه pipeline در علم داده است. این ابزار اجازهی ساخت pipelineهای قابل حمل را برای کدهایتان میدهد. Kedro با استفاده از اصول مهندسی نرمافزار به شما کمک میکند تا کدهای خود را استانداردتر، تکرارپذیرتر و ماژولارتر کنید.
Gradio
Gradio به شما اجازه میدهد تا اپلیکیشنهای وب را برای مدلهای یادگیری ماشین خود بسازید. این کتابخانه مانند Flask و Streamlit است اما عملکرد آسان و سریعتری در زمینه استقرار یک مدل دارد.
Gradio به خاطر دلایل زیر مفید است:
- امکان اعتبارسنجیهای بیشتری را به شما میدهد. با کمک آن میتوانید ورودیهای مختلف را در یک مدل آزمایش کنید.
- برای اجرا کردن دموها خوب است.
- پیادهسازی و توزیع آن راحت است زیرا همه از طریق یک لینک عمومی به اپلیکیشن وب دسترسی دارند.
Streamlit
ساختن برنامهها یا اپلیکیشنهای یادگیری ماشین و علم داده میتواند فرآیندی پیچیده باشد. Streamlit یکی دیگر از ابزارهای محبوبی است که برای ساخت رابط کاربری مورد استفاده قرار میگیرد. افراد از این کتابخانه متنباز پایتون برای ساختن اپلیکیشنهای وب قدرمند و سفارشی استفاده میکنند. Streamlit با چندین کتابخانه و فریمورک اصلی مانند Latex، OpenCV، Vega-Lite، PyTorch، Numpy و غیره سازگاری دارد.
2. مدلسازی داده
PyCaret
وظایف زیادی در زمینه یادگیری ماشین وجود دارد که میخواهیم آنها را به سرعت انجام داده و فوراً پاسخ دریافت کنیم. گاهی اوقات کدهای طولانی باعث کند شدن سرعت توسعه ما خواهد شد. PyCaret یک کتابخانه Low-Code است که امکان ساخت فوری مدلها را به شما میدهد. با کمک این کتابخانه میتوانید آزمایشها را انجام داده، مقادیر گمشده را نسبت داده و دیتاهای طبقهبندی شده را رمزگذاری کنید.
Prophet
سریهای زمانی یک مفهوم بسیار مهم در علم داده است. معمولاً به طور روزمره برای پیشبینیهای مفیدی در رابطه با طیف بزرگی از سناریوها مثل درآمد یک فروشگاه یا نرخ جرم و جنایت بکار گرفته میشود. Prophet یک کتابخانه پایتون است که به شما امکان ساخت مدلهای سری زمانی و اعمال داده بر روی آنها را میدهد. این کتابخانه توسط فیسبوک توسعه یافته و یک ابزار بسیار قدرتمند در زمینه آنالیز سریهای زمانی به حساب میآید.
3. آنالیز دادههای اکتشافی
Pandas Profiling
یک کتابخانهی پایتون بوده که EDA استانداردتان را با کمک یک خط کد تکمیل میکند. این کتابخانه موارد بسیاری را مورد آنالیز قرار داده و آنها را در قالب یک گزارش به نمایش میگذارد. این گزارش شامل اطلاعاتی در مورد ویژگیهای مجموعه داده، ویژگیهای متغیر، همبستگی متغیرها، مقادیر از دست رفته، توزیع دادهها و غیره است. به مثال زیر دقت کنید:
D-Tale
اگر در کار کردن با اکسل مهارت دارید، یعنی عاشق D-Tale خواهید شد. D-Tale یک کتابخانه پایتون است که Pandas DataFrame را بصریسازی میکند. این بصریسازی در قالب یک جدول محوری بسیار تعاملی ارائه داده خواهد شد. کتابخانه دارای خصوصیات مشابهی با Pandas Profiling است، اما ویژگیهایی همچون قالببندی شرطی، مرتبسازی دادهها، فیلتر کردن دادهها و غیره را نیز شامل میشود.
Autoviz
اگر دو کتابخانهی قبلی برای اتوماتیک کردن EDA و بصریسازی شما کافی نیستند، میتوانید از Autoviz استفاده کنید. Autoviz دادههای شما را با استفاده از کمی کد، بهبود خواهد بخشید. این کتابخانه خصوصیات مهم موجود در دادههای شما را فوراً پیدا میکند و آنها را به نمایش میگذارد. میتوانید از Autoviz برای کار کردن روی مجموعه دادههای بزرگ استفاده کرده و تغییرات سریعی را اعمال کنید.
Plotly
گرافها و دموها بخشی جدایی ناپذیر از علم داده هستند. ما به کمک گرافها میتوانیم زمان خراب شدن یک چیز را فوراً متوجه شویم. هنگامی که کدهای خود را تغییر میدهیم، گرافها تاثیرات آن تغییر بر داده را به ما نشان خواهند داد. Plotly قطعاً به خاطر قدرتمند بودن و سهولت در استفاده، یک ابزار ضروری در بصریسازی محسوب میشود.
Dash نیز در کنار این کتابخانه مورد استفاده قرار میگیرد و به شما اجازه میدهد تا داشبوردهای پویایی را با استفاده از بصریسازیهای Plotly خلق کنید. Dash یک رابط پایتون بوده که نیاز به جاوا اسکریپت را در چنین اپلیکیشنهایی برطرف کرده است. شما به کمک آن میتوانید نمودارها را به صورت آفلاین و آنلاین اجرا کنید.
دیدگاه و پرسش
در حال دریافت نظرات از سرور، لطفا منتظر بمانید
در حال دریافت نظرات از سرور، لطفا منتظر بمانید