می‌خواهیم به مقایسه چهار ابزار داده کاوی یعنی  orange , R, weka و Rapidminer بپردازیم.

oranage:

  • منبع باز
  • مصورسازی و تحلیل داده
  • مناسب برای مبتدیان و حرفه ای ها
  • قابل استفاده برای تمامی پلتفرم های مشهور نظیر ویندوز ، mac و انواع لینوکس
  • برنامه نویسی تصویری
  • جعبه ابزار بزرگ
  • قابلیت اسکریپت نویسی
  • قابل توسعه
  • دارای مستندات

R:

  • منبع باز
  • قابلیت مصورسازی و  تحلیل داده تا ۱۶ ترابایت
  • قابل توسعه
  • قابل نصب و اجرا بر روی ویندوز،  مک و انواع لینوکس
  • محیط گرافیکی
  • تحلیل داده بصورت فضایی
  • خوشه بندی
  • متن کاوی
  • تحلیل شبکه های اجتماعی و گراف کاوی
  • خروجی گرافیکی و آماری
  • امکان ویرایش داده ها


weka:

  • منبع باز
  • مجموعه از الگوریتم های آموزش ماشین
  • یک پلاتفرم مبتنی بر جاوا
  • دارای محیط گرافیکی
  • دارای قابلیت ها و وظایف اولیه از جمله پیش پردازش داده ، دسته بندی ، رگرسیون، خوشه بندی ، قوانین رابطه ای و مصور سازی
  • قابلیت اجرای فایلهای داده در فرمت های مختلف
  • یکی از قابلیت های استثنایی weka  امکان اتصال پایگاه داده با استفاده از JDBC با هر پکیج RDBMS می باشد

:Rapidminer

  • منبع باز
  • تصویر سازی و آنالیز داده
  • آموزش ماشین
  • داده کاوی و متن کاوی
  • اجرا بر روی موتور جاوا
  • قابل استفاده در تمام سیستم‌های عامل
  • دارای یک محیط گرافیکی ، به نحوی که نیازی به برنامه نویسی نباشد
  • طراحی برای فرایندهای آنالیز
  • آنالیزهای پیش بینی (توسط قالب های از قبل ساخته شده )
  • تغییر شکل داده
  • مدل سازی داده
  • مصور سازی داده
  • به شما امکان می دهد با داده‌های مختلف با سایزهای متفاوت کار کنید
  • به عنوان یک موتور زبان اسکریپت نویسی قدرتمند به همراه یک محیط گرافیکی مطرح است
  • عمل کرد به صورت عملگرهای ماژولار
  • قابلیت نمایش چند لایه داده
قابلیت R-programming Rapidminer weka orange
دسته بندی دیتاست به مجموعه های کاری و آزمایشی OK OK OK OK
descriptor scaling OK OK FAIL FAIL
descriptor selection FAIL OK OK FAIL
parameter optimization of machin learning FAIL OK FAIL FAIL
model validation OK OK OK OK

برچسب ها: