انجام پروژه های داده کاوی

انجام پروژه های داده کاوی

انجام پروژه های داده کاوی

انجام پروژه های داده کاوی

آموزش داده کاوی با وکا weka

آمورش داده کاوی

داده کاوی مجموعه تکنیک هایی می باشد که پایگاه داده های بزرگ را به منظور دستیابی به دانش، تحلیل می کند. به منظور داده کاوی امروزه از روش های ماشینی و یا نیمه ماشینی استفاده می شود که دلیل آن هم تفاوت عمده در مقیاس، وسعت و گوناگونی زمینه‌ها و کاربردها، و نیز ابعاد و اندازه‌های داده‌هایی می باشد که امروز مورد استفاده قرار می گیرد. داده کاوی یا Data Mining در اصل به معنای استخراج اطلاعات یا الگوهای عملکرد و روابط مشخص در میان داده ها و همین‌طور پایگاه های داده می باشد.

azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com


آموزش داده کاوی با استفاده از WEKA

داده کاوی چیست؟

داده کاوی مجموعه تکنیک هایی می باشد که پایگاه داده های بزرگ را به منظور دستیابی به دانش، تحلیل می کند. به منظور داده کاوی امروزه از روش های ماشینی و یا نیمه ماشینی استفاده می شود که دلیل آن هم تفاوت عمده در مقیاس، وسعت و گوناگونی زمینه‌ها و کاربردها، و نیز ابعاد و اندازه‌های داده‌هایی می باشد که امروز مورد استفاده قرار می گیرد. داده کاوی یا Data Mining در اصل به معنای استخراج اطلاعات یا الگوهای عملکرد و روابط مشخص در میان داده ها و همین‌طور پایگاه های داده می باشد.

 

داده کاوی، بهره گیری از ابزار های موجود جهت کسب دانش

داده کاوی بهره‌گیری از ابزارهای تجزیه و تحلیل داده‌ها به منظور کشف الگوها و روابط معتبر گفته می‌شود که استفاده از این ابزارها منجر به یافتن سریع مدل‌های آماری مورداستفاده درداده، مدل‌های آماری و الگوریتم‌های ریاضی می‌شود که این کار این به صورت خودکار و یا بر اساس تجربه‌ای که از طریق شبکه‌های عصبی یا درخت‌های تصمیم گیری به دست می‌آورند، انجام می دهند. داده کاوی علاوه بر گردآوری و مدیریت داده های انبوه، تجزیه، تحلیل اطلاعات و پیش بینی را نیز انجام میدهد که پارامتر های گوناگونی را در نظر می گیرد:


azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

  • ۱) قواعد انجمنی یا Association که شامل الگو هایی می باشد که یک رویداد به رویدادی دیگر ارتباط پیدا می کند.
  • ۲) ترتیب یا Sequence: ترتیب اجرای رویداد ها را پیگیری می کند.
  • ۳) پیش بینی یا Prediction که پیش بینی یک متغیر پیوسته را انجام می دهد.

azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

  • ۴) طبقه بندی یا Classification که رده های موجود در داده ها را تعریف می کند و نسبت به یکریگر متمایز می کند با این هدف که بتوان از این مدل برای پیش بینی رده رکوردهایی که برچسب رده آنها ناشناخته می‌باشد، استفاده نمود.
  • ۵) خوشه بندی یا Clustering که مجموعه ای از رکورد ها که شباهت بیشتری را نسبت به یکدیگر دارد را در یک گروه قرار می دهد.
  • ۶) مصور سازی یا visualization که داده های به دست آمده را شبیه سازی می کند.

 

ابزار های داده کاوی
  • ۱) کلمنتاین Clementine
  • ۲) نرم افزار Rapid Miner
  • ۳) نرم افزار WEKA

 azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

WEKA ابزاری متن باز برای داده کاوی در جاوا

WEKA را می توان یکی از قدرتمند ترین ابزار های موجود جهت داده کاوی دانست که یک کتابخانه متن باز می باشد که به کاربر این امکان را می دهد تا با استفاده از امکانات زبان جاوا، داده های خود را پردازش کند. WEKA توابع مختلف را برای داده کاوی در اختیار کاربر قرار میدهد. مزیت استفاده از این کتابخانه این می باشد که ابزار های متنوعی جهت پیاده سازی الگوریتم های داده کاوی را به صورت آماده دارد.

 

 مفاهیم داده کاوی

azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

    • اعمال فیلتر بر روی داده ها
      •  حذف ویژگی های غیرمفید
      • گسسته سازی ویژگی های عددی
      • ایجاد داده تصادفی
    • انتخاب ویژگی
    • خوشه بندی
      •  روش های انتخاب خوشه
    • دسته بندی
    • ارزیابی مدل و تست
      • آشنایی با ماتریس Confusion
      • آشنایی با مشخصه عملکرد سیستم
    • قوانین انجمن
  • آماده سازی محیط نرم افزاری برای شروع به کار با WEKA
    • نصب جاوا
    • نصب Eclipse
    • اتصال WEKA با Eclipse
  • درونریزی داده
    • آشنایی با نوع داده ARFF
    • تعریف ویژگی

    azsoftir.com
    09367292276
    09367292276
    azsoftir@gmail.com
    azsoftir.com
    09367292276
    09367292276
    azsoftir@gmail.com
    azsoftir.com

    • آشنایی با ساختار داده ها
    • ایجاد مجموعه داده در زمان اجرا
    • ذخیره داده در قالب ARFF
  • اعمال فیلتر بر روی داده ها
    • گسسته سازی ویژگی ها
    • ابزار اعمال فیلتر دسته بندی FilteredClassifier
  • انتخاب ویژگی در WEKA
    • Information Gain و کاربرد آن در انتخاب ویژگی
    • بررسی مولفه های اصلی
    • AttributeSelectedClassifier و انتخاب خاص دسته بندی کننده
  • ایجاد یک دسته بندی کننده و آموزش آن
    • ایجاد دسته بندی کننده با درخت تصمیم گیری یا Decision Treesb.
    • ایجاد دسته بندی کننده با استفاده از ماشین بردار پشتیبان یا SVM
    • مدل های دیگر دسته بندی کننده
    • ایجاد یک دسته بندی کننده اختصاصی
  • نمایش نتیجه
    • نمایش گرافیکی درخت به کاربر
  • بررسی و ارزیابی مدل ها
    • بررسی مجموعه داده ها و تست
    • نمایش نتایج آماری
    • جداسازی داده یادگیری
    • اعتبارسنجی متقابل k-fold
    • ماتریس Confusion
    • منحنی ROC
    • ذخیره مدل با استفاده از Serializable
    • بازگردانی مدل با استفاده از deserializable
  • رگرسیون
    • کلاس Zero
    • کلاس REPTree
    • کلاس SMOreg
    • کلاس MultilayerPerceptron
  • قوانین ارتباطی
    • الگوریتم Apriori و کشف قوانین ارتباطی
  • خوشه بندی
    • الگوریتم EM و نحوه خوشه بندی
    • azsoftir.com
      09367292276
      09367292276
      azsoftir@gmail.com
      azsoftir.com
      09367292276
      09367292276
      azsoftir@gmail.com
      azsoftir.com
    • دسته بندی کننده خوشه ای
    • خوشه بندی افزایشی
    • بررسی خوشه بندی

معرفی چند نرم افزار کاربردی جهت داده کاوی

معرفی چند نرم افزار کاربردی جهت داده کاوی
این درس از مجموعه دوره آشنایی با داده کاوی(Data Mining) و کاربردهای آن است

    درس قبلی - کاربرد داده کاوی و یادگیری ماشین در پردازش متن(Text Processing)
    درس بعدی - ویژگی(Feature) یا همان بُعد(Dimension) در داده کاوی چیست؟

azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

بهتر است ابتدا درس داده کاوی چیست را مطالعه کرده باشید
مطالعه با تمرکز بیشتر
مدرس: مسعود کاویانی
MasoudKaviani.ir

با مطالعه دروس گذشته، یاد گرفته ایم که داده کاوی چیست. در این درس، میخواهیم چند نرم افزار کاربردی حوزه داده کاوی را مروری داشته باشیم. در میان نرم افزار های موجود، تمرکز را بر نرم افزارهایی گذاشتیم که نیاز به دانش برنامه نویسی ندارند. یعنی کسانی که به حوزه برنامه نویسی علاقه ندارند یا فعلا ترجیح میدهند از نرم افزارهای آماده(بدون طراحی نرم افزار و برنامه نویسی) استفاده کنند، میتوانند یادگیری این نرم افزارها را در دستور کار خود قرار دهند.

نرم افزار RapidMiner

این نرم افزار که که به گفته سازندگان آن تلاش بر این کرده است که به صورت یکپارچه عملیات مختلف حوزه علوم داده را تجمیع کند و به دانشمندان علوم داده اجازه دهد به سرعت مدل های مورد نیاز برای عملیات داده کاوی را شناسایی کنند.
نرم افزار Weka

نرم افزار وکا(weka) مجموعه ای از الگوریتم های مختلف جهت عملیات داده کاوی را در اختیار متخصصان و دانشمندان علوم داده می گذارد. کار با این نرم افزار بسیار ساده است و در اینجا کتابی جهت آموزش نرم افزار weka توسط خود سایت سازنده قرار داده شده است.
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
[sc name=”tbl_ea”]
نرم افزار Orange

یکی از نرم افزارهای بسیار ساده و لذت بخش جهت انواع عملیات داده کاوی است. این نرم افزار به خاطر سادگی و واسط کاربری ساده آن میتواند مورد استفاده بسیاری از متخصصان حوزه علوم داده باشد. حتی دوستانی که به تازگی به دنبال یادگیری علوم داده هستند، میتوانند از این نرم افزار استفاده کنند.
نرم افزار Neural Designer مخصوص طراحی شبکه های عصبی

اگر با شبکه های عصبی کار کرده باشید میدانید که طراحی این گونه شبکه ها معمولا کار وقت گیری است و نیاز به دقت بالایی دارد. با استفاده از نرم افزار Neural Designer به راحتی میتوانید شبکه های عصبی مخصوص خود را طراحی کنید و مدل های مختلف داده را توسط آن ها آزمایش کنید.

 
می‌توانید نقاط قوت یا ضعف این درس را به ما بگویید و همچنین اگر سوالی در ذهن دارید از این قسمت(دیدگاه‌ها) سوال خود را مطرح فرمایید
جهت اطلاع از دروس جدید و طرح سوالات و پرسش و پاسخ درباره این دوره و دوره های دیگر، میتوانید در شبکه‌ها و صفحات اجتماعی ما عضو شوید
این درس از مجموعه دوره آشنایی با داده کاوی(Data Mining) و کاربردهای آن است
ترتیب پیشنهادی خواندن درس‌های این مجموعه به صورت زیر است:
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
    1 » داده کاوی(Data mining) چیست؟
    2 » یادگیری ماشین(Machine Learning) چیست؟
    3 » طبقه بندی(Classification) چیست؟
    4 » خوشه بندی(Clustering) چیست؟
    5 » سیستم توصیه گر(Recommendation System) چیست؟
    6 » کاربرد داده کاوی و یادگیری ماشین در پردازش متن(Text Processing)
    7 » معرفی چند نرم افزار کاربردی جهت داده کاوی
    8 » ویژگی(Feature) یا همان بُعد(Dimension) در داده کاوی چیست؟
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com

آشنایی با محیط وکا و ورود داده

آشنایی با محیط وکا و ورود داده

    آشنایی با محیط Explorer Weka
    آشنایی با محیط Experimenter
    آشنایی با محیط Knowledge Flow
    کار با عملگرها
    عملگرهای خواندن داده با انواع داده ای
    اجرای تمام روش های دوره مفاهیم در وکا و کار با پارامترها به ترتیب مراحل فرآیند کریسپ نحوه اجرا و ذخیره
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
    آماده سازی داده ها
        شناخت داده ها( تعریف، انواع داده، انواع مجموعه داده)
        پاکسازی داده( داده پرت و نویز، روش های تشخیص داده پرت، داده از دست رفته و .....)

    مرحله پیش پردازش
        جمع آوری داده(Integration)
        تجمیع(aggregation)
        نمونه برداری(sampling)
        کاهش ابعاد
        انتخاب ویژگی
        گسسته سازی
        تبدیل نوع داده ها

        مدلسازی (رده بندی و خوشه بندی)
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
        ارزیابی مدل ها( پارامترها، ماتریس درهم ریختگی، نمودار (ROC
        رده بندی و پیش بینی( درخت تصمیم، شبکه عصبی، بیز ساده، نزدیکترین همسایه، بردار پشتیبان، به خاطرسپاری، رگرسیون، روشهای جمعی بگینگ و بوستینگ و ...روش های معمول در وکا همراه با مفاهیم
        مدل های بدون راهنما: خوشه بندی سلسله مراتبی، الگوریتم K-Means
        روش های ارزیابی خوشه بندی
        مقایسه نمودار ROC
    قواعدانجمنی

    تعریف روش های موجود در وکا(apriori)،

    مفاهیم پیشرفته
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
    الگوریتم ژنتیک
    Smote
    الگوریتم ازدحام ذرات
    شاخص جینی و سود اطلاعاتی
    Relief
    PCA
    Wavelet
    رده نامتوازن( روش های برخورد با حل مشکل رده نامتوازن)
    مقایسه مدل ها با نمودار ROC
    حل چند مثال مهم و پروژه عملی