پیشنهاد چارچوبی برای شخصی سازی تبلیغات الکترونیکی با داده کاوی

هدف از این پایان نامه ارائه تبلیغ اینترنتی به مشتری با استفاده از تکنیک های داده کاوی بر حسب علایق و سلیقه او می باشد

دسته بندی رشته فناوری اطلاعات (IT)
فرمت فایل doc
حجم فایل ۱۹۵ کیلو بایت
تعداد صفحات ۱۵۸
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

دانلودپایان نامه کارشناسی ارشدرشته فناوری اطلاعات
پیشنهاد چارچوبی برای شخصی سازی تبلیغات الکترونیکی با داده کاوی

چکیده :
به دلیل بازار رقابتی شدیدی که امروزه در تجارت الکترونیک وجود دارد شرکت های تجاری در تلاش هستند تا شرایط مدیریت ارتباط با مشتری را هرچه بیشتر بهبود بخشند تا بتوانند مشتریان فعلی را حفظ و دیگر مشتریان را هم جذب کنند.به همین خاطر است که شرکت هایی که کالاهای خود را بصورت اینترنتی به فروش می رسانند به دنبال این هستند تا تبلیغات کالاهایشان بر اساس ترجیحات فردی مشتریان باشد، یعنی تبلیغات را برای هر مشتری شخصی سازی کنند.
برای شخصی سازی تبلیغات شرکت ها باید اطلاعاتی در مورد رفتار خرید پیشین مشتریانشان کسب کنند و بعد از آن این اطلاعات را تجزیه و تحلیل کنند تا بتوانند رفتار خرید آتی مشتریان را پیش بینی کنند. تکنیک داده کاوی ابزاری است که می تواند به شرکت ها کمک کند تا بتوانند اطلاعات رفتار خریدهای پیشین مشتری را تجزیه و تحلیل کرده و قوانینی را استنتاج کنند که برای پیش بینی رفتار خرید آتی مشتری مفید باشند و بر طبق آن بتوانند راهبردهای شخصی سازی تبلیغات برای مشتریان را برپا کنند.
ما در تحقیق خود از داده های جمع آوری شده از مشتری، که رفتار خریدهای پیشین مشتری هستند، استفاده کرده و با بکارگیری روش تاخر، تناوب و مالی ارزش مشتریان را برای شرکت مشخص کردیم.سپس برای خوشه بندی مشتریان بر اساس ارزش آنها، بصورت موازی از الگوریتم خوشه بندی K-Means و K-Harmonic Means استفاده کردیم سپس از الگوریتم استقرایی که یکی از الگوریتم های کشف قوانین وابستگی است استفاده کردیم و تکنیک قوانین وابستگی را بر روی داده های مربوط به هر یک از خوشه هایی که توسط K-Means مشخص شده اند بکار گرفتیم. با استفاده از قوانین بدست آمده از هر خوشه راهبردهای شخصی سازی تبلیغات برای هر خوشه از مشتریان را مشخص کردیم. برای هر مشتری علاوه بر قوانین مربوط به خوشه اصلی که به آن تعلق دارد از قوانین خوشه های دیگری که درجه تعلق مناسبی نسبت به آنها دارد نیز برای تعیین راهبردهای شخصی سازی تبلیغات استفاده کردیم تا بدین ترتیب تعداد تبلیغات پیشنهادی که مطابق با علایق مشتری است را بیشتر کنیم.
کلمات کلیدی:

تکنیک های داده کاوی

ارائه تبلیغ اینترنتی به مشتری

خوشه بندی مشتریان بر اساس ارزش آنها

مقدمه:
پیشرفت فناوری های اطلاعات و ارتباطات، حجم وسیعی از اطلاعات و داده های مفید را در دسترس قرار داده است.با توجه به رشد روز افزون بازار خرید اینترنتی و رقابت شدید بین شرکت ها و سایت های فروش اینترنتی، استفاده بهینه از اطلاعات بازار و مشتری اهمیت ویژه ای پیدا کرده است.ایده ها و راه حل های گوناگونی برای استفاده از اطلاعات بدست آمده از بازار و مشتریان جهت جذب مشتری و مهمتر از آن جهت نگهداری مشتریان فعلی پدید می آیند که یکی از این ایده ها، استفاده از اطلاعات مشتری برای بدست آوردن و پیش بینی کردن علایق آن است.فرایندهای زیادی را می توان برای بدست آوردن علایق مشتریان متصور شد، اما یکی از این فرایندها که امروزه با استقبال زیادی از سوی شرکت های تجاری و صاحبان سایت های فروش اینترنتی مواجه شده است، استفاده از تکنیک های داده کاوی۱ می باشد.با استفاده از تکنیک خوشه بندی۲ و تکنیک قوانین انجمنی۳ که از تکنیک های داده کاوی به شمار می آیند و بر روی داده های مربوط به رفتار خرید پیشین مشتری اعمال می شوند، می توان اطلاعات مفیدی جهت پیش بینی رفتار خرید آتی مشتری کسب نمود.شرکت ها از این اطلاعات استفاده می کنند تا بتوانند کالاهای مورد علاقه مشتریان را در مکان و زمان مناسب به آنها پیشنهاد دهند و بدین ترتیب در جهت سیاست نگهداری و حفظ مشتریان گام بردارند.
فهرست مطالب:
فصل اول: مقدمه و کلیات تحقیق
۱-۱: مقدمه ……………………………………………………………………………………………. ۲
۱-۲: بیان مسئله …………………………………………………………………………………….. ۳
۱-۳: هدف تحقیق …………………………………………………………………………………… ۴
۱-۴: اهمیت تحقیق ………………………………………………………………………………….. ۶
۱-۵: ساختار تحقیق …………………………………………………………………………………. ۷
فصل دوم: پیشینه و مفاهیم تحقیق
۲-۱: مبانی نظری……………………………………………………………………………………… ۱۰
۲-۱-۱: مدیریت ارتباط با مشتری………………………………………………………. ۱۰
۲-۱-۱-۱: تعریف مدیریت ارتباط با مشتری …………………………………………… ۱۰
۲-۱-۱-۲: تبلیغات اینترنتی …………………………………………………………… ۱۳
۲-۱-۲: داده کاوی …………………………………………………………………………………… ۱۵
۲-۱-۲-۱: تعریف داده کاوی ……………………………………………………………………… ۱۵
۲-۱-۲-۲: خوشه بندی ……………………………………………………………………………. ۱۸
۲-۱-۲-۳: قوانین وابستگی ……………………………………………………………………… ۲۵
۲-۱-۳: شیوه تاخر، تناوب و مالی ………………………………………………………………. ۳۱
۲-۲: پیشینه تحقیقاتی ………………………………………………………………………….. ۳۳
فصل سوم: روش شناسی تحقیق
۳-۱: مقدمه …………………………………………………………………………………………… ۴۰
۳-۲: اطلاعات مجموعه داده ها و آماده سازی داده ………………………………………… ۴۲
۳-۳: تعیین ارزش مشتری ……………………………………………………………………….. ۴۴
۳-۴: استفاده از تکنیک های داده کاوی ……………………………………………………… ۴۸
۳-۵: رهیافتی برای شخصی سازی تبلیغات …………………………………………………. ۵۶
۳-۶: روش ارزیابی ………………………………………………………………………………… ۵۹
فصل چهارم : محاسبات و یافته های تحقیق
۴-۱ : پایگاه داده هدف ……………………………………………………………………………. ۶۲
۴-۲ : آماده سازی مجموعه داده ……………………………………………………………….. ۶۳
۴-۳ : استخراج اطلاعات جهت تعیین معیارهای RFM …………………………………… 78
۴-۴ : داده کاوی ……………………………………………………………………………………. ۸۲
۴-۵ : ارائه تبلیغات مناسب به مشتری ……………………………………………………….. ۱۱۷
۴-۶ : ارزیابی مدل …………………………………………………………………………………. ۱۱۹
فصل پنجم : نتیجه گیری و کار آینده
۵-۱ : نتیجه گیری …………………………………………………………………………………. ۱۲۶
۵-۲ : پیشنهادها و کار آینده ………………………………………………………………….. ۱۲۸
منابع …………………………………………………………………………………………………. ۱۳۱
فهرست شکل ها:
شکل ۳-۱ : فرایند شخصی سازی تبلیغات توسط داده کاوی …………………………………………… ۴۱
شکل ۳-۲ : قالب کاری سیستم ارائه تبلیغ در سایت ………………………………………………………… ۵۸
شکل ۴-۱ : قالب داده های مربوط به خوشه شماره یک در WEKA ………………………………. 107
شکل ۴-۲ : قالب داده های مربوط به خوشه شماره دو در WEKA ………………………………… 110
شکل ۴-۳ : قالب داده های مربوط به خوشه شماره سه در WEKA ……………………………….. 114
فهرست جدول ها:
جدول ۲-۱ : مثال تراکنش های خرید ………………………………………………………………………………. ۲۶
جدول ۲-۲ : مثال معیاردهی RFM ………………………………………………………………………………….. 33
جدول ۳-۱ : مشخصات کالاهای موجود ……………………………………………………………………………. ۴۳
جدول ۳-۲ : ارزش گذاری معیار Recency …………………………………………………………………….. 46
جدول ۳-۳ : ارزش گذاری معیار Monetary …………………………………………………………………. 47
جدول ۳-۴ : مثال نحوه تخصیص RFM ……………………………………………………………………………. 48
جدول ۴-۱ : رکوردهای خرید مشتریان ……………………………………………………………………………… ۶۳
جدول ۴-۲ : تخصیص مقادیر RFM ………………………………………………………………………………….. 79
جدول ۴-۳ : شماره خوشه مشتریان در K-means …………………………………………………………. 83
جدول ۴-۴ : رکوردهای خرید مشتریان پس از ویرایش …………………………………………………….. ۹۲
جدول ۴-۵ : نتایج پیشنهادها و عرضه تبلیغات کالاها به مشتریان ……………………………………. ۱۲۰
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

مبانی نظری پیشنهاد چارچوبی جهت تشخیص علل تاثیرگذار و درصد تاثیر آنها در سود و زیان بیمه با داده کاوی در شرکت سهامی بیمه ایران

هدف از این مبانی نظری پیشنهاد چارچوبی جهت تشخیص علل تاثیرگذار و درصد تاثیر آنها در سود و زیان بیمه با داده کاوی در شرکت سهامی بیمه ایران می باشد

دسته بندی رشته فناوری اطلاعات (IT)
فرمت فایل doc
حجم فایل ۲۲۲ کیلو بایت
تعداد صفحات ۴۰
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

دانلودمبانی نظریپایان‌نامه كارشناسی ارشدمهندسی فناوری اطلاعات
پیشنهاد چارچوبی جهت تشخیص علل تاثیرگذار و درصد تاثیر آنها در سود و زیان بیمه با داده کاوی

(مطالعه موردی: شرکت سهامی بیمه ایران)
چکیده
بررسی اطلاعات بیمه های اتومبیل نشان داده عواملی چون نوع استفاده خودرو، داشتن گواهینامه رانندگی، نوع گواهینامه و تطابق یا عدم تطابق آن با وسیله نقلیه، مبلغ حق بیمه، میزان تعهدات بیمه نامه، کیفیت خودروی خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بیمه با مورد بیمه، تاخیردرتمدید بیمه نامه، در سود و زیان شرکت های بیمه تاثیر داشته اند.
هدف این پایان نامه شناخت عوامل اثرگذار و ضریب تاثیر آنها در سود و زیان بیمه شخص ثالث خودرو شرکت های بیمه با استفاده از روش داده کاوی و سپس انتخاب الگوریتمی که بهترین میزان دقت پیش بینی برای تشخیص این عوامل را داشته اند می باشد.نتیجه حاصل از این پژوهش نشان می دهد که روشهای داده کاوی با استفاده از الگوریتم های دسته بندی با دقت بالای ۹۱% و الگوریتم های درخت تصمیم با دقت بالای ۹۶% و الگوریتم های خوشه بندی با ایجاد خوشه های قابل قبول قادر به ارائه مدلی برای تشخیص عوامل اثرگذار و تعیین میزان اثر آنها در سود و زیان بیمه نامه شخص ثالث خودرو خواهند بود.
کلیدواژگان:

داده کاوی

سود و زیان

بیمه شخص ثالث خودرو

مقدمه
شرکتهای تجاری و بازرگانی برای ادامه بقا و حفظ بازار همواره بر سود دهی و کاهش ضرر و زیان خود تاکید دارند از این رو روشهای جذب مشتری و همچنین تکنیکهای جلوگیری یا کاهش زیان در سرلوحه کاری این شرکتها قرار می گیرد. از جمله شرکتهایی که بدلایل مختلف در معرض کاهش سود و یا افزایش زیان قرار می گیرند شرکتهای بیمه ای می باشند. عواملی همچون بازاریابی، وفاداری مشتریان، نرخ حق بیمه، تبلیغات، تقلب، می تواند باعث جذب یا دفع مشتری گردد که در سود و زیان تاثیر مستقیم و غیر مستقیم دارد. پرداخت خسارت نیز به عنوان تعهد شرکتهای بیمه منجر به کاهش سود و در بعضی موارد موجب زیان یک شرکت بیمه می شود. خسارت می تواند بدلایل مختلف رخ دهد و یا عملی دیگر به گونه ای خسارت جلوه داده شود که در واقع اینچنین نیست[Derrig et. al 2006].
عواملی از قبیل فرهنگ رانندگی، داشتن گواهینامه رانندگی، نوع گواهینامه و تطابق یا عدم تطابق آن با وسیله نقلیه، جاده های بین شهری و خیابانهای داخل شهر که شهرداری ها و ادارات راه را به چالش می کشد، تقلب، وضعیت آب و هوا، کیفیت خودروی خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بیمه با مورد بیمه [Wilson 2003]، روزهای تعطیل، مسافرتها و بسیاری موارد دیگر می توانند موجب خسارت و در نهایت افزایش زیان یک شرکت بیمه ای گردند. بیمه صنعتی سودمند، ضروری و مؤثر در توسعه اقتصادی است. این صنعت بدلیل «افزایش امنیت در عرصه های مختلف زندگی و فعالیتهای اقتصادی»، «افزایش سرمایه گذاری و اشتغال و رشد اقتصادی» و « ارتقای عدالت اقتصادی و کاهش فقر ناشی از مخاطرات »، حائز جایگاه مهمی در پیشرفت و تعالی یک کشور است.
با وجود نقش مهم بیمه در بسترسازی و تأمین شرایط مساعد اقتصادی، وضعیت کنونی این صنعت در اقتصاد ملی با وضعیت مطلوب آن فاصله زیادی دارد. عدم آشنایی عمومی و کم بودن تقاضا برای محصولات بیمه ای، دانش فنی پایین در عرصه خدمات بیمه ای، عدم تطابق ریسک با حق بیمه، تفاوت فاحش در مقایسه معیارهای تشخیص ریسک بیمه شخص ثالث با نوع بیمه معادل در کشورهای توسعه یافته، وجود نارسایی ها در مدیریت واحدهای عرضه بیمه از دلایل عدم توسعه مناسب این صنعت در کشور است. از آنجا که بشر در طول تاریخ به کمک علم و تجربه رستگاری ها و توفیقات فراوانی کسب کرده است، نگاه علمی تر به مشکلات این صنعت و یافتن راه حل در بستر علم می تواند راه گشا باشد. امروزه بوسیله روشهای داده کاوی ارتباط بین فاکتورهای مختلف موثر یا غیر موثر در یک موضوع مشخص می شود و با توجه به اینکه داده کاوی ابزاری مفید در استخراج دانش از داده های انبوه می باشد که ارتباطات نهفته بین آنها را نشان می دهد، شرکتهای تجاری بازرگانی رو به این تکنیکها آورده اند. داده کاوی محدود به استفاده از فناوری ها نیست و از هرآنچه که برایش مفید واقع شود استفاده خواهد کرد. با این وجود آمار و کامپیوتر پر استفاده ترین علوم و فناوری های مورد استفاده داده کاوی است.
فهرست مطالب
فصل اول: کلیات
۱-۱ تعریف داده کاوی ۳
۱-۲ تعریف بیمه ۴
۱-۳ هدف پایان نامه ۴
۱-۴ مراحل انجام تحقیق ۴
۱-۵ ساختار پایان نامه ۵
فصل دوم: ادبیات موضوع و تحقیقات پیشین
۲-۱ داده کاوی و یادگیری ماشین ۷
۲-۲ ابزارها و تکنیک های داده کاوی ۸
۲-۳ روشهای داده کاوی ۹
۲-۳-۱ روشهای توصیف داده ها ۱۰
۲-۳-۲ روشهای تجزیه و تحلیل وابستگی ۱۰
۲-۳-۳ روشهای دسته بندی و پیشگویی ۱۰
۲-۳-۴ درخت تصمیم ۱۱
۲-۳-۵ شبکه عصبی ۱۲
۲-۳-۶ استدلال مبتنی بر حافظه ۱۲
۲-۳-۷ ماشین های بردار پشتیبانی ۱۳
۲-۳-۸ روشهای خوشه بندی ۱۳
۲-۳-۹ روش K-Means 13
۲-۳-۱۰ شبکه کوهنن ۱۴
۲-۳-۱۱ روش دو گام ۱۴
۲-۳-۱۲ روشهای تجزیه و تحلیل نویز ۱۴
۲-۴ دسته های نامتعادل]صنیعی آباده ۱۳۹۱[. ۱۵
۲-۴-۱ راهکار مبتنی بر معیار ۱۵
۲-۴-۲ راهکار مبتنی بر نمونه برداری ۱۵
۲-۵ پیشینه تحقیق ۱۶
۲-۶ خلاصه فصل ۱۹
منابع و مأخذ
فهرست منابع فارسی
فهرست منابع انگلیسی
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

پیشنهاد چارچوبی جهت تشخیص علل تاثیرگذار و درصد تاثیر آنها در سود و زیان بیمه با داده کاوی

هدف از این پایان‌نامه پیشنهاد چارچوبی جهت تشخیص علل تاثیرگذار و درصد تاثیر آنها در سود و زیان بیمه با داده کاوی در شرکت سهامی بیمه ایران می باشد

دسته بندی رشته فناوری اطلاعات (IT)
فرمت فایل doc
حجم فایل ۱٫۳۰۵ مگا بایت
تعداد صفحات ۱۱۴
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

دانلودپایان‌نامه كارشناسی ارشدمهندسی فناوری اطلاعات
پیشنهاد چارچوبی جهت تشخیص علل تاثیرگذار و درصد تاثیر آنها در سود و زیان بیمه با داده کاوی

(مطالعه موردی: شرکت سهامی بیمه ایران)
چکیده
بررسی اطلاعات بیمه های اتومبیل نشان داده عواملی چون نوع استفاده خودرو، داشتن گواهینامه رانندگی، نوع گواهینامه و تطابق یا عدم تطابق آن با وسیله نقلیه، مبلغ حق بیمه، میزان تعهدات بیمه نامه، کیفیت خودروی خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بیمه با مورد بیمه، تاخیردرتمدید بیمه نامه، در سود و زیان شرکت های بیمه تاثیر داشته اند.
هدف این پایان نامه شناخت عوامل اثرگذار و ضریب تاثیر آنها در سود و زیان بیمه شخص ثالث خودرو شرکت های بیمه با استفاده از روش داده کاوی و سپس انتخاب الگوریتمی که بهترین میزان دقت پیش بینی برای تشخیص این عوامل را داشته اند می باشد.نتیجه حاصل از این پژوهش نشان می دهد که روشهای داده کاوی با استفاده از الگوریتم های دسته بندی با دقت بالای ۹۱% و الگوریتم های درخت تصمیم با دقت بالای ۹۶% و الگوریتم های خوشه بندی با ایجاد خوشه های قابل قبول قادر به ارائه مدلی برای تشخیص عوامل اثرگذار و تعیین میزان اثر آنها در سود و زیان بیمه نامه شخص ثالث خودرو خواهند بود.
کلیدواژگان:

داده کاوی

سود و زیان

بیمه شخص ثالث خودرو

مقدمه
شرکتهای تجاری و بازرگانی برای ادامه بقا و حفظ بازار همواره بر سود دهی و کاهش ضرر و زیان خود تاکید دارند از این رو روشهای جذب مشتری و همچنین تکنیکهای جلوگیری یا کاهش زیان در سرلوحه کاری این شرکتها قرار می گیرد. از جمله شرکتهایی که بدلایل مختلف در معرض کاهش سود و یا افزایش زیان قرار می گیرند شرکتهای بیمه ای می باشند. عواملی همچون بازاریابی، وفاداری مشتریان، نرخ حق بیمه، تبلیغات، تقلب، می تواند باعث جذب یا دفع مشتری گردد که در سود و زیان تاثیر مستقیم و غیر مستقیم دارد. پرداخت خسارت نیز به عنوان تعهد شرکتهای بیمه منجر به کاهش سود و در بعضی موارد موجب زیان یک شرکت بیمه می شود. خسارت می تواند بدلایل مختلف رخ دهد و یا عملی دیگر به گونه ای خسارت جلوه داده شود که در واقع اینچنین نیست[Derrig et. al 2006].
عواملی از قبیل فرهنگ رانندگی، داشتن گواهینامه رانندگی، نوع گواهینامه و تطابق یا عدم تطابق آن با وسیله نقلیه، جاده های بین شهری و خیابانهای داخل شهر که شهرداری ها و ادارات راه را به چالش می کشد، تقلب، وضعیت آب و هوا، کیفیت خودروی خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بیمه با مورد بیمه [Wilson 2003]، روزهای تعطیل، مسافرتها و بسیاری موارد دیگر می توانند موجب خسارت و در نهایت افزایش زیان یک شرکت بیمه ای گردند. بیمه صنعتی سودمند، ضروری و مؤثر در توسعه اقتصادی است. این صنعت بدلیل «افزایش امنیت در عرصه های مختلف زندگی و فعالیتهای اقتصادی»، «افزایش سرمایه گذاری و اشتغال و رشد اقتصادی» و « ارتقای عدالت اقتصادی و کاهش فقر ناشی از مخاطرات »، حائز جایگاه مهمی در پیشرفت و تعالی یک کشور است.
با وجود نقش مهم بیمه در بسترسازی و تأمین شرایط مساعد اقتصادی، وضعیت کنونی این صنعت در اقتصاد ملی با وضعیت مطلوب آن فاصله زیادی دارد. عدم آشنایی عمومی و کم بودن تقاضا برای محصولات بیمه ای، دانش فنی پایین در عرصه خدمات بیمه ای، عدم تطابق ریسک با حق بیمه، تفاوت فاحش در مقایسه معیارهای تشخیص ریسک بیمه شخص ثالث با نوع بیمه معادل در کشورهای توسعه یافته، وجود نارسایی ها در مدیریت واحدهای عرضه بیمه از دلایل عدم توسعه مناسب این صنعت در کشور است. از آنجا که بشر در طول تاریخ به کمک علم و تجربه رستگاری ها و توفیقات فراوانی کسب کرده است، نگاه علمی تر به مشکلات این صنعت و یافتن راه حل در بستر علم می تواند راه گشا باشد. امروزه بوسیله روشهای داده کاوی ارتباط بین فاکتورهای مختلف موثر یا غیر موثر در یک موضوع مشخص می شود و با توجه به اینکه داده کاوی ابزاری مفید در استخراج دانش از داده های انبوه می باشد که ارتباطات نهفته بین آنها را نشان می دهد، شرکتهای تجاری بازرگانی رو به این تکنیکها آورده اند. داده کاوی محدود به استفاده از فناوری ها نیست و از هرآنچه که برایش مفید واقع شود استفاده خواهد کرد. با این وجود آمار و کامپیوتر پر استفاده ترین علوم و فناوری های مورد استفاده داده کاوی است.
فهرست مطالب
فصل اول: کلیات
۱-۱ تعریف داده کاوی ۳
۱-۲ تعریف بیمه ۴
۱-۳ هدف پایان نامه ۴
۱-۴ مراحل انجام تحقیق ۴
۱-۵ ساختار پایان نامه ۵
فصل دوم: ادبیات موضوع و تحقیقات پیشین
۲-۱ داده کاوی و یادگیری ماشین ۷
۲-۲ ابزارها و تکنیک های داده کاوی ۸
۲-۳ روشهای داده کاوی ۹
۲-۳-۱ روشهای توصیف داده ها ۱۰
۲-۳-۲ روشهای تجزیه و تحلیل وابستگی ۱۰
۲-۳-۳ روشهای دسته بندی و پیشگویی ۱۰
۲-۳-۴ درخت تصمیم ۱۱
۲-۳-۵ شبکه عصبی ۱۲
۲-۳-۶ استدلال مبتنی بر حافظه ۱۲
۲-۳-۷ ماشین های بردار پشتیبانی ۱۳
۲-۳-۸ روشهای خوشه بندی ۱۳
۲-۳-۹ روش K-Means 13
۲-۳-۱۰ شبکه کوهنن ۱۴
۲-۳-۱۱ روش دو گام ۱۴
۲-۳-۱۲ روشهای تجزیه و تحلیل نویز ۱۴
۲-۴ دسته های نامتعادل]صنیعی آباده ۱۳۹۱[. ۱۵
۲-۴-۱ راهکار مبتنی بر معیار ۱۵
۲-۴-۲ راهکار مبتنی بر نمونه برداری ۱۵
۲-۵ پیشینه تحقیق ۱۶
۲-۶ خلاصه فصل ۱۹
فصل سوم: شرح پژوهش
۳-۱ انتخاب نرم افزار ۲۱
۳-۱-۱ Rapidminer 21
۳-۱-۲ مقایسه RapidMiner با سایر نرم افزار های مشابه ۲۱
۳-۲ داده ها ۲۵
۳-۲-۱ انتخاب داده ۲۵
۳-۲-۲ فیلدهای مجموعه داده صدور ۲۵
۳-۲-۳ کاهش ابعاد ۲۵
۳-۲-۴ فیلدهای مجموعه داده خسارت ۲۹
۳-۲-۵ پاکسازی داده ها ۲۹
۳-۲-۶ رسیدگی به داده های از دست رفته ۲۹
۳-۲-۷ کشف داده دور افتاده ۳۰
۳-۲-۸ انبوهش داده ۳۲
۳-۲-۹ ایجاد ویژگی دسته ۳۲
۳-۲-۱۰ تبدیل داده ۳۲
۳-۲-۱۱ انتقال داده به محیط داده کاوی ۳۲
۳-۲-۱۲ انواع داده تعیین شده ۳۳
۳-۲-۱۳ عملیات انتخاب ویژگیهای موثرتر ۳۴
۳-۳ نتایج اعمال الگوریتم PCA و الگوریتم های وزن دهی ۳۴
۳-۴ ویژگی های منتخب جهت استفاده در الگوریتمهای حساس به تعداد ویژگی ۳۶
۳-۵ معیارهای ارزیابی الگوریتمهای دسته بندی ۳۷
۳-۶ ماتریس درهم ریختگی ۳۷
۳-۷ معیار AUC 38
۳-۸ روشهای ارزیابی الگوریتم های دسته بندی ۳۹
۳-۸-۱ روش Holdout 39
۳-۸-۲ روش Random Subsampling 39
۳-۸-۳ روش Cross-Validation 40
۳-۸-۴ روش Bootstrap 40
۳-۹ الگوریتمهای دسته بندی ۴۱
۳-۹-۱ الگوریتم KNN 42
۳-۹-۲ الگوریتم Naïve Bayes 42
۳-۹-۳ الگوریتم Neural Network 43
۳-۹-۴ الگوریتم SVM خطی ۴۵
۳-۹-۵ الگوریتم رگرسیون لجستیک ۴۶
۳-۹-۶ الگوریتم Meta Decision Tree 47
۳-۹-۷ الگوریتم درخت Wj48 49
۳-۹-۸ الگوریتم درخت Random forest 51
۳-۱۰ معیارهای ارزیابی الگوریتم های مبتنی بر قانون(کشف قوانین انجمنی) ۵۴
۳-۱۰-۱ الگوریتم FPgrowth 55
۳-۱۰-۲ الگوریتم Weka Apriori 55
۳-۱۱ معیارهای ارزیابی الگوریتمهای خوشه بندی ۵۵
۳-۱۲ الگوریتم های خوشه بندی ۵۷
۳-۱۲-۱ الگوریتم K-Means 57
۳-۱۲-۲ الگوریتم Kohonen 60
۳-۱۲-۳ الگوریتم دوگامی ۶۴
فصل چهارم: ارزیابی و نتیجه گیری
۴-۱ مقایسه نتایج ۶۹
۴-۲ الگوریتمهای دسته بندی ۶۹
۴-۳ الگوریتم های دسته بندی درخت تصمیم ۷۰
۴-۴ الگوریتم های خوشه بندی ۷۹
۴-۵ الگوریتم های قواعد تلازمی(مبتنی بر قانون) ۸۱
۴-۶ پیشنهادات به شرکت های بیمه ۸۱
۴-۷ پیشنهادات جهت ادامه کار ۸۳
منابع و مأخذ
فهرست منابع فارسی ۸۴
فهرست منابع انگلیسی ۸۵
فهرست جدول‌ها
جدول شماره ۳-۱: نتایج رای گیری استفاده از نرم افزارهای داده کاوی ۲۴
جدول شماره ۳-۲: فیلدهای اولیه داده های صدور ۲۶
جدول شماره ۳-۳: فیلدهای نهایی داده های صدور ۲۷
جدول شماره ۳-۴: فیلدهای حذف شده داده های صدور و علت حذف آنها ۲۸
جدول ۳-۵: فیلدهای استخراج شده از داده های خسارت ۲۸
جدول ۳-۶: نتایج نمودار boxplot 31
جدول ۳-۷: انواع داده استفاده شده ۳۳
جدول ۳-۸: نتایج حاصل از اجتماع فیلدهای با بالاترین وزن در الگوریتمهای مختلف ۳۷
جدول ۳-۹: ماتریس در هم ریختگی رکوردهای تخمینی(Predicted Records) 38
جدول ۳-۱۰: قوانین استخراج شده توسط الگوریتم Fpgrowth 55
جدول ۳-۱۱: قوانین استخراج شده توسط الگوریتم Weka Apriori 55
جدول ۳-۱۲: تنظیمات پارامترهای الگوریتم K-Means 57
اجرا برای ۹ خوشه در الگوریتم K-Means 60
جدول ۳-۱۳: تنظیمات پارامترهای الگوریتم Kohonen 64
جدول ۳-۱۴: تنظیمات پارامترهای الگوریتم دوگامی ۶۹
جدول ۴-۱: مقایسه الگوریتم های دسته بند ۷۰
جدول ۴-۲: مقایسه الگوریتم های دسته بند درخت تصمیم ۷۰
جدول ۴-۳: ماتریس آشفتگی قانون شماره ۱ ۷۱
جدول ۴-۴: ماتریس آشفتگی قانون شماره ۲ ۷۲
جدول ۴-۵: ماتریس آشفتگی قانون شماره ۳ الف ۷۲
جدول ۴-۶: ماتریس آشفتگی قانون شماره ۳ ب ۷۲
جدول ۴-۷: ماتریس آشفتگی قانون شماره ۳ ج ۷۳
جدول ۴-۸: ماتریس آشفتگی قانون شماره ۳ د ۷۳
جدول ۴-۹: ماتریس آشفتگی قانون شماره ۳ ه ۷۳
جدول ۴-۱۰: ماتریس آشفتگی قانون شماره ۳ و ۷۴
جدول ۴-۱۱: ماتریس آشفتگی قانون شماره ۳ ز ۷۶
جدول ۴-۱۲: ماتریس آشفتگی قانون شماره ۴ ۷۶
جدول ۴-۱۳: ماتریس آشفتگی قانون شماره ۵ ۷۷
جدول ۴-۱۴: ماتریس آشفتگی قانون شماره ۶ الف ۷۷
جدول ۴-۱۵: ماتریس آشفتگی قانون شماره ۶ ب ۷۸
جدول ۴-۱۶: ماتریس آشفتگی قانون شماره۷ ۷۸
جدول ۴-۱۷: ماتریس آشفتگی قانون شماره۸ ۷۹
جدول ۴-۱۸: مقایسه الگوریتم های خوشه بندی ۷۹
جدول ۴-۱۹: فیلدهای حاصل از الگوریتم های خوشه بندی ۸۰
جدول ۴-۲۰: نتایج الگوریتم های FpGrowth Weka Apriori 81
فهرست شکل‌ها
شکل شماره۳-۱: داده از دست رفته فیلد" نوع بیمه " پس از انتقال به محیط داده کاوی ۳۳
شکل ۳-۲: نتایج الگوریتمPCA 34
شکل ۳-۳: نتایج الگوریتم SVM Weighting در ارزشدهی به ویژگی ها ۳۵
شکل ۳-۴: نتایج الگوریتم Weighting Deviation در ارزشدهی به ویژگی ها ۳۵
شکل ۳-۵: نتایج الگوریتم Weighting Correlation در ارزشدهی به ویژگی ها ۳۶
شکل ۳-۶: نمای کلی استفاده از روشهای ارزیابی ۴۱
شکل ۳-۷: نمای کلی استفاده از یک مدل درون یک روش ارزیابی ۴۲
شکل ۳-۸: نمودار AUC الگوریتم KNN 42
شکل ۳-۹: نمودار AUC الگوریتم Naïve Bayes 43
شکل ۳-۱۰: تبدیل ویژگی های غیر عددی به عدد در الگوریتم شبکه عصبی ۴۴
شکل ۳-۱۱: نمودار AUC و ماتریس آشفتگی الگوریتم Neural Net 44
شکل ۳-۱۲: تبدیل ویژگی های غیر عددی به عدد در الگوریتم SVM خطی ۴۵
شکل ۳-۱۳ : نمودار AUC الگوریتم SVM Linear 46
شکل ۳-۱۴ : نمودار AUC الگوریتم رگرسیون لجستیک ۴۷
شکل ۳-۱۵ : نمودار AUC الگوریتم Meta Decision Tree 48
شکل ۳-۱۶ : قسمتی از نمودارtree الگوریتم Meta Decision Tree 49
شکل ۳-۱۷ : نمودار radial الگوریتم Meta Decision Tree 49
شکل ۳-۱۸: نمودار AUC الگوریتم Wj48 50
شکل ۳-۱۹ : نمودار tree الگوریتم Wj48 51
شکل ۳-۲۰ : نمودار AUC الگوریتم Random forest 52
شکل ۳-۲۱ : نمودار تولید ۲۰ درخت در الگوریتم Random Forest 53
شکل ۳-۲۲ : یک نمونه درخت تولید شده توسط الگوریتم Random Forest 53
شکل ۳-۲۳ : رسیدن درصد خطا به صفر پس از ۸مرتبه ۵۷
شکل ۳-۲۴ : Predictor Importance for K-Means 58
شکل ۳-۲۵ : اندازه خوشه ها و نسبت کوچکترین خوشه به بزرگترین خوشه در الگوریتم
K-Means 59
شکل ۳-۲۶ : کیفیت خوشه ها در الگوریتمMeans K- 60
شکل ۳-۲۷ : Predictor Importance for Kohonen 61
شکل ۳-۲۸ : اندازه خوشه ها و نسبت کوچکترین خوشه به بزرگترین خوشه در الگوریتم
Kohonen 62
شکل ۳-۲۹ : کیفیت خوشه ها در الگوریتمMeans K- 63
شکل ۳-۳۰ : تعداد نرون های ورودی و خروجی در Kohonen 63
شکل ۳-۳۱ : Predictor Importance for دوگامی ۶۴
شکل ۳-۳۲ : اندازه خوشه ها و نسبت کوچکترین خوشه به بزرگترین خوشه در
الگوریتم دوگامی ۶۵
شکل ۳-۳۳ : کیفیت خوشه ها در الگوریتم دوگامی ۶۶
شکل۴-۱: نمودارنسبت تخفیف عدم خسارت به خسارت ۷۵
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

پیاده سازی روشی برای تشخیص نفوذ با تکنیکهای داده کاوی و ارزیای نتایج آن

هدف از این سمینار پیاده سازی روشی برای تشخیص نفوذ با تکنیکهای داده کاوی و ارزیای نتایج آن می باشد

دسته بندی رشته فناوری اطلاعات (IT)
فرمت فایل doc
حجم فایل ۳۶۴ کیلو بایت
تعداد صفحات ۷۰
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

دانلودسمیناركارشناسی ارشد مهندسیفناوری اطلاعات
پیاده سازی روشی برای تشخیص نفوذ با تکنیکهای داده کاوی و ارزیای نتایج آن

چکیده
با رشد فناوری اطلاعات، امنیت شبکه به عنوان یکی از مباحث مهم و چالش بسیار بزرگ مطرح است. سیستم های تشخیص نفوذ، مولفه اصلی یک شبکه امن است. سیستم های تشخیص نفوذ سنتی نمی توانند خود را با حملات جدید تطبیق دهند از این رو امروزه سیستم های تشخیص نفوذ مبتنی بر داده کاوی مطرح گردیده اند. مشخص نمودن الگوهای در حجم زیاد داده، کمک بسیار بزرگی به ما می کند. روش های داده کاوی با مشخص نمودن یک برچسب دودویی (بسته نرمال، بسته غیر نرمال) و همچنین مشخص نمودن ویژگی ها و خصیصه با الگوریتم های دسته بندی می توانند داده غیر نرمال تشخیص دهند. از همین رو دقت و درستی سیستم های تشخیص نفوذ افزایش یافته و در نتیجه امنیت شبکه بالا می رود.

در این پژوهش تمامی الگوریتم­های مربوط به مدل­های مختلف داده­کاوی شبیه ­سازی شده و نتایج بدست آمده ازارزیابی این مدل­ها بر اساس پارامترهای مختلف و همچنین ماتریس confusion نشان داده شده است.

کلمات کلیدی:

داده کاوی

کشف تقلب

یادگیری بانظارت

تشخیص نفوذ و حملات

مقدمه
از آنجایی که از نظر تکنیکی ایجاد سیستم های کامپیوتری بدون نقاط ضعف و شکست امنیتی عملا غیر ممکن است. تشخیص نفوذ در سیستم-های کامپیوتری با اهمیت خاصی دنبال می شود. سیستم های تشخیص نفوذ سخت افزار یا نرم افزاری است که کار نظارت بر شبکه کامپیوتری را در مورد فعالیت های مخرب و یا نقص سیاست های مدیریتی و امنیتی را انجام می-دهد و گزارش های حاصله را به بخش مدیریت شبکه ارائه می دهد‎[1]. سیستم های تشخیص نفوذ وظیف شناسایی و تشخیص هر گونه استفاده غیر مجاز به سیستم، سوء استفاده و یا آسیب رسانی توسط هر دودسته کاربران داخلی و خارجی را بر عهده دارند.
هدف این سیستم ها جلوگیری از حمله نیست و تنها کشف و احتمالا شناسایی حملات و تشخیص اشکالات امنیتی در سیستم یا شبکه کامپیوتری و اعلام آن به مدیر سیستم است. عموما سیستم های تشخیص نفوذ در کنار دیوارهای آتش و بصورت مکمل امنیتی برای آن ها مورد استفاده قرار می گیرد. سیستم های تشخیص نفوذ ستنی نمی توانند خود را با حملات جدید تطبیق دهند از این رو امروزه سیستم های تشخیص نفوذ مبتنی بر داده کاوی مطرح گردیده اند‎[1]. مشخص نمودن الگوهای در حجم زیاد داده، کمک بسیار بزرگی به ما می-کند. روش های داده کاوی با مشخص نمودن یک برچسب دودویی (بسته نرمال، بسته غیر نرمال) و همچنین مشخص نمودن ویژگی ها و خصیصه با الگوریتم های دسته بندی می توانند داده غیر نرمال تشخیص دهند. از همین رو دقت و درستی سیستم های تشخیص نفوذ افزایش یافته و در نتیجه امنیت شبکه بالا می رود‎[1].
در این پایان نامه سعی شده است با استفاده از روش های مبتنی بر داده کاوی سیتم های تشخیص نفوذ پیشنهاد کنیم که از این روش ها برای شناسایی و کشف حملات استفاده می کنند. در این روش ما تمامی الگوریتم های موجود را شبیه سازی نموده و در خاتمه بهترین الگوریتم را پیشنهاد می نماییم. نوآوری اصلی در این پایان نامه، استفاده از الگوریتم های مدل کاهل و مدل قانون محور در داده کاوی است که تاکنون برای سیستم-های تشخیص نفوذ استفاده نشده است. همچنین استفاده از تمام الگوریتم-های موجود در روش های دسته بندی است که در نرم افزار WEKA و Rapidminer موجود است[۶۷]. پیشنهاد ۵ نمونه داده که از داده اولیه استخراج شده و برای مدل های مختلف و الگوریتم ها بهترین جواب را می دهد از نوآوری این پایان نامه است. استخراج ۵ نمونه داده وقت بسیار زیادی به خود اختصاص داده وهمه الگوریتم های مختلف موجود در مدل های دسته بندی با مجموعه داده های مختلف شبیه سازی و اجرا شدند که در نهایت ۵ نمونه داده اولیه پیشنهاد نموده ایم.
فهرست مطالب
۴-۱ الگوریتمهای مدل بیزین و ارزیابی آنها ۸۳
۴-۲ مدل کاهل ۹۲
۴-۳ شبکه عصبی ۹۹
۴-۴ مدل قانون محور ۱۰۸
۴-۵ درخت تصمیم ۱۱۸
۴-۶ ماشین بردار پشتیبان ۱۳۰
فهرست منابع
فهرست جداول
جدول‏4 2: ماتریس Confusion الگوریتم Kernel naive Baysian 83
جدول‏4 1: معیارهای ارزیابی ونتایج الگوریتم Kernel naive Baysian 84
جدول‏4 4: ماتریس Confusion الگوریتم Naive Baysian 84
جدول‏4 3: معیارهای ارزیابی ونتایج الگوریتم Naive Baysian 84
جدول‏4 6: ماتریس Confusion الگوریتم Waode 85
جدول‏4 5: معیارهای ارزیابی ونتایج الگوریتم Waode 85
جدول‏4 8: ماتریس Confusion الگوریتم Aode 85
جدول‏4 7: معیارهای ارزیابی و نتایج الگوریتم Aode 86
جدول‏4 10: ماتریسConfusion الگوریتم Aodesr 86
جدول‏4 9: معیارهای ارزیابی ونتایج الگوریتم Aodesr 86
جدول‏4 12: ماتریسConfusion الگوریتم Bayesenet 87
جدول‏4 11: معیارهای ارزیابی ونتایج الگوریتم Bayesenet 87
جدول‏4 13: معیارهای ارزیابی ونتایج الگوریتم HNB 88
جدول‏4 14: ماتریسConfusion الگوریتم HNB 88
جدول‏4 16: ماتریس Confusion الگوریتم Dmnbtext 88
جدول‏4 15: معیارهای ارزیابی ونتایج الگوریتم Dmnbtext 89
جدول‏4 18: ماتریسConfusion الگوریتم BaysianLogic Regression 89
جدول‏4 17: معیارهای ارزیابی ونتایج الگوریتم BaysianLogic Regression 89
جدول‏4 20: ماتریسConfusion الگوریتم IB1 93
جدول‏4 19: معیارهای ارزیابی و نتایج الگوریتم IB1 93
جدول‏4 21: معیارهای ارزیابی ونتایج الگوریتم IBK 93
جدول‏4 22: ماتریس Confusion الگوریتم IBK 94
جدول‏4 24: ماتریس Confusion الگوریتم LWL 94
جدول‏4 23: معیارهای ارزیابی ونتایج الگوریتم LWL 94
جدول‏4 26: ماتریسConfusion الگوریتم KSTAR 95
جدول‏4 25: معیارهای ارزیابی ونتایج الگوریتم KSTAR 95
جدول‏4 27: معیارهای ارزیابی ونتایج الگوریتم KNN 95
جدول‏4 28: ماتریس Confusion الگوریتم KNN 96
جدول‏4 29: معیارهای ارزیابی ونتایج شبکه MLP 101
جدول‏4 30: ماتریس ConfusionشبکهMLP 101
جدول‏4 32: ماتریس Confusionشبکه Perceptrons 102
جدول‏4 31: معیارهای ارزیابی ونتایج شبکه Perceptrons 103
جدول‏4 34: ماتریسConfusion الگوریتم RBF 104
جدول‏4 33: معیارهای ارزیابی ونتایج الگوریتم RBF 104
جدول‏4 36:ماتریسConfusion الگوریتم Neural net 105
جدول‏4 35:معیارهای ارزیابی ونتایج الگوریتم Neural net 105
جدول‏4 38: ماتریس Confusion الگوریتم Conjuctive rule 108
جدول‏4 37: معیارهای ارزیابی ونتایج الگوریتم Conjuctive rule 108
جدول‏4 39: معیارهای ارزیابی ونتایج الگوریتم decision table 109
جدول‏4 40: ماتریسConfusion الگوریتم decision table 109
جدول‏4 41 :معیارهای ارزیابی ونتایج الگوریتم DTNB 110
جدول‏4 42: ماتریسConfusion الگوریتم DTNB 110
جدول‏4 44: ماتریس Confusion الگوریتم JRIP 110
جدول‏4 43: معیارهای ارزیابی ونتایج الگوریتم JRIP 111
جدول‏4 45: معیارهای ارزیابی ونتایج الگوریتم ONER 111
جدول‏4 46: ماتریس Confusion الگوریتم ONER 111
جدول‏4 47: معیارهای ارزیابی ونتایج الگوریتم PRSIM 112
جدول‏4 48: ماتریس Confusion الگوریتم PRSIM 112
جدول‏4 49: معیارهای ارزیابی ونتایج الگوریتم RIDOR 112
جدول‏4 50: ماتریسConfusion الگوریتم RIDOR 113
جدول‏4 51: معیارهای ارزیابی ونتایج الگوریتم RULE Induction 113
جدول‏4 52: ماتریسConfusion الگوریتم RULE Induction 113
جدول‏4 53: معیارهای ارزیابی ونتایج الگوریتم RULE Induction single attribute 114
جدول‏4 54: ماتریسConfusion الگوریتم RULE Induction single attribute 114
جدول‏4 55: معیارهای ارزیابی ونتایج الگوریتم TREE by rule 114
جدول‏4 56:ماتریس Confusion الگوریتم TREE by rule 115
جدول‏4 57: معیارهای ارزیابی ونتایج الگوریتم part 115
جدول‏7 58: ماتریسConfusion الگوریتم part 115
جدول‏4 59: معیارهای ارزیابی ونتایج الگوریتم CHAID 119
جدول‏4 60: ماتریسConfusion الگوریتم CHAID 119
جدول‏4 61: معیارهای ارزیابی ونتایج الگوریتم DECISION TREE 119
جدول‏4 62: ماتریس Confusion الگوریتم DECISION TREE 120
جدول‏4 63: معیارهای ارزیابی ونتایج الگوریتم J48 120
جدول‏4 64: ماتریسConfusion الگوریتم J48 120
جدول‏4 65: معیارهای ارزیابی ونتایج الگوریتم FT 121
جدول‏4 66: ماتریس Confusion الگوریتم FT 121
جدول‏4 68: ماتریس Confusion الگوریتم ID3 121
جدول‏4 67: معیارهای ارزیابی ونتایج الگوریتم ID3 122
جدول‏4 69: معیارهای ارزیابی ونتایج الگوریتم LAD 122
جدول‏4 70: ماتریس Confusion الگوریتم LAD 122
جدول‏4 71: معیارهای ارزیابی ونتایج الگوریتم ADT 123
جدول‏4 72: ماتریس Confusion الگوریتم ADT 123
جدول‏4 73: معیارهای ارزیابی ونتایج الگوریتم BF 123
جدول‏4 74: ماتریس Confusion الگوریتم BF 123
جدول‏4 75:معیارهای ارزیابی ونتایج الگوریتم LMT 124
جدول‏4 76:ماتریسConfusion الگوریتم LMT 124
جدول‏4 77: معیارهای ارزیابی ونتایج الگوریتم J48graft 124
جدول‏4 78: ماتریس Confusion الگوریتم J48graft 125
جدول‏4 79: معیارهای ارزیابی ونتایج الگوریتم NB 125
جدول‏4 80:ماتریس Confusion الگوریتم NB 125
جدول‏4 81:معیارهای ارزیابی ونتایج الگوریتم REEPTREE 126
جدول‏4 82: ماتریس Confusion الگوریتم REEPTREE 126
جدول‏4 83: معیارهای ارزیابی ونتایج الگوریتم Simplecart 126
جدول‏4 84:ماتریس Confusion الگوریتم Simplecart 127
جدول‏4 85:معیارهای ارزیابی ونتایج روش Libsvm 130
جدول‏4 86: ماتریسConfusion روش Libsvm 130
جدول‏4 87: معیارهای ارزیابی ونتایج روش Support vector machine 131
جدول‏4 88: ماتریس Confusion روش Support vector machine 131
جدول‏4 89: معیارهای ارزیابی ونتایج روش Support vector machine(linear) 132
جدول‏4 90: ماتریسConfusion روش Support vector machine(linear) 132
جدول‏4 91: معیارهای ارزیابی ونتایج روش Speggeous 132
جدول‏4 92: ماتریسConfusion روش Speggeous 133
جدول‏4 93: معیارهای ارزیابی ونتایج روش W-svm 133
جدول‏4 94: ماتریس Confusion روش W-svm 133
جدول‏4 95: معیارهای ارزیابی ونتایج روش Fast large 134
جدول‏4 96: ماتریس Confusion روش Fast large 134
فهرست اشکال و نمودارها
شکل‏4 1: نمودار ارزیابی الگوریتم های مدل بیزین برحسب پارامتر درستی ۹۰
شکل‏4 2: نمودار ارزیابی الگوریتم های مدل بیزین برحسب پارامتر دقت ۹۰
شکل‏4 3: نمودار ارزیابی الگوریتم های مدل بیزین بر حسب پارامتر یادآوری ۹۱
شکل‏4 4: نمودار ارزیابی الگوریتم های مدل بیزین برحسب پارامتر F 91
شکل‏4 5: نمودار ارزیابی الگوریتم های مدل بیزین برحسب پارامترهای مختلف ۹۲
شکل‏4 6: نمودار ارزیابی الگوریتم های مدل کاهل برحسب پارامتر درستی ۹۶
شکل‏4 7: نمودار ارزیابی الگوریتم های مدل کاهل برحسب پارامتر دقت ۹۷
شکل‏4 8: نمودار ارزیابی الگوریتم های مدل کاهل برحسب پارامتر یادآوری ۹۷
شکل‏4 9: نمودار م ارزیابی الگوریتم های مدل کاهل برحسب پارامتر F 98
شکل‏4 10: نمودار مربوط به ارزیابی الگوریتم های مدل کاهل برحسب پارامترهای مختلف ۹۸
شکل‏4 11: نمونه ای ازشبکهMLP 100
شکل‏4 12: عملکرد شبکه پرسپتون ۱۰۲
شکل‏4 13: نمونه ای ازشبکهRBF 103
شکل‏4 14:نمودار ارزیابی مدل های شبکه عصبی برحسب پارامتر درستی ۱۰۵
شکل‏4 15: نمودار ارزیابی مدل های شبکه عصبی برحسب پارامتر دقت ۱۰۶
شکل‏4 16: نمودار ارزیابی مدل های شبکه عصبی برحسب پارامتر یادآوری ۱۰۶
شکل‏4 17: نمودار ارزیابی مدل های شبکه عصبی برحسب پارامتر F 107
شکل‏4 18: نموداره ارزیابی مدل های شبکه عصبی برحسب پارامتر مختلف ۱۰۷
شکل‏4 19:نمودار ارزیابی الگوریتم های مدل قانون محور برحسب پارامتر درستی ۱۱۶
شکل‏4 20: نمودار ارزیابی الگوریتم های مدل قانون محور برحسب پارامتر دقت ۱۱۶
شکل‏4 21: نمودار ارزیابی الگوریتم های مدل قانون محور برحسب پارامتر یادآوری ۱۱۷
شکل‏4 22: نمودار ارزیابی الگوریتم های مدل قانون محور برحسب پارامتر F 117
شکل‏4 23: نمودار ارزیابی الگوریتم های مدل قانون محور برحسب پارامتر مختلف ۱۱۸
شکل‏4 24:نمودار ارزیابی الگوریتم های مدل درخت برحسب پارامتر درستی ۱۲۷
شکل‏4 25: نمودار ارزیابی الگوریتم های مدل درخت برحسب پارامتر دقت ۱۲۸
شکل‏4 26: نمودار ارزیابی الگوریتم های مدل درخت برحسب پارامتر یادآوری ۱۲۸
شکل‏4 27: نمودار ارزیابی الگوریتم های مدل درخت برحسب پارامتر F 129
شکل‏4 28: نمودار ارزیابی الگوریتم های مدل درخت برحسب پارامتر مختلف ۱۲۹
شکل‏4 29: نمودار ارزیابی روش های مختلف ماشین بردارپشتیبان برحسب پارامتر درستی ۱۳۵
شکل‏4 30: نمودار ارزیابی روش های مختلف ماشین بردارپشتیبان برحسب پارامتر یادآوری ۱۳۵
شکل‏4 31: نمودار ارزیابی روش های مختلف ماشین بردارپشتیبان برحسب پارامتر F 136
شکل‏4 32: نمودار ارزیابی روش های مختلف ماشین بردارپشتیبان برحسب پارامتر دقت ۱۳۶
شکل‏4 33: نمودار ارزیابی روش های مختلف ماشین بردارپشتیبان برحسب پارامتر مختلف ۱۳۷
شکل ۴-۳۴: نمودار مربوط به مقایسه بین همه الگوریتم ها بر حسب پارامترهای مختلف ۱۳۷
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

پروپوزال پیدا کردن بهترین مدل برای پیش بینی تقاضای دارو با دیتا ماینینگ

هدف از این پروپوزال پیدا کردن بهترین مدل برای پیش بینی تقاضای دارو با دیتا ماینینگ می باشد

دسته بندی رشته فناوری اطلاعات (IT)
فرمت فایل doc
حجم فایل ۱۹۶ کیلو بایت
تعداد صفحات ۳۰
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

دانلود پروپوزال پایان ‌نامه كارشناسی ارشد مهندسی فناوری اطلاعات
پیدا کردن بهترین مدل برای پیش بینی تقاضای دارو با دیتا ماینینگ

چکیده
توسعه ی استفاده از فناوری اطلاعات در بهداشت و درمان علاوه بر مزایای فراوان باعث می شود تا حجم زیادی از داده های مرتبط، در دسترس قرار بگیرند. با بکارگیری داده کاوی بر روی داده های موجود می توان تصمیم گیری ها و فرایند های مدیریتی را بهبود بخشید. در این پایان نامه تلاش شده است ضمن بررسی الگوریتم های مختلف داده کاوی مدلی جهت پیش بینی مصرف دارو در داروخانه های بیمارستان ها ارائه گردد. مجموعه داده در نظر گرفته شده مربوط به سیستم اطلاعات بیمارستان پاستور شهرستان بم می باشد که در مدت ۵ سال در پایگاه داده سیستم اطلاعات این بیمارستان ذخیره شده است. برای پیش بینی مصرف دارو عملکرد مدل های MLP، SVR، ADABOOST.R، BAGTREE، LR، LSSVR مورد بررسی قرار می گیرد. دقت پیش بینی بر اساس معیارها MSE RMSE MAE وR2 ارزیابی می گردد. طبق نتایج بدست آمده عملکرد مدل BAGTREE در روش های مختلف بهتر از سایر مدل ها بوده است.
واژگان کلیدی :
پیش بینی
خرید دارو
داروخانه
سیستم های اطلاعات بیمارستان
مقدمه
در سال های اخیر مراکز بهداشتی ودرمانی کشورمان به ویژه بیمارستانها درصدد مکانیزه کردن سیستم های اطلاعاتی خود برآمده-اند. در ابتدا مقصود از چنین فعالیت هایی کاهش هزینه های ناشی ازکاغذ بازی موجود در سیستم های دستی و اداری بوده است، اما اکنون به مرحله ای رسیده ایم که بهبود کیفیت ارائه خدمات درمانی اهمیتی روزافزون می یابد و در این راستا بکار گیری سیستم های اطلاعات بیمارستان ها بسیار مرسوم شده است.
بکارگیری سیستم اطلاعات بیمارستان علاوه بر مزایای فراوان از جمله کاهش زمان پذیرش، زمان ترخیص، زمان اخذ جواب ها، زمان مراجعه به اطلاعات قبلی پرونده، بالا بردن میزان دقت در درج اطلاعات و درخواست ها كه در حالت دستی می تواند ناخوانا باشد، همچنین می تواند موجب تسریع ارتباطات بین بخشی و در نهایت بالابردن میزان رضایت بیمار، ارائه خدمات بهتر، دریافت آمار و گزارشات روزانه و زمانی گردد. در نهایت بکارگیری سیستم های اطلاعات بیمارستان، حجم زیادی از داده های مرتبط با درمان را در دسترس قرار می دهد [۱]. با استفاده از تکنیک های داده کاوی می توان از داده های موجود در این سیستم ها در جهت پشتیبانی از تصمیم و مدیریت و در نهایت پیشبرد اهداف اقتصادی و درمانی سود جست .[۲] داده‌کاوی یکی از ده دانش در حال توسعه است و در سال‌های اخیر در دنیا گسترش فوق‌العاده سریعی داشته است. داده‌کاوی فرآیند کشف الگوها و روابط موجود بین داده ها در پایگاه داده های بزرگ است که با برخورداری از دامنه وسیع زیر زمینه‌های تخصصی با توصیف، تشریح، پیش‌بینی و کنترل پدیده‌های گوناگون پیرامون، امروزه کاربرد بسیار وسیع در حوزه‌های مختلفی ازجمله پزشکی و تجارت دارد [۳].
افزایش هزینه‌های بیمارستانی در سال‌های اخیر و نیز اجرای طرح خودگردانی و اداره‌ی بیمارستان‌ها به وسیله‌ی درآمد اختصاصی آنها، بیمارستان‌ها را با مشکلات مالی جدی رو به رو ساخته است. داروخانه یکی از بخش های مهم و درآمدزا در بیمارستان ها می باشد که می توان با بهبود خرید دارو و افزایش بهره وری آن، بنحوی به وضعیت اقتصادی بیمارستان ها کمک کرد. این حقیقت که مصرف دارو بر اساس شیوع بیمارها در فصول مختلف تغییر می کند و نیز در نظر گرفتن این نکته که برخی داروها برای درمان یک بیماری مکمل یکدیگرند، از جمله فاکتورهایی هستند که باید در خرید دارو درنظر گرفته شوند [۴]. به عبارتی با توجه به بیماری های بسیار متنوع، و تجویز داروهای مختلف برای آنها، میتوان بر اساس سابقه مصرف دارو، نیاز های دارویی در آینده را پیش بینی کرد در نتیجه، در صورت بکارگیری تکنیک های داده کاوی بر روی اطلاعات موجود در سیستم اطلاعات بیماستان می توان خرید دارو را بر اساس پیش بینی صورت گرفته توسط داده کاوی بهینه کرد.
لذا بر آن شدیم تا با انجام این مطالعه به پیش بینی مصرف دارو، با استفاده از تکنیکهای داده کاوی، در داروخانه یک بیمارستان بزرگ به منظور افزایش بهره وری مالی آن بپردازیم.
فهرست مطالب
فصل ۱- کلیات۲
۱-۱- فناوری اطلاعات در بهداشت و درمان ۲
۱-۲- داروخانه های بیمارستانی ۳
۱-۳- داده کاوی ۳
۱-۳-۱- داده کاوی چیست؟ ۳
۱-۳-۲- تكنیك های مختلف داده كاوی ۴
۱-۳-۲-۱-انواع تکنیک داده کاوی ۵
۱-۴- بیان مسئله ۶
۱-۵- اهداف تحقیق ۸
۱-۶- سوالات وفرضیات تحقیق ۹
۱-۶-۱- سوالات ۹
۱-۶-۲- فرضیات تحقیق ۹
۱-۷- فصول پایان نامه ۹
منابع
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

مبانی نظری پیدا کردن بهترین مدل برای پیش بینی تقاضای دارو با دیتا ماینینگ

هدف از این مبانی نظری پیدا کردن بهترین مدل برای پیش بینی تقاضای دارو با دیتا ماینینگ می باشد

دسته بندی رشته فناوری اطلاعات (IT)
فرمت فایل doc
حجم فایل ۹۰۳ کیلو بایت
تعداد صفحات ۷۳
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

دانلودمبانی نظریپایان ‌نامه كارشناسی ارشدمهندسی فناوری اطلاعات
پیدا کردن بهترین مدل برای پیش بینی تقاضای دارو با دیتا ماینینگ

چکیده
توسعه ی استفاده از فناوری اطلاعات در بهداشت و درمان علاوه بر مزایای فراوان باعث می شود تا حجم زیادی از داده های مرتبط، در دسترس قرار بگیرند. با بکارگیری داده کاوی بر روی داده های موجود می توان تصمیم گیری ها و فرایند های مدیریتی را بهبود بخشید. در این پایان نامه تلاش شده است ضمن بررسی الگوریتم های مختلف داده کاوی مدلی جهت پیش بینی مصرف دارو در داروخانه های بیمارستان ها ارائه گردد. مجموعه داده در نظر گرفته شده مربوط به سیستم اطلاعات بیمارستان پاستور شهرستان بم می باشد که در مدت ۵ سال در پایگاه داده سیستم اطلاعات این بیمارستان ذخیره شده است. برای پیش بینی مصرف دارو عملکرد مدل های MLP، SVR، ADABOOST.R، BAGTREE، LR، LSSVR مورد بررسی قرار می گیرد. دقت پیش بینی بر اساس معیارها MSE RMSE MAE وR2 ارزیابی می گردد. طبق نتایج بدست آمده عملکرد مدل BAGTREE در روش های مختلف بهتر از سایر مدل ها بوده است.
واژگان کلیدی :
پیش بینی
خرید دارو
داروخانه
سیستم های اطلاعات بیمارستان
مقدمه
در سال های اخیر مراکز بهداشتی ودرمانی کشورمان به ویژه بیمارستانها درصدد مکانیزه کردن سیستم های اطلاعاتی خود برآمده-اند. در ابتدا مقصود از چنین فعالیت هایی کاهش هزینه های ناشی ازکاغذ بازی موجود در سیستم های دستی و اداری بوده است، اما اکنون به مرحله ای رسیده ایم که بهبود کیفیت ارائه خدمات درمانی اهمیتی روزافزون می یابد و در این راستا بکار گیری سیستم های اطلاعات بیمارستان ها بسیار مرسوم شده است.
بکارگیری سیستم اطلاعات بیمارستان علاوه بر مزایای فراوان از جمله کاهش زمان پذیرش، زمان ترخیص، زمان اخذ جواب ها، زمان مراجعه به اطلاعات قبلی پرونده، بالا بردن میزان دقت در درج اطلاعات و درخواست ها كه در حالت دستی می تواند ناخوانا باشد، همچنین می تواند موجب تسریع ارتباطات بین بخشی و در نهایت بالابردن میزان رضایت بیمار، ارائه خدمات بهتر، دریافت آمار و گزارشات روزانه و زمانی گردد. در نهایت بکارگیری سیستم های اطلاعات بیمارستان، حجم زیادی از داده های مرتبط با درمان را در دسترس قرار می دهد [۱]. با استفاده از تکنیک های داده کاوی می توان از داده های موجود در این سیستم ها در جهت پشتیبانی از تصمیم و مدیریت و در نهایت پیشبرد اهداف اقتصادی و درمانی سود جست .[۲] داده‌کاوی یکی از ده دانش در حال توسعه است و در سال‌های اخیر در دنیا گسترش فوق‌العاده سریعی داشته است. داده‌کاوی فرآیند کشف الگوها و روابط موجود بین داده ها در پایگاه داده های بزرگ است که با برخورداری از دامنه وسیع زیر زمینه‌های تخصصی با توصیف، تشریح، پیش‌بینی و کنترل پدیده‌های گوناگون پیرامون، امروزه کاربرد بسیار وسیع در حوزه‌های مختلفی ازجمله پزشکی و تجارت دارد [۳].
افزایش هزینه‌های بیمارستانی در سال‌های اخیر و نیز اجرای طرح خودگردانی و اداره‌ی بیمارستان‌ها به وسیله‌ی درآمد اختصاصی آنها، بیمارستان‌ها را با مشکلات مالی جدی رو به رو ساخته است. داروخانه یکی از بخش های مهم و درآمدزا در بیمارستان ها می باشد که می توان با بهبود خرید دارو و افزایش بهره وری آن، بنحوی به وضعیت اقتصادی بیمارستان ها کمک کرد. این حقیقت که مصرف دارو بر اساس شیوع بیمارها در فصول مختلف تغییر می کند و نیز در نظر گرفتن این نکته که برخی داروها برای درمان یک بیماری مکمل یکدیگرند، از جمله فاکتورهایی هستند که باید در خرید دارو درنظر گرفته شوند [۴]. به عبارتی با توجه به بیماری های بسیار متنوع، و تجویز داروهای مختلف برای آنها، میتوان بر اساس سابقه مصرف دارو، نیاز های دارویی در آینده را پیش بینی کرد در نتیجه، در صورت بکارگیری تکنیک های داده کاوی بر روی اطلاعات موجود در سیستم اطلاعات بیماستان می توان خرید دارو را بر اساس پیش بینی صورت گرفته توسط داده کاوی بهینه کرد.
لذا بر آن شدیم تا با انجام این مطالعه بهپیش بینی مصرف دارو، با استفاده از تکنیکهای داده کاوی، در داروخانه یک بیمارستان بزرگ به منظور افزایش بهره وری مالی آن بپردازیم.
فهرست مطالب
فصل ۲- پیشینه پژوهشی ۱۲
۲-۱- جمع بندی ۲۴
فصل ۳- مروری بر ادبیات تحقیق و مبانی نظری ۲۶
۳-۱- سیستم های اطلاعات بیمارستان ۲۶
۳-۲- تعریف و مفهوم سیستم اطلاعات بیمارستانی ۲۸
۳-۲-۱– اهداف سیستم اطلاعات بیمارستانی ۲۹
۳-۲-۲- اهمیت و ضرورت راه‌اندازی سیستم اطلاعات بیمارستانی ۳۰
۳-۲-۳- مزایایی سیستم اطلاعات بیمارستانی ۳۱
۳-۳- داده کاوی ۳۲
۳-۴- مراحل داده کاوی ۳۳
۳-۴-۱- پیش پردازش داده ها ۳۵
۳-۴-۲- پاکسازی داده ها ۳۵
۳-۴-۳-یکپارچه سازی داده ها ۳۶
۳-۴-۴- تبدیل دادهها ۳۶
۳-۴-۵- تلخیص داده ها ۳۷
۳-۵- وظایف داده کاوی ۳۷
۳-۵-۱- دسته بندی ۳۸
۳-۵-۲- تخمین ۳۹
۳-۵-۳- پیش بینی ۳۹
۳-۵-۴- گروه بندی شباهت یا قوانین وابستگی ۴۰
۳-۵-۵- خوشه بندی ۴۰
۳-۵-۶- نمایه سازی ۴۱
۳-۶- كاربرد های داده كاوی ۴۱
۳-۷- رویکردهای مسائل داده کاوی در پزشکی ۴۲
۳-۸- مدلها و الگوریتمهای داده کاوی ۴۳
۳-۸-۱- شبکه های عصبی مصنوعی ۴۳
۳-۸-۱-۱-ساختار شبکه عصبی ۴۴
۳-۸-۱-۲-معماری شبکه عصبی ۴۵
۳-۸-۱-۳-آموزش شبکه های عصبی مصنوعی ۴۶
۳-۸-۱-۴-انواع یادگیری در شبکه های عصبی مصنوعی ۴۷
۳-۸-۲- درخت های انتخاب ۴۷
۳-۸-۳- Bagging & Boosting 48
۳-۸-۳-۱-Bagging 55
۳-۸-۱-۱-Boosting 44
۳-۸-۱-۱-الگوریتم های Boosting 44
۳-۸-۴- Adaptive Boosting(Adaboost) 50
۳-۸-۵- رگرسیون بردار پشتیبان ۵۱
۳-۸-۶- رگرسیون خطی ۵۲
۳-۹ نرم افزارهای داده کاوی ۵۴
۳-۱۰- فرایند خرید دارو ۵۵
۳-۱۱- جمع بندی ۵۶
منابع
فهرست جداول
جدول ۲- ۱تکنیک های مهم داده کاوی در بخش دارویی[۲۱] ۲۱
فهرست شکل ها و نمودارها
شکل ۲- ۱ مدل پیش بینی با شبکه عصبی[۴] ۱۲
شکل ۲- ۲ شبکه عصبی [۱۴] BP 12
شکل ۲- ۳ مدل بهینه سازی خرید دارو[۱۵] ۱۴
شکل ۲- ۴ مدل استخراج دانش [۲۶] ۱۶
شکل ۲- ۵ جریان عملیات در داروخانه[۱۷] ۱۷
شکل ۲- ۶ دسته بندی اهدا بکارگیری داده کاوی[۱۵] ۱۹
شکل ۲- ۷ روند بکارگیری داده کاوی در پزشکی[۲۰] ۲۰
شکل۳- ۱ مراحل داده کاوی[۴۰] ۳۲
شکل۳- ۲ ساختار شبکه عصبی[۴۷] ۴۳
شکل۳- ۳ مثالی از درخت تصمیم[۴۱] ۵۵
شکل ۳- ۴ واسط کاربری سیستم اطلاعات بیمارستان ۵۵
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

پیدا کردن بهترین مدل برای پیش بینی تقاضای دارو با دیتا ماینینگ

هدف از این پایان ‌نامه پیدا کردن بهترین مدل برای پیش بینی تقاضای دارو با دیتا ماینینگ می باشد

دسته بندی رشته فناوری اطلاعات (IT)
فرمت فایل doc
حجم فایل ۱٫۶۷۷ مگا بایت
تعداد صفحات ۱۲۶
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

دانلودپایان ‌نامه كارشناسی ارشدمهندسی فناوری اطلاعات
پیدا کردن بهترین مدل برای پیش بینی تقاضای دارو با دیتا ماینینگ

چکیده
توسعه ی استفاده از فناوری اطلاعات در بهداشت و درمان علاوه بر مزایای فراوان باعث می شود تا حجم زیادی از داده های مرتبط، در دسترس قرار بگیرند. با بکارگیری داده کاوی بر روی داده های موجود می توان تصمیم گیری ها و فرایند های مدیریتی را بهبود بخشید. در این پایان نامه تلاش شده است ضمن بررسی الگوریتم های مختلف داده کاوی مدلی جهت پیش بینی مصرف دارو در داروخانه های بیمارستان ها ارائه گردد. مجموعه داده در نظر گرفته شده مربوط به سیستم اطلاعات بیمارستان پاستور شهرستان بم می باشد که در مدت ۵ سال در پایگاه داده سیستم اطلاعات این بیمارستان ذخیره شده است. برای پیش بینی مصرف دارو عملکرد مدل های MLP، SVR، ADABOOST.R، BAGTREE، LR، LSSVR مورد بررسی قرار می گیرد. دقت پیش بینی بر اساس معیارها MSE RMSE MAE وR2 ارزیابی می گردد. طبق نتایج بدست آمده عملکرد مدل BAGTREE در روش های مختلف بهتر از سایر مدل ها بوده است.
واژگان کلیدی :
پیش بینی
خرید دارو
داروخانه
سیستم های اطلاعات بیمارستان
مقدمه
در سال های اخیر مراکز بهداشتی ودرمانی کشورمان به ویژه بیمارستانها درصدد مکانیزه کردن سیستم های اطلاعاتی خود برآمده-اند. در ابتدا مقصود از چنین فعالیت هایی کاهش هزینه های ناشی ازکاغذ بازی موجود در سیستم های دستی و اداری بوده است، اما اکنون به مرحله ای رسیده ایم که بهبود کیفیت ارائه خدمات درمانی اهمیتی روزافزون می یابد و در این راستا بکار گیری سیستم های اطلاعات بیمارستان ها بسیار مرسوم شده است.
بکارگیری سیستم اطلاعات بیمارستان علاوه بر مزایای فراوان از جمله کاهش زمان پذیرش، زمان ترخیص، زمان اخذ جواب ها، زمان مراجعه به اطلاعات قبلی پرونده، بالا بردن میزان دقت در درج اطلاعات و درخواست ها كه در حالت دستی می تواند ناخوانا باشد، همچنین می تواند موجب تسریع ارتباطات بین بخشی و در نهایت بالابردن میزان رضایت بیمار، ارائه خدمات بهتر، دریافت آمار و گزارشات روزانه و زمانی گردد. در نهایت بکارگیری سیستم های اطلاعات بیمارستان، حجم زیادی از داده های مرتبط با درمان را در دسترس قرار می دهد [۱]. با استفاده از تکنیک های داده کاوی می توان از داده های موجود در این سیستم ها در جهت پشتیبانی از تصمیم و مدیریت و در نهایت پیشبرد اهداف اقتصادی و درمانی سود جست .[۲] داده‌کاوی یکی از ده دانش در حال توسعه است و در سال‌های اخیر در دنیا گسترش فوق‌العاده سریعی داشته است. داده‌کاوی فرآیند کشف الگوها و روابط موجود بین داده ها در پایگاه داده های بزرگ است که با برخورداری از دامنه وسیع زیر زمینه‌های تخصصی با توصیف، تشریح، پیش‌بینی و کنترل پدیده‌های گوناگون پیرامون، امروزه کاربرد بسیار وسیع در حوزه‌های مختلفی ازجمله پزشکی و تجارت دارد [۳].
افزایش هزینه‌های بیمارستانی در سال‌های اخیر و نیز اجرای طرح خودگردانی و اداره‌ی بیمارستان‌ها به وسیله‌ی درآمد اختصاصی آنها، بیمارستان‌ها را با مشکلات مالی جدی رو به رو ساخته است. داروخانه یکی از بخش های مهم و درآمدزا در بیمارستان ها می باشد که می توان با بهبود خرید دارو و افزایش بهره وری آن، بنحوی به وضعیت اقتصادی بیمارستان ها کمک کرد. این حقیقت که مصرف دارو بر اساس شیوع بیمارها در فصول مختلف تغییر می کند و نیز در نظر گرفتن این نکته که برخی داروها برای درمان یک بیماری مکمل یکدیگرند، از جمله فاکتورهایی هستند که باید در خرید دارو درنظر گرفته شوند [۴]. به عبارتی با توجه به بیماری های بسیار متنوع، و تجویز داروهای مختلف برای آنها، میتوان بر اساس سابقه مصرف دارو، نیاز های دارویی در آینده را پیش بینی کرد در نتیجه، در صورت بکارگیری تکنیک های داده کاوی بر روی اطلاعات موجود در سیستم اطلاعات بیماستان می توان خرید دارو را بر اساس پیش بینی صورت گرفته توسط داده کاوی بهینه کرد.
لذا بر آن شدیم تا با انجام این مطالعه بهپیش بینی مصرف دارو، با استفاده از تکنیکهای داده کاوی، در داروخانه یک بیمارستان بزرگ به منظور افزایش بهره وری مالی آن بپردازیم.
فهرست مطالب
فصل ۱- کلیات۲
۱-۱- فناوری اطلاعات در بهداشت و درمان ۲
۱-۲- داروخانه های بیمارستانی ۳
۱-۳- داده کاوی ۳
۱-۳-۱- داده کاوی چیست؟ ۳
۱-۳-۲- تكنیك های مختلف داده كاوی ۴
۱-۳-۲-۱-انواع تکنیک داده کاوی ۵
۱-۴- بیان مسئله ۶
۱-۵- اهداف تحقیق ۸
۱-۶- سوالات وفرضیات تحقیق ۹
۱-۶-۱- سوالات ۹
۱-۶-۲- فرضیات تحقیق ۹
۱-۷- فصول پایان نامه ۹
فصل ۲- پیشینه پژوهشی ۱۲
۲-۱- جمع بندی ۲۴
فصل ۳- مروری بر ادبیات تحقیق و مبانی نظری ۲۶
۳-۱- سیستم های اطلاعات بیمارستان ۲۶
۳-۲- تعریف و مفهوم سیستم اطلاعات بیمارستانی ۲۸
۳-۲-۱– اهداف سیستم اطلاعات بیمارستانی ۲۹
۳-۲-۲- اهمیت و ضرورت راه‌اندازی سیستم اطلاعات بیمارستانی ۳۰
۳-۲-۳- مزایایی سیستم اطلاعات بیمارستانی ۳۱
۳-۳- داده کاوی ۳۲
۳-۴- مراحل داده کاوی ۳۳
۳-۴-۱- پیش پردازش داده ها ۳۵
۳-۴-۲- پاکسازی داده ها ۳۵
۳-۴-۳-یکپارچه سازی داده ها ۳۶
۳-۴-۴- تبدیل دادهها ۳۶
۳-۴-۵- تلخیص داده ها ۳۷
۳-۵- وظایف داده کاوی ۳۷
۳-۵-۱- دسته بندی ۳۸
۳-۵-۲- تخمین ۳۹
۳-۵-۳- پیش بینی ۳۹
۳-۵-۴- گروه بندی شباهت یا قوانین وابستگی ۴۰
۳-۵-۵- خوشه بندی ۴۰
۳-۵-۶- نمایه سازی ۴۱
۳-۶- كاربرد های داده كاوی ۴۱
۳-۷- رویکردهای مسائل داده کاوی در پزشکی ۴۲
۳-۸- مدلها و الگوریتمهای داده کاوی ۴۳
۳-۸-۱- شبکه های عصبی مصنوعی ۴۳
۳-۸-۱-۱-ساختار شبکه عصبی ۴۴
۳-۸-۱-۲-معماری شبکه عصبی ۴۵
۳-۸-۱-۳-آموزش شبکه های عصبی مصنوعی ۴۶
۳-۸-۱-۴-انواع یادگیری در شبکه های عصبی مصنوعی ۴۷
۳-۸-۲- درخت های انتخاب ۴۷
۳-۸-۳- Bagging & Boosting 48
۳-۸-۳-۱-Bagging 55
۳-۸-۱-۱-Boosting 44
۳-۸-۱-۱-الگوریتم های Boosting 44
۳-۸-۴- Adaptive Boosting(Adaboost) 50
۳-۸-۵- رگرسیون بردار پشتیبان ۵۱
۳-۸-۶- رگرسیون خطی ۵۲
۳-۹ نرم افزارهای داده کاوی ۵۴
۳-۱۰- فرایند خرید دارو ۵۵
۳-۱۱- جمع بندی ۵۶
فصل ۴- روش انجام پژوهش ۵۸
۴-۱- مقدمه ۵۸
۴-۲- الگوریتم پیشنهادی ۵۹
۴-۳- پیش پردازش دادهها ۶۰
۴-۳-۱- ساخت ماتریس داده ۶۰
۴-۳-۱-۱-روش ماههای متوالی ۶۷
۴-۳-۱-۲-روش ماههای یکسان ۴۴
۴-۳-۱-۳-روش فصول متولی ۶۹
۴-۴- الگوریتمهای Prediction 63
۴-۴-۱- روش NN 64
۴-۴-۲-روش SVR 64
۴-۴-۳- روش LSSVR 67
۴-۴-۴- AdaBoost.R 69
۴-۵- مجموعه داده ۷۰
۴-۵-۱- پاکسازی داده ۷۲
۴-۶- معیارهای ارزیابی ۷۲
۴-۷- جمع بندی ۷۴
فصل ۵- بحث و نتیجه گیری ۷۶
۵-۱- مقایسه روشهای مورد بررسی ۷۶
۵-۱-۱- ارزیابی الگوریتم با روش ماههای متوالی ۷۷
۵-۱-۲- ارزیابی الگوریتم با روش ماههای یکسان ۸۳
۵-۲- جمع بندی ۹۳
فصل ۶- پیشنهادهاو فرصت‌های پژوهشی آینده ۹۵
فهرست جداول
جدول ۲- ۱تکنیک های مهم داده کاوی در بخش دارویی[۲۱] ۲۱
جدول ۴- ۱ ماتریس داده بصورت ماههای متوالی ۶۰
جدول ۴- ۲ ماتریس داده بصورت ماههای یکسان ۶۱
جدول ۴- ۳ ماتریس داده بصورت فصول متوالی ۲
جدول ۵- ۱ نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 77
جدول ۵- ۲ نتایج اعمال الگوریتم های معرفی شده بر روی داده های Vialdioxin 81
جدول ۵- ۳ نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol 82
جدول ۵- ۴ نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 82
جدول ۵- ۵ نتایج اعمال الگوریتم های معرفی شده بر روی داده های Vialdioxin 85
جدول ۵- ۶ نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol 86
جدول ۵- ۷نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 91
جدول ۵ – ۸ نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol 93
فهرست شکل ها و نمودارها
شکل ۲- ۱ مدل پیش بینی با شبکه عصبی[۴] ۱۲
شکل ۲- ۲ شبکه عصبی [۱۴] BP 12
شکل ۲- ۳ مدل بهینه سازی خرید دارو[۱۵] ۱۴
شکل ۲- ۴ مدل استخراج دانش [۲۶] ۱۶
شکل ۲- ۵ جریان عملیات در داروخانه[۱۷] ۱۷
شکل ۲- ۶ دسته بندی اهدا بکارگیری داده کاوی[۱۵] ۱۹
شکل ۲- ۷ روند بکارگیری داده کاوی در پزشکی[۲۰] ۲۰
شکل۳- ۱ مراحل داده کاوی[۴۰] ۳۲
شکل۳- ۲ ساختار شبکه عصبی[۴۷] ۴۳
شکل۳- ۳ مثالی از درخت تصمیم[۴۱] ۵۵
شکل ۳- ۴ واسط کاربری سیستم اطلاعات بیمارستان ۵۵
شکل ۴- ۱ دیاگرام چاچوب تحقیق ۵۸
شکل۴- ۲ پارامترهای مورد استفاده در SVM 64
شکل۴- ۳ گزارش تهیه شده با کریستال ریپورت ۷۰
شکل۴- ۴ خروجی گزارش تهیه شده با کریستال ریپورت ۷۱
شکل۵- ۱ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R 78
شکل۵- ۲ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR 78
شکل۵- ۳ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE 79
شکل۵- ۴ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR 80
شکل۵- ۵ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR 80
شکل۵- ۶ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE 83
شکل۵- ۷ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR 83
شکل۵- ۸ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR 84
شکل ۵- ۹ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R 84
شکل۵- ۱۰ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR 85
شکل ۵- ۱۱ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R 86
شکل۵- ۱۲ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR 87
شکل۵- ۱۳ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR 87
شکل۵- ۱۴ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR 88
شکل۵- ۱۵ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R 89
شکل۵- ۱۶ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم NN 90
شکل۵- ۱۷ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR 90
شکل۵- ۱۸ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR 92
شکل۵- ۱۹ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE 93
شکل۵- ۲۰ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR 94
شکل۵- ۲۱ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE 94
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

ارائه مدلی برای پیش بینی مصرف دارو با استفاده از الگوریتم های پیش بینی

هدف از این سمینار ارائه مدلی برای پیش بینی مصرف دارو با استفاده از الگوریتم های پیش بینی می باشد

دسته بندی رشته فناوری اطلاعات (IT)
فرمت فایل doc
حجم فایل ۹۲۵ کیلو بایت
تعداد صفحات ۵۷
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

دانلودسمینارپایان ‌نامه كارشناسی ارشدمهندسی فناوری اطلاعات
ارائه مدلی برای پیش بینی مصرف دارو با استفاده از الگوریتم های پیش بینی

چکیده
توسعه ی استفاده از فناوری اطلاعات در بهداشت و درمان علاوه بر مزایای فراوان باعث می شود تا حجم زیادی از داده های مرتبط، در دسترس قرار بگیرند. با بکارگیری داده کاوی بر روی داده های موجود می توان تصمیم گیری ها و فرایند های مدیریتی را بهبود بخشید. در این پایان نامه تلاش شده است ضمن بررسی الگوریتم های مختلف داده کاوی مدلی جهت پیش بینی مصرف دارو در داروخانه های بیمارستان ها ارائه گردد. مجموعه داده در نظر گرفته شده مربوط به سیستم اطلاعات بیمارستان پاستور شهرستان بم می باشد که در مدت ۵ سال در پایگاه داده سیستم اطلاعات این بیمارستان ذخیره شده است. برای پیش بینی مصرف دارو عملکرد مدل های MLP، SVR، ADABOOST.R، BAGTREE، LR، LSSVR مورد بررسی قرار می گیرد. دقت پیش بینی بر اساس معیارها MSE RMSE MAE وR2 ارزیابی می گردد. طبق نتایج بدست آمده عملکرد مدل BAGTREE در روش های مختلف بهتر از سایر مدل ها بوده است.

در این تحقیق ابتدا چارچوب کلی سمینار و مراحل پیاده سازی را شرح داده، سپس توضیح مختصری راجع به مجموعه داده­های ایجاد شده داده می­شود و در نهایت، به شرح الگوریتم­هایی که برای ارزیابی مورد مقایسه قرار گرفته اند خواهیم پرداخت.

۱-۱- مقدمه

در این مطالعه، هدف، ارائه مدلی برای پیش بینی مصرف دارو با استفاده از الگوریتم های پیش بینی می باشند. از دیگر اهداف تحقیق بکارگیری مدل ارائه شده بر روی داده های یک بیمارستان و ارزیابی نتایج حاصل از آن می باشد. مدل ارائه شده در این سمینار می تواند در سایر بیمارستان های کشور نیز مورد استفاده قرار بگیرد.

واژگان کلیدی :
پیش بینی
خرید دارو
داروخانه
سیستم های اطلاعات بیمارستان
فهرست مطالب
۴-۱- مقدمه
۴-۲- الگوریتم پیشنهادی
۴-۳- پیش پردازش دادهها
۴-۳-۱- ساخت ماتریس داده
۴-۳-۱-۱-روش ماههای متوالی
۴-۳-۱-۲-روش ماههای یکسان
۴-۳-۱-۳-روش فصول متولی
۴-۴- الگوریتمهای Prediction
۴-۴-۱- روش NN
۴-۴-۲-روش SVR
۴-۴-۳- روش LSSVR
۴-۴-۴- AdaBoost.R
۴-۵- مجموعه داده
۴-۵-۱- پاکسازی داده
۴-۶- معیارهای ارزیابی
۴-۷- جمع بندی
فصل بحث و نتیجه گیری
۵-۱- مقایسه روشهای مورد بررسی
۵-۱-۱- ارزیابی الگوریتم با روش ماههای متوالی
۵-۱-۲- ارزیابی الگوریتم با روش ماههای یکسان
۵-۲- جمع بندی
منابع
فهرست جداول
جدول ۴- ۱ ماتریس داده بصورت ماههای متوالی ۶۰
جدول ۴- ۲ ماتریس داده بصورت ماههای یکسان ۶۱
جدول ۴- ۳ ماتریس داده بصورت فصول متوالی ۲
جدول ۵- ۱ نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 77
جدول ۵- ۲ نتایج اعمال الگوریتم های معرفی شده بر روی داده های Vialdioxin 81
جدول ۵- ۳ نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol 82
جدول ۵- ۴ نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 82
جدول ۵- ۵ نتایج اعمال الگوریتم های معرفی شده بر روی داده های Vialdioxin 85
جدول ۵- ۶ نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol 86
جدول ۵- ۷نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 91
جدول ۵ – ۸ نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol 93
فهرست شکل ها و نمودارها
شکل ۴- ۱ دیاگرام چاچوب تحقیق ۵۸
شکل۴- ۲ پارامترهای مورد استفاده در SVM 64
شکل۴- ۳ گزارش تهیه شده با کریستال ریپورت ۷۰
شکل۴- ۴ خروجی گزارش تهیه شده با کریستال ریپورت ۷۱
شکل۵- ۱ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R 78
شکل۵- ۲ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR 78
شکل۵- ۳ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE 79
شکل۵- ۴ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR 80
شکل۵- ۵ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR 80
شکل۵- ۶ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE 83
شکل۵- ۷ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR 83
شکل۵- ۸ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR 84
شکل ۵- ۹ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R 84
شکل۵- ۱۰ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR 85
شکل ۵- ۱۱ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R 86
شکل۵- ۱۲ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR 87
شکل۵- ۱۳ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR 87
شکل۵- ۱۴ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR 88
شکل۵- ۱۵ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R 89
شکل۵- ۱۶ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم NN 90
شکل۵- ۱۷ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR 90
شکل۵- ۱۸ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR 92
شکل۵- ۱۹ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE 93
شکل۵- ۲۰ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR 94
شکل۵- ۲۱ میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE 94
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

پروپوزال بکارگیری روشهای داده کاوی جهت مدیریت دانش مشتریان

هدف از این پروپوزال بکارگیری روشهای داده کاوی جهت مدیریت دانش مشتریان می باشد

دسته بندی رشته فناوری اطلاعات (IT)
فرمت فایل doc
حجم فایل ۸۸ کیلو بایت
تعداد صفحات ۳۳
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

دانلود پروپوزال پایان نامه کارشناسی ارشد در رشته فناوری اطلاعات
بکارگیری روشهای داده کاوی جهت مدیریت دانش مشتریان

چکیده
افزایش روزافزون سطح رقابت در بازار، مدیران و تحلیل گران سازمان ها را وادار ساخته به دنبال راهکارهایی باشند که مزیت رقابتی را برای سازمان به ارمغان آورند. بر اساس مطالعات موجود، استفاده از دانش مشتری جهت اتخاذ استراتژی‌های لازم برای جلب رضایت مشتری می تواند سازمان ها را به سمت تحقق این هدف سوق دهد. از سوی دیگر گسترش بهره گیری از فناوری های بروز در زمینه اطلاعات و ارتباطات خصوصاً در بانک ها باعث بر جای ماندن حجم عظیمی از داده ها گشته که تحلیل و تصمیم-گیری بر اساس آن ها با روش های معمول گزارش گیری و روش-های آماری امکان پذیر نمی باشد. داده کاوی ابزار بروز و قدرتمندی است که در این پایان نامه جهت تحلیل داده ها به جهت استخراج دانش مشتری پیشنهاد می گردد.
هدف از این تحقیق با عنوان «مدیریت دانش مشتریان بانک مهر اقتصاد با استفاده از تکنیک های داده‌کاوی»، بخش‌بندی مشتریان بانک مهر اقتصاد، باهدف کشف ویژگی‌های رفتاری مشابه، برای کمک به مدیران این بانک جهت تسهیل اتخاذ استراتژی‌های متناسب با هر بخش و در نتیجه حفظ، تقویت و یا توسعه ارتباط با مشتریان و نهایتاً سودآوری برای این بانک می باشد. داده‌های خام مورد نیاز جهت این مطالعه از پایگاه داده‌های بانک مهر اقتصاد استخراج شده است.
كلمات كلیدی :

داده کاوی

کشف دانش

مدیریت دانش مشتری

خوشه بندی مشتریان

مقدمه
در سال های اخیر دانش به عنوان منبعی ارزشمند در کنار منابعی چون کار، زمین، سرمایه قرار گرفت و به عنوان موتور تولیدکننده درآمد و یك دارایی مهم و راهبُردی برای سازمان شناخته شد. از طرفی به دلیل وجود رقابت شدید در بین کسب و کارهای امروزی از جمله صنعت بانکداری، مشتری و توجه به جایگاه او و ارتباط با او اهمیت ویژه ای یافته است. بنابراین مبحث بسیار مهم مدیریت دانش مشتری مطرح گردید که امروزه مطالعات بسیار زیادی را به خود اختصاص داده است. مدیریت دانش مشتری با استفاده از راهکارهای مختلف مدیریت دانش نظیر روش‌های داده‌کاوی زمینه بسیار خوبی را جهت استفاده مفید از گنجینه گران‌بهای دانش مشتری فراهم می آورد.
از سوی دیگر در عصر حاضر بهره گیری از فناوری های نوین اطلاعات و ارتباطات در عرصه های مختلف کسب وکار به امری گریزناپذیر مبدل گشته است. به طور خاص صنعت بانکداری از جمله صنایعی است که به‌کارگیری فناوری های روز دنیا در این صنعت می تواند مزیت رقابتی انکارناپذیری را برای آن ایجاد نماید. بنابراین این صنعت نیز از بهره گیری از بروزترین فناوری ها مستثنا نبوده و مواردی مانند بانکداری الکترونیک، سیستم‌های یکپارچه بانکداری ، دستگاه های خودپرداز، کارت های اعتباری، پایانه های خرید الکترونیک و… از مصادیق این امر می باشد.
ورود فناوری های جدید به سازمان سبب افزایش چشمگیر سرعت تولید اطلاعات و در نتیجه بر جای ماندن حجم عظیمی از داده‌ها گشته است. از آنجا که این داده‌ها اغلب حجیم و وسیع می-باشند، معمولاً به صورت خام قابل‌استفاده نیستند، بلکه دانش موجود در آن ها باید استخراج گردد. با این وجود که ارزش این داده‌ها بر کسی پوشیده نیست، حجم بسیار بالای داده‌های ارزشمند موجود، تحلیل و بهره گیری از آن ها را به امری چالش‌برانگیز مبدل ساخته است.
چرا که تحلیل به واسطه روش‌های گزارش گیری سنتی در این مقیاس امکان پذیر نیست و روش‌های آماری موجود نیز از ظرفیت کافی جهت تحلیل این داده‌ها برخوردار نمی باشند. بنابراین باید به دنبال راهکاری بود که با غلبه بر این محدودیت، امکان انجام مطالعاتی جامع تر با نتایج دقیق تر و درصد خطای پایین تر را ممکن سازد. این مسئله گواهی بر لزوم به‌کارگیری روش‌های نوین تحلیل داده‌ها جهت حصول دانش، نظیر روش داده‌کاوی خواهد بود.دانش قابل توجهی که در زمان استفاده از خدمت یا مصرف کالا توسط مشتری، بین مشتری و سازمان تبادل می شود، به عنوان منبعی مهم برای سازمان شناخته می شود و کسب و بهره برداری از آن به یک مزیت رقابتی در سازمان ها تبدیل شده است.مدیریت دانش مشتری دربردارنده فرایندهایی ست که با شناسایی و اکتساب اطلاعات مشتری و نیز ایجاد و بهره برداری از دانش مشتریان، مربوط است [۹]. چنین اطلاعاتی در ماورای محدوده های خارجی سازمان قرار دارند و دانشی که از آن ها استخراج می شود موجب ایجاد ارزش برای سازمان و مشتریان آن خواهد شد [۳۲]. در این تحقیق مسئولیت کشف دانش بر عهده الگوریتم‌های داده‌کاوی خواهد بود. در ادامه از این دانش به عنوان راهنما در مسیر اتخاذ استراتژی‌های سازمان، بهره گیری می شود.
فهرست مطالب
فصل اول ۱
۱-۱- مقدمه ۲
۱-۲- تعریف مسئله ۳
۱-۳- ضرورت انجام تحقیق ۷
۱-۴- مراحل انجام تحقیق ۸
۱-۵- محدوده تحقیق ۹
۱-۶- اهداف تحقیق ۹
۱-۷- ساختار پایان‌نامه ۱۰
منابع و مآخذ
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

مبانی نظری بکارگیری روشهای داده کاوی جهت مدیریت دانش مشتریان

هدف از این مبانی نظری بکارگیری روشهای داده کاوی جهت مدیریت دانش مشتریان بانک مهر اقتصاد می باشد

دسته بندی رشته فناوری اطلاعات (IT)
فرمت فایل doc
حجم فایل ۷۱۱ کیلو بایت
تعداد صفحات ۱۰۲
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود

دانلودمبانی نظریپایان نامه کارشناسی ارشد در رشتهفناوری اطلاعات
بکارگیری روشهای داده کاوی جهت مدیریت دانش مشتریان بانک

چکیده
افزایش روزافزون سطح رقابت در بازار، مدیران و تحلیل گران سازمان ها را وادار ساخته به دنبال راهکارهایی باشند که مزیت رقابتی را برای سازمان به ارمغان آورند. بر اساس مطالعات موجود، استفاده از دانش مشتری جهت اتخاذ استراتژی‌های لازم برای جلب رضایت مشتری می تواند سازمان ها را به سمت تحقق این هدف سوق دهد. از سوی دیگر گسترش بهره گیری از فناوری های بروز در زمینه اطلاعات و ارتباطات خصوصاً در بانک ها باعث بر جای ماندن حجم عظیمی از داده ها گشته که تحلیل و تصمیم-گیری بر اساس آن ها با روش های معمول گزارش گیری و روش-های آماری امکان پذیر نمی باشد. داده کاوی ابزار بروز و قدرتمندی است که در این پایان نامه جهت تحلیل داده ها به جهت استخراج دانش مشتری پیشنهاد می گردد.
هدف از این تحقیق با عنوان «مدیریت دانش مشتریان بانک مهر اقتصاد با استفاده از تکنیک های داده‌کاوی»، بخش‌بندی مشتریان بانک مهر اقتصاد، باهدف کشف ویژگی‌های رفتاری مشابه، برای کمک به مدیران این بانک جهت تسهیل اتخاذ استراتژی‌های متناسب با هر بخش و در نتیجه حفظ، تقویت و یا توسعه ارتباط با مشتریان و نهایتاً سودآوری برای این بانک می باشد. داده‌های خام مورد نیاز جهت این مطالعه از پایگاه داده‌های بانک مهر اقتصاد استخراج شده است.
كلمات كلیدی :

داده کاوی

کشف دانش

مدیریت دانش مشتری

خوشه بندی مشتریان

مقدمه
در سال های اخیر دانش به عنوان منبعی ارزشمند در کنار منابعی چون کار، زمین، سرمایه قرار گرفت و به عنوان موتور تولیدکننده درآمد و یك دارایی مهم و راهبُردی برای سازمان شناخته شد. از طرفی به دلیل وجود رقابت شدید در بین کسب و کارهای امروزی از جمله صنعت بانکداری، مشتری و توجه به جایگاه او و ارتباط با او اهمیت ویژه ای یافته است. بنابراین مبحث بسیار مهم مدیریت دانش مشتری مطرح گردید که امروزه مطالعات بسیار زیادی را به خود اختصاص داده است. مدیریت دانش مشتری با استفاده از راهکارهای مختلف مدیریت دانش نظیر روش‌های داده‌کاوی زمینه بسیار خوبی را جهت استفاده مفید از گنجینه گران‌بهای دانش مشتری فراهم می آورد.
از سوی دیگر در عصر حاضر بهره گیری از فناوری های نوین اطلاعات و ارتباطات در عرصه های مختلف کسب وکار به امری گریزناپذیر مبدل گشته است. به طور خاص صنعت بانکداری از جمله صنایعی است که به‌کارگیری فناوری های روز دنیا در این صنعت می تواند مزیت رقابتی انکارناپذیری را برای آن ایجاد نماید. بنابراین این صنعت نیز از بهره گیری از بروزترین فناوری ها مستثنا نبوده و مواردی مانند بانکداری الکترونیک، سیستم‌های یکپارچه بانکداری ، دستگاه های خودپرداز، کارت های اعتباری، پایانه های خرید الکترونیک و… از مصادیق این امر می باشد.
ورود فناوری های جدید به سازمان سبب افزایش چشمگیر سرعت تولید اطلاعات و در نتیجه بر جای ماندن حجم عظیمی از داده‌ها گشته است. از آنجا که این داده‌ها اغلب حجیم و وسیع می-باشند، معمولاً به صورت خام قابل‌استفاده نیستند، بلکه دانش موجود در آن ها باید استخراج گردد. با این وجود که ارزش این داده‌ها بر کسی پوشیده نیست، حجم بسیار بالای داده‌های ارزشمند موجود، تحلیل و بهره گیری از آن ها را به امری چالش‌برانگیز مبدل ساخته است.
چرا که تحلیل به واسطه روش‌های گزارش گیری سنتی در این مقیاس امکان پذیر نیست و روش‌های آماری موجود نیز از ظرفیت کافی جهت تحلیل این داده‌ها برخوردار نمی باشند. بنابراین باید به دنبال راهکاری بود که با غلبه بر این محدودیت، امکان انجام مطالعاتی جامع تر با نتایج دقیق تر و درصد خطای پایین تر را ممکن سازد. این مسئله گواهی بر لزوم به‌کارگیری روش‌های نوین تحلیل داده‌ها جهت حصول دانش، نظیر روش داده‌کاوی خواهد بود.دانش قابل توجهی که در زمان استفاده از خدمت یا مصرف کالا توسط مشتری، بین مشتری و سازمان تبادل می شود، به عنوان منبعی مهم برای سازمان شناخته می شود و کسب و بهره برداری از آن به یک مزیت رقابتی در سازمان ها تبدیل شده است.مدیریت دانش مشتری دربردارنده فرایندهایی ست که با شناسایی و اکتساب اطلاعات مشتری و نیز ایجاد و بهره برداری از دانش مشتریان، مربوط است [۹]. چنین اطلاعاتی در ماورای محدوده های خارجی سازمان قرار دارند و دانشی که از آن ها استخراج می شود موجب ایجاد ارزش برای سازمان و مشتریان آن خواهد شد [۳۲]. در این تحقیق مسئولیت کشف دانش بر عهده الگوریتم‌های داده‌کاوی خواهد بود. در ادامه از این دانش به عنوان راهنما در مسیر اتخاذ استراتژی‌های سازمان، بهره گیری می شود.
فهرست مطالب
فصل دوم ۱۲
۲-۱- مقدمه ۱۳
۲-۲- مدیریت دانش ۱۴
۲-۲-۱- دانش چیست؟ ۱۵
۲-۲-۲- هرم دانش ۱۵
۲-۲-۳- انواع دانش ۱۶
۲-۲-۳-۱- دانش صریح ۱۶
۲-۲-۳-۲- دانش ضمنی ۱۶
۲-۲-۴- مدیریت دانش چیست؟ ۱۷
۲-۲-۵- استراتژی‌های مدیریت دانش ۱۸
۲-۲-۵-۱- استراتژی اجتماعی سازی (تبدیل دانش پنهان به پنهان) ۱۹
۲-۲-۵- ۲- استراتژی برونی سازی (پنهان به آشکار) ۱۹
۲-۲-۵- ۳- استراتژی ترکیب سازی (آشکار به آشکار) ۲۰
۲-۲-۵- ۴- استراتژی درونیسازی (آشکار به پنهان) ۲۰
۲-۲-۶-معایب عدم بهرهگیری از دانش در سازمان ۲۰
۲-۲-۷- اهداف مدیریت دانش ۲۱
۲-۲-۸- مدل های مدیریت دانش ۲۱
۲-۳- مدیریت دانش مشتری ۲۳
۲-۳-۱- انواع دانش مشتری ۲۴
۲-۳-۲- مدل مدیریت دانش مشتری ۲۸
۲-۴- مدیریت ارتباط با مشتری ۲۹
۲-۴-۱- مدیریت ارتباط مشتریان در نظام بانکی ۳۲
۲-۴-۲- مدیریت ارتباط با مشتری: اهداف، مزایا و چالش‌ها ۳۳
۲-۵- مقایسه مفاهیم CKM و KM و CRM 34
۲-۶- تاریخچه‌ای از بانک و بانکداری ۳۷
۲-۷- سیر تحول فناوری اطلاعات در صنعت بانكداری ۳۸
۲-۷-۱ دوره اول: اتوماسیون پشت باجه ۳۸
۲-۷-۲- دوره دوم: اتوماسیون جلوی باجه ۳۸
۲-۷-۳- دوره سوم: اتصال مشتریان به حساب‌هایشان ۳۸
۲-۷-۴- دوره چهارم: یکپارچه‌سازی سیستم‌ها و مرتبط كردن مشتریان با تمامی عملیات بانكی ۳۹
۲-۷-۵- بانكداری الكترونیك ۳۹
۲-۸- داده‌کاوی ۴۰
۲-۸-۱- مقایسه روش‌های آماری و داده‌کاوی ۴۰
۲-۸-۲- مفهوم داده‌کاوی ۴۲
۲-۸-۳- داده‌کاوی و کشف دانش ۴۴
۲-۸-۴- فرایند داده‌کاوی ۴۵
۲-۸-۵- معرفی روش‌های داده‌کاوی ۵۱
۲-۸-۵-۱- دسته‌بندی ۵۳
۲-۸-۵-۲- درخت تصمیم ۵۳
۲-۸-۵-۳- شبکه‌های عصبی ۵۵
۲-۸-۵-۴- پیش بینی ۵۶
۲-۸-۵-۵- خوشه‌بندی ۵۶
۲-۸-۵-۵- انواع خوشه‌بندی ۵۷
۲-۸-۵-۵-۲- معیارهای ارزیابی در خوشه‌بندی ۵۹
۲-۸-۵-۶- تحلیل انحراف ۶۰
۲-۸-۵-۷- قواعد وابستگی (انجمنی) ۶۱
۲-۸-۵-۸- تحلیل توالی ۶۱
۲-۸-۶- نرم‌افزار داده‌کاوی ۶۲
۲-۸-۷- کاربردهای داده‌کاوی ۶۳
۲-۸-۷-۱- داده‌کاوی در صنعت بانكداری ۶۳
۲-۹- پیشینه تحقیق ۶۵
۲-۹-۱- کاربرد داده‌کاوی در بخش‌بندی و مدل‌سازی رفتاری مشتریان در صنعت بانکداری ۶۶
۲-۹-۲- کاربرد داده‌کاوی در ارزیابی اعتبار مشتریان ۶۸
۲-۹-۳- کاربرد داده‌کاوی در زمینه کشف تقلب ۶۹
۲-۹-۴- کاربرد داده‌کاوی در تحلیل روی‌گردانی مشتری ۶۹
۲-۱۰- جمع‌بندی مطالب فصل ۷۴
منابع و مآخذ
فهرست جدول‌ها
جدول ۲-۱ انواع مختلف تبدیلات دانش ۱۹
جدول ۲-۲ مقایسه مفاهیم مدیریت دانش، مدیریت ارتباط با مشتری و مدیریت دانش مشتری ۳۵
جدول ۲-۳ مقایسه روش‌های تحلیل آماری و داده‌کاوی ۴۱
جدول ۲-۴ فعالیت‌های مربوط به فازهای CRISP-DM و خروجی هر فعالیت ۵۰
جدول ۲-۵ نمونه داده‌های مورد نیاز در یک مسئله مدل‌سازی به روش دسته‌بندی ۵۴
جدول ۲-۶ معیارهای محاسبه شباهت در خوشه‌بندی ۵۹
جدول ۲-۷ معیارهای محاسبه فاصله در خوشه‌بندی ۶۰
جدول ۲-۸ پژوهش‌های انجام‌گرفته در زمینه کاربرد داده‌کاوی در صنعت بانکداری ۷۱
فهرست تصاویر و نمودارها
شکل ۲-۱ سلسله‌مراتب دانش ۱۶
شکل ۲-۲ دانش صریح فقط بخش کوچکی از دانش را تشکیل می‌دهد. ۱۷
شکل ۲-۳ مدل مدیریت دانش پروبست و رمهارد ۲۲
شکل ۲-۴ چارچوب خوشه انگور جهت نوع شناسی دانش مشتری ۲۶
شکل ۲-۵ مدل مدیریت دانش مشتری ۲۸
شکل ۲-۷ گام‌های فرایند تولید دانش از پایگاه داده‌ها ۴۴
شکل ۲-۸ متدولوژی فرآیند استاندارد میان صنعتی داده‌کاوی (CRISP-DM) 47
شکل ۲-۹ دسته‌بندی کلی عملکردهای داده‌کاوی ۵۲
شکل ۲-۱۱ نیروهای رقابتی پورتر ۶۴
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود