پروژه داده کاوی
پروژه داده کاوی ارشد
خرید پروژه داده کاوی
پروژه در مورد data mining
پروژه در مورد داده کاوی در سازمان
موضوع پروژه داده کاوی در سازمان
خرید پروژه داده کاوی در سازمان
پروژه داده کاوی در شهرداری
هدف از پروژه داده کاوی در سازمان ، کاربرد داده کاوي در کشف دانش پنهان ميان داده هاي سامانه 137 شهرداري تهران می باشد. تحقيق حاضر از نوع کاربردي مي باشد و به بررسي به کارگيری برخی روشهاي داده کاوي در مورد دادههاي سامانه 137 شهرداري تهران ميپردازد.
سامانه 137 يک مرکز گيرنده پيامهاي مردمي جهت رسيدگي به مشکلات و معضلات مشکلات شهري شهروندان تهراني ميباشد. در اين راستا کل پيامهاي سال 1389 اين سامانه در بانک اطلاعاتي2008 SQL Server گردآوري و مورد تحليل قرار گرفت.سامانه 137 با هدف رفع مشکلات و معضلات شهري و با رويکرد مشارکت بيشتر شهروندان در مديريت شهري راه اندازي شده است. تعداد کل پيام ها در طول سال مورد بررسي و پس از مرحله آماده سازي داده ها مجموعاً 1.082.195 بوده است که به لحاظ تحليلهاي آماري تعداد قابل توجه و براي تحليلهاي دادهکاوي مناسب ميباشد.
رويکرد محقق در اين تحقيق به کارگيري تکنيک هاي مختلف داده کاوي به منظور شناسايي و پيش بيني، نيازها و مشکلات شهري بر اساس داده هاي بدست آمده از سامانه مديريت شهري 137 مي باشد. تمرکز اصلي در اين تحقيق بر استفاده از روشهاي داده کاوي و نرم افزار SPSS Clementine ميباشد. همان طور که در فصل قبل بيان شد، دليل استفاده از اين نرم افزار، توانايي آن در پردازش مجموعه هاي داده اي بزرگ و متداول بودن آن در ميان کاربران است. در بخش آماده سازي داده ها، رسم نمودارها و جداول از نرم افزارهايي نظير Sql server 2008، Excel 2007 و Spss 16 استفاده شده است.
در مرحله ي توصيف اطلاعات، ابتدا توزيع فراواني و درصد فراواني متغيرهاي گوناگون و همينطور برخي از شاخصهاي سرانه را مورد بررسي قرار داديم و در بخش تحليل داده ها با استفاده از تکنيک هاي داده کاوي، گروه مدلها و تحليلهاي زير مورد بررسي قرار گرفته است:
• شناسايي مناطق همگن از منظر سامانه 137
• پيش بيني وضعيت تماس هاي آب گرفتگي هر يک از مناطق به ازاي بارش هر ميلميتر باران
• تعيين ارتباط ميان آب گرفتگی نواحی مختلف يک منطقه
• تعيين نواحي مستعدتر درهر منطقه در بروز مشکلات و معضلات شهري
فهرست مطالب
فصل اول: کليات
مقدمه 1
1-1- بيان مساله 2
1-2- هدف تحقيق 3
1-3- سوالات تحقيق 3
1-4- اهميت و ضرورت تحقيق 4
1-5- قلمرو تحقيق 5
1-5-1- از منظر سازماني 5
1-5-2- از منظر زماني و مکاني 5
1-5-3- از منظر موضوعي 5
1-6- روش تحقيق و جمع آوري اطلاعات 5
1-7- تعريف واژه ها و اصطلاحات فنی 6
1-8- خلاصه فصل اول 6
فصل دوم: ادبيات تحقيق
مقدمه 8
2-1- مباني نظري 9
2-1-1- تاريخچه داده کاوي 9
2-1-2- تعريف داده کاوي 10
2-1-3- انواع داده کاوي 11
2-1-4- دلايل استفاده از داده کاوي 12
2-1-5- پيش نيازهاي يک داده کاوي موفق 12
2-1-6- مراحل فرايند داده کاوي ( استاندارد CRISP-DM ) 13
2-1-6-1شناخت کسب و کار 14
2-1-6-2شناخت داده ها 14
2-1-6-3آماده سازي داده ها 15
2-1-6-4مدل سازي 15
2-1-6-5ارزيابي مدل 15
2-1-6-6توسعه ي مدل 16
2-1-7- قابليت هاي اساسي داده کاوي 16
2-1-7-1 طبقه بندي 16
2-1-7-2 پيش بيني 17
2-1-7-3 تحليل خوشه اي 17
2-1-7-4 تخمين 18
2-1-7-5 گروه بندي شباهت يا قوانين وابستگي 19
2-1-7-6 توصيف و نمايه سازي 20
2-1-8- دسته بندي الگوريتم هاي داده کاوي 20
2-1-9- الگوريتم هاي خوشه بندي 21
2-1-9-1روش افرازي ( تقسيم بندي) 21
2-1-9-1-1الگوريتم K-MEANS 22
2-1-9-2روش هاي سلسله مراتبي 22
2-1-9-3روش هاي مبتني بر چگالي 23
2-1-10- الگوريتم هاي وابستگي قواعد 23
2-1-10-1الگوريتم Naïve 23
2-1-10-2 الگوريتم Apriori 24
2-1-11- الگوريتم هاي طبقه بندي 26
2-1-11-1الگوريتم درخت طبقه بندي و رگرسيون (CART) 26
2-1-11-2الگوريتم درخت تصميم C4.5 27
2-1-11-3الگوريتم هاي شبکه هاي بيزين 29
2-2-1- مديريت شهري و شهرداري 30
2-2-2- نقش فن آوري اطلاعات در توسعه ي مديريت شهري 31
2-2-3- معرفي سامانه مديريت شهري 137 شهرداري تهران 33
2-2-3-1نحوه ي عملکرد سامانه مديريت شهري 137 36
2-2-3-2ماموريت هاي مرکز سامانه مديريت شهري 137 38
2-2-3-3رويکردهاي اجرايي مرکز سامانه مديريت شهري 137 38
2-2-3-4چشم انداز مرکز سامانه مديريت شهري 137 39
2-2-3-5ساختار سازماني سامانه مديريت شهري 137 39
2-2 مدل مفهومي تحقيق 40
2-3- ادبيات ياپيشينه تحقيق 40
2-4- خلاصه فصل دوم 44
فصل سوم: روش تحقيق
مقدمه 46
3-1- نوع تحقيق 46
3-2- مدل فرايندي داده کاوي بر اساس استاندارد CRISP-DM 47
3-2-1- شناخت کسب و کار 47
3-2-2- شناخت داده ها 48
3-2-3- آماده سازي داده ها 48
3-2-4- مدل سازي 49
3-2-5- ارزيابي مدل 49
3-2-6- توسعه مدل 49
3-3- داده هاي تحقيق 50
3-4- جامعه آماري, روش نمونه گيري و حجم نمونه 50
3-5- روش گردآوري اطلاعات و ابزار سنجش 50
3-6- نوع داده ها و مقياس آن ها 51
3-7- ساختار اجرايي تحقيق 51
3-7-1- درک مساله کسب و کار 51
3-7-2- درک داده ها 52
3-7-3- آماده سازي داده ها 53
3-7-4- مدل سازي 55
3-7-5- ارزيابي نتايج 56
3-7-6- به کارگيري مدل 56
3-8- مدل اجرايي تحقيق 56
3-9- خلاصه فصل سوم 58
فصل چهارم: تجزيه و تحليل داده ها
مقدمه 60
4-1- توصيف داده ها 60
4-2- تحليل توصيفي داده ها با استفاده از جداول و نمودارهاي توصيفي 63
4-2-1- طبقه بندي بر اساس نوع مشکل 63
4-2-2- طبقه بندي بر اساس منطقه بروز مشکل 66
4-2-3- شاخصهاي توصيفي سرانه 67
4-3- تحليل داده ها با استفاده از تکنيک هاي داده کاوي 70
4-3-1- شناسايي مناطق همگن از منظر سامانه 137 70
4-3-1-1ارزيابي خوشه ها 76
4-3-2- پيش بيني وضعيت تماس هاي آب گرفتگي در هر يک از مناطق به ازاي بارش هر ميليمتر باران 77
4-3-2-1 مدل تعميم يافته خطي 77
4-3-2-2مدل شبکههاي عصبي 82
4-3-3 تعيين ارتباط ميان آب گرفتگي نواحي مختلف يک منطقه 84
4-3-4 تعيين نواحي مستعدتر در هر منطقه در بروز مشکلات و معضلات شهري 86
4-4- خلاصه فصل چهارم 87
فصل پنجم: بحث و نتيجه گيری
مقدمه 89
5-1-خلاصه 89
5-2- دلايل با اهميت بودن نتايج و دستاوردهاي تحقيق 90
5-3- جنبه ي نوآوري تحقيق 91
5-4- نتايج تحقيق 91
5-4-1- نتايج تحليل توصيفي 91
5-4-2- نتايج حاصل از تحليل داده کاوي و ارائه ي دانش استخراج شده 94
5-4-2-1نتايج حاصل از شناسايي مناطق همگن با استفاده از روش خوشه بندي دو مرحله اي 94
5-4-2-2- نتايج پيش بيني تماس هاي آب گرفتگي در هر يک از مناطق به ازاي بارش هر ميليمتر باران 95
5-4-2-3تعيين ارتباط میان آب گرفتگي نواحي مختلف يک منطقه 96
5-4-2-4نتايج تحليل قوانين وابستگي براي شناسايي نواحي مستعدتر در هر منطقه در بروز مشکلات و معضلات شهري 97
5-5- پاسخ به سوالات تحقيق 97
5-6- محدوديتهاي تحقيق 98
5-7- پيشنهادات تحقيق 99
5-8- پيشنهادات جهت تحقيقات آتي 100
5-9- خلاصه فصل پنجم 101
فهرست منابع 102
چکیده انگلیسی 105
فهرست جداول
جدول 2-1 : نمونه اي از جدول پيام 35
جدول 2-2: تحقيقات خارجي در زمينه کاربرد داده کاوي در مراکز تماس 444
جدول4-1 : فيلد هاي جدول پيام 61
جدول 4-2: فيلد هاي جدول اطلاعاتي مربوط به اعتبار مصوب عمراني مناطق 61
جدول4-3: فيلد هاي جدول اطلاعاتي مربوط به بارش مناطق 61
جدول4-4: فراواني گروه هاي تماس 63
جدول4-5 پراکندگي مشکلات مربوط به گروه جمع آوري و نصب 65
جدول4-6 : طبقه بندي مشکلات بر اساس منطقه 66
جدول 4-7 سرانه تماس و بودجه مناطق بيست و دو گانه تهران 68
جدول4-8: شاخصهاي نيکويي برازش 78
جدول4-9: آزمون درستنمايي مدل خطي تعميم يافته 78
جدول4-10 آزمون عوامل مدل خطي تعميم يافته 79
جدول4-11 آزمون ضرائب مدل خطي تعميم يافته 79
جدول4-12 بخشي از ارتباطهاي دنبالهاي شناسايي شده 85
جدول4-13 قوانين شناسايي شده به روش GRI 86
فهرست شکل ها
شکل 2-1 مراحل فرايند کشف دانش و جايگاه داده کاوي. 11
شکل2-2 مراحل فرايند CRISP-DM 13
شکل 2-1 چرخه گردش پيام- ماخذ: مرکز سامانه 137 36
شکل 2-2ساختار سازماني سامانه مديريت شهري سامانه 137-ماخذ: مرکز مديريت سامانه 137 39
شکل2-3 مدل مفهومي تحقيق 40
شکل3-1وضعيت ايستگاه هاي پنج گانه هواشناسي مستقر در شهر تهران مي باشد. 53
شکل3-2 روش اجرايي تحقيق 57
شکل4-1: درصد فراواني هر کدام از گروههاي تماس 64
شکل 4-2 :سهم مناطق در تماس هاي از نوع "جمع آوري خاک و نخاله" و "نصب سطل زباله مخزن دار" 66
شکل4-3: رابطه ميان تعداد تماس، جمعيت و اعتبار مصوب عمرانی 69
شکل4-4 بررسي نه عامل اول در خوشه بندي 73
شکل4-5 بررسي نه عامل دوم در خوشه بندي 74
.شکل 4-6 بررسي هفت عامل آخر در خوشه بندي 75
شکل 4-7 اعضاي خوشه هاي اول و دوم 76
شکل 4-8 : آناليز مدل خطی تعميم يافته 81
شکل 4-9: نمودار صعود 81
شکل 4-10: مدل شبکه عصبي 83
شکل 4-11: آناليز مدل شبکه عصبی 84
شکل 5-1 : رابطه ميان تعداد تماس، جمعيت و اعتبار مصوب عمراني 93
شکل 5-2 اعضای خوشه اول و دوم 94