یانگین خطای الکوریتمهای مختلف weka 64
جدول شماره 5-2: مقایسه خطای الگوریتم بگینگ و رندوم فارست 66

فهرست شکل‌ها

عنوان صفحه
شکل 1-1: معماری کلی مربوط به متدهای یادگیری تجمعی 6
شکل 2-1: معماری کلی الگوریتم بگینگ 14
شکل 2-2: نمایی کلی از الگوریتم رندوم فارست 16
شکل 2-3: معماری کلی مربوط به الگوریتم رندوم فارست 20
شکل 4-1: صفحه‌ی نمایش شبیه ساز ترافیک TSF 42
شکل 4-2: نقشه‌ی شهر Warsaw، اعمال شده بهTSF 43
شکل 4-3: نمایش نمادین اعمال تکنیک پیشنهادی 46
شکل 4-4: توزیع جریان‌های ترافیکی مسیرها 47
شکل 4-5: ارائه‌ی دید دقیق‌تر در خصوص رفتار جریان‌های ترافیکی 48
شکل 4-6: نمایش نمادین روند انجام مرحله گردآمدگی 50
شکل 4-7: نمودار الزامات معیار شباهت مناسب 53
شکل 4-8: جریانهای ترافیکی مسیرها مربوط به دو context 55
شکل 5-1: مثالی از چگونگی اعمال مراحل گردآمدگی 68
شکل 5-2: مقایسهی خطا روشها با اعمال سایزهای مختلف گردآمدگی 69
شکل 5-3: مراحل نمادین استخراج مجموعه نمونه آموزشی 71
شکل 5-4: مقایسه خطای تکنیک پیشنهادی و روش Ensemble RF 72

فصل اول

مقدمه

تعریف مسئله

امروزه، با توجه به گسترش روزافزون مطالبات حمل‌ونقل و بروز مشکلات ناشی از افزایش ترافیک شهری، ازجمله آلودگی هوا، آلودگی صوتی، مصرف سوخت، اتلاف وقت و انرژی و هزینه‌های تحمیلی آنها، ارائه راهکار مناسب درجهت روان شدن ترافیک از اهمیت ویژه‌ای برخوردار است. از طرفی باتوجه به محدودیت‌های امکانات شهرسازی در مقابل تقاضای انبوه وسایل نقلیه، لازم است تا تمهیداتی کاربردی و امکان‌پذیر برای حل این معضل درنظر گرفته ‌شود. ازآنجا که تاکنون فناوری اطلاعات1 نقش مؤثری درعرصه‌های مختلف صنعتی ایفا کرده است، ورود این تکنولوژی در زمینه‌ی سیستم‌های حمل‌ونقل نیز بعنوان راهکاری مناسب مورد توجه قرارگرفت و منجر به پدیدآمدن سیستم‌های حمل‌ونقل هوشمند2 شد. در واقع تکنولوژی فناوری اطلاعات به عناصر سیستم حمل‌ونقل این امکان را می‌دهد تا با بکارگیری حسگر3ها و میکروچیپ‌ها و ارتباط آنها از طریق تکنولوژی بیسیم4، تبدیل به یک سیستم هوشمند شوند. امروزه سیستم حمل‌ونقل هوشمند با تشکیل سامانه‌ای متشکل از حسگرهای دریافت داده، سامانه‌های پردازش اطلاعات و سامانه‌های ارائه‌ی اطلاعات به استفاده کنندگان، گامی مؤثر در راستای مدیریت سیستم حمل‌ونقل و استفاده هوشمندانه از زیرساختارهای موجود، برداشته است [1]. بطور مثال این سیستم با بکارگیری فناوری‌های متفاوتی همچون هدایت خودرو و سیستم کنترل چراغ‌های راهنمایی، تابلوهای اعلان ترافیک، دوربین سرعت‌سنج و سیستم خودکار شناسایی شماره‌ی خودرو گرفته تا سیستم‌های پیشرفته و پیچیده‌تری که بطور همزمان اطلاعات متفاوتی مانند وضعیت آب و هوا، وضعیت ترافیک، وضعیت جاده‌ها را از منابع متفاوت یکپارچه میکند، کنترل این حوزه را بدست‌ گرفته‌ است. از جمله دستاوردهای مهم بکارگیری سیستم حمل‌ونقل هوشمند می‌توان به کاهش ترافیک، کاهش حوادث و تصادفات، امکان انتخاب مسیرهای بهینه با توجه به وضعیت مسیرها، مدیریت حمل‌ونقل عمومی و وسائل نقلیه‌ی امدادی و همچنین امکان اخذ الکترونیکی مواردی همچون عوارض، هزینه‌ی پارکینگ و خرید بلیط که منجر به صرفه جویی در سوخت وانرژی و کاهش هزینه‌های تحمیلی میشود، اشاره کرد. عموماً سیستم‌های حمل ونقل هوشمند را تحت عنوان پنج گروه اصلی بررسی میکنند که هرکدام حوزه‌های مختلف از این سامانه را شامل میشوند؛
الف) سامانه‌های پیشرفته‌ی اطلاعات مسافرتی5(ATIS) که وظیفه‌ی آن فراهم آوردن اطلاعات وضعیت فعلی ترافیکی و جوّی جاده‌ها، تصادفات و تعمیرات جاده‌ای و همچنین اطلاع رسانی به مسافران و کاربران بمنظور استفاده‌ی بهینه از مسیرهای موجود و برقراری تعادل ترافیکی می‌باشد.
ب) سامانه‌های پیشرفته‌ی مدیریت ترافیک6 (ATMS)که اطلاعات ترافیکی جمعآوری شده از منابع مختلف را بررسی و یکپارچه کرده و از طریق ابزارهای کنترل ترافیک مانند سینگال‌های ترافیکی، کنترل رمپ7 ورودی بزرگراه ها به منظور حفظ تراکم و تابلوهای اطلاع رسانی متغیر موجود در جاده‌ها، کنترل جریان ترافیکی را در دست می‌گیرند.
ج) سامانه‌های پرداخت الکترونیکی8 (EPS) که شامل سیستم جمع‌آوری الکترونیکی عوارض9(ETC)، سامانه‌های پرداخت عوارض بمنظور استفاده از خطوط ویژه‌ی وسایل نقلیه پرسرنشین10 توسط وسایل تک سرنشین و همچنین قیمت‌گذاری مسیر11 و خطوط پرترافیک می‌باشد.
د) سامانه‌های پیشرفته و هوشمند حمل‌ونقل همگانی12 (APTS)اموری در جهت تسهیل ارائه‌ی خدمات حمل‌ونقل عمومی همچون تعیین موقعیت خودکار13 وسیله نقلیه و اطلاع رسانی به مسافران، خدمات رزرو و تعیین کرایه را نیز شامل می‌شود.
ه) سامانه‌های پیشرفته‌ی کنترل وسائل نقلیه(AVCS)14 که شامل سامانهی انطباق هوشمند سرعت15(ISA)، سامانه‌های هشدار و پیشگیری از تصادفات می‌شوند.
در حوزه‌یAITS وATMS، پیش‌بینی کوتاه مدت ترافیک از عناصر مهم موفقیت سیستم‌های حمل‌ونقل هوشمند محسوب می‌شود، چرا که در راستای کنترل ترافیک نه تنها وضعیت فعلی ترافیک بلکه وضعیت آینده‌ی ترافیک نیز حائز اهمیت است. از این رو الگوریتم‌های پیش‌بینی ترافیک مورد توجه ویژه‌ای در میان مح
ققان این حوزه قرار گرفتند.

مطلب مرتبط :   منابع و ماخذ تحقیقدینامیکی، مدل سازی

چالش‌های مسئله

همانطور که پیشتر بیان شد، مراکز کنترل ترافیک بر اساس جمعآوری آمار و اطلاعات ترافیکی، پردازش و یکپارچه سازی آنها، تصمیمات لازم جهت مدیریت و کنترل ترافیک را اتخاذ می‌کنند. در راستای بهبود کنترل ترافیک، ATIS و ATMS بعنوان اصلیترین اجزاء سیستم حملونقل هوشمند، علاوه بر وضعیت فعلی ترافیک، به وضعیت آینده ترافیک نیز احتیاج دارند. ازین‌رو پیشبینی وضعیت آینده ترافیک از جمله مباحث مهم برای این مراکز به حساب می‌آید تا با استفاده از آن استراتژی‌های لازم جهت جلوگیری از تراکم و هشدار به رانندگان جهت انتخاب مسیر بهینه، صورت گیرد. تاکنون تحقیقات متعددی در خصوص پیش‌بینی وضعیت ترافیکی آینده انجام شده است که در واقع با استفاده از داده‌های ثبت شده از وضعیت فعلی ترافیک، ترافیک مربوط به زمان‌های آتی را پیش‌بینی می‌کنند.
بطور معمول داده‌های جمع‌آوری شده در حوزه‌ی ترافیک، بصورت سری‌های زمانی16 در اختیار ما قرار می‌گیرند که در واقع شامل رکوردهای مختلفی هستند که در بازه های زمانی مساوی و در طی اندازه‌گیری‌های متوالی بدست می‌آیند. با استفاده از داده‌های فعلی و گذشته، مقادیر آن‌ها در آینده پیش‌بینی می‌شوند [2]. تاکنون تکنیک‌های متفاوتی در زمینه‌ی پیش‌بینی ترافیک بکار گرفته شده است که از جمله‌ی آن‌ها می‌توان به روش‌های کالمن فیلترینگ17 [4,3]، متدهای آماری غیرپارامتریک [5,6] 18، روش‌های یادگیری متوالی[7] 19، مدل‌های شبکه‌عصبی20 [8-11] و آنالیزهای سری‌های زمانی[13-17] اشاره کرد. از مهمترین چالش‌های اعمال این الگوریتم‌ها، حجم بالای داده‌های ترافیکی است که منجر شده تا اخیراً گرایش تحقیقات به سمت استفاده از الگوریتم‌های داده کاوی21 باشد.
همانطور که می‌دانیم تکنیک‌های داده کاوی قابلیت استخراج اطلاعات از داده‌هایی با حجم بسیار بالا همچون داده‌های ترافیکی را دارا هستند. از میان آن‌ها روش‌های مبتنی بر درختهای تصمیم‌گیری22 بطور گسترده‌ای در حوزه‌ی ترافیک مورد استفاده قرار گرفته است[18,19]. همچنین متدهای یادگیری تجمعی23 همانند بگینگ و بوستینگ با توجه به کارایی بالا، مورد توجه ویژه‌ای واقع شدند. ایده‌ی اصلی آن‌ها ساخت مجموعه‌ای از مدل‌ها و ترکیب نتایج آن‌ها با هدف بهبود دقت24 یادگیری می‌باشد[47]. در شکل -11 معماری کلی الگوریتم‌های یادگیری تجمعی را می‌بینیم که از کتاب [20] آورده شده است.

شکل 1-1. معماری کلی مربوط به متدهای یادگیری تجمعی. در این متدها، مجموعه‌ای از کلاسه‌بندها یا مدل‌های پیش‌بینی کننده M1, M2, …, Mk تولید می‌شوند و نهایتاً با ورود نمونه‌ی ناشناخته25 ، استراتژی‌های رأی‌گیری برای ترکیب پیش‌بینی‌های مختلف مدل‌ها استفاده می‌شوند.
رندوم فارست26 یکی از مشهورترین و کاراترین متدهای مبتنی بر یادگیری تجمعی در زمینه پیش‌بینی است که توسط Leo Brieman در سال 2001 ارائه شد. رندوم فارست در واقع حالتی عمومی از متدهای بگینگ به حساب می‌آید که از مجموعه‌ای از درخت‌هایCART 27 غیر هرس شده28، تشکیل شده است [21]. در حالت رگرسیون29، جواب نهایی میانگین جواب‌های درختان و در حالت کلاسه بندی30، کلاس نهایی با توجه به اکثریت آرا تعیین می‌شود. درخت‌های CART در واقع درخت‌های تصمیم‌گیری هستند که در آن‌ها هر گره31ی والد تنها به دو بچه تقسیم می‌شود و همچنین از معیار Gini به منظور ارزیابی ویژگی ها استفاده می‌کند [20].
بطور خلاصه، اغلب روش‌های اعمال شده ، تنها بر روی اعمال الگوریتم‌های مختلف داده کاوی به مدل‌های یادگرفته شده از داده‌های پیشین32 هستند، حال آنکه با توجه به ماهیت ناپایداری و وابسته به زمان بودن جریان‌های ترافیکی33، لازم است تا قبل از یادگیری این مدل‌ها، رفتار جریان‌های ترافیکی نیز بررسی شوند. در این راستا، آنالیزهای مختلف کلاسترینگ34 نیز با هدف ثبت رفتارها و روند تغیرات جریان‌های ترافیکی انجام شد تا جریان‌های با رفتارهای مشابه قبل از یادگیری، دسته بندی شوند[22, 23]. اکثریت این دسته‌بندی‌ها بر اساس زمان‌های پُرترافیک وکم‌ترافیک صورت می‌گیرد. همانطور که می‌دانیم در طی روزهای مختلف، رفتارهای ویژه‌ای در ساعات معینی از روز دنبال می‌کنند. بنابراین تفکیک و جداسازی و یادگیری مدل‌های متفاوت بر مبنای این رفتارها، نقش مؤثری در دقت الگوریتم‌های پیش‌بینی خواهد داشت. نکته‌ی حائز اهمیت در اینجا این‌است که اغلب روش‌هایی که رفتارهای جریان‌های ترافیکی را بررسی می‌کنند تنها بر روی داده‌های واقعی یا داده‌هایی که زمان رخدادشان مشخص است، قابل اعمالند. هرچند در برخی از داده‌های جمع‌آوری شده، زمان جمع‌آوری آنها مشخص نیست. بنابراین، با توجه به اهمیت موضوع، هدف این پایان‌نامه ارائه‌ی روشی مبتنی بر الگوریتم رندوم فارست است که بدون در اختیار داشتن زمان واقعی جمع آوری داده، توزیع داده را بررسی، رفتارهای ترافیکی را تشخیص و در مرحله یادگیری از آنها استفاده می‌کند.

مطلب مرتبط :   منابع پایان نامه ارشد دربارهانگیزش شغلی، روابط انسانی، رضایت شغلی، سلسله مراتب

نگاهی به فصول پایان نامه

ادامه‌ی مطالب عنوان شده در این پایان نامه در قالب چهار فصل و بصورت زیر سازماندهی شده‌اند؛ فصل دوم با عنوان مبانی نظری تحقیق، ضمن ارائه‌ی چهارچوب‌های نظری مورد استفاده، قالب ریاضی مسئله‌ی پیش‌بینی ترافیک را مورد مطالعه قرار می‌دهد و مفاهیم اولیه و متغیرهای مسئله را مطرح می‌کند. فصل سوم نیز با عنوان پیشینه تحقیقات، ش
امل خلاصه‌ای از نظریات و مطالعات پیشین انجام شده در حوزه‌ی این پایان نامه می‌باشد که در آن متدهایی که تاکنون کاربرد گسترده‌تری داشته‌اند، در قالب سه گروه تقسیم بندی و مطالعه می‌شوند.
فصل چهارم نیز تحت عنوان معرفی تکنیک پیشنهادی، مباحثی همچون آنالیز داده‌ی مورد استفاده، ارائه توصیف کلی از هدف اصلی متد و مراحل اعمال تکنیک ارائه شده را شامل می‌شود. در راستای مطالعه و بررسی عملکرد تکنیک پیشنهادی، آزمایش‌های متعددی صورت گرفته که در فصل پنجم با نام نتایج تجربی، تحلیل ها و نتایج حاصل از اعمال این تکنیک‌ها در مقایسه با دیگر روش‌ها مورد بررسی قرار خواهند گرفت.
در نهایت، نتیجه‌گیری و خلاصه‌ای از تحلیل‌های حاصل از انجام این مطالعات، در فصل ششم ارائه خواهد شد و علاوه بر آن گام‌هایی در راستای گسترش و ادامه این تحقیق در کارهای آینده، پیشنهاد می‌شوند.

فصل دوم

مبانی نظری تحقیق

مقدمه

پیش‌بینی دقیق وضعیت ترافیکی، امری لازم و تأثیرگذار در مدیریت مؤثر سیستم‌های حمل‌ونقل هوشمند به حساب می‌آید. از آنجا که داده‌های ترافیکی معمولاً داده‌هایی با حجم بالا هستند، تکنیک‌های کاربردی و جدیدی را برای پردازش نیاز دارند. داده کاوی بعنوان یک شاخه از علم کامپیوتر اخیراً توجه زیادی را به خود جلب کرده است که در نتیجه‌ی اعمال آن، آنالیز و پردازش پایگاه داده35 های بزرگ فراهم می‌شود. در واقع متدهای داده کاوی معمولاً با هدف استخراج دانش36 و ساخت مدل از داده‌های حجیم بکار گرفته می‌شوند[24]. از میان روش‌های گوناگون داده کاوی، تمرکز تعداد قابل توجهی از تحقیقات به روی یادگیری یادگیری تجمعی 37 ، درخت‌های تصمیم‌گیری و بطور ویژه رندوم فارست38 می‌باشد که در ادامه توضیح داده خواهند شد[25].

متدهای یادگیری تجمعی

در سال‌های اخیر گرایش زیادی به سمت تکنیک‌های یادگیری تجمعی مشاهده می‌شود که ایده‌ی اصلی آن‌ها استفاده از ترکیبی از مدل‌ها به جای استفاده از یک مدل است. در واقع این متدها با هدف بهبود کارایی مدل نهایی M، مجموعه‌ای از K مدل (کلاسه‌بند یا پیش‌بینی‌کننده39) شامل را ترکیب می‌کنند[20].

تعاریف مفاهیم اولیه
کلاسه بند: فرآیند پیدا کردن یک مدل (یا یک تابع) که قابلیت توصیف داده‌ای که توسط آن آموزش دیده را دارد، می‌باشد. در نهایت از این مدل می‌توان برای پیش‌بینی کلاس مربوط به نمونه‌هایی که برچسب40 کلاس آنها مشخص نیست، استفاده کرد. مدل بدست آمده می‌تواند با فرم‌های متفاوتی از جمله قوانین کلاسه بندی (IF-THEN)41 ، درخت های تصمیم‌گیری، فرمول‌های ریاضی42، شبکه های عصبی و … ارائه شود [20].
درخت تصمیم‌گیری: در واقع یک ساختار درختی شبه فلوچارت43 می‌باشد که هر گره44ی تصمیم، نمایانگر یک تصمیم‌گیری روی مقادیر یک ویژگی است و هر شاخه45 بیانگر نتیجه آن تصمیم‌گیری است. همچنین برگ46های یک درخت، برچسب کلاس‌ها یا توزیع‌های کلاسی47 را نشان می‌دهند .[20]
شبکه عصبی مصنوعی: یک مدل ریاضی الهام گرفته از شبکه عصبی انسان است که از گروه‌هایی از نِرون‌های48 مصنوعی تشکیل شده است. اساس محاسبات در این روش بر مبنای اتصال بهم پیوسته49 چندین واحد پردازشی می‌باشد و می‌تواند ساختار خود را در طی مرحله یادگیری تغییر دهد که این موضوع را با تنظیم وزن50 اتصال‌ها انجام می‌دهد [26].
پیش‌بینی کننده: بر خلاف کلاسه‌بند که برچسب‌های گسسته51 را پیش‌بینی می‌کند، پیش‌بینی‌کننده، توابع با مقادیر پیوسته52 را مدل می‌کند، یعنی به جای برچسب کلاس، مقادیر عددی53 را پیش‌بینی می‌کند.

Written by 

دیدگاهتان را بنویسید