یک مقاله معتبر در زمینه سیستم های توصیه

به منظور دانلود موارد مشابه به اینجا مراجعه کنید.

چند وقت پیش یکی از مشتریانم لطف کرد و ترجمه قسمتی از این مقاله (A web recommendation system considering sequential information) ((((دانلود کنید))))  را در اختیار من قرار داد و اجازه داد در اختیار همه قرار بدم. دقت کنید هدف من از گذاشتن این مطالب اینه که دوستان عزیز بتونن عین برخی از کاربران که با من کار می کنن به راحتی کار کنن و بیان و مشکلاتی که دارن بیان کنن و ادبیات مقالات رو بیشتر درک کنند.

برای دریافت پیاده سازی این مقاله با من یا از طریق ایمیلم یا از طریق آی دی تلگرامم Research_moghimi@ در ارتباط باشید

معماری سیستم پیشنهاد دهنده

به طور کلی یک سیستم پیشنهاددهنده مبتنی بر تشخیص الگو شامل دو فاز است. فاز اول خوشه بندی که با دسته بندی انجام می شود.. در فاز اول سیستم با یادگیری همراه است. بنابراین دقت دسته بندی (classification) سیستم بسیار بالا ویا در سطح مناسبی است. بعد از یادگیری سیستم،یک مجموعه ای از پیشنهاد ها با رتبه های مناسب تولید می شود.

در سیستم ما ، ابتدا خوشه­ها را برای بدست آوردن دانش در مورد کاربران وب  تشکیل دادیم و از تکنیک دسته بند برای بالا بردن توان یادگیری برای  تولید پیشنهادها استفاده کردیم. یک کاربر وب ممکن است در چندین خوشه قرار داشته باشد، بناربراین ما از الگوریتم خوشه بندی مبتنی بر upper approximation (شباهت تقریبی بالا)  استفاده کردیم. به عبارت دیگر برای بدست آوردن رفتار ترتیبی کاربر در هنگام تشکیل خوشه­ها از معیار شباهت s3m بهره گرفته ایم.

Soft clusters خوشه های نرم، اجازه می دهند عناصر در بیش از یک خوشه ظاهر شوند. این به این معنی است یک data point  می تواند ویژگی های که در بیش از یک خوشه وجود دارد، را نمایش دهد. یک مرتبه خوشه ها تشکیل می شوند، برای دسته بندی نشست های کاربر از SVD(تجزیه مقدار تکیین) بهره گرفته ایم.

در شکل ۱ معماری کلی سیستم را مشخص کرده ایم. در فاز اول داده ها از لاگ های وب جمع آوری شده اند. بعد از جمع آوری داده ها، پیش پردازش انجام شده است. و سپس خوشه بندی. در ماژول خوشه بندی، هر دنباله ای به عنوان یک data point در نظر گرفته می شود و همه point ها در چندین گروه با استفاده از یک مجموعه بزرگ مبتنی بر الگریتم خوشه بندی که خوشه های نرم تولید می کند، خوشه بندی می شوند. پس از خوشه بند، برای هر کاربر جدید پیشنهادهایی تولید می شود.

M تا خوشه های بالا  بر اساس شباهت بین کاربر و مرکز خوشه مشخص می شود. ماتریس پاسخ با توجه به m  خوشه ی بالا  بوحود می آید. یک بردار وزن که با استفاده از SVD پر می شود، ساخته می شود. پیش بینی های تولید شده با مقدارهای واقعی مجموعه داده ها  برای اندازه گیری دقت پیش بینی،مقایسه می شوند.

۱-۳- خوشه بندی نشست کاربر

کاربران با استفاده از الگوریتم خوشه بندی و معیار شباهت، گروه بندی می شوند.ما از یک الگوریتم خوشه بندی، برای خوشه بندی بهره گرفته ایم. خوشه بندی بر اساس شباهت موجود بین کاربران انجام می شود . معیارهای شباهت برای تخمین شباهت بین اشیاء استفاده می شود. معیارهای شباهت مبتنی بر محتوا،شباهت محتوا میان کاربران را تخمین می زنند در حالیکه معیارهای شباهت دنباله ای،شباهت دنباله ای(ترتیبی) بین کاربران را تخمین می زنند.  معیارهای شباهت ژاکارد و دایس نمونه ای از معیارهای شباهت مبتنی بر محتوا هستند در حالیکه فاصله Levensthin، طولانی ترین زیر دنباله مشترک (LCS) و فاصله همینگ نمونه ای از معیارهای شباهت / فاصله مبتنی بر دنباله است. ترکیبی از محتوا و دنباله مبتنی بر معیارهای شباهت، باعث می شود در معیارهای شباهت ترکیبی، محتوا و دنباله ی شباهت میان کاربران بدست بیاید. در کار ما،  ما از معیارهای شباهت ترکیبی در طول خوشه بندی بهره گرفته ایم.

S3M یک معیار شباهت است،یک ترکیب خطی از معیار شباهت ژاکارد و معیار شباهت دنباله ای که با اندازه گیری طول طولانی ترین زیر دنباله مشترک(LLCS)  بدست می آید. ما برای بدست آوردن خوشه های نرم از شباهت upper approximation بهره گرفته ایم.

UN(نماینگر مجموعه جهانی)  یک مجموعه غیر خالی و شامل n نشست کاربر است. {x1,x2,…xn} هر نشست کاربر شامل صفحه وب ملاقات شده است.

خوشه بندی با استفاده از شباهت تقریبی بالا

D یک ماتریس شباهت است[Dij] =µ(xi, xj).شباهت بین نشستهای کاربر وب xi و xj را نشان می دهد.

شباهت بین نشست های کاربر با معیار S3M  محاسبه می شود. ماتریس شباهت یکبار با استفاده از شباهت تقریبی بالا محاسبه می شود.

اگر دو مجموعه A و B باشد تنها یک مجموعه را در نظر می گیریم {آخر ص ۴ و  اولین پاراگراف ص۵ (متوجه نشدم)} (این رو از قصد حذف نکردم تا دوستان متوجه بشن قرار نیست تمام مقاله رو متوجه بشن، هر چیزی که متوجه نشدید برای من بفرستید کمکتون می کنم)اگر مجموعه A زیر مجموعه ی B باشد، انگاه فقط مچموعه Bدر نظر گرفته می شود.

با این حال، خانواده ای از مجموعه خوشه ها به علت عناصر مشترک در مجموعه های مختلف احتمالا، یک شبه پارتیشن است. به منظور داشتن یک گروه واقعی، لازم است جهان هستی(universe) پارتیشن بندی شود.در این چنین پارتیشن بندی، یک عنصر باید دریک پارتیشن باشد.

بعد از ایجاد خوشه ، با توجه به اولین شباهت تقریبی بالا،یک نشست کاربر عضو یک یا چند گروه خواهد بود. به این چنین اشیایی، میتوان به عنوان اشیای مبهم اشاره کرد. این مجموعه، از اشیائ مبهم، خوشه های نرم را تشکیل می دهند.تقریبی پایین تر، مجموعه ای از کاربران وب است که قطعا متعلق به خوشه هستند.

ما الگوریتمی را برای خوشه بندی  دنباله ای داده ها با استفاده از شباهت تقریبی بالا مشخص کرده ایم.

Algorithm_Elsevier

در روش شباهت تقریبی  بالا δ€(۰,۱] برای هر عنصر در نظر گرفته می شود.

روش S3M

توضیحات مختصر در متن داده شده است ولی شامل چند رابطه است

رابطه ۱

Algorithm_Elsevier02

جدول زیر با توجه به الگوریتم بالا بدست آمده است.

Algorithm_Elsevier03

به نظر می رسد درایه ها باs8, توجه به گام اول Sim(x1,X2)    بدست آمده است.

در گام دوم آستانه        ۰٫۲=δ در نظر گرفته می شود پس

R1= S1,S5,S6

  R2= S2,S4

   R3= S3,S6,S7,S8,S9,S10

  R4= S2,S4,S7,S8,S9,S10

  R5= S1,S5

R6= S1,S3,S6,S8

  R7= S3,S4,S7,S8,S10

  R8= S3,S4,S6,S7,S8,S10

  R9=S4,S9,S10

  S10=S3<S4,S7,S8,S9,S10

 در گام سوم، در تقریب اول، تعدادی زیر مجموعه وجود دارد(بیش از حد است) از این رو در این مرحله حذف می شود و مجموعه ای از عبارات زیر را می دهد.R(1)= S1,S5,S6  R(4)=S2,S4,S7,S8,S9,S10  R(6)=S1,S3,S6,S8  R(8)=S3,S4,S6,S7,S8,S10  R(10)= S3,S4,S7,S8,S9,S10

بعد از گام سوم تنها S1,S4,S6,S8,S10  بافی می مانند که به عنوان مرکز خوشه در نظر گرفته می شوند.

در گام ۴ مرکز خوشه از دیگر خوشه ها حذف می شود.بعد از حذف مجموعه ها به این صورت می شود:

{{۱,۵},{۴,۲,۷,۹},{۶,۳},{۸,۳,۷},{۱۰,۳,۷,۹}}  اعدادی که به رنگ قرمز هستند مرکز خوشه رانشان میدهند

۲-۳- دسته بندی نشست های وب

پس از تولید خوشه ها، برای کاربر جدید ماتریس پاسخ ساخته می شود.در این مرحله از دیتاست MSNBC استفاده شده است. متوسط طول هر نشست کاربر ۵٫۷ است، بنابراین ما از نشست هایی استفاده می کنیم که طول آن ها ۶ است. شباهت بین کاربر جدید و مراکز خوشه با استفاده از الگوی ترتبیشان با طول ۵ محاسبه شده است و سیستم پیشنهاد دهنده ما ششمین صفحه ملاقات شده را پیش بینی خواهد کرد. M  خوشه مشابه برای ساخت ماتریس پاسخ(A) انتخاب می شود.هر سطر این ماتریس شامل ۱۷ ستون است(در MSNBC، ۱۷ نوع یا دسته وجود دارد)

در ماتریس پاسخ A، بردار سطر در ماتریس پاسخ A مربوط می شود به اولین خوشه a1،  m امین خوشه با بردار am نمایش داده می شود.M کلاستر، M سطر از ماتریس A را تولید می کنند

(این قسمت را اگه می شه در مقاله ملاحظه کنید)

۳-۳ پیشنهاد برای کاربر وب

گام بعد از ساختن ماتریس پاسخ A ، ساختن بردار وزن برای کاربران جدید است.این مرحله با مثال مشخص شده است.الگوی متوالی یک کاربر برای اولین بار، ۵ صفحه {۳,۸,۷,۵,۱} ملاقات کرده است.وزن هر صفحه یا دسته i که توسط کاربر در موقعیت j بازدید کرده است، به نام Wijشناخته شده است. و می تواند به صورت زیر محاسبه شود

Algorithm_Elsevier04

که |Vij| = تعداد دفعاتی که صفحه i در موقعیت j  ام قرار دارد.

|vi| = تعداد دفعاتی که صفحه i در تمام موقعیت ها قرار دارد.

محاسبه wij با مثال زیر توضیح داده شده است.T1,T2,T3,T4 چهار دنباله با طول ۶ هستند.

T1= 3,7,8,3,1,9   T2= 5,8,3,5,4,8  T3= 7,1,8,13,2,6  T4= 5,15,7,13,2,6

دنباله صفحات ملاقات شده کاربر جدید{۳,۸,۷,۵,۱} وزن صفحات در مکان های متفاوت به صورت زیر تکمیل می شود:

Algorithm_Elsevier05

برای صفحه بعدی ملاقات شده، وزنWk6 محاسبه می شود. با توجه به این دیتاست k={1,2,3,…,۱۷}. یک بردار P1  به طول ۱۷ برای کاربر جدید ساخته می شود. ورودی های این بردار، به وزن صفحه مربوط می شود.

P1= {0.5,x,0.33,x,0.33,x,0.33,0.25,x,x,x,x,x,x,x,x,x  ورودی های نا شناخته با x مشخص شده اند

پیاده سازی زنجیره های مارکوف، زنجیره مارکوف، زنجیره های مارکوف، پیاده سازی مقاله، پیاده سازی مارکوف، پیاده سازی زنجیره های مارکوف

 

Add a Comment

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *


پاسخ من را به ایمیلم ارسال کن

مشاوره می خواهید؟ ما همیشه آنلاین هستیم. در هر حوزه ای در تلگرام یا واتس آپ با شماره تلفن 09367938018 ارتباط بگیرید
+