دسته بندی متون فارسی و سایر زبا نها
برنامه ی نوشته شده به زبان Java میباشد. کار برنامه، دسته بندی متون فارسی میباشد و این دسته بندی میتواند برای زبانهای دیگر مانند انگلیسی نیز بکار رود. دیتابیس به کار رفته در این برنامه، شامل چندین متن برپسبگ ذاری شده در زمینه های ادبیات، ورزشی، تاریخی، بهداشتی، اقتصادی، دینی، سیاسی و … میباشد. اگر دیتابیسی که برای آموزش لازم را خود کارفرما داشته باشد، میتوان از دیتابیس وی نیز استفاده نمود برای آموزش. این برنام، با گرفتن فایلهای مورد نظر، با استفاده از الگوریتمهای KNN و Naïve Bayes، کار دسته بندی را انجام میدهد. از دیگر کارهای انجام شده میتوان به شباهت دو متن نام برد. با دادن دو متن به زبانهای فارسی، انگلیسی و …، این برنامه، میزان شباهت این دو متن را پیدا میکند. درصد درستی فایلهای دسته بندی شده برای دیتابیسی که در دسترس است، برای تاپیکهای محتلف، میزان متفاوتی میباشد. مثلا برای تاپیک ورزشی، این میزان بالای ۹۰% و برای تاپیکی مانند سیاسی، این میزان حدود ۵۰% است. دیتابیس در دست اجرا، دیتابیسی از چند وبلاگ ایرانی است که موضوع هر یک، با برچسبی مشخص گردیده.
حتما آن را پیشنهاد می کنم از این محصول استفاده کنید. برای دریافت این محصول با ما تماس بگیرید: Research.moghimi@gmail.com یا با آی دی تلگرام بنده به آدرس Research_moghimi@ در ارتباط باشید