جدول۳-۴ عبارات که حاوی کلمات عامیانه هستند. با انجام پیش پردازش، عبارات اصلاح شده و به فرم قابل مشاهده در جدول تبدیل میشوند.
عبارت حاوی کلمات عامیانه و فاصلههای نامنظم | عبارت پیش پردازش شده با تنظیم فاصلهها و تبدیل کلمات به فرم رسمی |
آخرین ایرادی که این گوشی داره حافظه ی داخلیه کمیه که داره | آخرین ایرادی که این گوشی دارد حافظهی داخلی کمی هست که دارد |
افتضاس | افتضاح است |
یه کم سنگینه | یک کم سنگین است |
روش پیشنهادی شامل پنج فاز اصلی میباشد، که در شکل (۱) قابل مشاهده هستند. همانطور که در شکل مشخص شده، ورودی تحلیلگر احساس مجموعهای از اسناد هستند، در ابتدا همه اسناد پیشپردازش میشوند تا به قالب مناسب برای تحلیل در فازهای بعدی تبدیل شوند. پس از انجام پیشپردازشها با بهرهگیری از کتابخانه Persian POS Tagger برچسب POS کلمات را به متن اضافه میکنیم. در فاز دوم روش پیشنهادی، خصیصههای مورد نیاز از متن استخراج میشوند، سپس با ترکیب کردن خصیصهها، بردار خصیصههای را تشکیل میدهیم، با داشتن بردار خصیصهها باید هر سند را بصورت یک بردار خصیصه نمایش دهیم. در پایان نیز خصیصههای سودمند را انتخاب میکنیم و عملیات طبقهبندی را انجام میدهیم.
شکل۳-۸ شمای کلی روش پیشنهادی.
-
-
-
-
-
- ریشه یابی و برچسبگذاری نقش کلمات
-
-
-
-
برای ریشهیابی و برچسبگذاری نقش کلمات از نرم افزار برچسب گذاری نقش کلمات فارسی دانشگاه فردوسی مشهد[۳۰] استفاده شدهاست. این نرم افزار توسط تیم پردازش زبان طبیعی دانشگاه فردوسی مشهد طراحی و پیادهسازی شد. شکل۳-۹ یک مثال از عملکرد این نرم افزار را نشان می دهد.
ریشه یاب و برچسب گذار نقش کلمات فارسی
البته<ADV> تنها<ADV> بدی<N> که<SUBR> داشت<V> که<SUBR> البته<ADV> دی<N> کالا<N> هم<ADV> به<PREP> آن<PREM> اشاره<N> کرد<V> یک<PRENUM> کیفیت<N> پایین<ADJ> فیلم<N> آن <PR> است<V>
شکل۳-۹ برچسب گذار زبان فارسی: در این شکل یک مثال از عملکرد ریشهیابی و برچسبگذاری کلمات فارسی را میبینیم، خروجی به این شکل تولید میشود: ابتدا ریشه هر کلمه مشخص میشود سپس به هر کلمه نقش سخن آن اضافه شده و کلمه-POS مطابق شکل تولید میشود.
البته تنها بدیهایی که دارد که البته دیجی کالا هم به آنها اشاره کرده یکی کیفیت پایین فیلمبرداری آن است . . .
تعداد زیاد خصیصهها در متون از جمله مشکلات مطرح در تحلیل احساسات و عقاید موجود درمتن برای همه زبانها است، با ریشهیابی کلمات میتوانیم تعداد خصیصهها را کاهش دهیم. در این تحقیق ابتدا ریشهی کلمات استخراج شد ، و در مرحله بعد برچسب نقش کلمات به متن اضافه شد.