نرمال سازی متن فارسی برای استفاده در جستجو وبسایتها
نرمال سازی متن فارسی برای استفاده در جستجو وبسایتها
پکیج نوشته شده برای نرمال سازی متون فارسی برای ذخیره متن در دیتابیس و همچنین بخش جستجو کاربران کاربرد دارد.
با استفاده از این پکیج میتوانید تجربه کاربری را بهبود ببخشید و نتایج بهتری به کاربر نشان بدهید.
EasyPersianNormalizer
EasyPersianNormalizer یک نرمالساز متن فارسی است.
1. مرور کلی
EasyPersianNormalizer یک نرمالساز متن فارسی است که برای پاکسازی و استانداردسازی متون فارسی طراحی شده است.
2. ویژگیهای کلیدی
1. حذف فاصلههای اضافی
- توضیح: حذف فاصلههای اضافی از ابتدا و انتهای متن
- نوع:
bool - پیشفرض:
true - کاربرد: پاکسازی ورودی کاربر و آمادهسازی برای ذخیره یا پردازش
2. حذف حرکات (اعراب)
- توضیح: حذف اعراب و نشانهگذاریهای عربی
- نوع:
bool - پیشفرض:
true - کاربرد: یکپارچهسازی متون برای جستجو و مقایسه
3. تبدیل “ی” و “ک” عربی به فارسی
- توضیح: استانداردسازی نویسههای عربی به معادل فارسی آنها
- نوع:
bool - پیشفرض:
true - کاربرد: جلوگیری از مشکلات در جستجو و نمایش متن
4. تبدیل فاصله کامل به نیمفاصله
- توضیح: جایگزینی فاصلهی کامل با نیمفاصله جهت نمایش درست
- نوع:
bool - پیشفرض:
true - کاربرد: زیباسازی و خوانایی بهتر متن
5. حذف خط تیرههای اضافی
- توضیح: حذف خط تیرههای غیرضروری
- نوع:
bool - پیشفرض:
true
6. حذف نقطههای اضافی
- توضیح: حذف نقطههای پیدرپی و بیمورد
- نوع:
bool - پیشفرض:
true
7. تبدیل کوتیشن انگلیسی به فارسی
- توضیح: جایگزینی نقلقول انگلیسی
" "با معادل فارسی« »یا“ ” - نوع:
bool - پیشفرض:
true
8. حذف علائم اضافی
- توضیح: حذف نشانههای تکراری مانند
؟یا! - نوع:
bool - پیشفرض:
true
9. حذف کشیده
- توضیح: حذف حروف کشیدهشده (مانند “کــــتاب”)
- نوع:
bool - پیشفرض:
true
10. حذف فاصلهها و خطهای اضافی
- توضیح: حذف خط جدید یا فاصلههای بیمورد
- نوع:
bool - پیشفرض:
true
11. اصلاح فاصله درون و بیرون علائم نگارشی
- توضیح: تنظیم فاصله داخل و بیرون پرانتز، کوتیشن، کروشه و…
- نوع:
bool - پیشفرض:
true
12. حذف نویسههای هگزادسیمال
- توضیح: حذف نویسههای نامرئی یا خرابشده حاصل از کدگذاری نادرست
- نوع:
bool - پیشفرض:
true
13. تبدیل اعداد
- توضیح: تبدیل اعداد فارسی به انگلیسی یا بالعکس
- نوع:
NumberConvertorType - پیشفرض:
ToEnglish - مقادیر مجاز:
ToPersian: تبدیل اعداد به فارسیToEnglish: تبدیل اعداد به انگلیسیNone: بدون تغییر
- کاربرد: پشتیبانی از زبانهای مختلف در ذخیرهسازی یا نمایش
3. نصب
برای نصب پکیج EasyPersianNormalizer از NuGet استفاده کنید:
NuGet Package Manager
1
Install-Package EasyPersianNormalizer
1
dotnet add package EasyPersianNormalizer
4. نمونه
1
2
3
4
var yourText = "این متن من است";
var result = yourText.NormalizerText();
var result1 = yourText.NormalizerText(new NormalizerConfig());
اطلاعات بیشتر: