نرمال سازی متن فارسی برای استفاده در جستجو وبسایتها
پکیج نوشته شده برای نرمال سازی متون فارسی برای ذخیره متن در دیتابیس و همچنین بخش جستجو کاربران کاربرد دارد.
با استفاده از این پکیج میتوانید تجربه کاربری را بهبود ببخشید و نتایج بهتری به کاربر نشان بدهید.
EasyPersianNormalizer
EasyPersianNormalizer
یک نرمالساز متن فارسی است.
فهرست مطالب
1. مرور کلی
EasyPersianNormalizer
یک نرمالساز متن فارسی است که برای پاکسازی و استانداردسازی متون فارسی طراحی شده است.
2. ویژگیهای کلیدی
1. حذف فاصلههای اضافی
- توضیح: حذف فاصلههای اضافی از ابتدا و انتهای متن
- نوع:
bool
- پیشفرض:
true
- کاربرد: پاکسازی ورودی کاربر و آمادهسازی برای ذخیره یا پردازش
2. حذف حرکات (اعراب)
- توضیح: حذف اعراب و نشانهگذاریهای عربی
- نوع:
bool
- پیشفرض:
true
- کاربرد: یکپارچهسازی متون برای جستجو و مقایسه
3. تبدیل “ی” و “ک” عربی به فارسی
- توضیح: استانداردسازی نویسههای عربی به معادل فارسی آنها
- نوع:
bool
- پیشفرض:
true
- کاربرد: جلوگیری از مشکلات در جستجو و نمایش متن
4. تبدیل فاصله کامل به نیمفاصله
- توضیح: جایگزینی فاصلهی کامل با نیمفاصله جهت نمایش درست
- نوع:
bool
- پیشفرض:
true
- کاربرد: زیباسازی و خوانایی بهتر متن
5. حذف خط تیرههای اضافی
- توضیح: حذف خط تیرههای غیرضروری
- نوع:
bool
- پیشفرض:
true
6. حذف نقطههای اضافی
- توضیح: حذف نقطههای پیدرپی و بیمورد
- نوع:
bool
- پیشفرض:
true
7. تبدیل کوتیشن انگلیسی به فارسی
- توضیح: جایگزینی نقلقول انگلیسی
" "
با معادل فارسی« »
یا“ ”
- نوع:
bool
- پیشفرض:
true
8. حذف علائم اضافی
- توضیح: حذف نشانههای تکراری مانند
؟
یا!
- نوع:
bool
- پیشفرض:
true
9. حذف کشیده
- توضیح: حذف حروف کشیدهشده (مانند “کــــتاب”)
- نوع:
bool
- پیشفرض:
true
10. حذف فاصلهها و خطهای اضافی
- توضیح: حذف خط جدید یا فاصلههای بیمورد
- نوع:
bool
- پیشفرض:
true
11. اصلاح فاصله درون و بیرون علائم نگارشی
- توضیح: تنظیم فاصله داخل و بیرون پرانتز، کوتیشن، کروشه و…
- نوع:
bool
- پیشفرض:
true
12. حذف نویسههای هگزادسیمال
- توضیح: حذف نویسههای نامرئی یا خرابشده حاصل از کدگذاری نادرست
- نوع:
bool
- پیشفرض:
true
13. تبدیل اعداد
- توضیح: تبدیل اعداد فارسی به انگلیسی یا بالعکس
- نوع:
NumberConvertorType
- پیشفرض:
ToEnglish
- مقادیر مجاز:
ToPersian
: تبدیل اعداد به فارسیToEnglish
: تبدیل اعداد به انگلیسیNone
: بدون تغییر
- کاربرد: پشتیبانی از زبانهای مختلف در ذخیرهسازی یا نمایش
3. نصب
برای نصب پکیج EasyPersianNormalizer
از NuGet استفاده کنید:
NuGet Package Manager
Install-Package EasyPersianNormalizer
dotnet add package EasyPersianNormalizer
4. نمونه
var yourText = "این متن من است";
var result = yourText.NormalizerText();
var result1 = yourText.NormalizerText(new NormalizerConfig());
اطلاعات بیشتر: