نرمال سازی متن فارسی برای استفاده در جستجو وبسایتها
پکیج نوشته شده برای نرمال سازی متون فارسی برای ذخیره متن در دیتابیس و همچنین بخش جستجو کاربران کاربرد دارد.
با استفاده از این پکیج میتوانید تجربه کاربری را بهبود ببخشید و نتایج بهتری به کاربر نشان بدهید.
EasyPersianNormalizer
EasyPersianNormalizer یک نرمالساز متن فارسی است.
فهرست مطالب
1. مرور کلی
EasyPersianNormalizer یک نرمالساز متن فارسی است که برای پاکسازی و استانداردسازی متون فارسی طراحی شده است.
2. ویژگیهای کلیدی
1. حذف فاصلههای اضافی
- توضیح: حذف فاصلههای اضافی از ابتدا و انتهای متن
- نوع:
bool - پیشفرض:
true - کاربرد: پاکسازی ورودی کاربر و آمادهسازی برای ذخیره یا پردازش
2. حذف حرکات (اعراب)
- توضیح: حذف اعراب و نشانهگذاریهای عربی
- نوع:
bool - پیشفرض:
true - کاربرد: یکپارچهسازی متون برای جستجو و مقایسه
3. تبدیل “ی” و “ک” عربی به فارسی
- توضیح: استانداردسازی نویسههای عربی به معادل فارسی آنها
- نوع:
bool - پیشفرض:
true - کاربرد: جلوگیری از مشکلات در جستجو و نمایش متن
4. تبدیل فاصله کامل به نیمفاصله
- توضیح: جایگزینی فاصلهی کامل با نیمفاصله جهت نمایش درست
- نوع:
bool - پیشفرض:
true - کاربرد: زیباسازی و خوانایی بهتر متن
5. حذف خط تیرههای اضافی
- توضیح: حذف خط تیرههای غیرضروری
- نوع:
bool - پیشفرض:
true
6. حذف نقطههای اضافی
- توضیح: حذف نقطههای پیدرپی و بیمورد
- نوع:
bool - پیشفرض:
true
7. تبدیل کوتیشن انگلیسی به فارسی
- توضیح: جایگزینی نقلقول انگلیسی
" "با معادل فارسی« »یا“ ” - نوع:
bool - پیشفرض:
true
8. حذف علائم اضافی
- توضیح: حذف نشانههای تکراری مانند
؟یا! - نوع:
bool - پیشفرض:
true
9. حذف کشیده
- توضیح: حذف حروف کشیدهشده (مانند “کــــتاب”)
- نوع:
bool - پیشفرض:
true
10. حذف فاصلهها و خطهای اضافی
- توضیح: حذف خط جدید یا فاصلههای بیمورد
- نوع:
bool - پیشفرض:
true
11. اصلاح فاصله درون و بیرون علائم نگارشی
- توضیح: تنظیم فاصله داخل و بیرون پرانتز، کوتیشن، کروشه و…
- نوع:
bool - پیشفرض:
true
12. حذف نویسههای هگزادسیمال
- توضیح: حذف نویسههای نامرئی یا خرابشده حاصل از کدگذاری نادرست
- نوع:
bool - پیشفرض:
true
13. تبدیل اعداد
- توضیح: تبدیل اعداد فارسی به انگلیسی یا بالعکس
- نوع:
NumberConvertorType - پیشفرض:
ToEnglish - مقادیر مجاز:
ToPersian: تبدیل اعداد به فارسیToEnglish: تبدیل اعداد به انگلیسیNone: بدون تغییر
- کاربرد: پشتیبانی از زبانهای مختلف در ذخیرهسازی یا نمایش
3. نصب
برای نصب پکیج EasyPersianNormalizer از NuGet استفاده کنید:
NuGet Package Manager
Install-Package EasyPersianNormalizer
dotnet add package EasyPersianNormalizer
4. نمونه
var yourText = "این متن من است";
var result = yourText.NormalizerText();
var result1 = yourText.NormalizerText(new NormalizerConfig());
اطلاعات بیشتر: