1 دقیقه میانگین مدت زمان مطالعه است

پکیج نوشته شده برای نرمال سازی متون فارسی برای ذخیره متن در دیتابیس و همچنین بخش جستجو کاربران کاربرد دارد.
با استفاده از این پکیج می‌توانید تجربه کاربری را بهبود ببخشید و نتایج بهتری به کاربر نشان بدهید.

EasyPersianNormalizer

EasyPersianNormalizer یک نرمال‌ساز متن فارسی است.


فهرست مطالب

  1. مرور کلی
  2. ویژگی‌های کلیدی
  3. نصب
  4. مثال

1. مرور کلی

EasyPersianNormalizer یک نرمال‌ساز متن فارسی است که برای پاک‌سازی و استانداردسازی متون فارسی طراحی شده است.


2. ویژگی‌های کلیدی

1. حذف فاصله‌های اضافی

  • توضیح: حذف فاصله‌های اضافی از ابتدا و انتهای متن
  • نوع: bool
  • پیش‌فرض: true
  • کاربرد: پاک‌سازی ورودی کاربر و آماده‌سازی برای ذخیره یا پردازش

2. حذف حرکات (اعراب)

  • توضیح: حذف اعراب و نشانه‌گذاری‌های عربی
  • نوع: bool
  • پیش‌فرض: true
  • کاربرد: یکپارچه‌سازی متون برای جستجو و مقایسه

3. تبدیل “ی” و “ک” عربی به فارسی

  • توضیح: استانداردسازی نویسه‌های عربی به معادل فارسی آن‌ها
  • نوع: bool
  • پیش‌فرض: true
  • کاربرد: جلوگیری از مشکلات در جستجو و نمایش متن

4. تبدیل فاصله کامل به نیم‌فاصله

  • توضیح: جایگزینی فاصله‌ی کامل با نیم‌فاصله جهت نمایش درست
  • نوع: bool
  • پیش‌فرض: true
  • کاربرد: زیباسازی و خوانایی بهتر متن

5. حذف خط تیره‌های اضافی

  • توضیح: حذف خط تیره‌های غیرضروری
  • نوع: bool
  • پیش‌فرض: true

6. حذف نقطه‌های اضافی

  • توضیح: حذف نقطه‌های پی‌در‌پی و بی‌مورد
  • نوع: bool
  • پیش‌فرض: true

7. تبدیل کوتیشن انگلیسی به فارسی

  • توضیح: جایگزینی نقل‌قول انگلیسی " " با معادل فارسی « » یا “ ”
  • نوع: bool
  • پیش‌فرض: true

8. حذف علائم اضافی

  • توضیح: حذف نشانه‌های تکراری مانند ؟ یا !
  • نوع: bool
  • پیش‌فرض: true

9. حذف کشیده

  • توضیح: حذف حروف کشیده‌شده (مانند “کــــتاب”)
  • نوع: bool
  • پیش‌فرض: true

10. حذف فاصله‌ها و خط‌های اضافی

  • توضیح: حذف خط جدید یا فاصله‌های بی‌مورد
  • نوع: bool
  • پیش‌فرض: true

11. اصلاح فاصله درون و بیرون علائم نگارشی

  • توضیح: تنظیم فاصله داخل و بیرون پرانتز، کوتیشن، کروشه و…
  • نوع: bool
  • پیش‌فرض: true

12. حذف نویسه‌های هگزادسیمال

  • توضیح: حذف نویسه‌های نامرئی یا خراب‌شده حاصل از کدگذاری نادرست
  • نوع: bool
  • پیش‌فرض: true

13. تبدیل اعداد

  • توضیح: تبدیل اعداد فارسی به انگلیسی یا بالعکس
  • نوع: NumberConvertorType
  • پیش‌فرض: ToEnglish
  • مقادیر مجاز:
    • ToPersian: تبدیل اعداد به فارسی
    • ToEnglish: تبدیل اعداد به انگلیسی
    • None: بدون تغییر
  • کاربرد: پشتیبانی از زبان‌های مختلف در ذخیره‌سازی یا نمایش

3. نصب

برای نصب پکیج EasyPersianNormalizer از NuGet استفاده کنید:

NuGet Package Manager

Install-Package EasyPersianNormalizer
dotnet add package EasyPersianNormalizer

4. نمونه

var yourText = "این متن من است";

var result = yourText.NormalizerText();
var result1 = yourText.NormalizerText(new NormalizerConfig());

اطلاعات بیشتر:

EasyPersianNormalizer Nuget
EasyPersianNormalizer Github