> soundex | خوارزمية صوتية | مطابقة تقريبية <
// Soundex - خوارزمية صوتية لفهرسة الأسماء حسب النطق
يعتمد على الصوت
يرمِّز الأسماء بناءً على طريقة النطق وليس التهجئة.
مطابقة تقريبية
يعثر على الأسماء المتشابهة في النطق حتى مع اختلاف الكتابة.
بحث عائلي
أداة أساسية لعلم الأنساب والسجلات التاريخية.
>> معلومات تقنية
كيف يعمل Soundex:
يحتفظ Soundex بالحرف الأول من الاسم ويستبدل باقي الحروف الساكنة بأرقام حسب مجموعات صوتية. تحصل الحروف المتشابهة في النطق على نفس الرقم، وتُهمل الحروف المتحركة، ثم يُقصَّر أو يُملأ الرمز ليطابق الطول المطلوب (4 خانات في American أو طول متغير في Refined).
قواعد الترميز:
1 = B,F,P,V 2 = C,G,J,K,Q,S,X,Z 3 = D,T 4 = L 5 = M,N 6 = R Robert → R163 Rupert → R163 Rubin → R150
لماذا أستخدم Soundex؟:
- >إزالة التكرار في قواعد البيانات
- >بحث الأنساب
- >تحليل بيانات التعداد
- >مطابقة العملاء
- >تصحيح الإملاء
>> أسئلة شائعة
ما هو Soundex؟
Soundex خوارزمية صوتية طُوِّرت عام 1918 لفهرسة الأسماء حسب طريقة النطق. استُخدمت في تعداد الولايات المتحدة لمساعدة الباحثين على العثور على الألقاب ذات النطق المتشابه رغم اختلاف التهجئة.
ما الفرق بين American وRefined Soundex؟
ينتج American Soundex رموزًا مكوّنة من 4 خانات (حرف + 3 أرقام). أما Refined Soundex (المستخدم في SQL Server) فيستخدم مجموعات أرقام أكثر ويُنتج رموزًا بطول متغير لدقة أعلى.
لماذا تحصل تهجئات مختلفة على نفس الرمز؟
هذا هو الهدف من Soundex! فهو يجمع الأسماء ذات النطق المتقارب في نفس المجموعة. على سبيل المثال، Smith وSchmidt يُنطقان بشكل متشابه، لذا يحصلان على رموز متقاربة لتسهيل العثور على المتغيرات في قواعد البيانات.
ما هي حدود Soundex؟
يعمل Soundex بأفضل صورة مع الأسماء الإنجليزية. قد لا يتعامل جيدًا مع الأسماء من لغات أخرى، كما أن بعض الاختلافات الكبيرة في التهجئة قد تؤدي إلى رموز مختلفة لنفس الاسم.