> daitch | mokotoff | soundex <
// D-M Soundex - zaawansowane kodowanie fonetyczne dla żydowskich i wschodnioeuropejskich nazwisk
Wiele kodów
Generuje wiele kodów dla niejednoznacznej wymowy.
Kody 6-cyfrowe
Spójne 6-cyfrowe kody liczbowe dla wszystkich nazwisk.
Nazwiska żydowskie
Zoptymalizowany pod kątem wzorców nazwisk w jidysz i hebrajskim.
>> informacje techniczne
Jak działa Daitch-Mokotoff
Daitch-Mokotoff Soundex, opracowany w 1985 roku przez Gary'ego Mokotoffa i Randy'ego Daitcha, jest ulepszeniem amerykańskiego Soundexu zaprojektowanym specjalnie dla żydowskich i wschodnioeuropejskich nazwisk. W przeciwieństwie do klasycznego Soundexu, który generuje pojedynczy kod, D-M może tworzyć wiele kodów, aby uwzględnić różne możliwe wymowy, co jest szczególnie ważne w przypadku nazwisk transliterowanych z hebrajskiego, jidysz, polskiego, rosyjskiego i niemieckiego.
Dlaczego warto używać Daitch-Mokotoff
- Badania genealogii żydowskiej
- Dopasowywanie wschodnioeuropejskich nazwisk
- Bazy danych ocalałych z Holokaustu
- Przeszukiwanie rejestrów imigracyjnych
- Dopasowywanie nazw w wielojęzycznych transliteracjach
Przykłady D-M Soundex
Wariacje nazwisk żydowskich:
Warianty nazwiska Cohen:
Cohen → 560000
Cohn → 560000
Kohn → 560000
Kahn → 560000
Kagan → 556000
Warianty nazwiska Moskowitz:
Moskowitz → 645740
Moscowitz → 645740
Moskovitz → 645740
Moskovich → 645740
Przykład wielu kodów:
Auerbach → [097500, 097400]
AU → 0 lub 7
Daje dwa kody
Kluczowe zasady:
- CH → 5 lub 4 (w zależności od kontekstu)
- CK → 5 lub 45
- Samogłoski początkowe → 0
- DZ, DZH, DZS → 4
- TSH, TZH → 4
>> najczęstsze pytania
Czym jest Daitch-Mokotoff Soundex?
Daitch-Mokotoff Soundex to system kodowania fonetycznego stworzony w 1985 roku specjalnie dla żydowskich i wschodnioeuropejskich nazwisk. Ulepsza American Soundex, lepiej radząc sobie z typowymi wariantami pisowni nazwisk transliterowanych z hebrajskiego, jidysz, polskiego, rosyjskiego i niemieckiego.
Dlaczego generuje wiele kodów?
D-M Soundex generuje wiele kodów, ponieważ wiele kombinacji liter może być wymawianych różnie w zależności od języka źródłowego. Na przykład „CH” brzmi inaczej w niemieckim „Bach” i w angielskim „Chair”. Wiele kodów zapewnia poprawne dopasowania nawet wtedy, gdy oryginalna wymowa nie jest znana.
Czym różni się od American Soundex?
D-M Soundex używa 6-cyfrowych kodów numerycznych (zamiast 4 znaków), obsługuje znacznie więcej kombinacji liter, generuje wiele kodów dla przypadków niejednoznacznych i jest specjalnie dostosowany do wzorców nazwisk żydowskich i wschodnioeuropejskich, z którymi tradycyjny American Soundex ma problemy.
Gdzie stosuje się D-M Soundex?
Jest szeroko stosowany w bazach danych genealogii żydowskiej, projektach upamiętniających Holokaust, rejestrach imigracyjnych, rejestrach cmentarzy oraz innych systemach pracujących z dużą liczbą żydowskich i wschodnioeuropejskich nazwisk o wielu wariantach pisowni i transliteracji.