> daitch | mokotoff | soundex <
// D-M Soundex - algoritmo de codificação fonética avançado para nomes judeus e do Leste Europeu
Múltiplos códigos
Gera vários códigos para pronúncias ambíguas.
Códigos de 6 dígitos
Códigos numéricos de 6 dígitos consistentes para todos os nomes.
Nomes judeus
Otimizado para padrões de nomes em iídiche e hebraico.
>> informações técnicas
Como funciona o Daitch-Mokotoff
Daitch-Mokotoff Soundex, criado em 1985 por Gary Mokotoff e Randy Daitch, é uma versão aprimorada do Soundex americano, projetada especificamente para sobrenomes judeus e do Leste Europeu. Ao contrário do Soundex tradicional, que produz apenas um código, o D-M pode gerar vários códigos para refletir diferentes pronúncias possíveis, o que é especialmente importante para nomes transliterados do hebraico, iídiche, polonês, russo e alemão.
Por que usar Daitch-Mokotoff
- Pesquisas de genealogia judaica
- Correspondência de sobrenomes do Leste Europeu
- Bancos de dados de sobreviventes do Holocausto
- Pesquisa em registros de imigração
- Correspondência de nomes em transliterações multilíngues
Exemplos de D-M Soundex
Variações de sobrenomes judeus:
Variações de Cohen:
Cohen → 560000
Cohn → 560000
Kohn → 560000
Kahn → 560000
Kagan → 556000
Variações de Moskowitz:
Moskowitz → 645740
Moscowitz → 645740
Moskovitz → 645740
Moskovich → 645740
Exemplo de múltiplos códigos:
Auerbach → [097500, 097400]
AU → 0 ou 7
Gera dois códigos
Pontos principais:
- CH → 5 ou 4 (dependendo do contexto)
- CK → 5 ou 45
- Vogais iniciais → 0
- DZ, DZH, DZS → 4
- TSH, TZH → 4
>> perguntas frequentes
O que é Daitch-Mokotoff Soundex?
Daitch-Mokotoff Soundex é um sistema de codificação fonética criado em 1985 especificamente para sobrenomes judeus e do Leste Europeu. Ele aprimora o American Soundex ao lidar melhor com variações de grafia comuns em nomes transliterados do hebraico, iídiche, polonês, russo e alemão.
Por que ele gera vários códigos?
D-M Soundex gera vários códigos porque muitas combinações de letras podem ser pronunciadas de maneira diferente dependendo da língua de origem. Por exemplo, "CH" é pronunciado de forma distinta em "Bach" (alemão) e "Chair" (inglês). Vários códigos garantem correspondências mesmo quando a pronúncia original é desconhecida.
Em que ele é diferente do American Soundex?
D-M Soundex usa códigos numéricos de 6 dígitos (em vez de 4 caracteres), trata muitas combinações adicionais de letras, gera múltiplos códigos para casos ambíguos e é otimizado para padrões de nomes judaicos e do Leste Europeu, que são tratados de forma limitada pelo Soundex americano tradicional.
Onde o D-M Soundex é utilizado?
Ele é amplamente utilizado em bases de dados de genealogia judaica, projetos de memória do Holocausto, registros de imigração, registros de cemitérios e em qualquer sistema que lide com muitos nomes judeus ou do Leste Europeu com múltiplas variantes de grafia e transliteração.