Wordlist em Português

Estava precisando hoje de algo que não tinha visto antes: uma wordlist com palavras em Português! Arrumar uma lista de palavras em inglês ou outras línguas até, como hungaro foi até simples, mas em Português realmente estava muito difícil. Parei para pensar um pouco sobre como obter uma boa lista de palavras em nosso idioma. Qual a maior fonte de palavras em Português que conheço e que esteja disponível gratuitamente na Internet? BrOffice.org! Creio que não haja nenhum outro projeto aberto que tenha conseguido realizar uma listagem tão grande quanto à do projeto brasileiro do OpenOffice.org. A lista de palavras do BrOffice.org pode ser baixada em aqui.

Após ter obtido o arquivo, é necessário extrair seu conteúdo e realizar alguns procedimentos:

  • Instalação do pacote ispell, caso sua distro ainda não possua. Utilizando Fedora Core 6, passei por um problema, pois existe um outro pacote (aspell) que substitui o antigo ispell. Porém, o aspell não possui o binário buildhash, necessário para a compilação das palavras.
  • Compilação das palavras através do comando “make palavras” que pode ser executado na raiz do pacote descompactado.

Após estes passos, será gerado um novo arquivo chamado “palavras.ispell” contendo 261799 palavras, com verbos e adjetivos e substantivos. Esta lista pode ser facilmente unida à wordlist criada anteriormente em outro post. Para unir, basta o comando abaixo.

$ cat palavras.ispell wordlist.txt | sort | uniq > grandelista.txt

Após isto, agora temos uma wordlist com dois idiomas contendo quase 600 mil termos! Acho que com isso já me serve no momento! 🙂

Até mais! 😀

62 comentários sobre “Wordlist em Português

  1. Avatar
    ThigU disse:

    Essa wordlist é útil para a realização de ataques do tipo “brute force” onde é necessário uma boa base de palavras para realizar testes de sucesso e falhas.

    Tchau!

  2. Avatar
    supertux disse:

    podiam mandar o ficheiro final por mail ?
    é que nem uso linux de momento , poupava mesmo muito trabalho.
    se for possivel pra alguem , mandem para o endereço :
    pedroleonelsilva@ gmail.com

  3. Avatar
    ThigU disse:

    Me desculpem, mas não posso ficar enviando as wordlists para todos! Se realmente elas forem necessárias, sigam os procedimentos que já passei nesta página. Caso encontrem problemas, aí sim venham aqui e digam o que os atrapalhou.

    Até mais!

  4. Avatar
    Renan disse:

    Bom dia!
    Procurei em diversos lugares os wordlist em portugues mas não consegui.
    Cheguei a baixar o arquivo que vc disse porem vi que é para linux.
    Eu não tenho ele aqui.
    Tem como você enviar para meu email ou fazer um upload para esses sites que hospedam arquivos de graça e postar o link aqui ?

    Meu email é:
    renanmelo.rj@gmail.com

    Se puder me ajudar irei ficar muito grato.

    Parabéns pelo post !

    Abraços

  5. Avatar
    Addy disse:

    ora viva!!!
    ja vi que este post aqui é brutal msm…
    mas oh man,eu neste momento não tou a correr linux,mas sim ttou com BackTrack 3 beta a correr,gostaria de saber se dá pa fazer este wordlist…
    senão,plz…ja vi que tás cansado de mandar mas,faria um grande favor pra min

    abraços
    meu mail é:

    adilsol1@hotmail.com

  6. Avatar
    Rodrigo disse:

    Meu Deus…
    qual a dificuldade de alguém colocar isso num 4shared ou rapidshare?

    se for o caso eu coloco lá… isso é de uma utilidade muito grande a muita gente…

    Por favor

  7. Avatar
    Pedro Malta disse:

    Grande Thigu, adorei, seu blog, cheguei aki procurando uma wordlist pra dar um jeito nos wpa handshakes q eu capturei aki na minha rede!

    Consegui compilar a lista, mas todas as palavras com “ç” deram erro, não é muito importante porque eu acho q ninguém poe senha com cedilha, mas pra efeito vc sabe porque??

    Cara, mas a minha pergunta mesmo é outra, vc tem ideia de como eu faria para excluir as palavras com menos de 8 caracteres?

    Abraços! vou continuar te lendo!

  8. Avatar
    Tibundo disse:

    Poe]w eu quero sabe pra que serve Word List pq to precisando pra pode faze alguma mudanças aki.lguem poderia me ajuda e manda o Link pra min Baixar aki Em Casa.

    Fiko Grato pela ajuda. =D

  9. Avatar
    André disse:

    Muito bom o artigo, mas como vimos, muitos ainda não tem linux instalado no pc. Não teria como tu disponibilizar este arquivo para download? Qualquer coisa me avise. Abraço

  10. Avatar
    waldison disse:

    Ola!!!

    Se alguem puder estar me disponibilizando esta wordlist ficaria muito satisfeito pois jah estou ah varios dias tentando encontrar uma em portugues e nada por favor me ajudem

  11. Avatar
    Will disse:

    Não se iludam com este tipo de ataque Brute Force!
    Somente uma pessoa ingênua ou iniciante usa uma simples palavra ou frase curta como senha…
    Basta dar uma fuçada nas configurações de QUALQUER roteador sem fio e encontrar a opção de segurança WPA2-PSK, que oferece uma senha tipo [ q2w3-d3fg-tr21-qpmz ]!
    Será que um ataque do tipo palavras de dicionário funciona com uma senha dessas?!
    Acho que não…

  12. Avatar
    RafaelC457ro disse:

    Voce consegue gerar uma wordlist com o br-ispell mais atualizado? No caso o br.ispell 3.0 beta4?Estou usando o ubuntu ja instalei o gawk via repositorio…instalei i ispell tb.Mas nao consiguo fazer o

    $make formas
    para gerar o arquivo formas com a wordlist.
    retorna o seguinte erro:

    ./fl -l >br.ispell.tmp
    formato inv�lido (vogal n�o normalizada: w=, y= (apoi:ap))
    make: ** [br.ispell] Erro 1

    se puder ajudar…

  13. Avatar
    Carla de Oliveira Camargo disse:

    To usando o Xubuntu aqui, instalei o ispell e checkei e o aspell ja ta instalado tbm.
    Quando vou na raiz do br.ispell que vc forneceu o link, abro o terminal la e dou o make palavras, mas o palavras.ispell nao eh gerado de maneira alguma.
    Quando rodo o comando make, essas sao as duas ultimas linhas
    /bin/sh: 1: /usr/bin/gawk: not found
    make: ** [v.ispell] Erro 1

    Valeu pela ajuda desde ja

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *