O LEX-BR-Ius: arquitetura e decisões na compilação de um corpus representativo das leis federais brasileiras.
Keywords:
LEX-BR-Ius, Corpus, Legislação Federal Brasileira, Arquitetura, MetodologiaAbstract
O artigo apresenta o LEX-BR-Ius, um corpus representativo das leis federais brasileiras, em fase de compilação. São introduzidas as plataformas de busca das normas legislativas brasileiras e a necessidade da compilação de um corpus para a pesquisa linguística do gênero. Explicamos sobre as diversas espécies normativas presentes na legislação brasileira para descrever as escolhas metodológicas na compilação do corpus. Discutem-se em seguida as etapas de compilação e as decisões em aberto. Os critérios de escolha das normas legais que farão parte do corpus são (a) estar em vigor no momento da coleta; (b) serem textos inteiros, sem recortes, para não interferir em sua textualização e representatividade interna (SINCLAIR, 2004); (c) serem selecionadas com base em sua frequência de uso. O corpus possui marcação textual em Modest XML (HARDIE, 2014), que permite refinar as buscas e cabeçalho em XML com informações precisas sobre cada norma e será disponibilizado também em sua versão com texto limpo e com lematização e anotação morfossintática. São apresentadas algumas possibilidades investigativas a partir dos dados coletados.