LanguageTool

Tela Software:
LanguageTool
Detalhes de Software:
Versão: 2.9 Atualizado
Data de upload: 14 Apr 15
Revelador: Daniel Naber
Licença: Livre
Popularidade: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool é um programa de código aberto projetado revisão para encontrar erros que ferramentas verificador ortográfico regulares não conseguem detectar. É um estilo e verificador gramatical que vai encontrar erros para que uma regra é definida em seus arquivos de configuração XML, tais como misturando-se & ldquo baseado em regras; seu & rdquo; com & ldquo;. & rdquo lá;


Detecta vários problemas de gramática

O programa também pode detectar vários problemas de gramática e vem com suporte para mais de 20 idiomas, incluindo Inglês, alemão, polonês, francês, espanhol, sueco, grego, chinês, dinamarquês, japonês, islandês, Português e Português do Brasil.
Além disso, ele possui uma interface gráfica fácil de usar, simples e direta que permite a qualquer um colar um texto que precisa ser verificado feitiço. Pode verificar o texto na área de transferência, tag texto, recortar / copiar / colar texto, e residir na área da bandeja do sistema.


Detecta uma ampla gama de problemas

Na caixa de diálogo Opções, você pode permitir que tipo de problemas o aplicativo pode detectar, incluindo um estilo ruim, erros da gramática, gírias, erros de pontuação, possíveis erros de digitação, frases redundantes, comumente palavras confusas, colocações, capitalização, semântica, bem como frases não-padrão.


LanguageTool para LibreOffice e OpenOffice

Além de ser um aplicativo independente, LanguageTool também está disponível como uma extensão para dois dos mais populares e poderosos suítes de escritório open-source, o LibreOffice e OpenOffice.org Apache, permitindo que os usuários para revisar seus textos com o botão direito-on frases selecionadas ou parágrafos.


LanguageTool para o Mozilla Firefox

Além disso, o aplicativo também está disponível para download como um add-on para o mundo & rsquo; s mais popular navegador web de código aberto no mundo, Mozilla Firefox. Ele não requer reinicialização e coloca um pequeno botão na barra de ferramentas principal, permitindo que você revise o texto realçado a partir de sites ou formulários.


Sob o capô e disponibilidade

A aplicação é inteiramente escrito na linguagem de programação Java, o que significa que & rsquo; sa software multi-plataforma, projetada para funcionar com qualquer distribuição GNU / Linux, bem como o BSD, Solaris, Microsoft Windows e Mac OS operacional X sistemas, onde o Java Runtime Environment está instalado.

O que é novo nesta versão:

  • catalão:
  • POS atualizado dicionário tag
  • adicionou novas regras
  • alarmes falsos fixos
  • Inglês:
  • Adicionado algumas regras fixas e alguns alarmes falsos
  • muitas regras novo estilo Adicionado contribuíram por Heikki Lehvaslaiho. Como estes podem causar falsos alarmes, que não são activados por padrão. Você pode ativá-los rodando em todas as regras na nova categoria "Plain Inglês '.
  • Esperanto:
  • acrescentou algumas novas regras
  • French
  • POS atualizado dicionário tag e dicionário Hunspell para Dicollecte-5.3
  • Alemão:
  • acrescentou algumas novas regras e alarmes falsos fixos
  • Adicionado uma nova regra que verifica a existência de concordância sujeito verbo. Por enquanto, apenas os casos com 'ist', 'sind', 'guerra', e 'Waren' são suportados. Exemplo para erros que são detectados: '. Der Hund sind SCHA & Pará; n', 'Die Autos ist Schnell.' Para fazer este trabalho regra, frases estão agora unificadas em disambiguation.xml: por exemplo, 'Mann' na frase 'ein Mann' só vai manter a sua leitura nominativas (SUB: NOM: SIN: MAS), ao passo que costumava ter também leituras acusativo e dativo (SUB: AKK: SIN: MAS, SUB: DAT: SIN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
  • italiano:
  • melhorou algumas regras
  • Polish:
  • acrescentou vários novas regras
  • Português:
  • Adicionado / melhoradas várias regras
  • 3695 palavras compostas (pré-reforma) - o maior banco de dados livre
  • russo:
  • adicionado e melhores regras
  • ucraniano:
  • grande atualização dicionário
  • novas regras gramaticais
  • nova regra para substituir simples sugestões suaves
  • melhorias disambiguator
  • marcação composto de ortografia e melhorias

  • Melhorias
  • iniciais marcação
  • frases e palavras melhorias tokenizing
  • melhorias no processamento de stres símbolo e hífen
  • regras Bitext:
  • acrescentou uma regra simples para verificar se as traduções terminam com a mesma marca de pontuação que o original (o que inclui somente.?! Caracteres).
  • agora é possível adicionar arquivos de regra bitext externos na linha de comando, usando
  • opção -bitextrule. O caminho do arquivo tem de ser absoluta. Nota:. Isto permite usar regras bitext também para as línguas que não têm regras bitext incluídos por padrão
  • Ortografia:
  • Os novos arquivos na /hunspell/spelling.txt pode ser usado para adicionar palavras aceitos para o verificador ortográfico que também são considerados ao criar sugestões de palavras com erros ortográficos. Isto é semelhante aos arquivos /hunspell/ignore.txt, que lista aceites palavras que * não * são usados ​​na criação de sugestões de palavras com erros ortográficos.
  • API:
  • JLanguageTool.activateDefaultPatternRules () e JLanguageTool.activateDefaultFalseFriendRules () foram removidos - todas as regras padrão e regras falso amigo (se uma segunda língua é especificada) está agora activado automaticamente quando o construtor de JLanguageTool é chamado. Se você precisar de um verificador, sem as regras padrão baseados em XML, ampliar a sua aula de língua (por exemplo, 'Inglês') com um que substitui os método getPatternRules () e retorna uma lista vazia lá.
  • ManualTagger.lookup () foi substituído por ManualTagger.tag () depois de ser preterido desde a última versão
  • Todos os métodos estáticos e campos de classe 'Língua' foram movidos para a nova classe 'línguas'. Por enquanto, os métodos / campos na classe Língua ainda existem, mas foram reprovados.
  • LanguageIdentifierTools foi removido. Use LanguageIdentifier vez.
  • Removido (Padrão) ResourceDataBroker.setResourceDir () e setRulesDir () uma vez que estes podem ser definidos com o construtor
  • Limparam-se Colaborador classe, por exemplo, removendo getRemark ()
  • Category.setDefaultOff () foi removido, isso pode ser definido via construtor agora
  • classes renomeados: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
  • Outras pequenas limpezas de API que não deve afetar os casos de uso comuns, por exemplo, IncorrectExample.getCorrections () retorna e lista unmodifiable agora, a remoção de métodos obsoletos.
  • servidor incorporado:
  • escapar XML foi corrigido, isso poderia causar documentos XML inválidos a ser devolvido
  • nova opção de arquivo de configuração 'maxWorkQueueSize' que permite que você defina o tamanho máximo da fila de pedido - se ele fica maior do que isso, as solicitações serão rejeitadas (503 Serviço não disponível)
  • O servidor agora responde com códigos de status HTTP mais específicas para estas condições de erro: 413 Request Entity Too Large - se o texto excede o tamanho máximo do texto 503 Service Unavailable - se de verificação ultrapassa o tempo máximo de verificação
  • GUI:
  • A GUI autônomo pode agora ter um arquivo de texto como um argumento, este arquivo será então carregado no arranque (Github questão # 232).
  • de linha de comando:
  • Agora é possível adicionar um arquivo de regra externa ao chamar LanguageTool a partir da linha de comando. Use --rulefile para adicionar um arquivo. Se o nome do arquivo tem um formato que contém um nome de idioma, ele será usado ao lado de outras regras; caso contrário, ele irá substituir as regras. Você também pode carregar um arquivo externo com falsos amigos usando as --falsefriends opção. O nome do arquivo deve ser um caminho de arquivo absoluto, e arquivos amigo falsos são sempre adicionados aos que são carregados para o idioma. (Github edição # 192)
  • sintaxe Regra:
  • Uma regra pode agora ter um único exemplo sentença, enquanto ele tem um atributo 'correção' - isto pode poupar alguma redundância se a única frase correta é o mesmo que a sentença incorreta com a correção aplicada. Antes, uma regra precisava de pelo menos duas frases de exemplo.
  • "exemplo" elemento: type = "incorreto" agora é opcional, se houver um atributo de "correção". O atributo "correção" implica que a sentença é incorreta.
  • "exemplo" elemento: type = "correta" agora é opcional. Nenhum atributo 'tipo' e nenhum atributo 'correção' implica que a frase está correta.
  • Interno:
  • Mudamos de Apache Tika a linguagem de detector (https://github.com/optimaize/language-detector) para identificar automaticamente o idioma do texto. Deve ser mais rápido e os resultados devem ser mais fiável. Detecção de Astúrias e Galiza teve de ser desativado porque a qualidade de detecção foi muito baixo e também afetou a detecção de espanhol.
  • Corrigido uma regressão que tornou impossível para carregar arquivos de regras externas na GUI.

O que é novo na versão 2.8:

  • asturiano:
  • dependência removido em Hunspell, agora usa Morfologik para verificação ortográfica
  • Breton:
  • acrescentado e melhorado algumas regras
  • catalão:
  • dicionário atualizado
  • adicionado e melhores regras
  • alarmes falsos fixos
  • holandês:
  • adicionados e melhorados muitas regras
  • Inglês:
  • algumas novas regras (graças a Nick Hough)
  • atualizou os Tagger e sintetizador dicionários, que fixa a edição # 202
  • novo filtro para ser usado para combinar o partofspeech de partes de palavras, por exemplo:. Em * Isso só vai manter resultados para palavras que começam com 'em' e onde a parte após o 'em' é um adjetivo (tag POS 'JJ'). O 'NO: 1 "é a posição de sinal, isto é, aqui o primeiro (e apenas) correspondente é referido
  • .
  • Francês:
  • acrescentado e melhorado algumas regras
  • Alemão:
  • acrescentado e melhorado algumas regras
  • Polish:
  • adicionados e melhorados várias regras
  • adicionados e melhorados com falsos amigos Inglês
  • Português:
  • Adicionado / melhoradas várias regras
  • Espanhol:
  • dependência removido em Hunspell, agora usa Morfologik para verificação ortográfica
  • arquivo de regras Reformatado
  • Adicionado mais regras
  • tagalo:
  • dependência removido em Hunspell, agora usa Morfologik para verificação ortográfica
  • o carácter traço ("") é um delimitador de agora, quando tokenizing o texto
  • russo:
  • adicionado e melhores regras
  • acrescentou algumas regras falso amigo (Russo / Inglês)
  • ucraniano:
  • muitas novas regras (incluindo acordo com substantivos, expressões de tempo etc)
  • melhoria da cobertura regra
  • atualização de dicionário (grandes melhorias para nomes próprios e vocativo)
  • novo tag e governar para alertar sobre ortografia alternativa
  • acrescentou informações de freqüência de palavras para melhorar sugestões de ortografia
  • algumas novas regras disambiguator
  • Regra Sintaxe:
  • ... agora pode ser adicionado a uma rulegroup para afetar todas as regras desse grupo
  • Se você desenvolver suas próprias regras que não fazem parte da LT agora você pode adicionar externo = "sim" para as suas categorias para evitar o link regra para community.languagetool.org de aparecer na nossa GUI standalone (o link não funciona regras que não fazem parte da distribuição principal de LT). (Github edição # 223)
  • Se um grupo de regra especifica default = "off", as regras dentro do grupo de regra não pode também especificar default = "on" / "off".
  • API:
  • classes e métodos que haviam sido removidos obsoleto desde 2.7 ou mais
  • servidor incorporado:
  • As opções do arquivo de configuração 'requestLimit' e '' requestLimitPeriodInSeconds agora também pode ser usado para o servidor HTTP (e não apenas para o servidor HTTPS)
  • Nova opção arquivo de configuração 'trustXForwardForHeader': definir isso para 'true' se você executar o servidor atrás de um proxy reverso e quer que o limite de solicitações de trabalhar sobre os endereços IP originais fornecidos pelo cabeçalho HTTP "Xforwardedfor", normalmente definido por o proxy. Se você correr atrás de um proxy, mas não definir a propriedade como true, um usuário pode usar todos os pedidos para que outros usuários também irá receber uma mensagem de erro por causa do limite do pedido.
  • resposta Fix Depois de o modo de Prazo: ... às vezes era vazio, confundindo a verificação de texto em WordPress
  • Bitext regras não foram desabilitados corretamente, mesmo que tenham sido especificado com um parâmetro adequado para o servidor; agora ele é fixo
  • Corrigido o problema com posições impróprias para algumas regras bitext (edição # 218)
  • GUI:
  • Uma nova configuração 'errorColors' foi adicionada ao arquivo de configuração languagetool.cfg. Ele pode ser usado para definir a cor de fundo erros. Por exemplo, errorColors = tipográfico: # b8b8ff, estilo: # ffb8b8 irá mostrar erros tipográficos '' com um fundo azul e erros '' com um fundo vermelho na parte superior da janela do LT. 'Tipográfico' e 'estilo' são os tipos que são definidos em grammar.xml como "type = ...". Não há nenhuma interface de usuário ainda para configurar essas cores. Note que você só deve editar o arquivo languagetool.cfg quando LT não está em execução.
  • Interno:
  • Correção: regras dentro de um grupo de regra não havia sido ativado se uma regra anterior do mesmo rulegroup usado default = "off"
  • As palavras não são mais ignorados pelo corretor ortográfico só porque eles ocorrem em uma sugestão de regra. Se você deseja que o verificador ortográfico para ignorar palavras globalmente, adicioná-los à HunSpell / ignore.txt. Ignorá-las, dependendo do contexto, adicionar uma regra 'ignore_spelling' para disambiguation.xml.
  • Um arquivo 'HunSpell / prohibit.txt' agora pode ser usado para marcar palavras como erros de ortografia, mesmo se o verificador ortográfico normalmente aceitá-los. Isso é útil para melhorar o verificador ortográfico LanguageTool sem esperar que o verificador montante a ser atualizado. O arquivo 'prohibit.txt' é o oposto de 'ignore.txt', o que faz com que o verificador ortográfico para ignorar palavras.
  • O tagger partofspeech para a maioria das línguas pode agora ser estendida adicionando entradas ao arquivo org / LanguageTool / recurso / XX / added.txt (XX sendo o código de linguagem). O formato é "fullform baseform Postag", três colunas separadas por abas. Isso torna mais fácil para os usuários (e desenvolvedores) para estender o tagger POS, como eles não precisam de exportar, modificar e recriar o dicionário de binário para cada mudança.

O que é novo na versão 2.7:

  • Breton:
  • adicionado e melhores regras
  • Nova regra que verifica se um dia da semana corresponde a uma data, por exemplo, detecta "Gwener 28 a Eost viz 2014", em que essa data não é uma sexta-feira.
  • catalão:
  • adicionado e melhores regras
  • alarmes falsos fixos
  • holandês:
  • adicionados e melhorados muitas regras
  • comutada para verificador ortográfico baseado em Morfologik
  • -English:
  • Você quer ser parte da equipe que desenvolve ferramenta de revisão mais poderoso Open Source do mundo? Nós estamos procurando por um mantenedor para as regras inglesas em LanguageTool. Veja http://wiki.languagetool.org/tasks-for-language-maintainers para mais detalhes.
  • Todos os dicionários ingleses foram estendidos para conter classes de frequência de palavras para melhorar as sugestões do corrector ortográfico (os dados de freqüência é feita a partir de https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / imes / Latino / dicionários, como para outros idiomas que já utilizam este recurso).
  • sugestões melhores para estudantes de inglês: verbos irregulares, substantivos e adjetivos agora geralmente têm uma sugestão melhor. Por exemplo, 'thinked' sugere 'pensamento', 'mulher' sugere 'mulheres'.
  • Mais erros ortográficos fornecer sugestões agora, por exemplo, 'Garentee' (garantia), "grato" (grata). Isso pode causar uma diminuição do desempenho de ~ 10% (mais para textos com um monte de palavras desconhecidas).
  • Nova regra que verifica se um dia da semana corresponde a uma data, por exemplo, detecta "segunda-feira, outubro 7, 2014", em que essa data não é uma segunda-feira. Esta regra só vai funcionar se ele detecta o formato da data em uso. Até agora, esses formatos são suportados: * "segunda-feira, outubro 7, 2014" * "segunda-feira, outubro 7, 2014" * "segunda-feira, outubro 7, 2014" * "segunda-feira, outubro 7, 2014" * (isso também funciona com semana abreviado dias como Mo ou Mon para segunda-feira)
  • Esperanto:
  • Nova regra que verifica se um dia da semana corresponde a uma data, por exemplo, detecta "Vendredon la 28-um de AAgusto 2014", em que essa data não é uma sexta-feira.
  • Francês:
  • POS atualizado dicionário tag e dicionário Hunspell para Dicollecte-5.2
  • adicionado um sintetizador - a regra acordo agora pode fazer sugestões para alguns erros
  • Adicionado / melhoradas várias regras
  • Nova regra que verifica se um dia da semana corresponde a uma data, por exemplo, detecta "vendredi 28/08/2014", como aquela data não é uma sexta-feira.
  • Alemão:
  • Corrigido um NullPointerException rara e um ArrayIndexOutOfBoundsException
  • vários alarmes falsos Fixo
  • Adicionado e regras melhoradas
  • Nova regra que verifica a existência de sentenças sem um verbo (desativada por padrão, devido ao risco de falsos alarmes)
  • Nova regra que verifica se um dia da semana corresponde a uma data, por exemplo, detecta "Dienstag, 2014/09/29", em que essa data não é uma terça-feira.
  • Melhorias de desempenho para sugestões de verificação ortográfica
  • Persian:
  • adicionou suporte inicial para persa (farsi)
  • Polish:
  • acrescentado e melhorado algumas regras
  • nova regra que verifica se um dia da semana corresponde a uma data
  • Português:
  • Adicionado / melhoradas várias regras
  • adicionou muitas dezenas de palavras compostas
  • russo:
  • adicionou novas regras
  • corrigir SourceForge pedido a função # 38 (buscar por diferentes aspas)
  • acrescentou algumas regras falso amigo (Russo / Inglês)
  • nova regra que verifica se um dia da semana corresponde a uma data, por exemplo, detecta "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH; & micro; & ETH; & frac12; N & sbquo; N & ?? ETH; & plusmn; N & euro; N ?? 2014 & ETH; & SUP3 ;. ", em que essa data não é uma segunda-feira
  • .
  • regra composto russo expandido com novas palavras de dicionário Postag
  • Espanhol:
  • Adicionado nova categoria POS Z (para números soletrados, por exemplo, 'uno', 'dos', ...)
  • números soletradas agora pode ser detectado e gerenciado tanto em disambiguation e regras.
  • Corrigido alguns lemas incorretas no dicionário POS.
  • Adicionado chunker-disambiguator Hybrid.
  • Tamil:
  • Adicionado suporte inicial para Tamil. Se a fonte de Tamil não é exibido corretamente no seu computador e você estiver usando o Windows, você pode precisar aplicar o trabalho em torno descrito aqui: https://bugs.openjdk.java.net/browse/JDK-8008572
  • ucraniano:
  • grande atualização para o dicionário POS (correções e novas palavras)
  • alguma tag POS renomeado para a consistência; novas tags para abreviaturas e palavras raras
  • muitas novas regras e correções para as regras existentes
  • nova regra que verifica se um dia da semana corresponde a uma data, por exemplo, detecta "& ETH; & ETH; & frac34; & ETH; & frac12; & ETH; & micro; & ETH; 'N & ETH;" & ETH; & frac34; & ETH; & ordm ;, 7 & ETH; & para; & ETH; & frac34; & ETH; & SUP2; 2014 ", em que essa data não é uma segunda-feira
  • melhoria token de desempenho normalização
  • Integração LibreOffice:
  • Não fique confuso com notas de rodapé no LibreOffice 4.3 e posterior (agora nos fornece as posições de nota de rodapé como meta dados, para que possamos ignorá-los).
  • API:
  • As principais melhorias de desempenho para o caso de uso multi-thread, onde JLanguageTool é criado por thread, mas o objeto de língua (por exemplo, 'Alemão') é criado apenas uma vez. Overhead para a criação de JLanguageTool agora deve ser muito menor.
  • Removido várias classes e métodos que haviam sido reprovados desde a versão 2.6
  • DutchSpellerRule Removido - use MorfologikDutchSpellerRule vez
  • A assinatura do Language.getRelevantRules () mudou
  • Os construtores JLanguageTool e MultiThreadedJLanguageTool não declarar a lançar uma IOException mais
  • WhitespaceRule foi renomeado para MultipleWhitespaceRule (WhitespaceRule ainda existe, mas foi preterido)
  • Reprovado alguns métodos cuja visibilidade será reduzida (por exemplo, de público para os protegidos)
  • MorfologikSpellerRule.getRuleMatch (String, int) foi renomeado para MorfologikSpellerRule.getRuleMatches (String, int)
  • O construtor RuleMatch agora lança uma exceção se toPosition não é maior que fromPosition
  • Introduzida uma nova TextLevelRule classe abstrata que estende Regra e que pode ser usado para regras que cobrem mais de sentenças individuais.
  • linha de comando:
  • Activar e desactivar regras específicas, ao mesmo tempo agora é permitido. A fim de testar apenas algumas regras (incapacitantes todo o resto), que anteriormente era feito com "LIST_OF_RULES --enable", agora usam "LIST_OF_RULES --enabledonly --enable" (ou "-eo -e LIST_OF_RULES").
  • servidor incorporado:
  • Duas novas opções podem ser definidas no arquivo de propriedades para fazer LanguageTool retornar o mesmo formato XML como após o prazo (ATD). Desta forma, ele pode ser usado como um substituto para ATD: * modo - 'LanguageTool' ou 'AfterTheDeadline' * afterTheDeadlineLanguage - código de idioma padrão se o modo é definido como 'AfterTheDeadline' NOTA: o modo 'AfterTheDeadline' deve ser considerada experimental para agora.
  • A nova opção 'maxCheckThreads' permite definir o número máximo de threads de trabalho sobre os pedidos em paralelo. O padrão é 10, como costumava ser.
  • Internals:
  • New abstrato regra AbstractDateCheckFilter que permite verificar se uma correspondência dia da semana e data. Por exemplo, "terça-feira setembro 29, 2014" poderia ser detectado, como 29 de setembro de 2014 não é, na verdade, uma terça-feira. Este usa a nova interface RuleFilter experimental que pode ser chamado de XML com o novo elemento 'filtro'. 'Filtro' leva esses atributos: 'classe': o nome totalmente qualificado de uma classe Java que implementa RuleFilter, por exemplo, "org.languagetool.rules.de.DateCheckFilter" 'args': uma string como "ano: um mês: 2 dia: 3 durante a semana: 4", ou seja, uma lista separada por espaço de pares de chave / valor, onde x é resolvido para valor simbólico do padrão (como no elemento 'mensagem')
  • A regra composto agora ignora tokens que foram imunizados no disambiguation.xml
  • A ação "filtro" no disambiguator é agora aplicada apenas a marcas POS que correspondem a tag POS dado. Se eles não corresponderem, a regra não será aplicada.
  • Se você está estendendo as regras XML, conforme descrito no http://wiki.languagetool.org/tips-and-tricks#toc2, os arquivos de regras e de desambiguação externos podem agora ser hospedado em um servidor protegido por senha, especificando uma URL como este: http: // usuário: password@example.org/path/user-rules.xml
  • O travessão ("um & euro;" ") é agora um caráter tokenizing para todos os idiomas
  • Novo recurso:
  • O uso de modelos de linguagem
  • LanguageTool podem agora fazer uso de dados Ngram. Ngram dados de informações sobre a frequência com que ocorrem frases em uma língua. Atualmente, este usa frases de comprimento 3.
  • Os dados são utilizados por uma regra de Inglês para encontrar erros homophone, como misturar-se grosso / curso ou flair / flare. LanguageTool tinha algumas regras desse tipo antes, mas a nova regra agora suporta cerca de 900 de tais pares de palavras / sets.
  • Os dados necessários para isso é enorme (7 GB para o Inglês) e, portanto, não fazem parte ou LanguageTool.
  • Os dados (apenas em Inglês por agora) e mais documentação está disponível em http://wiki.languagetool.org/finding-errors-using-big-data
  • Usando ngrams faz LanguageTool um pouco mais lento quando os dados são armazenados em um SSD.
  • Se não armazenados em um SSD, o desempenho pode diminuir drasticamente.
  • Use a nova opção --languagemodel com o cliente de linha de comando para ativar a regra que usa os dados. Essa opção ainda não está disponível para a GUI autônomo.

O que é novo na versão 2.4.1:

  • bibliotecas Morfologik Atualizado para 1.8.3 para corrigir sugestões lentos no corretor ortográfico, que afetou pelo menos en-US

O que é novo na versão 2.4:

  • Breton:
  • SRX sentença tokenization
  • acrescentou / melhorou algumas regras
  • fixos alguns alarmes falsos
  • fixo sugestões incorretas, graças a testes adicionados sobre as correcções
  • catalão:
  • Adicionado / melhoradas várias regras
  • alarmes falsos fixos
  • feitas adições e correções para o dicionário tagger
  • removido algumas palavras de dicionário de síntese (ver filterarchaic.txt)
  • acrescentou dados de frequência para o dicionário pegador; wordlist frequência vem do projeto Gaia, com Apache License, versão 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • Inglês:
  • acrescentou / melhorou algumas regras
  • fixos alguns alarmes falsos
  • Francês:
  • Adicionado / melhoradas várias regras
  • fixos alguns alarmes falsos
  • Alemão:
  • Adicionado / melhoradas várias regras
  • adicionado um sintetizador a regra acordo agora pode fazer sugestões para alguns erros (não todas as sugestões estão corretas, embora)
  • Polish:
  • acrescentou / melhoradas várias regras, especialmente para hífen e utilização traço
  • acrescentou informação de freqüência para o dicionário de verificação ortográfica; wordlist frequência vem do projeto Gaia, com Apache License, versão 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • fixos alguns alarmes falsos
  • Português:
  • acrescentou / melhoradas várias regras (que agora inclui regras de gênero "a" / "o")
  • que agora tem 3400+ palavras compostas
  • o arquivo JAR foi renomeado para languagetool.jar, desde antigamente languagetoolstandalone.jar para evitar confusão sobre o que 'autônomo' significa neste contexto (github questão # 29)
  • para idiomas com muitas regras (como o francês ou alemão) sobre o desempenho textos longos foi aumentado em cerca de 2,030%
  • correção para threadsafety (poderia causar pendurar em MultiWordChunker)
  • Corrigido um bug onde anotações do pedaço não foram testadas em grupos
  • correção: 1 e não tinha sido avaliada em ...
  • reparado um bug no mecanismo de unificação que descartadas algumas das interpretações de harmonização prematuramente
  • adicionou suporte para anotações do pedaço na disambiguator, e fixa um bug em tokens de filtragem com anotações do pedaço
  • bibliotecas atualizadas Morfologik a 1.8.2 (correções de bugs, mais rigoroso de sanidade de entrada verifica, adicionar dados de frequência de dicionários)
  • adicionou a opção de incluir dados de frequência para taggging ou de verificação ortográfica. O formato esperado das listas de palavras de freqüência é a do projeto Gaia, com Apache License, versão 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • novas ferramentas de linha de comando para exportar e criar dicionários binários:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • Integração LibreOffice / OpenOffice:
  • adicionou uma solução alternativa para a detecção incorreta sentença para o caso de que uma nota de rodapé apareceu depois de uma paragem completa frase (Sourceforge bug # 191)
  • GUI standalone: ​​
  • A caixa de diálogo aberta pelo "Mais ..." item no menu de contexto de um erro irá agora também mostrar exemplos de frases corretas e incorretas
  • API:
  • SentenceTokenizer é agora uma interface, a execução foi movido para RegexSentenceTokenizer, mas esta é obsoleto e SRXSentenceTokenizer deve ser usado em vez
  • Alguns métodos de org.languagetool.tools.StringTools foram movidos para a classe org.languagetool.gui.Tools no projeto languagetoolguicommons
  • LanguageToolListener.languageToolEventOccured () foi renomeado para LanguageToolListener.languageToolEventOccurred ()
  • org.languagetool.tools.SymbolLocator não é público mais (não deve afetar qualquer pessoa)
  • removido DanishSentenceTokenizer que tinha sido preterido por três anos
  • Rule.getCorrectExamples () e Rule.getIncorrectExamples () não retornar nulo, mas mais uma lista vazia se não há exemplos. Consequentemente, setCorrectExamples () e setIncorrectExamples () não aceitam nulo mais.
  • Rule.getId () pode retornar a qualquer cadeia agora, não apenas AsciiOnly cordas (na verdade, este tem sido o caso antes, como a restrição AsciiOnly não foi cumprida e só mencionou no javadoc)
  • languagetoolwikipedia: as opções de linha de comando para verificar um despejo Wikipedia foram simplificados. O comando pode agora ser chamado assim: java jar languagetoolwikipedia.jar checkdata l en f enwiki20130621pagesarticles.xml Chame apenas "java jar languagetoolwikipedia.jar checkdata" para obter uma mensagem de uso. Mais de um arquivo pode ser especificado com a opção f. Além disso a Wikipédia lixeiras XML, arquivos CSV de Tatoeba (http://tatoeba.org) agora também são suportados, eles precisam ser filtrada primeiro a conter somente o idioma relevante.

O que é novo na versão 2.3:

  • Breton:
  • acrescentou / melhorou algumas regras
  • alarmes falsos fixos
  • dicionário POS atualizado de Apertium (SVN r47282)
  • catalão:
  • adicionou suporte para código de idioma ca-ES-valencia (Catalão Valenciana), para ser usado no LibreOffice 4.2.0
  • adicionado uma regra de substituição simples, com centenas de sugestões de substituição
  • Adicionado / melhoradas várias regras
  • alarmes falsos fixos
  • chinês:
  • adicionou uma solução alternativa para um StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • Inglês:
  • acrescentou padrões de substituição para o verificador ortográfico para fazer sugestões melhor (agora oferece 'ensinou' para 'ensinou')
  • acrescentou / melhorou algumas regras
  • Francês:
  • acrescentou / melhorou algumas regras
  • alarmes falsos fixos
  • POS atualizado dicionário tag e dicionário Hunspell para Dicollecte-4.12
  • Alemão:
  • Adicionado / melhoradas várias regras
  • Português:
  • acrescentou / melhorou algumas regras
  • que agora tem 3300+ palavras compostas
  • ucraniano:
  • Adicionado / melhoradas várias regras
  • o código-fonte foi movido para github: https://github.com/languagetool-org/languagetool
  • LanguageTool requer Java 7 agora
  • LanguageTool faz uso de vários segmentos agora para texto verificação de hardware moderno, melhorando o desempenho (isso afeta a versão stand-alone, a versão de linha de comando ea extensão LibreOffice / OpenOffice)
  • sintaxe Regra:
  • suporte preliminar para novos atributos min / max que permitam combinar um elemento que parece um dado número de vezes. Por exemplo: foo irá corresponder a nada ou "foo", ou seja, "foo" foo é opcional irá corresponder "foo" ou foo "foo foo" irá corresponder a nada, "foo", ou "foo foo" Use max = "- 1" para permitir que ocorrências ilimitadas. Para min, apenas 0 ou 1 é suportado (1 é o padrão).
  • Suporte para OR-declarações. Por exemplo: a nível interno e em tempo de execução, uma regra que contenha ou-afirmações é convertida em várias regras ou sem-afirmações
  • .
  • Inglês agora tem um chunker para detectar, entre outros, pedaços substantivo no singular e no plural. Isso está documentado no http://wiki.languagetool.org/using-chunks
  • versão standalone: ​​
  • A versão standalone agora sublinha erros com um vermelho (erros de ortografia) ou azul (outros erros) linha (Panagiotis Minos)
  • Lembre-se da seleção de idioma para a próxima partida
  • Melhoria da janela e colocação de diálogo em uma configuração de vários monitores
  • servidor embutido: usa a porta padrão (8081) novamente se iniciado sem argumentos
  • atualizou a biblioteca para a versão 1.7.1 para permitir melhores sugestões, incluindo tratamento adequado dos sinais diacríticos e padrões de substituição desengace morfologik (equivalentes de MAP e REP recursos em dicionários Hunspell)
  • OpenOffice integração / LibreOffice:
  • CORRECÇÃO: o "About" diálogo não funcionou no Apache OpenOffice 4.0
  • CORRECÇÃO: regras específicas para cada país (como para Inglês britânico) não funcionou
  • API:
  • Na aula de língua, getCountryVariants () foi renomeado para GetCountries (), e foi adicionado um novo método getVariant.
  • Alguns métodos foram reprovados











O que é novo na versão 2.2:



O que é novo na versão 2.1:





O que é novo na versão 2.0:







Requisitos :

  • Java 2 Standard Edition Runtime Environment

Outro software de desenvolvedor Daniel Naber

Jwordsplitter
Jwordsplitter

21 Jan 15

LanguageTool
LanguageTool

21 Jan 15

Comentário para LanguageTool

Comentários não encontrado
Adicionar comentário
Ligue imagens!