PdfMasher é uma ferramenta para converter arquivos PDF que contenham texto em arquivos HTML prontas a ebook. A maioria dos leitores de ebook suporta arquivos PDF nativamente, mas é muitas vezes uma verdadeira dor de ler esses documentos, pois não temos controle sobre o tamanho da fonte do documento como a que temos com ebooks nativas. Em muitos casos, temos que usar o recurso de zoom e é apenas uma dor. Outra desvantagem de PDFs em leitores de ebook é que as anotações não são suportados.
Já existem ferramentas para converter PDFs para ebooks como Calibre, mas o que eles fazem é que eles tentam adivinhar o papel de cada pedaço de texto no PDF (e que, se você tiver sorte). Eu acho que em todos, mas os casos mais simples, é um erro pensar que nada menos do que uma AI pode fazer esse tipo de adivinhação.
Digite PdfMasher. PdfMasher pergunta ao usuário sobre o papel de cada parte do texto, e faz isso de uma maneira eficiente. Seu PDF tem um cabeçalho em cada página e você não quer que eles ninhada seu texto? Classificar elementos de texto por Y-position (agrupando-os todos juntos), shift selecionar os elementos e marcá-los como ignorado. Eles não vão aparecer no seu HTML final. Seu PDF tem notas de rodapé em muitas páginas? Ordenar seus elementos pelo conteúdo de texto (agrupamento, assim, todos os elementos com o texto que começa com um número juntos) e sinalizá-las como notas de rodapé. Eles serão movidos para o final do documento, e PdfMasher tentará criar hiperlinks para nota de rodapé referências
O que é novo nesta versão:.
Removido o diálogo fairware (More Info).
Comentários não encontrado