Apache Pig tem gerado a partir do Apache Hadoop projeto e é um dos seus módulos que onde encarregado de fornecer uma maneira de analisar os dados que ele processados e armazenados.
Porco usa uma linguagem de consulta personalizado chamado "Latino de porco", que é incrivelmente fácil de aprender e suporta ambos os estilos relacionais e funcionais.
Isto significa que você pode usá-lo como uma linguagem SQL clássico beneficiando de dados se junta e filtros, ou você pode usar seus recursos MapReduce, os mapeadores de dados e redutores.
Por padrão Apache Pig foi concebido para ser usado dentro de instalações do Hadoop, mas as versões mais recentes permitem que ele seja executado separadamente através de um JVM separado
O que é novo nesta versão:.
- mecanismos de execução plugáveis (para permitir a execução de porco em motores não-MapReduce no futuro)
- Modo Auto-local (para trabalhos com tamanho pequeno de dados de entrada para executar em processo)
- Obter otimização (para melhorar a interatividade de grunhido)
- contadores fixas para-modo local
- Suporte para cache de nível de usuário jar
- Suporte para criação de listas negras e listas brancas comandos porco
- Várias correções de desempenho e características debuggability
- Algumas modificações de interface não-compatíveis com versões anteriores foram introduzidos neste comunicado para fazer trabalho de porco com motores não-MapReduce
O que é novo na versão 0.14.0:
- mecanismos de execução plugáveis (para permitir porco prazo sobre a não motores -mapreduce no futuro)
- Modo Auto-local (para trabalhos com tamanho pequeno de dados de entrada para executar em processo)
- Obter otimização (para melhorar a interatividade de grunhido)
- contadores fixas para-modo local
- Suporte para cache de nível de usuário jar
- Suporte para criação de listas negras e listas brancas comandos porco
- Várias correções de desempenho e características debuggability
- Algumas modificações de interface não-compatíveis com versões anteriores foram introduzidos neste comunicado para fazer trabalho de porco com motores não-MapReduce
O que é novo na versão 0.11.0:
- Esta versão inclui DateType tipo de dados, RANK, e CUBE operadores ROLLUP, udfs Groovy, estimativa redutor de costume, tuplas à base de esquema e integração HCatalog DDL.
O que é novo na versão 0.9.1:.
- Esta versão trabalha com Hadoop 0.20
O que é novo na versão 0.6:
- Adicionado Zebra como um projeto contrib. Veja http://wiki.apache.org/pig/zebra
- Adicionado UDFContext, dá UDFs uma maneira de passar informações de frente para trás fim e dá acesso UDFS para JobConf no backend.
- Adicionado esquerda junção externa para o fragmento de réplica entrar.
- Adicionado a capacidade de definir a prioridade de trabalho a partir de Pig Latin.
- avançado multi-consulta para trabalhar com junta em alguns casos.
- Gerenciador de memória reformulado para reduzir significativamente Overhead GC e Fora de falhas Heap.
- Interface Adicionado acumulador para UDFs.
- Mais de 100 correções de bugs e melhorias.
Requisitos :
- Java 1.6.x ou superior
- Apache Hadoop 0.20.x ou superior
Comentários não encontrado