Git: diferenças entre revisões

Origem: Wikipédia, a enciclopédia livre.
Conteúdo apagado Conteúdo adicionado
Embat (discussão | contribs)
Embat (discussão | contribs)
Linha 63: Linha 63:
; Manipulação eficiente de projetos extensos: Torvalds descreveu o Git como sendo veloz e escalável,<ref>{{cite mailing list | author=Linus Torvalds |url=http://marc.info/?l=git&m=116128307511686 |title=Re: VCS comparison table |date=2006-10-19 |mailinglist=git}}</ref> e testes de performance realizados pela [[Mozilla]] apontaram que o Git é uma [[ordem de magnitude]] mais rápido que alguns sistemas de controle de versão. Obter o histórico das revisões salvos em repositórios locais resulta ser duas ordens de magnitude mais rápido que obtê-los de um servidor remoto.<ref>{{Cite journal |author=jst | url=http://weblogs.mozillazine.org/jst/archives/2006/11/vcs_performance.html | title=bzr/hg/git performance |journal=Jst's Blog |last=Stenback |first=Johnny |date=2006-11-30 |accessdate=2008-02-20}}, benchmarking "git diff" against "bzr diff", and finding the former 100x faster in some cases.</ref><ref>{{cite web | author=Roland Dreier |url=http://digitalvampire.org/blog/index.php/2006/11/16/oh-what-a-relief-it-is/ |title=Oh what a relief it is |date=2006-11-13}}, observing that "git log" is 100x faster than "svn log" because the latter has to contact a remote server.</ref> Um detalhe interessante é que o Git não fica mais lento com o aumento do histórico do projeto.<ref>{{Cite book |author=Robert Fendt |url=http://ldn.linuxfoundation.org/article/dvcs-roundup-one-system-rule-them-all-part-2 |title=DVCS Round-Up: One System to Rule Them All?—Part 2 |publisher=Linux Foundation |last=Fendy |first=Robert |date=2009-01-21 |quote=One aspect that really sets Git apart is its speed. …dependence on repository size is very, very weak. For all facts and purposes, Git shows nearly a flat-line behavior when it comes to the dependence of its performance on the number of files and/or revisions in the repository, a feat no other VCS in this review can duplicate (although Mercurial does come quite close). |accessdate=2009-06-25}}</ref>
; Manipulação eficiente de projetos extensos: Torvalds descreveu o Git como sendo veloz e escalável,<ref>{{cite mailing list | author=Linus Torvalds |url=http://marc.info/?l=git&m=116128307511686 |title=Re: VCS comparison table |date=2006-10-19 |mailinglist=git}}</ref> e testes de performance realizados pela [[Mozilla]] apontaram que o Git é uma [[ordem de magnitude]] mais rápido que alguns sistemas de controle de versão. Obter o histórico das revisões salvos em repositórios locais resulta ser duas ordens de magnitude mais rápido que obtê-los de um servidor remoto.<ref>{{Cite journal |author=jst | url=http://weblogs.mozillazine.org/jst/archives/2006/11/vcs_performance.html | title=bzr/hg/git performance |journal=Jst's Blog |last=Stenback |first=Johnny |date=2006-11-30 |accessdate=2008-02-20}}, benchmarking "git diff" against "bzr diff", and finding the former 100x faster in some cases.</ref><ref>{{cite web | author=Roland Dreier |url=http://digitalvampire.org/blog/index.php/2006/11/16/oh-what-a-relief-it-is/ |title=Oh what a relief it is |date=2006-11-13}}, observing that "git log" is 100x faster than "svn log" because the latter has to contact a remote server.</ref> Um detalhe interessante é que o Git não fica mais lento com o aumento do histórico do projeto.<ref>{{Cite book |author=Robert Fendt |url=http://ldn.linuxfoundation.org/article/dvcs-roundup-one-system-rule-them-all-part-2 |title=DVCS Round-Up: One System to Rule Them All?—Part 2 |publisher=Linux Foundation |last=Fendy |first=Robert |date=2009-01-21 |quote=One aspect that really sets Git apart is its speed. …dependence on repository size is very, very weak. For all facts and purposes, Git shows nearly a flat-line behavior when it comes to the dependence of its performance on the number of files and/or revisions in the repository, a feat no other VCS in this review can duplicate (although Mercurial does come quite close). |accessdate=2009-06-25}}</ref>
; Autenticação criptográfica do histórico: O histórico do Git é salvo de uma maneira que o nome de uma determinada revisão (um "commit", ou entrega, nos termos do Git) depende de todo o histórico de desenvolvimento que leva até este commit. Uma vez publicado, não é possível mudar as versões antigas sem passar despercebido. A estrutura é similar à uma [[Árvore (estrutura de dados)|árvore]] [[hash]] ([[hash tree]]), mas com dados adicionais nos nós e nas folhas.<ref>{{cite web | url=http://www.kernel.org/pub/software/scm/git/docs/user-manual.html#trust | title=Git User's Manual - Git Concepts - Trust | date=2006-10-18 }}</ref> (o [[Mercurial]] e o [[Monotone]] também possuem esta propriedade.)
; Autenticação criptográfica do histórico: O histórico do Git é salvo de uma maneira que o nome de uma determinada revisão (um "commit", ou entrega, nos termos do Git) depende de todo o histórico de desenvolvimento que leva até este commit. Uma vez publicado, não é possível mudar as versões antigas sem passar despercebido. A estrutura é similar à uma [[Árvore (estrutura de dados)|árvore]] [[hash]] ([[hash tree]]), mas com dados adicionais nos nós e nas folhas.<ref>{{cite web | url=http://www.kernel.org/pub/software/scm/git/docs/user-manual.html#trust | title=Git User's Manual - Git Concepts - Trust | date=2006-10-18 }}</ref> (o [[Mercurial]] e o [[Monotone]] também possuem esta propriedade.)
; Modelo baseado em ferramentas: O Git foi modelado como um conjunto de programas escrito em [[Linguagem C|C]], e numerosos [[Shell script|scripts em shell]] que encapsulam estes programas.<ref>{{cite mailing list | mailinglist=git | author=Linus Torvalds | url=http://marc.info/?l=git&m=116118369005954 | title=Re: VCS comparison table | accessdate=2009-04-10 }}, describing Git's script-oriented design</ref> Embora muitos destes scripts foram reescritos em C, como parte de um esforço de portar o Git para o Windows, o modelo básico continua, sendo fácil agrupar seus componentes.<ref>{{cite web | author=iabervon | url=http://lwn.net/Articles/165202/ | title=Git rocks! | date=2005-12-22 }}, praising Git's scriptability</ref>
; Modelo baseado em ferramentas: O Git foi modelado como um conjunto de programas escrito em [[Linguagem C|C]], e numerosos [[Shell script|scripts em shell]] que encapsulam estes programas.<ref>{{cite mailing list | mailinglist=git | author=Linus Torvalds | url=http://marc.info/?l=git&m=116118369005954 | title=Re: VCS comparison table | accessdate=2009-04-10 }}, describing Git's script-oriented design</ref> Embora muitos destes scripts tenham sido reescritos em C, como parte de um esforço de portar o Git para o Windows, o modelo básico continua, sendo fácil agrupar seus componentes.<ref>{{cite web | author=iabervon | url=http://lwn.net/Articles/165202/ | title=Git rocks! | date=2005-12-22 }}, praising Git's scriptability</ref>
; Estratégias de mescla (merge) conectáveis: Como parte de desenho em ferramentas, o Git tem um conjunto bem definido de modelos de uma mescla incompleta, e possuí vários algoritimos para completá-las, culminando em comunicar o usuário que é incapaz de completar o merge automaticamente, sendo necessária uma edição manual.
; Estratégias de mescla (merge) conectáveis: Como parte de desenho em ferramentas, o Git tem um conjunto bem definido de modelos de uma mescla incompleta, e possuí vários algoritimos para completá-las, culminando em comunicar o usuário que é incapaz de completar o merge automaticamente, sendo necessária uma edição manual.
; O [[Coletor de lixo|lixo]] se acumula se não for limpo: Abortar operações ou desfazer mudanças irá deixar objetos sem valor pendentes no banco de dados. Existe porém uma pequena fração desejável de objetos no sempre crescente histórico, mas [[Coletor de lixo|liberar o espaço]] usando <code>git gc --prune</code> pode ser uma operação lenta.<ref>{{cite web | url=http://www.kernel.org/pub/software/scm/git/docs/user-manual.html#ensuring-reliability | title= Git User's Manual | date=2007-08-05 }}</ref>
; O [[Coletor de lixo|lixo]] se acumula se não for limpo: Abortar operações ou desfazer mudanças irá deixar objetos sem valor pendentes no banco de dados. Existe porém uma pequena fração desejável de objetos no sempre crescente histórico, mas [[Coletor de lixo|liberar o espaço]] usando <code>git gc --prune</code> pode ser uma operação lenta.<ref>{{cite web | url=http://www.kernel.org/pub/software/scm/git/docs/user-manual.html#ensuring-reliability | title= Git User's Manual | date=2007-08-05 }}</ref>

Revisão das 04h43min de 10 de novembro de 2012

Git
Git logo
Desenvolvedor Linus Torvalds, Junio Hamano
Versão estável 1.8.0 (21 de outubro de 2012; há 11 anos)
Sistema operacional POSIX
Gênero(s) Controle de versões
Licença GNU GPLv2
Página oficial http://git-scm.com/

Git é um sistema de controle de versão distribuído com ênfase em velocidade. O Git foi inicialmente projetado e desenvolvido por Linus Torvalds para o desenvolvimento do kernel Linux.

Cada diretório de trabalho Git é um repositório com todos os históricos e habilidade total de controle das revisões, não dependente de acesso a uma rede ou a um servidor central.

A manutenção de software do Git é atualmente supervisionada por Junio Hamano. É distribuído sob os termos da versão 2 da GNU General Public License. O Git é um software livre.

Nome

Linus Torvalds satirizou sobre o nome "git", que é um gíria em inglês britânico para uma pessoa estúpida ou desagradável, dizendo:[1] "Eu sou um egoísta degenerado, e vou batizar todos os meus projetos com meu nome. Primeiro Linux, agora git."[2][3] (Isto é especialmente irônico, pois o próprio Linus resistiu à idéia de escolher o nome Linux para o núcleo do seu sistema operacional.)

O wiki oficial do Git também dá algumas explicações alternativas e um retroacrónimo para o nome, incluindo "Rastreamento Global de Informações (Global Information Tracker)".[2]

História Inicial

O desenvolvimento do Git surgiu após vários desenvolvedores do kernel (núcleo) do Linux decidirem desistir de acessar ao sistema do BitKeeper, que é um software proprietário.[4] O acesso gratuito ao BitKeeper foi removido pelo detentor dos direitos autorais, Larry McVoy, depois de acusar Andrew Tridgell de usar de engenharia reversa nos protocolos do BitKeeper, alegando violação da licença do mesmo. Tridgell demonstrou, em uma apresentação na Linux.Conf.Au, realizada em 2005, que o processo de engenharia reversa utilizado não foi mais do que simplesmente direcionar um telnet para a porta apropriada de um servidor BitKeeper e digitar "help (ajuda)".[5]

Torvalds queria um sistema distribuído que ele pudesse utilizar de forma similar ao BitKeeper (BK), mas nenhum dos sistemas gratuitos disponíveis atendia suas necessidades, particularmente com relação à performance. Segue abaixo uma parte retirada de um e-mail, de 7 de Abril de 2005, escrito enquanto desenvolvia seu primeiro protótipo:[6]

De qualquer forma, os SCVs que olhei dificultam as coisas. Uma delas (a maior delas, na verdade) que estive trabalhando é fazer este processo ser realmente eficiente. Se leva meio minuto para aplicar um patch e ainda lembrar o que mudou, etc (e francamente, isso é rápido para a maioria dos SCVs por aí para um projeto do tamanho do Linux), daí uma série de 250 e-mails (que não é estranho acontecer quando eu sincronizo com o Andrew, por exemplo) demora duas horas. Se um dos patches no meio do processo não é aplicado, as coisas ficam realmente muito feias.

Agora, o BK (BitKeeper) não era um inferno também (na verdade, comparado com todo o resto, o BK é um inferno em velocidade, geralmente em uma ou duas ordens de magnitude), e levou cerca de 10-15 segundos por e-mail quando mesclei meus arquivos com o Andrew. MESMO ASSIM, com o BK isso não era um problema tão grande, visto que mesclas de arquivos de BK←>BK eram tão fáceis, eu nunca precisei das lentas mesclas por e-mail com nenhum dos outros desenvolvedores principais. Então um "mesclador" de um SCV baseado em patches precisaria ser realmente mais rápido que o BK. O que realmente é extremamente difícil.

Então eu estou escrevendo alguns scripts para tentar alinhar tudo mais rápido. Indicações iniciais são de que eu poderei fazer isso tão rápido quanto eu aplico patches, mas para ser franco, estou no máximo com metade pronto, e se eu estiver na direção errada, talvez essa não seja a mais pura verdade. De qualquer forma, a razão de que eu consigo criar tudo isso tão rápido é que meus scripts não serão um SCV, serão tipo um "registro de estado do Linus" bem específico. Isso vai fazer minhas mesclas lineares de patches muito mais eficientes no tempo, e nestas condições, possível.

(Se a aplicação de um patch demora três segundos, até mesmo uma série grande de patches não é um problema: se eu for notificado em um minuto ou dois que falhou na metade do caminho, sem problemas, eu posso então simplesmente arrumar manualmente. É por isso que a latência é crítica - se eu tivesse que fazer as coisas efetivamente "desconectado", eu não poderia, por definição, arrumar as coisas quando problemas aparecessem).

Torvalds teve vários critérios para o projeto:

  1. Tomar o CVS como um exemplo do que não fazer; na dúvida, tomar exatamente a decisão contrária. Para citar Torvalds, de certa forma mordendo a língua:
    "Nos primeiros 10 anos de manutenção do kernel, nós literalmente usamos patches de tarballs, o que é muito superior como controle de versão que o CVS, mas eu acabei usando o CVS por 7 anos em uma empresa comercial [Transmeta[7]] e eu odiava de paixão. Quando eu digo que eu odiava de paixão, eu também tenho que dizer que, se houver algum usuário de SVN (Subversion) na platéia, talvez você queira sair. Porque meu ódio pelo CVS significa que eu vejo o Subversion como sendo o projeto iniciado mais sem objetivo de todos os tempos. O slogan do Subversion por um tempo foi "CVS feito [do jeito] certo", ou algo assim, e se você começa com esse slogan, você não vai a lugar nenhum. Não tem como o CVS fazer [do jeito] certo."
  2. Suportar um fluxo distribuído, como o BitKeeper
    "O BitKeeper não foi simplesmente o primeiro sistema de versionamento que eu senti que absolutamente valia a pena, foi também o sistema de controle de versão que me ensinou porque eles tem um objetivo, e como você realmente deve fazer as coisas. Então o Git, de várias formas, mesmo que de uma visão técnica muito diferente do BitKeeper (e isso foi outro objetivo de projeto, porque eu queria deixar claro que não era um plágio do BitKeeper), muitos dos fluxos que usamos no Git vieram diretamente dos fluxos que aprendemos com o BitKeeper."
  3. Várias firmes proteções contra corrompimento de arquivos, seja por acidente ou origem maldosa[8]
  4. Alta performance

Os primeiros três critérios acima eliminam cada controle de versão pré-existente ao Git, exceto pelo Monotone, e o quarto elimina todos. Então, imediatamente depois de liberar a versão 2.6.12-rc2 de desenvolvimento do kernel do Linux, ele começou a desenvolver o seu próprio.

O desenvolvimento do Git começou em 3 de Abril de 2005.[9] O projeto foi anunciado em 6 de Abril,[10] e tornou-se auto-hospedeiro no dia 7 de Abril.[9] A primeira mescla de arquivos (merge) em múltiplos ramos (branches) foi realizado em 18 de Abril.[11] Torvalds alcançou seus objetivos de performance; em 29 de Abril, o recém-nascido Git se tornou referência ao registrar patches para a árvore de desenvolvimento do kernel do Linux na taxa de 6,7 por segundo.[12] No dia 16 de Junho, a entrega do kernel 2.6.12 foi gerenciada pelo Git.[13]

Mesmo que fortemente influenciado pelo BitKeeper, Torvalds deliberadamente tentou evitar abordagens tradicionais, levando à um design único.[14] Ele desenvolveu o sistema até que fosse possível sua utilização por usuários técnicos, entregando então a manutenção do software para Junio Hamano, um dos principais colaboradores do projeto, em 16 de Julho de 2005.[15] Hamano foi responsável pela entrega da versão 1.0 em 21 de dezembro de 2005,[16] e continua como responsável pela manutenção do mesmo.

Desenho

O desenho do Git foi inspirado no BitKeeper e no Monotone.[17][18] Seu desenho original era de um controle de versão de baixo-nível, de forma que outros pudessem desenvolver interfaces em cima dele, como por exemplo o Cogito ou o StGIT.[18] No entanto, o núcleo do projeto do Git se tornou, desde então, um sistema de controle de versão completo que pode ser diretamente utilizado.[19]

Características

O projeto do Git é uma síntese da experiência de Torvalds com a manutenção do desenvolvimento altamente distribuído do projeto do Linux, junto com seu íntimo conhecimento de performance de sistemas de arquivos (conhecimentos adquiridos no mesmo projeto) e a necessidade urgente de produzir um sistema funcional em um curto espaço de tempo. Essas influências o levaram às seguintes escolhas de implementação:

Suporte consistente para desenvolvimentos não-lineares
O Git suporta rápidas criações de ramos (branches) e mesclas (merges), e inclui ferramentas específicas para visualização e navegação de históricos de desenvolvimento não-lineares. Uma suposição intrínseca no Git é que uma mudança será mesclada mais do que é escrita, enquanto é passada por vários revisores.
Desenvolvimento distribuído
Assim como o Darcs, o BitKeeper, o Mercurial, o SVK, o Bazaar e o Monotone, o Git dá a cada desenvolvedor uma cópia local completa de todo o histórico de desenvolvimento, e as mudanças são copiadas de um único repositório para outro. Estas mudanças são importadas como ramos (branches) adicionais de desenvolvimento, e podem sofrer uma mescla (merge) da mesma forma que um ramo de desenvolvimento local.
Compatibilidade com protocolos/sistemas existentes
Repositórios podem ser publicados por HTTP, FTP, rsync, um protocolo Git sobre uma porta conhecida ou por ssh. O Git também tem uma emulação de servidor CVS, o que habilita a existência de clientes CVS e extensões (plugins) em diversos ADIs a utilizar os repositórios Git. O Subversion e o svk podem utilizar os repositórios diretamente com o git-svn.
Manipulação eficiente de projetos extensos
Torvalds descreveu o Git como sendo veloz e escalável,[20] e testes de performance realizados pela Mozilla apontaram que o Git é uma ordem de magnitude mais rápido que alguns sistemas de controle de versão. Obter o histórico das revisões salvos em repositórios locais resulta ser duas ordens de magnitude mais rápido que obtê-los de um servidor remoto.[21][22] Um detalhe interessante é que o Git não fica mais lento com o aumento do histórico do projeto.[23]
Autenticação criptográfica do histórico
O histórico do Git é salvo de uma maneira que o nome de uma determinada revisão (um "commit", ou entrega, nos termos do Git) depende de todo o histórico de desenvolvimento que leva até este commit. Uma vez publicado, não é possível mudar as versões antigas sem passar despercebido. A estrutura é similar à uma árvore hash (hash tree), mas com dados adicionais nos nós e nas folhas.[24] (o Mercurial e o Monotone também possuem esta propriedade.)
Modelo baseado em ferramentas
O Git foi modelado como um conjunto de programas escrito em C, e numerosos scripts em shell que encapsulam estes programas.[25] Embora muitos destes scripts tenham sido reescritos em C, como parte de um esforço de portar o Git para o Windows, o modelo básico continua, sendo fácil agrupar seus componentes.[26]
Estratégias de mescla (merge) conectáveis
Como parte de desenho em ferramentas, o Git tem um conjunto bem definido de modelos de uma mescla incompleta, e possuí vários algoritimos para completá-las, culminando em comunicar o usuário que é incapaz de completar o merge automaticamente, sendo necessária uma edição manual.
O lixo se acumula se não for limpo
Abortar operações ou desfazer mudanças irá deixar objetos sem valor pendentes no banco de dados. Existe porém uma pequena fração desejável de objetos no sempre crescente histórico, mas liberar o espaço usando git gc --prune pode ser uma operação lenta.[27]
Empacotamento periódico explícito de objetos
O Git armazena cada novo objeto criado como um arquivo separado. Embora cada arquivo seja individualmente comprimido, isso requer um espaço considerável no disco e é ineficiente. Isto é resolvido com o uso de "pacotes" que armazenam um grande número de objetos em um único arquivo (ou pela rede), comprimidos pelo delta entre eles. Pacotes são comprimidos usando a heurística de que arquivos com o mesmo nome são provavelmente similares, mas que não dependam exatamente disso. Mesmo assim, novos objetos criados (novo histórico adicionado) são gravados um a um, e reempacotamentos periódicos são necessários para manter o espaço de forma eficiente. O Git faz reempacotamentos periódicos automaticamente, mas também é possível fazer reempacotamentos manuais com o comando git gc.

Outra propriedade do Git é que ele salva o estado (snapshot) dos diretórios de arquivos. Os sistemas mais antigos de controle de versão de código fonte, Sistemas de Controle de Código Fonte (SCCF) e Sistemas de Controle de Revisão (SCR), trabalhavam em cima de arquivos individuais, enfatizando o espaço em disco ganho por intercalação de deltas (SCCF) ou por encodificação de deltas (RCS) entre versões (mais similares). Sistemas de controle de versão posteriores mantiveram esta noção de arquivos possuírem uma identidade atráves de múltiplas revisões de um projeto. Porém, Torvalds rejeitou esse conceito.[28] Consequentemente, o Git não salva relacionamentos entre revisão de arquivos em nenhum nível abaixo da árvore de diretório do código fonte.

Relacionamentos inexplícitos de revisão remete à consequências significativas:

  • É pouco mais dispendioso examinar o histórico de um único arquivo do que o histórico de todo o projeto.[29] Para obter o histórico de mudanças de um arquivo, Git precisa caminhar pelo histórico global e então verificar qual mudança modificou aquele arquivo. Este método de examinar o histório faz, porém, com que o Git produza igual eficiência em mostrar um histórico de mudanças de um ou de vários arquivos arbitrários. Por exemplo, é comum o caso de um subdiretório da árvore de arquivos fontes mais um arquivo global de cabeçalho associado.
  • Renomeamento de arquivos são feitos de forma implícita. Uma queixa comum no CVS é que este usa o nome do arquivo para identificar o seu histórico de revisões. Então, não é possível mover ou renomear um arquivo sem interromper ou renomear seu histórico,o que, consequentemente, faz com que o histórica seja impreciso. A maioria dos controles de revisão pós-CVS resolve este probelam por dar um tipo de identidade por nome único invariável para cada arquivo (um tipo de nó-i) que continua mesmo após renomamentos. O Git não salva este tipo de identificador, e isso é uma vantagem alegada por Torvalds.[30][31] Arquivos de código fonte, às vezes, são divididos, mesclados ou simplesmente renomeados.[32] Salvar todas estas mudanças como simples renomeios poderia congelar uma descrição imprecisa do que aconteceu na história real do mesmo (que é imutável). Git resolve este problema por detectar renomeios enquanto navega pela história dos estados invés de gravá-los quando o estado é criado.[33] (Para ser breve, dado um arquivo numa revisão N, um arquivo de mesmo nome numa revisão N-1 é seu ancestral comum. Porém, quando não existe arquivo com um nome parecido na revisão N-1, o Git procura por um arquivo que existiu apenas na revisão N-1 e que era similar ao arquivo novo). No entanto, não é necessário mais tempo de processamento intensivo toda vez que o histórico é revisado. Existem também numerosas opções para ajustar estas heurísticas.

O Git implemente várias estratégias de merge (mescla de arquivos); uma não padrão pode ser selecionada durante um merge:[34]

  • resolve (resolver): o tradicional algoritmo de merge em três vias.
  • recursive (recursivo): Este é o padrão quando baixando ou mesclando um branch, é uma variante do algortimo de mescla em três vias. "Quando há mais de um ancestral comum que pode ser usado em um merge de três vias, cria-se uma árvore de merge dos ancestrais comuns e usa-se isso como a árvoe de referência para o merge em três vias. Isto têm resultado em menor número de conflitos em merges sem causar merges errados por testes realizados em merges tirados do histórico de desenvolvimento do kernel do Linux 2.6. Adicionalmente pode detectar e lidar com merges envolvendo renomeamentos."[35]
  • octopus (polvo): Este é o padrão quando efetuado merge em mais de duas heads.

Implementação

Como o BitKeeper, o Git não usa um servidor centralizado. Entretanto, os primórdios do Git não são inerentemente um sistema de gerenciamento de versão. Torvalds explica:[36]

Você pode ver o git apenas como um sistema de arquivos por vários motivos — ele é um armazenamento endereçável de conteúdo (SCM), e tem o conceito de versionamento, mas eu realmente o modelei vindo de um problema no ponto de vista de um sistema de arquivos (ei, eu faço núcleos de sistemas operacionais), e na verdade eu não tenho absolutamente nenhum interesse em criar um sistema tradicional de SCM.

Apesar de suas intenções, o Git agora possuí toda a coleção de funcionalidade de um SCM tradicional.[37]

O Git possuí duas estruturas de dados: um índice mutável que provê informações sobre o diretório de trabalho e a próxima revisão a ser cometida; e um banco de dados de objetos de acréscimo imutável.

O banco de dados de objetos contém quatro tipos de objetos:

  • Um objeto blob é o conteúdo de um arquivo. Estes objetos não possuem nomes, datações ou outros metadados.
  • Um objeto tree (árvore) é o equivalente à um diretório. Ele contém um lista de nomes de arquivos, cada um com bits que informam o tipo e o nome do blob, da árvore, ligação simbólica ou conteúdo de diretório que pertence à este nome. Este objeto descreve o estado da árvore de diretório.
  • Um objeto commit (entrega) liga árvores de objetos junto com um histório. Ele contém o nome de uma árvore de objetos (da raiz de diretórios), datação, uma mensagem de log, e os nomes de zero ou mais objetos-pai de commit.
  • Um objeto tag (rótulo) é um invólucro que referencia outros objetos e pode conter metadados adicionais relacionados à outro objeto. Em geral, é usado para armazenar uma assinatura digital de um objeto commit correspondente à aquela release de dados que estão sendo rastreados pelo Git.

O índice serve como um ponto de conexão entre o banco de dados de objetos e a àrvore de trabalho.

Cada objeto é identificado por um hash SHA-1 de seu conteúdo. O Git computa o hash e usa esse valor como nome para o objeto. O objeto é colocado em um diretório que corresponde aos primeiros dois caracteres deste hash. O resto do hash é usado como um nome de arquivo para cada objeto.

O Git armazena cada revisão do arquivo com um único objeto blob. Os relacionamentos entre os blobs podem ser encontrados por examinar à arvore de objetos commit. Objetos recém adicionados são armazenados internamente usando compressão do zlib. Isto pode consumir uma grande quantidade de espaço de disco rapidamente. Desta forma, os objetos são combinados em pacotes, que são comprimidos em delta para salvar espaço, gravando blobs como mudanças relativas à outros blobs.

Servidores Git tipicamente escutam na porta TCP/IP 9418.[38]

Portabilidade

O Git está primariamente desenvolvido para Linux, mas pode ser usados em outros sistemas operacionais baseados no Unix, incluindo o BSD, o Solaris e o Darwin. O Git é extremamente rápido em arquiteturas POSIX como o Linux.[39]

O Git também roda no Microsoft Windows. Existem duas variantes:

  • Uma adaptação nativa para Microsoft Windows, chamada msysgit (usando MSYS da MinGW). Ao passo que é relativamente mais vagaroso que a versão para o Linux,[40] ele é aceitavelmente rápido[41] e é notoriamente usado em produção, com apenas algumas dificuldade menores.[42] Em particular, alguns comandos ainda não estão disponíveis nas GUIs, e precisam ser chamadas por linha de comando.
  • O git também roda em cima do Cygwin (uma camada de emulação POSIX),[43] embora é notoriamente mais lento, especialmente para comando escritos em shell script.[44] Isto é causado principalmente pelo alto custo realizado pelo comando fork emulado pelo Cygwin. Entretanto, as recentes reescritas de vários comandos do Git (originalmente escritas em sheel script) para a linguagem C, resultou em um ganho significativo de performance no Windows.[45]

Outras alternativas para rodar o Git incluí:

  • git-cvsserver (que emula um servidor CVS, permitindo seu uso em cliente CVS para Windows):[46]
  • Ambientes de desenvolvimento baseados em Eclipse para Git, baseado em implementações puras em Java no interior do Git: egit
  • Suporte do NetBeans para o Git está em desenvolvimento [2] e está também disponível pelo plugin NbGit
  • O TortoiseGit, Git-Cheetah e o Git Extensions são extensões clientes para o Gerenciado de Arquivos do Windows, assim como versões independentes de GUI e o plugin para Visual Studio. O Git Source Control Provider é outro software gratuito em forma de plugin para o Visual Studio que exibe o status do projeto Git no 'solution explorer'.
  • IntelliJ IDEA Versão 8.1 agora suporta o Git por um plugin embutido: Intellij Version Control Systems Integration
  • Xcode 4 - assim como a versão 4 de demonstração, o git está disponível como parte da IDE [3]
  • Git# é uma implementação .Net/Mono do git.

Refaturar as operações de mais baixo nível em bibliotecas poderia, teoricamente, permitir a reimplementação do componente de níveis mais altos para o Windows sem reescrever o resto.[47]

Adoção

Hospedagem de código fonte

Os seguintes websites provêm hospedagem gratuita de código fonte para repositório Git:[48]

Projetos que usam Git

Um grande número de projetos de software de alto-padrão estão utilizando agora o Git como controle de revisão::[49]

O projeto KDE começou a migrar para o Git, o Amarok completou sua migração[113][114] e logo também a do Phonon.[115] A comunidade do Drupal recentemente anúnciou planos para migrar o desenvolvimento para Git.[116]

Ver também

Referências

  1. «Depois de controvérsia, Torvalds começa trabalhar no git». InfoWorld. 19 de abril de 2005. ISSN 0199-6649. Consultado em 20 de fevereiro de 2008 
  2. a b «GitFaq: Porque o nome 'git'?». Git.or.cz. Consultado em 16 de junho de 2009 
  3. «Depois de controvérsia, Torvalds começa trabalhar no git». PC World. 20 de abril de 2005. Torvalds parecia estar ciente que sua decisão de desistir do BitKeeper também seria controversa. Quando perguntado como chamaria seu novo software, ele respondeu com a gíria inglesa "git", que signifa "uma pessoa podre". 'Eu sou um egoísta degenerado, e vou batizar todos os meus projetos com meu nome. Primeiro Linux, agora git.' 
  4. Feature: No More Free BitKeeper | KernelTrap.org
  5. Jonathan Corbet (20 de abril de 2005). «Como Tridge usou engenharia reversa no BitKeeper». Linux Weekly News 
  6. Linus Torvalds (7 de abril de 2005). «Re: Kernel SCM saga..». linux-kernel (Lista de grupo de correio) 
  7. Linus Torvalds (31 de outubro de 2005). «Re: git contra o CVS (contra o bk)». git (Lista de grupo de correio) 
  8. Linus Torvalds (10 de junho de 2007). «Re: fatal: aumento inconsistente grave». git (Lista de grupo de correio)  Uma breve descrição dos objetivos de integridade de dados no projeto do Git.
  9. a b Linus Torvalds (27 de fevereiro de 2007). «Re: Trivia: When did git self-host?». git (Lista de grupo de correio) 
  10. Linus Torvalds (6 de abril de 2005). «Kernel SCM saga..». linux-kernel (Lista de grupo de correio) 
  11. Linus Torvalds (17 de abril de 2005). «First ever real kernel git merge!». git (Lista de grupo de correio) 
  12. Matt Mackall (29 de abril de 2005). «Mercurial 0.4b vs git patchbomb benchmark». git (Lista de grupo de correio) 
  13. Linus Torvalds (17 de junho de 2005). «Linux 2.6.12». git-commits-head (Lista de grupo de correio) 
  14. Linus Torvalds (20 de outubro de 2006). «Re: VCS comparison table». git (Lista de grupo de correio)  A discussion of Git vs. BitKeeper
  15. Linus Torvalds (27 de julho de 2005). «Meet the new maintainer…». git (Lista de grupo de correio) 
  16. Junio C Hamano (21 de dezembro de 2005). «ANNOUNCE: GIT 1.0.0». git (Lista de grupo de correio) 
  17. Linus Torvalds (5 de maio de 2006). «Re: [ANNOUNCE] Git wiki». linux-kernel (Lista de grupo de correio)  "Some historical background" on git's predecessors
  18. a b Linus Torvalds (8 de abril de 2005). «Re: Kernel SCM saga». linux-kernel (Lista de grupo de correio). Consultado em 20 de fevereiro de 2008 
  19. Linus Torvalds (23 de março de 2006). «Re: Errors GITtifying GCC and Binutils». git (Lista de grupo de correio) 
  20. Linus Torvalds (19 de outubro de 2006). «Re: VCS comparison table». git (Lista de grupo de correio) 
  21. jst, Johnny (30 de novembro de 2006). «bzr/hg/git performance». Jst's Blog. Consultado em 20 de fevereiro de 2008  |last= e |author= redundantes (ajuda), benchmarking "git diff" against "bzr diff", and finding the former 100x faster in some cases.
  22. Roland Dreier (13 de novembro de 2006). «Oh what a relief it is» , observing that "git log" is 100x faster than "svn log" because the latter has to contact a remote server.
  23. Robert Fendt, Robert (21 de janeiro de 2009). DVCS Round-Up: One System to Rule Them All?—Part 2. [S.l.]: Linux Foundation. Consultado em 25 de junho de 2009. One aspect that really sets Git apart is its speed. …dependence on repository size is very, very weak. For all facts and purposes, Git shows nearly a flat-line behavior when it comes to the dependence of its performance on the number of files and/or revisions in the repository, a feat no other VCS in this review can duplicate (although Mercurial does come quite close).  |last= e |author= redundantes (ajuda)
  24. «Git User's Manual - Git Concepts - Trust». 18 de outubro de 2006 
  25. Linus Torvalds. «Re: VCS comparison table». git (Lista de grupo de correio). Consultado em 10 de abril de 2009 , describing Git's script-oriented design
  26. iabervon (22 de dezembro de 2005). «Git rocks!» , praising Git's scriptability
  27. «Git User's Manual». 5 de agosto de 2007 
  28. Linus Torvalds (10 de abril de 2005). «Re: more git updates..». linux-kernel (Lista de grupo de correio) 
  29. Bruno Haible (11 de fevereiro de 2007). «how to speed up "git log"?». git (Lista de grupo de correio) 
  30. Linus Torvalds (1 de março de 2006). «Re: impure renames / history tracking». git (Lista de grupo de correio) 
  31. Junio C Hamano (24 de março de 2006). «Re: Errors GITtifying GCC and Binutils». git (Lista de grupo de correio) 
  32. Junio C Hamano (23 de março de 2006). «Re: Errors GITtifying GCC and Binutils». git (Lista de grupo de correio) 
  33. Linus Torvalds (28 de novembro de 2006). «Re: git and bzr». git (Lista de grupo de correio) , on using git-blame to show code moved between source files
  34. Linus Torvalds (18 de julho de 2007). «git-merge(1)» 
  35. Linus Torvalds (18 de julho de 2007). «CrissCrossMerge» 
  36. Linus Torvalds (10 de abril de 2005). «Re: more git updates…». linux-kernel (Lista de grupo de correio) 
  37. Linus Torvalds (23 de março de 2006). «Re: Errors GITtifying GCC and Binutils». git (Lista de grupo de correio) 
  38. «Exporting a git repository via the git protocol». Kernel.org. Consultado em 17 de novembro de 2009 
  39. Stenback, Johnny (30 de novembro de 2006). «bzr/hg/git performance». Jst's Blog. Consultado em 20 de fevereiro de 2008 
  40. Johannes Schindelin (14 de outubro de 2007). «Re: Switching from CVS to GIT». git (Lista de grupo de correio)  A subjective comparison of Git under Windows and Linux on the same system.
  41. Martin Langhoff (15 de outubro de 2007). «Re: Switching from CVS to GIT». git (Lista de grupo de correio)  Experience running msysgit on Windows
  42. Johannes Sixt (15 de outubro de 2007). «Re: Switching from CVS to GIT». git (Lista de grupo de correio) 
  43. Shawn Pearce (24 de outubro de 2006). «Re: VCS comparison table». git (Lista de grupo de correio) 
  44. Johannes Schindelin (1 de janeiro de 2007). «Re: [PATCH] Speedup recursive by flushing index only once for all». git (Lista de grupo de correio) 
  45. Shawn O. Pearce (18 de setembro de 2007). «[PATCH 0/5] More builtin-fetch fixes». git (Lista de grupo de correio) 
  46. «git-cvsserver(1)». Kernel.org. 2 de abril de 2009. Consultado em 15 de junho de 2009 
  47. Johannes Schindelin (2 de março de 2006). «Re: windows problems summary». git (Lista de grupo de correio) 
  48. Git Hosting - Git SCM Wiki
  49. «Projects that use Git for their source code management». Consultado em 20 de fevereiro de 2008 
  50. Getting Started/Sources/Amarok Git Tutorial - KDE TechBase
  51. amarok in kde-developers - Gitorious
  52. Usando Repo e o Git
  53. BlueZ » Acessar o GIT
  54. «Btrfs source repositories - btrfs Wiki». Btrfs.wiki.kernel.org. Consultado em 15 de junho de 2009 
  55. http://github.com/richhickey/clojure
  56. http://cakephp.lighthouseapp.com/projects/42648/home
  57. http://curl.haxx.se/
  58. git.debian.org Git
  59. digg.git - part 1 | Digg About
  60. TypicalGitUsage - dragonflywiki
  61. WTP Incubator using Git
  62. Download
  63. «Get FFmpeg». Ffmpeg.org. Consultado em 15 de junho de 2009 
  64. http://github.com/freenet/
  65. http://freeswitch.org/
  66. «Git - Fast Version Control System». Consultado em 24 de abril de 2010 
  67. The GIMP Development Team. «GIMP Developer Resources». Consultado em 7 de agosto de 2010 
  68. Lucas Rocha. «Mailing List Announcement». Consultado em 19 de março de 2009. GNOME to migrate to git version control system… 
  69. Git - GNOME Live!
  70. http://www.nico.schottelius.org/software/gpm/
  71. gstreamer Wiki - GitDeveloperGuidelines
  72. gthumb - GNOME Live!
  73. GTK+ - Download
  74. source repositories
  75. Downloading jQuery - jQuery JavaScript Library
  76. CCHIT's laika at master - GitHub
  77. LilyPond, music notation for everyone
  78. The Linux Mint Blog » Blog Archive » Mint to use Launchpad for translations, bugs, blueprints and github for code hosting and version control
  79. DistroWatch.com: Put the fun back into computing. Use Linux, BSD
  80. LMMS - Linux MultiMedia Studio
  81. Maemo - Gitorious
  82. MeeGo - Gitorious
  83. Ruby on Rails: Merb
  84. GitFAQ - Mono
  85. Mono Project - GitHub
  86. MooTools - a compact javascript framework
  87. OLPC wiki. «Project hosting». Consultado em 20 de fevereiro de 2008 
  88. http://www.openfoam.com/download/git.php
  89. openSUSE - Gitorious
  90. «FrictionalGames' PenumbraOverture at master». GitHub 
  91. «Penumbra: Overture goes Open Source!». Frictional Games 
  92. Léon Brocard. «Mailing List Announcement». Consultado em 22 de dezembro de 2008. The Perl Foundation has migrated Perl 5 to the Git version control system…  line feed character character in |quote= at position 51 (ajuda)
  93. PHP (20 de março de 2012). «PHP migrates to Git». The PHP Group. Consultado em 23 de março de 2012 
  94. phpBB (7 de março de 2010). «phpBB moves source code versioning from Subversion to Git». phpBB Group. Consultado em 7 de março de 2010 
  95. Prototype JavaScript framework: Contribute
  96. «Qt now open for community contributions». 11 de maio de 2009. Consultado em 22 de junho de 2009 
  97. «Reddit Goes Open Source». Consultado em 26 de fevereiro de 2010 
  98. http://gitweb.samba.org/?p=rsync.git
  99. «"Rails is moving from SVN to Git"». Consultado em 3 de abril de 2008 
  100. Using Git for Samba Development - SambaWiki
  101. SproutCore Documentation
  102. [1]
  103. Sugar Labs project hosting
  104. Accessing SWI-Prolog source via <a href="http://git-scm.com/">GIT</a>
  105. a b Git - VideoLAN Wiki
  106. http://vtk.org/gitweb
  107. GitWine - The Official Wine Wiki
  108. Xfce Git
  109. Xiph Git
  110. X.Org Wiki - Development/git
  111. «YUI 2 and YUI 3 Source Code Now on GitHub». Consultado em 20 de janeiro de 2009 
  112. http://git.zendframework.com/?a=summary&p=zf
  113. life at the end of the universe » we’re testing the water for everyone
  114. KDE gets millionth commit - The H Open Source: News and Features
  115. (Kde-scm-interest) Minutes from Today's KDE → Git BoF, Ian Monroe, Wed July 8 18:43:42 CEST 2009
  116. Migrating Drupal.org to Git

Ligações externas