Wikipédia:GLAM/Museu Paulista/Fotografias/Werner Haberkorn/Posição relativa dentro de imagens

Origem: Wikipédia, a enciclopédia livre.
Página inicialAcervoIntegrantesNovidadesMuseu Republicano

Esta página tem o intuito de guiar o processo de adição e melhoramento dos metadados de localização dos descritores nas fotografias de Werner Haberkorn no acervo do Museu Paulista.

Vista parcial do Vale do Anhangabaú. São Paulo/SPVista parcial do Vale do Anhangabaú. São Paulo/SPVista parcial do Vale do Anhangabaú. São Paulo/SP

Vista parcial do Vale do Anhangabaú. São Paulo/SP, Werner Haberkorn, Acervo do Museu Paulista.

Em ordem: Fotografia da obra, metadados do reticulado do Museu e metadados refinados

Exemplo de reticulado

Os metadados da localização dos descritores foram obtidos a partir da aplicação, pela equipe do Museu, de um retículo sobre as imagens e adicionando uma declaração da localização da entidade retratada no campo de legenda da imagem no banco de dados do Museu. Esse retículo tem sempre o mesmo formato: 13 unidades de largura por 11 unidades de altura, e tal qual uma matriz, tem suas colunas representadas por letras maiúsculas e suas linhas representadas por números.

Os metadados estão registrados nas fichas descritivas das obras nos formatos:

X# - ENTIDADE ou X# a Y# - ENTIDADE

Onde X e Y representam as unidades de largura, que variam de A a M, # representa as unidades de altura, que variam de 0 a 10 e ENTIDADE representa a entidade (pessoa, edifício etc) com alguma parte contida nas células declaradas.

Para a imagem destacada, por exemplo, os metadados são:

E3 - EDIFÍCIO ALTINO ARANTES
G2 - EDIFÍCIO BANCO DO BRASIL
J5 - EDIFÍCIO MARTINELLI

Que identificam alguma parte dos edifícios Altino Arantes, Banco do Brasil e Martinelli nas células E3, G2 e J5, respectivamente.

Passo-a-passo[editar código-fonte]

Cada declaração carrega um conjunto de coordenadas sobre a posição (x, y) dos retângulos onde estão localizadas as entidades na obra. Este passo-a-passo pretende indicar como esses dados podem ser processados, carregados e refinados por crowdsourcing.

Pré-processamento[editar código-fonte]

  • As letras das células definem a posição horizontal relativa (x) do ponto superior esquerdo da mesma, partindo-se da esquerda para a direita;
  • Os números das células definem a posição vertical relativa (y) do ponto superior esquerdo da mesma, partindo-se de cima para baixo;
  • As letras de A a M representam as posições horizontais relativas respectivas de 0, 1/13, ... e 12/13.
  • Os números de 0 a 11 representam as posições verticais relativas respectivas de 0, 1/11, ... e 10/11.
    • De modo que a célula E3, por exemplo, represente o ponto (x, y) = (4/13, 3/11) e o retângulo que começa nesse ponto e tem uma unidade de altura por uma unidade de largura (w, h iguais a 1/13 e 1/11, respectivamente).
  • Em declarações com mais de uma célula, o retângulo representado começa no ponto superior mais à esquerda (geralmente da primeira célula declarada) e termina no ponto inferior direito mais à direita (geralmente da segunda célula declarada).
    • Nessas circunstâncias, a altura e largura do retângulo são calculadas como segue:
Sejam () e () os pontos superiores da primeira e da segunda célula da declaração.
w =
h =
  • Os retângulos das declarações que definem somente uma célula são os mais simples de serem pré-processados, pois é assumido que têm uma unidade de altura por uma unidade de largura.

A tabela originada dessa etapa do pré-processamento segue::

VALOR ORIGINAL X Y W H ENTIDADE
E3 - EDIFÍCIO ALTINO ARANTES 4/13 3/11 1/13 1/11 EDIFÍCIO ALTINO ARANTES
G2 - EDIFÍCIO BANCO DO BRASIL 6/13 2/11 1/13 1/11 EDIFÍCIO BANCO DO BRASIL
J5 - EDIFÍCIO MARTINELLI 9/13 5/11 1/13 1/11 EDIFÍCIO MARTINELLI

Que após a conversão dos valores fracionários para valores decimais separados por ponto, se torna a tabela:

VALOR ORIGINAL X Y W H ENTIDADE
E3 - EDIFÍCIO ALTINO ARANTES 0.30769 0.27273 0.07692 0.09091 EDIFÍCIO ALTINO ARANTES
G2 - EDIFÍCIO BANCO DO BRASIL 0.46154 0.18182 0.07692 0.09091 EDIFÍCIO BANCO DO BRASIL
J5 - EDIFÍCIO MARTINELLI 0.69231 0.45455 0.07692 0.09091 EDIFÍCIO MARTINELLI

Wikidatificação dos metadados[editar código-fonte]

Para adicionar o posicionamento digital relativo das entidades em uma das obras, é necessário identificá-las dentro do Wikidata.

  • O item correspondente ao Edifício Altino Arantes é o Q169420;
  • O item correspondente ao Edifício do Banco do Brasil é o Q9293741; e
  • O item correspondente ao Edifício Martinelli é o Q6777115.

Substituindo na tabela, obtêm-se:

VALOR ORIGINAL X Y W H ENTIDADE
E3 - EDIFÍCIO ALTINO ARANTES 0.30769 0.27273 0.07692 0.09091 Q169420
G2 - EDIFÍCIO BANCO DO BRASIL 0.46154 0.18182 0.07692 0.09091 Q9293741
J5 - EDIFÍCIO MARTINELLI 0.69231 0.45455 0.07692 0.09091 Q6777115

Carregamento[editar código-fonte]

Exemplo da tela de carregamento dos metadados no Wikidata através da ferramenta QuickStatements
Tela da ferramenta Wikidata Image Positions

A inserção desses metadados no Wikidata pode ser feita manualmente ou através de scripts e ferramentas automatizadas; O principal deles é o QuickStatements, que significa, traduzindo-se livremente, declarações rápidas. O QuickStatements recebe comandos em um formato específico e adiciona a informação passada no Wikidata. Para as declarações de posicionamento digital relativo, o comando é como segue para cada entidade retratada:

<QID da obra>|P180|<QID da entidade retratada>|P2677|"pct:<x>,<y>,<w>,<h>"

No caso da obra de exemplo dessa página, o valor para <QID da obra> é Q53065063, portanto, os comandos para o Quick Statements são:

Q53065063|P180|Q169420|P2677|"pct:0.30769,0.27273,0.07692,0.09091"
Q53065063|P180|Q169420|P2677|"pct:0.46154,0.18182,0.07692,0.09091"
Q53065063|P180|Q169420|P2677|"pct:0.69231,0.45455,0.07692,0.09091"

Refinamento[editar código-fonte]

Os metadados do Museu fornecem uma região na imagem onde podemos identificar as entidades retratadas. Essa seção guia o processo de refinamento da precisão dessa região uma vez que ela esteja declarada no Wikidata. Para tanto, será utilizada outra ferramenta, chamada Wikidata Image Positions, para a edição dos posicionamentos digitais relativos. Essa ferramenta permite que essa atividade seja feita de maneira dinâmica e colaborativa.

  • Entre em sua conta Wiki clicando no botão 'Log In', no canto superior direito e conceda as permissões necessárias para a ferramenta;
  • Insira o QID da obra na página inicial da ferramenta e clique em Load para carregar a imagem e as regiões;
  • Na parte inferior da página, clique em Edit a region;
  • Em seguida, clique em uma das regiões delimitadas por retângulos amarelos sobre a imagem para editá-la;
  • Arraste as bordas do seletor com o mouse até que a entidade retratada esteja justamente contida dentro do seletor;
  • Para salvar a nova região refinada da entidade, clique em use this region;
  • Repita o processo para as demais entidades da obra.

O resultado final são metadados mais precisos. Essas edições podem reverberar por diversas páginas na internet, como livros colaborativos, aplicativos que utilizam o Wikidata, artigos na Wikipédia etc.

Escreva sua dúvida na página de discussão