Saltar para o conteúdo

Arquivo.pt

Origem: Wikipédia, a enciclopédia livre.
Arquivo.pt
História
Fundação
Quadro profissional
Tipo
País
Organização
Afiliação
Website

O Arquivo.pt é um arquivo da Web de Portugal.[1] Tem como missão arquivar periodicamente conteúdos de interesse nacional disponíveis na Web. É um serviço da Fundação para a Ciência e Tecnologia (FCT) que começou na Fundação para a Computação Científica Nacional (FCCN) no dia 8 de novembro de 2007.[2]

O Arquivo.pt recolhe regularmente todos os websites que fazem parte da Web Portuguesa, ou seja, todos os websites sob o Domínio de topo .pt, bem como todos aqueles de interesse nacional. O conteúdo preservado fica disponível um ano após a sua recolha para qualquer utilizador no website arquivo.pt.

Em março de 2025, o Arquivo.pt já contava com 21 118 milhões de ficheiros, 47 milhões de websites e 1455 PetaBytes de páginas web armazenadas datadas desde o ano de 1996.[3][4]

História

[editar | editar código]

A ideia original de arquivar a Web portuguesa começou em 2001 com o projeto tumba!, desenvolvido pelo grupo de investigação XLDB da Faculdade de Ciências da Universidade de Lisboa e apoiado pela FCCN, onde recolheu cerca de 57 milhões de conteúdos, maioritariamente textuais[5]. Desse projeto surgiu o Tomba, um protótipo de um motor de busca que possibilita o acesso a websites arquivados. O nome Tomba surgiu em sequência do nome do Arquivo Nacional da Torre do Tombo.[6]

No dia 8 de novembro de 2007, o projeto do Arquivo da Web Portuguesa foi criado na FCCN[2] tendo combinado os recursos e competências adquiridas no projeto anterior. O projeto foi liderado por Daniel Coelho Gomes desde 2007 até 2025[7]. No início de 2008, a equipa do projeto fez a primeira recolha de websites alojados sob o domínio .pt. O projeto tinha uma maturidade prevista de dois anos e, entretanto, transformou-se num serviço permanente da FCT.[6][8][9]

Serviços

[editar | editar código]

Pesquisa e acesso

[editar | editar código]

O Arquivo.pt disponibiliza uma ferramenta de pesquisa de páginas web a partir de um endereço URL. Esta funcionalidade permite aos utilizadores aceder a diferentes versões da mesma página ao longo do tempo. Para além disso, a funcionalidade de pesquisa também é compatível com a pesquisa por conteúdo textual.

No dia 24 de março de 2021, foi introduzido uma funcionalidade de pesquisa de imagens chamada de Dionisius, que permite aos utilizadores encontrar imagens que já não se encontram disponíveis na live web e localizar as páginas da web onde as imagens foram originalmente publicadas. Esta ferramenta permite o acesso a mais de mil milhões de imagens do passado da Web.[10][11][12]

O acesso automático pode ser feito através de APIs (interfaces para programação de aplicações informáticas), que foi introduzido em 2012.[13][6]

ArchivePageNow

[editar | editar código]

Em 2022, o Arquivo.pt lançou o "ArchivePageNow". Esta funcionalidade permite aos utilizadores arquivar uma página web no momento pretendido. Posteriormente as páginas arquivadas ficam disponíveis para pesquisa.[14]

Arquivo404

[editar | editar código]

Em 2022, o Arquivo.pt desenvolveu o Arquivo404, um algoritmo que permite que páginas na Web com o erro 404 tenham uma hiperligação direcionada para a versão da mesma página preservada no Arquivo.pt.[15]

  • CitationSaver - extrai os links contidos em documentos e arquiva as páginas correspondentes[16]

Casos de uso

[editar | editar código]
Projeto Autores Descrição Ano de publicação
Conta-me Histórias Ricardo Campos, Arian Pasquali, Vítor Mangaravite, Alípio Jorge e Adam Jatowt Serviço online que oferece ao utilizador uma narrativa temporal a partir de notícias sobre um tópico escolhido pelo utilizador, recorrendo a 24 fontes de notícias eletrónicas (jornais e portais nacionais)[17][18] 2018
Enquadramento do conceito de “homossexualidade” em 20 anos de publicação do Jornal Expresso João Teixeira Duarte e Zélia Teixeira Estudo misto (quantitativo e qualitativo) que faz o enquadramento do conceito “homossexualidade” nas peças jornalísticas do semanário “Expresso” (versão escrita e on-line) publicadas ao longo de 20 anos[19] 2018
Arquivo de Opinião Miguel Won Aplicação web que disponibiliza ao utilizador um repositório digital de artigos de opinião, publicados entre 2008 e 2016, nos principais agentes de media de Portugal 2018
meuParlamento.pt Nuno Moniz, Arian Pasquali e Tomás Amaro Aplicação móvel que simula o Parlamento Português, convidando todos os cidadãos e cidadãs a desempenharem o papel de deputado[20] 2019
Revisionista.pt: Des-cobre as notícias Flávio Martins e André Mourão Ferramenta online para revelar alterações pós-publicação nas notícias portuguesas[21] 2019
Discursos públicos sobre violência em privado Zélia de Macedo Teixeira Análise de 217 notícias recolhidas no Arquivo.pt a partir dos três principais jornais diários, sobre violência doméstica 2019
Desarquivo Miguel Ramalho Website que permite pesquisar por entidades (ex. pessoas, organizações e locais) e identificar relações entre elas, a partir das notícias publicadas em jornais online ao longo do tempo[22] 2020
Extensão Arquivo.pt Rodrigo Marques e Hugo Silva Extensão para Google Chrome que permite realizar pesquisas avançadas no Arquivo.pt, sem necessitar de abandonar a página que está visualizar no momento 2020
Arquivo Económico Nuno Bragança Apresenta a informação preservada pelo Arquivo.pt acerca dos preços de produtos desde o tempo do escudo português 2020
Jornal do Passado Bruno Galhardo Um jogo para todas as idades, desenvolvido para Android, no qual o utilizador põe à prova os seus conhecimentos sobre notícias/eventos tentando adivinhar a data em que ocorreram 2020
Major Minors Paulo Martins e Leandro Costa Ontologia de recortes de imprensa de jornais portugueses com referência a minorias sociais 2021
Politiquices David Batista Aplicação Web que permite pesquisar relações de apoio ou oposição entre personalidades e partidos políticos expressas em títulos de notícias preservadas no Arquivo.pt 2021
Primeiras páginas de jornais online portugueses Susana Parreira (sob orientação de Ana Sabino, Ana Boavida e Penousal Machado) Apresenta uma análise gráfica interativa das primeiras páginas de jornais online portugueses. Para este estudo foram analisados itens específicos dentro do desenho de jornais, permitindo assim observar tendências ao longo do tempo[23][24] 2021
Arquivo do Parlamento Tiago Santos Aplicação Web que agrega notícias e artigos de opinião extraídos do Arquivo.pt com base nos dados abertos do Parlamento.pt. 2022
Classificação automática de artigos estigmatizantes de doenças mentais Yanchuk, Alina Trifan, Olga Fajarda e José Luís Oliveira Envolve uma metodologia para a classificação automática de artigos estigmatizantes de doenças mentais, presentes em jornais de notícias portugueses online, através de Inteligência Artificial 2022
Arquivo Público Diogo Correia e Ricardo Campos Aplicação Web focada nos conteúdos publicados no sítio Web do Jornal Público ao longo do tempo e preservados pelo Arquivo.pt 2022
Viajar no tempo sobre carris Antero Pires, Carlos Cipriano, Diogo Ferreira Nunes e Ruben Martins Plataforma online que analisa e apresenta a evolução dos tempos de viagens de comboio em Portugal, com base nos horários preservados no Arquivo.pt 2023
Representatividade das mulheres artistas na imprensa nacional Cláudia Sevivas e Miguel Boavida Disponibiliza informação sobre artistas portuguesas e apresenta as páginas Web em que foram mencionadas ao longo do tempo 2023
Memória Política Miguel Lopes, Maria Carneiro e João Andrade Aplicação Web que processa e apresenta informação retirada das páginas web dos partidos políticos com assento parlamentar, arquivadas pelo Arquivo.pt 2023
Fábrica do Jornal Miguel Almeida Aplicação Web que permite ao utilizador gerar um jornal personalizado a partir de notícias preservadas no Arquivo.pt, podendo obter uma versão que pode imprimir ou guardar em formato digital 2023
Imaginarium Diogo Sousa Aplicação Web que faz pesquisa de imagens a partir de semelhanças com outras imagens 2023
GlórIA David Semedo, Ricardo Lopes e João Magalhães Modelo de Linguagem em Grande Escala para a língua portuguesa[25][26] 2024
Noticioso – Desafiar percepções Carmen Fonseca e António Ramiro Plataforma em que o utilizador pode comparar a cobertura mediática sobre diversos temas através de um jogo em formato de quiz. Permite ainda explorar tendências ao longo do tempo através de uma ferramenta analítica 2024
Habitação.NET: Uma visão do Mercado de Habitação em Portugal Diogo Gonçalves Ferramenta que permite ao utilizador explorar, de forma interativa, a evolução do valor médio do mercado habitacional e arrendatário português, contextualizado com notícias publicadas sobre o tema e as políticas de habitação 2024
Pegada Lusa Diana Costa e Sérgio Teixeira Mostra a evolução das políticas e iniciativas sustentáveis nas diversas regiões do país, a partir da análise dos projetos e boas práticas dos Objetivos de Desenvolvimento Sustentável 2024
Uma viagem no tempo com o Público e o Expresso Rita Marques Costa e Beatriz Malveiro Analisa e compara as páginas web do Público e o Expresso, desde 1998, mostrando ao utilizador do website como evoluíram as versões digitais destes meios 2024
discordAR: a Proximidade dos Partidos na Assembleia da República Miguel Salema e Sebastião Fonte App que mostra a proximidade entre partidos políticos, usando os votos na Assembleia da República Portuguesa 2024
ArquivoNC – arquivo web do Jornal de Notícias da Covilhã Rodrigo Dias da Silva (orientado pelo Professor Ricardo Campos, da Universidade da Beira Interior) Disponibiliza o acesso a dez anos de páginas web do jornal Notícias da Covilhã a partir das notícias preservadas pelo Arquivo.pt entre 2009 e 2019 2024
A minha região Rúben Almeida, Ricardo Campos e Sérgio Nunes Plataforma que reúne informação eleitoral autárquica, entre 1976 e 2021, que permite procurar informação por distrito, município e freguesia[27][28][29][30][31] 2025
Memor.pt – Explore a Memória Digital Portuguesa Joaquim Matoso Plataforma interativa que utiliza conteúdos preservados pelo Arquivo.pt para tornar acessível a memória digital de Portugal. Através de uma IA conversacional, um quiz temático e um artigo diário, os utilizadores podem explorar milhares de páginas arquivadas sobre temas como habitação, democracia, cultura e mercado de trabalho 2025
Narrative Monitoring Erik Bran Marino, Rafael Prezado, Ana Sofia Ribeiro e Renata Vieira Constitui uma análise sistemática e abrangente da emergência e evolução das teorias conspirativas de substituição populacional no espaço digital português, entre 1996 e 2021 2025
Estudos Arquivados Filipe Oliveira João e Paulo Cabrita Plataforma para uso do Arquivo.pt em contexto pedagógico e de ensino. Organiza as pesquisas de um utilizador por disciplina e ano escolar, podendo o utilizador registar-se e guardar as suas próprias pesquisas para uso posterior 2025
Archive Chain Bruno Cotrim (com orientação científica dos professores Bernardo Ferreira e Miguel Matos) Blockchain que vem democratizar a missão de arquivar a web histórica portuguesa[32][33] 2025
Arquivo 25 de abril Miguel Garcia Disponibiliza um arquivo online de artigos jornalísticos sobre várias personalidades, eventos e movimentos que tiveram relevância no antes e durante o 25 de Abril de 1974 2025

Prémio Arquivo.pt

[editar | editar código]

Desde 2018, organiza o Prémio Arquivo.pt, com alto patrocínio do Presidente da República Portuguesa e em parceria com o Jornal Público, onde são galardoados trabalhos de investigação que usam a informação constante do arquivo.[34][35]

Distinções

[editar | editar código]
  • 2008 - Melhor artigo para Arquivo e medição da web portuguesa at Ibero-Americana IADIS WWW/Internet 2008[36]
  • 2022 - Quadro de honra da segurança em Portugal segundo o Observatório Português de Tecnologias da Internet[37]
  • 2022 - Melhor Serviço Digital de 2022[38]
  • 2023 - Top 3 dos serviços digitais governamentais em Portugal[39][40]
  • 2024 - Finalista do The National Archives (UK) Award for Safeguarding the Digital Legacy (Digital Preservation Coalition Awards 2024)[41]
  • 2024 - Melhor Projeto Digital da Administração Pública Central[42]
  • 2024 - Prémio Transformação Digital 2024[43][44]

Ver também

[editar | editar código]

Referências

  1. Daniel Gomes, André Nogueira, João Miranda, Miguel Costa, Introducing the Portuguese web archive initiative, 8th International Web Archiving Workshop, Aarhus, Dinamarca, Setembro de 2008
  2. a b Pinto, Pedro (26 de novembro de 2023). «Arquivo.pt já tem 1 PetaByte de informação guardada...». Pplware. Consultado em 25 de agosto de 2025 
  3. «Arquivo.pt em números». Arquivo.pt. Consultado em 25 de agosto de 2025 
  4. «Arquivo.pt in numbers». arquivo.pt. Consultado em 25 de agosto de 2025 
  5. GOMES, Daniel. Arquivo e medição da Web portuguesa (PDF). [S.l.: s.n.] 
  6. a b c «História Arquivo.pt». Arquivo.pt. Consultado em 25 de agosto de 2025 
  7. «Antigos Membros». Arquivo.pt. Consultado em 25 de agosto de 2025 
  8. «List of the collections preserved by Arquivo.pt». Google Docs. Consultado em 25 de agosto de 2025 
  9. «Arquivo.pt». arquivo.pt. 18 de março de 2008. Consultado em 25 de agosto de 2025 
  10. «Milhões de imagens sobre o passado! – sobre.arquivo.pt». 23 de agosto de 2022. Consultado em 25 de agosto de 2025 
  11. SAPO. «Arquivo.pt tem mais de mil milhões de imagens históricas da internet pesquisáveis online». SAPO Tek. Consultado em 5 de maio de 2021 
  12. Mourão, André; Gomes, Daniel (9 de outubro de 2023). «Searching images in a web archive». IEEE: 1–10. ISBN 979-8-3503-4503-2. doi:10.1109/DSAA60987.2023.10302607. Consultado em 27 de agosto de 2024 
  13. «APIs». GitHub (em inglês). Consultado em 25 de agosto de 2025 
  14. «Arquive páginas no Arquivo.pt com o ArchivePageNow». Arquivo.pt. 7 de janeiro de 2025. Consultado em 25 de agosto de 2025 
  15. «Arquivo404 mostra páginas preservadas em vez de "páginas não encontradas"». FCCN - serviços digitais da FCT. 21 de abril de 2022. Consultado em 23 de agosto de 2025 
  16. «CitationSaver preserves citations to web resources» (em inglês). 20 de abril de 2023. Consultado em 25 de agosto de 2025 
  17. «Contar histórias sobre a História». Fórum Estudante. 6 de dezembro de 2018. Consultado em 20 de agosto de 2024 
  18. LIAAD - Laboratory of Artificial Intelligence and Decision Support. «Conta-me Historias Temporal Summarization». GitHub. Consultado em 20 de agosto de 2024 
  19. «Projeto de docente da UFP distinguido nos Prémios Arquivo.pt». Universidade Fernando Pessoa. Consultado em 20 de agosto de 2024 
  20. Reis, Tiago (13 de março de 2020). «"App" que "simula" o Parlamento vale prémio a investigadores da U.Porto». Notícias Universidade do Porto. Consultado em 20 de agosto de 2024 
  21. «Investigadores do NOVA LINCS ganham Prémio Arquivo.pt 2019». 12 de julho de 2019. Consultado em 20 de agosto de 2024 
  22. Serafim, Teresa (2 de agosto de 2020). «Criada uma ferramenta para "desarquivar" ligações entre entidades». Público 
  23. Parreira, Susana Catarina Arromba (17 de setembro de 2020). «Primeiras páginas de jornais online portugueses - Uma análise gráfica interativa». Consultado em 27 de agosto de 2024 
  24. «"Primeiras páginas de jornais online" receives Arquivo.pt 2021 Award». Computation Design and Visualisation Lab - Departamento de Engenharia Informática da Faculdade de Ciências e Tecnologia da Universidade de Coimbra 
  25. JD (22 de maio de 2024). «GlórIA: the new Portuguese-European Large Language Model». NOVA LINCS. Consultado em 23 de agosto de 2025 
  26. «Modelo de Linguagem em Grande Escala para a língua portuguesa». 29 de novembro de 2024. Consultado em 23 de agosto de 2025 
  27. «Rúben Almeida, alumnus do M.EIC, distinguido com o 1º lugar do Prémio Arquivo.pt 2025 pelo desenvolvimento de um projeto inovador que promove a proximidade entre cidadãos e o poder local». DEI - Departamento de Engenharia Informática. 16 de julho de 2025. Consultado em 23 de agosto de 2025 
  28. «Prémio Arquivo.pt para docente do Departamento de Informática». UBI - Universidade da Beira Interior. 18 de julho de 2025. Consultado em 23 de agosto de 2025 
  29. «Portal recupera 50 anos de dados eleitorais autárquicos». RTP Madeira. 17 de julho de 2025. Consultado em 23 de agosto de 2025 
  30. «INESC TEC vence Prémio Arquivo.pt com portal que recupera 50 anos de dados autárquicos». BIP INESC TEC Magazine. 16 de julho de 2025. Consultado em 23 de agosto de 2025 
  31. Leite, Mafalda (21 de julho de 2025). «Da engenharia à democracia: docentes da FEUP vencem Prémio Arquivo.pt com plataforma autárquica». Notícias da Faculdade de Engenharia. Consultado em 23 de agosto de 2025 
  32. Séneca, Hugo (4 de julho de 2025). «Investigadores de CIÊNCIAS distinguidos pelos prémios Arquivo.pt». Faculdade de Ciências da Universidade de Lisboa. Consultado em 23 de agosto de 2025 
  33. «Professor do DEI distinguido com menção honrosa no Prémio Arquivo.pt 2025». Departamento de Engenharia Informática. 3 de julho de 2025. Consultado em 23 de agosto de 2025 
  34. «Prémios Arquivo.pt». Consultado em 23 de agosto de 2025 
  35. «Prémio Arquivo.pt». FCT. Consultado em 23 de agosto de 2025 
  36. Arquivo e Medição da Web Portuguesa, 2008 
  37. ISOC Portugal lança o Observatório da Internet portuguesa – ISOC.PT, 2024, consultado em 20 de agosto de 2024 
  38. Exame Informática | Os Melhores & As Maiores do Portugal Tecnológico 2022: conheça os vencedores, 2022, consultado em 20 de agosto de 2024 
  39. Quem são os líderes da transformação digital do país?, 2023, consultado em 20 de agosto de 2024 
  40. «Vencedores Portugal Digital Awards® 2023». Portugal Digital Awards. 2023. Consultado em 23 de agosto de 2025. Arquivado do original em 5 de maio de 2024 
  41. «The National Archives (UK) Award for Safeguarding the Digital Legacy - Digital Preservation Coalition» (em inglês). Consultado em 23 de agosto de 2025. Arquivado do original em 12 de agosto de 2024 
  42. Arquivo.pt recebe prémio de Melhor Projeto da Administração Pública Central, consultado em 4 de novembro de 2024 
  43. Arquivo.pt venceu o Prémio Transformação Digital 2024, consultado em 5 de dezembro de 2024 
  44. 4.ª Edição – Prémio Transformação Digital (2024), consultado em 6 de janeiro de 2025 

Ligações externas

[editar | editar código]