Modelo de arquivamento de páginas web para Portais de Periódicos

um relato de pesquisa no Portal de Periódicos da UNICAMP

Autores

DOI:

https://doi.org/10.20396/rebpred.v3i00.16017

Palavras-chave:

Arquivamento de páginas web, Preservação digital, Páginas web, Conifer

Resumo

Introdução: O crescimento dos documentos em formato digital tem provocado diversas mudanças no cenário da pesquisa científica, e diversos sites institucionais e de pesquisa se proliferaram de forma acelerada e necessitam de tratamento. Os arquivos da Web têm um papel importante a desempenhar como infraestruturas sociais que permitem a preservação da memória. Objetivo: Preservar digitalmente, por meio da ferramenta CONIFER da empresa Rhizome, as páginas Web do Portal de Periódicos Eletrônicos Científicos da Universidade Estadual de Campinas (UNICAMP). Metodologia: Uma pesquisa de cunho exploratório, com abordagem da microarchiving, tendo como enfoque o levantamento bibliográfico para a elaboração da revisão da literatura sobre a temática em discussão. Utiliza-se como ferramenta o Conifer, que promoveu o arquivamento Web do Portal de Periódicos Eletrônicos da UNICAMP. O formato trabalhado nesta metodologia é o WARC. O WARC é um formato de arquivo para conteúdo da Web que armazena conteúdo da página Web, cabeçalhos de respostas e metadados para um grupo de páginas da Web. Resultados: Preservadas atualmente duas (02) revistas do Portal de Periódicos da UNICAMP. Conclusão: Espera-se que com essa metodologia possamos ampliar a preservação e arquivamento da Web de páginas institucionais da universidade, bem como oferecer a metodologia para as demais instituições interessadas em arquivar as páginas Web de seus Portais.

Downloads

Não há dados estatísticos.

Biografia do Autor

Gildenir Carolino Santos, Universidade Estadual de Campinas

Bibliotecário. Responsável pelo Portal de Periódicos Eletrônicos Científicos da UNICAMP.

Danilo Formenton, Universidade Federal de São Carlos

Mestrado em Ciência, Tecnologia e Sociedade pela Universidade Federal de São Carlos - Campus de São Carlos. Doutorando em Ciência, Tecnologia e Sociedade pela Universidade Federal de São Carlos - Campus de São Carlos. 

Gabriela Ayres Ferreira Terrada, Universidade Federal Fluminense

Graduação em Biblioteconomia e Documentação pela Universidade Federal Fluminense e graduação em Arquivologia pela Universidade Federal Fluminense. Mestra pelo Programa de Pós-Graduação em Ciência da Informação PPGCI-UFF. É servidora da Fundação Biblioteca Nacional.

Conceituação: SANTOS, G.C.
Curadoria de dados: SANTOS, G.C.
Investigação: SANTOS, G.C.; FORMENTON, D.
Metodologia: SANTOS, G.C.
Administração de projetos: SANTOS, G.C.
Software: SANTOS, G.C.
Supervisão: SANTOS, G.C.; FORMENTON, D.
Validação: SANTOS, G.C.; FORMENTON, D.; TERRADA, G. A. F
Visualização: SANTOS, G.C.; FORMENTON, D.; TERRADA, G. A. F.
Redação–rascunho original: SANTOS, G.C.; FORMENTON, D.
Redação–revisão e edição: FORMENTON, D.; TERRADA, G. A. F.

Referências

ALVES, R. C. V. Metadados como elementos do processo de catalogação. 2010. Tese (Doutorado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, SP, 2010.

ANGELO, E. da S.; OLIVEIRA, M. Estudo altmétrico de repercussão social das revistas científicas brasileiras de acesso aberto. Bibliotecas: Anales de Investigación, v. 17, n. 1, p. 14-26, 2021. Disponível em: https://urless.in/iYHLd. Acesso em: 22 maio 2022.

BRÜGGER, N. Archiving websites: general considerations and strategies. Århus: The Centre for Internet Research, 2005. Disponível em: https://cfi.au.dk/fileadmin/www.cfi.au.dk/publikationer/archiving_underside/archiving.pdf. Acesso em: 22 maio 2022.

DAY, M. Preserving the fabric of our lives: a survey of web preservation initiatives. In: EUROPEAN CONFERENCE ON RESEARCH AND ADVANCED TECHNOLOGY FOR DIGITAL LIBRARIES, 7., 2003, Trondheim. Proceedings [...]. Trondheim, Norway: Springer Verlag, 2003a. Disponível em: http://www.ukoln.ac.uk/metadata/presentations/ecdl2003-day/day-paper.pdf. Acesso em: 22 maio 2022.

FORMENTON, D.; GRACIOSO, L. de S. Padrões de metadados no arquivamento da Web: recursos tecnológicos para a garantia da preservação digital de websites arquivados. RDBCI: Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, SP, v. 20, e022001, 2022. DOI: 10.20396/rdbci.v20i00.8666263. Disponível em: https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8666263. Acesso em: 5 jun. 2022. DOI: https://doi.org/10.20396/rdbci.v20i00.8666263

FORMENTON, D.; GRACIOSO, L. de S. Preservação digital: desafios, requisitos, estratégias e produção científica. RDBCI: Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, SP, v. 18, e020012, 2020. DOI: 10.20396/rdbci.v18i0.8659259. Disponível em: https://periodicos.sbu.unicamp.br/ojs/index.php/rdbci/article/view/8659259. Acesso em: 3 jun. 2022. DOI: https://doi.org/10.20396/rdbci.v18i0.8659259

GRÁCIO, J. C. A. Metadados para a descrição de recursos da Internet: o padrão Dublin Core, aplicações e a questão da interoperabilidade. 2002. Dissertação (Mestrado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, SP, 2002.

HEDSTROM, Margaret. Digital preservation: a time bomb for digital libraries. Computers and the Humanities, Netherlands, v. 31, p. 189-202, 1998. Disponível em: https://deepblue.lib.umich.edu/bitstream/handle/2027.42/42573/?sequence=1. Acesso em: 3 jun. 2022. DOI: https://doi.org/10.1023/A:1000676723815

HOCKX-YU, H. The past issue of the web. In: INTERNATIONAL WEB SCIENCE CONFERENCE, 3., 2011, NewYork. Proceedings [...]. New York, NY: Association for ComputingMachinery, 2011. p. 1-8. DOI: https://doi.org/10.1145/2527031.2527050. DOI: https://doi.org/10.1145/2527031.2527050

INTERNATIONAL INTERNET PRESERVATION CONSORTIUM. Web archiving. Tools & software. [S. l.], c2022. Disponível em: https://netpreserve.org/web-archiving/tools-and-software/. Acesso em: 3 jun. 2022.

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION - ISO. BS ISO 28500: 2009: information and documentation: WARC file format. Switzerland: ISO, 2009.

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION - ISO. BS ISO 28500: 2017: Information and documentation: WARC file format. Switzerland: ISO, 2017. Disponível em: https://www.iso.org/obp/ui/#iso:std:iso:28500:ed-2:v1:en. Acesso em: 22 maio 2022.

PENNOCK, M. Web archiving. DPC technology watch report 13-01 March 2013. Great Britain: DCP, 2013.DOI: http://dx.doi.org/10.7207/twr13-01.Disponível em: https://www.dpconline.org/docs/technology-watch-reports/865-dpctw13-01-pdf/file. Acesso em: 9 jun. 2021.

PEREIRA, P. C. Avaliação da usabilidade do Portal de Periódicos Eletrônicos Científicos da UNICAMP. 2019. 1 recurso online (251 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1636189. Acesso em: 1 jun. 2022.

PINHEIRO, L. V. R.; FERREZ, H. D. Tesauro brasileiro de ciência da informação. Rio de Janeiro; Brasília, DF: Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT), 2014. 384 p. Disponível em: http://sitehistorico.ibict.br/publicacoes-e-institucionais/tesauro-brasileiro-de-ciencia-da-informacao-1/copy_of_TESAUROCOMPLETOFINALCOMCAPA24102014.pdf. Acesso em: 3 jun. 2022.

RILEY, J. Understanding metadata: what is metadata, and what is it for? Baltimore, Maryland: National Information Standards Organization (NISO), c2017. 45 p. Disponível em: https://groups.niso.org/higherlogic/ws/public/download/17446/Understanding%20Metadata.pdf. Acesso em: 1 jun. 2022.

RHIZOME.ORG. Conifer. About. [New York, United States], [2022]. Disponível em: https://conifer.rhizome.org/_faq. Acesso em: 3 jun. 2022.

SAMOUELIAN, M.; DOOLEY, J. Descriptive metadata for web archiving: review of harvesting tools. Dublin, Ohio: Online Computer Library Center (OCLC) Research, Feb. c2018. 23 p. Disponível em: https://www.oclc.org/content/dam/research/publications/2018/oclcresearch-wam-harvesting-tools.pdf. Acesso em: 3 jun. 2022.

SANTOS, G. C. Ensaio sobre arquivamento de páginas web: foco na experiência do Portal de Periódicos da UNICAMP, utilizando o Conifer (Rhizome). In: SEMINÁRIO INTERNACIONAL DE PRESERVAÇÃO DIGITAL, 5., 2021, Campinas. Resumos [...]. Campinas: UNICAMP: IBICT, 2021. Disponível em: http://eventoscariniana.ibict.br/index.php/sinpred/issue/view/5. Acesso em: 31 maio 2021.

SANTOS, G. C. Organização, registro e a divulgação do conhecimento científico: metodologia para a criação do Portal de Periódicos Científicos produzido na UNICAMP. 2012. 82 f. Relatório (Pós-doutorado) - Universidade Estadual de Campinas, Laboratório de Estudos Avançados em Jornalismo, 2012.

SANTOS, G. C. Visibilidade e vantagens na publicação de periódicos em portais institucionais. Blog PPEC, Campinas, SP, v.1, n.1, 2017. ISSN 2526-9429. Disponível em: https://periodicos.sbu.unicamp.br/blog/index.php/2017/06/12/portais-2/. Acesso em: 22 maio 2022.

SANTOS, G.C.; CAMARGO, V. R. T. Portal da informação e comunicação: proposta de desenvolvimento do portal de periódicos científicos eletrônicos da Universidade Estadual de Campinas. In: CONGRESSO INTERNACIONAL DE CIDADES CRIATIVAS,3., 2013, Campinas, SP. Actas Icono14. Campinas, SP: [S.l.], 2013. v. 1. p. 1691-1706.

TERRADA, G. A. F. Preservação digital da web: uma reflexão sobre política e práticas. 2022. 213 f. Dissertação (Mestrado). Universidade Federal Fluminense, Instituto de Arte e Comunicação Social, 2022. Disponível em: http://dx.doi.org/10.22409/PPGCI.2022.m.11797917706. Acesso em: 22 maio 2022.

VLASSENROOT, E. et al. Web archives as a data resource for digital scholars. International Journal of Digital Humanities, London, v. 1, p. 85-111, 2019. DOI: https://doi.org/10.1007/s42803-019-00007-7. Disponível em: https://link.springer.com/article/10.1007/s42803-019-00007-7. Acesso em: 02 fev. 2021. DOI: https://doi.org/10.1007/s42803-019-00007-7

WEB PAGE. In: WIKIPEDIA: the free encyclopedia. [San Francisco, CA: Wikimedia Foundation, 2022]. Disponível em: https://en.wikipedia.org/wiki/Web_page. Acesso em: 3 jun. 2022.

WEBSITE. In: WIKIPEDIA: the free encyclipedia. [San Francisco, CA: Wikimedia Foundation, 2022]. Disponível em: https://en.m.wikipedia.org/wiki/Website. Acesso em: 3 jun. 2022.

páginas

Publicado

2022-07-12

Como Citar

SANTOS, G. C.; FORMENTON, D.; TERRADA, G. A. F. . Modelo de arquivamento de páginas web para Portais de Periódicos: um relato de pesquisa no Portal de Periódicos da UNICAMP. Revista Brasileira de Preservação Digital, Campinas, SP, v. 3, n. 00, p. e022001, 2022. DOI: 10.20396/rebpred.v3i00.16017. Disponível em: https://econtents.bc.unicamp.br/inpec/index.php/rebpred/article/view/16017. Acesso em: 4 dez. 2022.