Compartilhamento de datasets de pesquisa do projeto Música em Periódicos Oitocentistas (MPO): um protótipo com o uso da solução ckan

Autores

DOI:

https://doi.org/10.62758/re.v3i3.214

Palavras-chave:

Ciência Aberta, Música em Periódicos Oitocentistas, FAIR, FAIRficação, Reuso, CKAN

Resumo

O movimento do acesso aberto está sendo impulsionado pela iniciativa Open Science, onde, em essência, os objetos de pesquisa e resultados obtidos em investigações vão além da produção documental em C&T, pois passam a incorporar também os dados que são utilizados no desenvolvimento dessas pesquisas. A disponibilização desses dados deve ser implementada de forma a possibilitar que outras iniciativas de pesquisa possam reutilizá-los no contexto de novas investigações. Este relato explora o uso do banco de dados do projeto Música em Periódicos Oitocentistas (MPO) e apresenta o protótipo com a iniciativa de compartilhamento de dados desse projeto. O desenvolvimento do protótipo para compartilhamento seguiu as recomendações apresentadas pelos princípios FAIR (Findable, Accessible, Interoperable e Reusable), pois a adoção desses princípios promove a melhoria no compartilhamento de dados de pesquisa. A metodologia utilizada combina métodos e abordagens epistemológicas, avaliando os dados de forma qualitativa e utilizando a revisão bibliográfica para reunir os aspectos teóricos envolvidos, além da aplicação prática por meio de estudo de caso para a composição dos conjuntos de dados.  Fazendo uso do processo de FAIRficação (FAIRfication process) sobre conjuntos de dados do projeto MPO, selecionados a partir do periódico A Marmota na Corte, foram definidas estruturas de recursos para elucidar o conjunto de dados (dataset) depositado no software CKAN - Comprehensive Knowledge Archive Network. Os resultados do protótipo apresentam a estrutura de dois conjuntos de dados que contém registros com descrições textuais de notícias sobre música no século XIX. Os conjuntos de dados estão publicados sob licenciamento Creative Commons Attribuition License (cc-by) e hospedados na plataforma CKAN, possibilitando que o seu conteúdo possa ser reutilizado por pesquisadores interessados na temática.

Referências

Allemang, D., & Hendler, J. (2011). Semantic web for the working ontologist: effective modeling in RDFS and OWL. Elsevier. DOI: https://doi.org/10.1016/B978-0-12-385965-5.10002-0

Baker, M. (2016). Is there a reproducibility crisis? Nature, 533, p. 452, 26 May 2016. https://www.nature.com/news/1-500-scientists-lift-the-lid-on-reproducibility-1.19970. DOI: https://doi.org/10.1038/533452a

Benhamed, O. M. et al. (2023). The FAIR Data Point: Interfaces and Tooling. Data Intelligence 2023; 5 (1): 184–201. doi: https://doi.org/10.1162/dint_a_00161 DOI: https://doi.org/10.1162/dint_a_00161

Brasil. (2019, Dezembro 5). Infraestrutura nacional de dados abertos. https://www.gov.br/governodigital/pt-br/dados-abertos/infraestrutura-nacional-de-dados-abertos.

Ckan (s.d.). API Guide. 2.10.1. https://docs.ckan.org/en/2.10/api/index.html

Creative Commons (s.d.). Licenses. https://creativecommons.org/licenses/?lang=pt_BR

Curty, R. G. & Aventurier, P. (2017). O paradigma da publicação de dados e suas diferentes abordagens. [Conference session]. Encontro Nacional de Pesquisa e Pós-graduação em Ciência da Informação, XVIII ENANCIB. http://hdl.handle.net/20.500.11959/brapci/105144.

Fanelli, D. (2018). Opinion: Is science really facing a reproducibility crisis, and do we need it to? Proceedings of the National Academy of Sciences of the United States of America, 115(11), 2628-2631, mar. https://www.pnas.org/doi/10.1073/pnas.1708272114. DOI: https://doi.org/10.1073/pnas.1708272114

Fenner, M., Crosas, M., Grethe, J.S., Kennedy D., Hermjakobet H., Rocca-Serra P., Durand G., Berion R., Karcher S., Martone M. & Clark T. (2019). A data citation roadmap for scholarly data repositories. Sci Data 6(28). https://doi.org/10.1038/s41597-019-0031-8 DOI: https://doi.org/10.1038/s41597-019-0031-8

Gabriel Junior, R. F., Rocha, R. P., Caregnato, S. Vans, S., Pavão, C. G., Moura, A. P. M. de & Passos, P. C. S. J. (2022, agosto 9-11). Iniciativa para o desenvolvimento e implementação de repositórios de dados de pesquisa: RNP/Ibict/CNPq. [Conference session]. ENCONTRO DA REDE BRASILEIRA DE REPOSITÓRIOS DIGITAIS, Fiocruz-Icict e IBICT. https://www.arca.fiocruz.br/handle/icict/54759

Henning, P. C., Ribeiro, C. J. S., Sales, L. F., Moreira, L. R, Santos & L. O. B. da S. (2018). Desmistificando os princípios FAIR: conceitos, métricas, tecnologias e aplicações inseridas no ecossistema dos dados FAIR. Tendências da Pesquisa Brasileira em Ciência da Informação, 11(1), 1-23. https://revistas.ancib.org/index.php/tpbci/article/view/458. DOI: https://doi.org/10.22478/ufpb.1981-0695.2019v14n3.46969

Jacobsen, A. et al. (2020). A generic workflow for the Data FAIRification Process. Data Intelligence, Cambridge, 2(1-2), 56-65, 2020. https://doi.org/10.1162/dint_a_00028. DOI: https://doi.org/10.1162/dint_a_00028

Jorge, V. A. & Albagli, S. (2018). Compartilhamento de dados de pesquisa em saúde: iniciativas do National Institutes of Health (NIH). Reciis, 12(4), out./dez. Disponível em: https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/1499. DOI: https://doi.org/10.29397/reciis.v12i4.1499

Kalinauskaitê, D. (2017). To be findable, accessible, interoperable and reusable: language data and technology infrastructure for supporting the FAIR data approach. [Conference session]. CEUR Workshop Proceedings, Kaunas. ICYRIME 2017: proceedings of the symposium for young researchers in informatics, mathematics and engineering. Aachen: CEUR-WS. https://www.vdu.lt/cris/entities/publication/6138a749-b4c6-48b0-9020-b2b97ef1dd91/details.

Koche, J. C. (2015). O fluxograma da pesquisa científica. In J. C. KOCHE (ed.), Fundamentos de metodologia científica: teoria da ciência e iniciação à pesquisa. 34. Ed. (pp. 121-136). Petrópolis. Vozes.

Novaes, F. C. P.; Tolare, J. B. & Moreira, W. (2023). Análise da representação da música em bibliotecas digitais. [Conference Session] ISKO-Brasil 2023. Organização e representação do conhecimento em diferentes contextos. PPGCI-UEL. (pp. 126-133). Londrina.

Nüst, D., Granell, C., Hofer, B., Konkol, M., Ostemann, F. O, Sileryte, R. & Cerutti, V. (2018). Reproducible research and GIScience: an evaluation using AGILE conference papers. PeerJ, 6, e5072. https://peerj.com/articles/5072/. DOI: https://doi.org/10.7717/peerj.5072

Open Knowledge Foundation (s.d). Open Database License. https://opendefinition.org/licenses/odc-odbl/

Packer, A. L. & Santos, S. (2019). Ciência aberta e o novo modus operandi de comunicar pesquisa – parte I. https://blog.scielo.org/blog/2019/08/01/ciencia-aberta-e-o-novo-modus-operandi-de-comunicar-pesquisa-parte-i/#.Y5Rn433MLIV.

Portugal. (2016). Ministério da Ciência, Tecnologia e Ensino Superior. Ciência aberta. https://www.ciencia-aberta.pt/sobre-ciencia-aberta

Rautemberg, S., Souza, L. de, Dall´Agnol, J. M. H & Michelon, G. A. (2018). Guia prático para publicação de dados abertos conectados na web. Curitiba. Appris.

Ribeiro, C. J. S., Sousa, C. S. de, Tertulino, C. I., Amaral, I. S. do, Santos, M. J. S. dos, Soares, Cóquero, S. de M. S., & Ulhoa, M. T de (2023). Knowledge Organization no Processo de FAIRificação de Datasets: Estruturando a Semântica e Interligando as Notícias do Banco de Dados de Periódicos Musicais Oitocentistas. *[Conference Session]. [Conference Session] ISKO-Brasil 2023. Organização e representação do conhecimento em diferentes contextos. PPGCI-UEL. Londrina. doi https://doi.org/10.29327/5261847 DOI: https://doi.org/10.29327/5261847

Ribeiro, C. J. S., & Almeida, R. F. de. (2011). Dados Abertos Governamentais (Open Government Data): instrumento para exercício de cidadania pela sociedade. [Conference Session]. Encontro Nacional de Pesquisa em Pós-Graduação em Ciência da Informação, Brasília, 12. http://hdl.handle.net/20.500.11959/brapci/182610.

Ribeiro, C. J. S. & Velho, A. C. M. (2021). Princípios FAIR e a gestão de bases governamentais: análise do compartilhamento de dados de registros civis por meio da iniciativa GovData. In L. F. Sales, V. S. de O. Veiga,P. Henning, L. F. Sayão. (Eds.), Princípios FAIR aplicados à gestão de dados de pesquisa. (pp 69-83). Ibict. https://ridi.ibict.br/handle/123456789/1182

Sayão, L. F. & Sales, L. F. (2015). Guia de gestão de dados de pesquisa para bibliotecários e pesquisadores. CNEN/IEN. http://www.aben.com.br/Arquivos/420/420.pdf.

Severino, A. J. (2007). Metodologia do trabalho científico. Cortez. DOI: https://doi.org/10.36311/2007.978-85-249-1311-2

University of Twente. (2022). FAIR principles and the FAIRification process (2021-2B) [Web course]. University of Twente. The Netherlands.

Veiga, V. S. de O., Dib, S. F., Henning, P. C., Nascimento, F. J. T., Gunaes, P. , Penedo, E., Guimarães, C. (2022). Plano de Gestão de Dados de Pesquisa - PGD: guia de elaboração. [Working Paper]. Fiocruz/Icict, https://www.arca.fiocruz.br/handle/icict/54805

Wilkinson, M. D. et al. (2017). A design framework and exemplar metrics for FAIRness. [bioRxiv preprint] https://www.biorxiv.org/content/biorxiv/early/2017/11/29/225490.full.pdf.

Downloads

Publicado

2023-12-21

Como Citar

Ribeiro, C. J. S., & Ulhôa, M. T. de . (2023). Compartilhamento de datasets de pesquisa do projeto Música em Periódicos Oitocentistas (MPO): um protótipo com o uso da solução ckan. Revista EDICIC, 3(3), 1–18. https://doi.org/10.62758/re.v3i3.214