Metadados e Dublin Core no Tainacan

Link para o vídeo: https://vimeo.com/462222209/27bca65eb3

Transcrição

Neste vídeo iremos descobrir o que são metadados e conhecer o famoso esquema de metadados Dublin Core.

Estruturar o conhecimento e os objetos em coleções organizadas, como observamos nas bibliotecas, arquivos e museus, impõe grandes desafios.

Precisamos inventariar nosso acervo, para sabermos exatamente o que temos e, então, decidirmos a melhor forma de catalogar estes objetos, sejam eles físicos ou digitais. Além disto, estes sistemas não só devem organizar o conhecimento como também facilitar a sua recuperação. Ou seja, quando um usuário deseja um livro numa biblioteca, um documento em um arquivo ou uma obra no museu, precisa saber como encontrar tanto o objeto quanto as informações disponíveis sobre ele.

Ao longo da história, foram muitas as formas de documentação das coleções, que na era pré-digital, acontecia quase sempre por meio de listas de inventário, fichas, cartões, dossiês e outros escritos ou impressos em papel.

Por exemplo, o Museu da Escola de Arquitetura e Design da UFMG possui uma extensa coleção de réplicas de obras de arte em gesso. Parte dos originais destas obras está no Louvre. Algumas réplicas estão expostas na biblioteca da Escola de Arquitetura.

Esta é uma antiga ficha patrimonial de uma destas réplicas em gesso, que nos revela muitas informações interessantes sobre a origem do acervo. Com a popularização da informática, os acervos em papel começaram a ser digitalizados e ampliados.

Em 2010, o Ateliê de Moldagens da França encaminhou algumas fichas digitais de obras do Louvre cujas réplicas se encontram no Museu da Escola de Arquitetura. Aqui, estamos vendo as informações sobre a Vênus de Milo. As fichas do catálogo do Atelier foram disponibilizadas em formato PDF e encaminhadas por e-mail ao museu.

Hoje este catálogo está disponível na Internet.

É possível até encomendar on-line uma réplica em gesso. A Vênus de Milo custa cerca de 50.000 reais… Sem frete! Tendo em vista que pesa 130 kg, convidamos a todos para vê-la de graça, lá na no museu da Escola de Arquitetura da UFMG.

Ainda que a digitalização tenha ampliado o acesso e a portabilidade da documentação, como observamos neste exemplo, com o surgimento da Internet, surgiram também novas demandas.

A documentação disponibilizada na Web precisa ser corretamente compreendida por computadores e humanos, de modo com que os computadores nos ajudem a encontrar a informação que precisamos, através de sistemas de busca.

Também deve permitir a interoperabilidade dos dados, ou seja, que estes dados possam ser importados e exportados, abertos e lidos em diversos sistemas e softwares. Precisa garantir a acessibilidade, sendo facilmente reconhecida, por exemplo, por leitores de tela para pessoas com deficiência.

Por fim, seu modelo abstrato, que envolve questões de sintaxe, ontologia, significados conceituais, deve ser intercambiáveis em diversas culturas, de modo com que a compreensão dos dados seja correta em todos os continentes. Para isto, foram desenvolvidos esquemas de metadados, como o Dublin Core e o Schema.org. Mas o que são metadados?

De forma simplificada, podemos dizer que metadados são os dados de um dado. Vejamos a nossa exposição didática, que tudo ficará mais fácil de compreender. Esta foto do Louvre, exibida em nossa coleção on-line, é um dado. O próprio museu do Louvre, seu edifício, por exemplo, também é um dado.

Já estes aqui são os metadados do Louvre, os dados do dado, as informações que utilizamos para descrever aquele dado, no caso, o museu do Louvre. Quando estes dados são estruturados dentro de um esquema, dentro de um padrão, aqueles desafios que citamos anteriormente, como interoperabilidade, acessibilidade, universalidade, são melhor solucionados. Esta é a proposta do esquema de metadados Dublin Core.

Este projeto open source, iniciado em 1995 na cidade de Dublin, Ohio, nos Estados Unidos da América, propôs um conjunto de metadados padrão para a Web, que poderia ser utilizado para descrever qualquer objeto. Este esquema se tornou posteriormente uma norma ISO.

Aqui temos os quinze principais elementos propostos pelo esquema de metadados Dublin Core. Os elementos, informalmente falando, são os campos de uma ficha que preenchemos sobre nosso objeto no processo de documentação do acervo.

Vejamos como poderíamos utilizar o esquema Dublin Core Simplificado para descrever a imagem da Mona Lisa disponibilizada na Wikipedia. Repare que não estamos descrevendo a obra de arte em si (o quadro da Mona Lisa que está no Louvre), mas sim sua fotografia digital.

O Título, refere-se ao nome do recurso, no caso, o nome completo do quadro da Mona Lisa.

O Criador é o autor, que pode ser um escritor no caso de livros, o diretor de um filme, um artista no caso de obras de arte. Também pode ser o nome de uma instituição.

O Assunto refere-se às palavras-chave relacionadas àquele objeto. A descrição é um texto breve e sucinto que elucide o item.

O Publicador é o editor, que pode ser uma pessoa, um website, uma editora ou organização. Os colaboradores são autores daquele objeto, que não possuem o status de autor. São, portanto, coautores.

Neste caso, seguindo o modelo proposto pelo professor Jeffrey Pomerantz, acrescentamos o pintor Leonardo da Vinci como colaborador.

Uma outra opção, seria repetir o elemento Criador e colocar ali Leonardo da Vinci. Este é um aspecto importante do Dublin Core: podemos repetir elementos, ou seja, podemos ter mais de um Criador, mais de uma data, e assim por diante.

A Data, neste caso, refere-se à data de inclusão da fotografia na Wikipedia, mas poderíamos também acrescentar um campo data referente ao ano em que a fotografia foi tirada, se tivéssemos este dado.

O Tipo do nosso item é uma imagem. Outro tipo comum na Web é o Texto.

O Formato refere-se ao arquivo digital da fotografia. Isto é importante para que o usuário saiba qual software será necessário para acessar aquele objeto digital.

O Identificador é um valor único que representa aquele objeto. Em bibliotecas, é a referência do livro. Em museus, seu número de catalogação. Aqui, é o link para a imagem na Wikipedia.

No elemento Fonte, acrescentamos o nome do usuário responsável pela inclusão da fotografia na Wikipedia. A relação, em geral, aponta para outros objetos do acervo que se relacionam com aquele item.

Neste caso, relacionamos nossa fotografia digital com uma página sobre a Mona Lisa no website do Louvre. Nossa cobertura é o mundo, porque nossa coleção está na Internet! Por fim, os direitos elucidam quem detém o copyright daquele objeto, que aqui no caso, é uma foto em domínio público.

Repare que o elemento Idioma foi eliminado. Apesar de Leonardo da Vinci falar italiano, o idioma não se aplica, porque a imagem não possui nenhum texto escrito nela. Este é outro ponto interessante do Dublin Core: utilizamos somente os elementos que precisamos e na ordem que quisermos, não há uma obrigatoriedade de incluir elementos que não se apliquem à nossa coleção ou ao item que desejamos descrever.

Para explicarmos aos usuários como preencher estes campos em nossa coleção, devemos elaborar um manual de orientação dos profissionais da documentação, que fornecerá as instruções de preenchimento e de uso dos vocabulários controlados, ontologias, normas e demais parâmetros. Na descrição deste vídeo, acrescentamos alguns exemplos.

E assim, concluímos a parte do Dublin Core que se refere aos humanos. Vamos ver agora a parte que se refere às máquinas. Apesar do Dublin Core ser amplo e genérico, os sistemas de recuperação da informação e mecanismos de busca serão capazes de identificar os aspectos principais do acervo, que são informados pelo software gerenciador de algumas maneiras, tais como: através do código da página em HTML, através de RDF ou JSON.

Foge ao escopo deste vídeo apresentar as questões de programação associadas aos metadados, mas a título de ilustração, vamos ver um item da coleção on-line Cidade Palimpséstica, uma fotografia antiga do Campus da UFMG. Note que o título deste item é “Campus da UFMG”.

Repare agora no código fonte da página do nosso item, que acabamos de ver. Podemos identificar o elemento DC.Title dentre os metadados em HMTL, que conta, por exemplo, para o Google, que “Campus da UFMG” é o título deste item da coleção, segundo os padrões para Títulos do esquema Dublin Core. Ou seja, agora, tanto a máquina quanto os humanos serão capazes de saber qual é o título deste item e seus demais dados.

Como a coleção on-line Cidade Palimpséstica seguiu a descrição original disponível no Laboratório de Fotodocumentação da UFMG, cuja documentação foi elaborada muito antes do Dublin Core existir, utilizamos um plugin gratuito para gerar automaticamente os elementos do Dublin Core e inseri-los, como vimos, no código fonte do website. Contudo, a situação ideal é controlarmos como os metadados em Dublin Core serão gerados, preenchidos e exibidos para os mecanismos de busca, criando nós mesmos os metadados de nossa coleção já dentro do esquema Dublin Core.

Nos metadados do Tainacan, como veremos mais detalhadamente no próximo vídeo, existe um campo em cada metadado que permite incluir um link especial. Este link identifica qual esquema de metadados estamos utilizando em nossa coleção. Por exemplo, se estamos criando o elemento título segundo o Dublin Core, o link apontará para a página que descreve o que é um título no website do projeto Dublin Core. Deste modo, os sistemas de busca saberão exatamente do que se trata esta informação: o título do item, segundo os critérios do Dublin Core para um título. E assim, teremos uma coleção organizada, estruturada dentro dos princípios da interoperabilidade, acessibilidade e universalidade na divulgação do conhecimento e da cultura.

Agora que já sabemos o que são os metadados e como os dados estruturados funcionam, veja como criar em poucos cliques, uma coleção no Tainacan com o esquema de metadados Dublin Core inserido automaticamente.

Newsletter

Em breve teremos um newsletter mensal, com conteúdos exclusivos. Não repassamos seus dados a terceiros e não encaminhamos spam. Cadastre o seu melhor e-mail!  Saiba mais


    Pular para o conteúdo