FALANDO DA
ANÁLISE DE DOCUMENTOS E DA INDIZACIÓN…
QUE SON OS
METADATOS?
Os metadatos son “datos sobre datos” ou
“informacións sobre datos”, “datos sobre informacións” e “informacións sobre
informacións”.
Poderíanse conceptualizar así mesmo como
“descricións estruturadas e opcionais que axudan a localizar obxectos” ou
“datos estruturados e codificados que facilitan a identificación,
descubrimento, valoración e administración de recursos dixitais”. Tamén aquí a
importancia xira en torno á recuperación de información.
E AS BASES
DE DATOS?
Son un conxunto de informacións almacenadas nun
soporte lexible por ordenador e organizadas internamente por rexistros (formado
por todos os campos referidos a unha entidade ou obxecto almacenado) e campos
(cada un dos elementos que integran un rexistro). Permite recuperar calquera
clase de información: referencias, documentos textuais, imaxes, datos
estatísticos, etcétera (Pinto, 2011).
Datos son o conxunto de textos, cifras, imaxes ou
mestura de todos rexistrados de forma que poidan ser lidos a través dun
ordenador e organizados de acordo cun programa que permita a súa localización e
recuperación.
O segundo tipo de paxinas que son son difíciles de
buscar son as páxinas dinámicas.
As páxinas dinámicas serían páxinas inexistentes,
non exactamente virtuais e que se xeran cando nós facemos unha búsqueda nunha
páxina de datos. Estas páxinas existen , se estivesen ben indizada , os
buscadores recuperaríanas fácilmente.
Outro concepto é o de invisible , aquelo que os buscadores
tradicionales non poderían recuperar. Refírese a aqueles materiais ou
informació que non está indizada por los buscadores xeralistas.
Para poder recuperar un documento tes que facer unha
búsqueda na base de datos, tes que facer ti
THESEO é unha base de datos que almacena todas as
teses que se publican en España. O investigador que presenta a sua tee , ten
que cubrir un documento decindo que presenta esa tese poñendolle ( autor ,
titulo) , o que é unha ficha técnica.
Periodismo e Galicia : distintas teses que pode
haber dese tema, están ahí pero ata que non busco ese tema non aparecen .
Páxina dinámica : A páxina que che aparece cando ti
fas unha búsqueda na base de datos ( Google, Teseo)
Hai outra serie deinstitucións que non lles
interesan que os busquen , polo que teñen unha pasarela ou un cortafogos que
che pide o rexistro, desta maneira non podemos consultar a información.
Hai institucións que non queren que os motores de
búsqueda indicen os seus contidos , polo tanto esta páxina vai a ser invisible
, non vai a ser recuperada polos motores de búsqueda. O principio , os motores
de búsqueda
Marcos son unha páxina web que están bastante
desnostadas, nos vemos unha páxina web , con unha url distintas que están
unidas por este tipo de diseño ( marco) .
é moi difícil que os motores de búsqueda recuperen esta páxina porque
son tres. Pode que recupere unha pero non todas.
Existen uns robots que lerían as etiquetas de
artigo.
Temos o concepto dos motores de búsqueda en papel , en
LITERATURA GRIS non se move
polo circuito tradicional de difusión . Non podemos recuperar polos motivos
anterores. Textos , documentos , recursos que non seguen os recursos
tradicionais . exemplo : teses.
No entorno impreso, fálase de literatura gris que
sería a información que non se poe adquirir a través de canles comeciais
habituais e polo que é difícil identificar e obter. É dicir, son documentos que
non se distribúen a través dos circuitos habituais, como informets, tesis de
doutoramento, ponencias e comunicacións de congresos, informes, etcétera
Dalgunha maneira podemos relacionar a literatura
gris con internet invisible .
En internet canto mais especializada sexa a búsqueda
, máis especializados deben ser os nosos recursos. Todo dependerá do ámbito no
que esteamos traballando.
En canto as folcsonomía ou Folksonomía son clasificacións
de contidos pero a diferencia dos outros , é que é feita polos usuarios con
palabras clave , descriptores. Faise en colaboración , non está marcada. Un
exemplo é Bookmarks que era unha páxina , das primeiras que se creou , na que
os ususarios ian gardando nesas páxinas todos os teus favoritos . Se te
desprazabas sempre os tiñas Aí.
Estes marcadores sociales identifican as páxinas para despois poder
recuperar todas as información.
A Folcsonomía ou Folksonomía é unha forma de
indización pero non controlada , pode haber duplicidade de palabras. O problema
que ten é que se usa unha linguaxe tradicional
, e que os usuarios usas as súas palAo realizar unha folcsonomía, varios
usuarios colaboran na descrición dun espazo informativo para establecer unha
lista de palabras clave ou un vocabulario non controlado.
Dende a perspectiva dos usuarios, o tagging (de tag,
marca ou etiqueta) xera unha navegación baseada na exploración. Os tags serven
para clasificar, ordenar, buscar e atopar información. As nubes de termos son a
representación deste tipo de indización.abras clave.
A imaxe / visualización desas palabras clave serían
as nubes .
Folsonomía é unha indización ¨popular ¨de ususario ,
colaborativa.
Falando de indizadores podemos falar da ferramenta
que os orienta : O thesaurus.
Nos últimos tempos, o ámbito da representación e
recuperación de información na Documentación e a Biblioteconomía tivo que
asumir o impacto de Internet e as súas tecnoloxías asociadas, en especial o
World Wide Web (WWW). Os cambios tecnolóxicos derivados destes cambios
tecnolóxicos están a conducir a unha progresiva dixitalización do ámbito da
representación e recuperación de información que afecta por igual aos recursos
de información, as ferramentas de representación e recuperación, e os
requirimentos dos usuarios. Un exemplo destas ferramentas:
Un thesaurus é unha ferramenta para o control do
vocabulario. Orienta aos indizadores e aos usuarios sobre os termos que poden
utilizar e, así axuda a mellorar a calidade da recuperación.
Aínda que existe algún thesaurus xeral, de carácter
enciclopédico, habitualmente un thesaurus deséñase para a indexación e busca
nun tema ou área específicos. Exemplos de temas cubertos polos thesaurus son
educación, metalurxia, arte ou arquitectura.
Un bo thesaurus debe deixar moi claro que
significado cobre un termo. Faino mediante os termos non válidos e as relacións
semánticas. Outras maneiras de dirixir o uso do thesaurus son as notas
introdutorias e as notas de alcance. Unha nota de alcance toma a miúdo a forma
dunha definición do termo. Asegurar que os termos están utilizados
constantemente co mesmo significado é outro aspecto importante do control do
vocabulario
A construción do thesaurus require recoller un
conxunto de termos. Algúns destes rematarán sendo descritores e outros poden
non aparecer no thesaurus na súa forma orixinal, pero poden suxerir os
conceptos que necesitarán ser cuberto dalgún xeito.
Valle Gastaminza, Félix de. “Lenguajes documentales.
Los tesauros” [en liña]. Facultad de Ciencias de la Información, Universidad
Complutense, 2003-2004.
[Consulta: 10 decembro
2012]
Rubio Liniers, María Cruz está en la página web. “El
análisis documental: Indización y resumen en
bases de datos especializadas” [en liña]. CINDOC-CSIC,
2004
[Consulta: 10 decembro 2012]
Arano,
Silvia. “Los tesauros y las ontologías en la Biblioteconomía y la
Documentación” [en liña]. hypertext.net, 2005. < Arano, Silvia. “Los tesauros y las
ontologías en la Biblioteconomía y la Documentación” [en liña]. hypertext.net,
2005. http://www.upf.edu/hipertextnet/numero-3/tesauros.html[Consulta: 10 Decembro 2012]
No hay comentarios:
Publicar un comentario