lunes, 10 de diciembre de 2012

Un pouco de todo..


FALANDO DA ANÁLISE DE DOCUMENTOS E DA INDIZACIÓN…

QUE SON OS METADATOS?

Os metadatos son “datos sobre datos” ou “informacións sobre datos”, “datos sobre informacións” e “informacións sobre informacións”.

Poderíanse conceptualizar así mesmo como “descricións estruturadas e opcionais que axudan a localizar obxectos” ou “datos estruturados e codificados que facilitan a identificación, descubrimento, valoración e administración de recursos dixitais”. Tamén aquí a importancia xira en torno á recuperación de información.

E AS BASES DE DATOS?

Son un conxunto de informacións almacenadas nun soporte lexible por ordenador e organizadas internamente por rexistros (formado por todos os campos referidos a unha entidade ou obxecto almacenado) e campos (cada un dos elementos que integran un rexistro). Permite recuperar calquera clase de información: referencias, documentos textuais, imaxes, datos estatísticos, etcétera (Pinto, 2011).

Datos son o conxunto de textos, cifras, imaxes ou mestura de todos rexistrados de forma que poidan ser lidos a través dun ordenador e organizados de acordo cun programa que permita a súa localización e recuperación.

O segundo tipo de paxinas que son son difíciles de buscar son as páxinas dinámicas.

As páxinas dinámicas serían páxinas inexistentes, non exactamente virtuais e que se xeran cando nós facemos unha búsqueda nunha páxina de datos. Estas páxinas existen , se estivesen ben indizada , os buscadores recuperaríanas fácilmente.

Outro concepto é o de invisible , aquelo que os buscadores tradicionales non poderían recuperar. Refírese a aqueles materiais ou informació que non está indizada por los buscadores xeralistas.

Para poder recuperar un documento tes que facer unha búsqueda na base de datos, tes que facer ti

THESEO é unha base de datos que almacena todas as teses que se publican en España. O investigador que presenta a sua tee , ten que cubrir un documento decindo que presenta esa tese poñendolle ( autor , titulo) , o que é unha ficha técnica.

Periodismo e Galicia : distintas teses que pode haber dese tema, están ahí pero ata que non busco ese tema non aparecen .

Páxina dinámica : A páxina que che aparece cando ti fas unha búsqueda na base de datos ( Google, Teseo)

Hai outra serie deinstitucións que non lles interesan que os busquen , polo que teñen unha pasarela ou un cortafogos que che pide o rexistro, desta maneira non podemos consultar a información.

Hai institucións que non queren que os motores de búsqueda indicen os seus contidos , polo tanto esta páxina vai a ser invisible , non vai a ser recuperada polos motores de búsqueda. O principio , os motores de búsqueda

Marcos son unha páxina web que están bastante desnostadas, nos vemos unha páxina web , con unha url distintas que están unidas por este tipo de diseño ( marco) .  é moi difícil que os motores de búsqueda recuperen esta páxina porque son tres. Pode que recupere unha pero non todas.

Existen uns robots que lerían as etiquetas de artigo.

Temos o concepto dos motores de búsqueda en papel , en LITERATURA GRIS  non se move polo circuito tradicional de difusión . Non podemos recuperar polos motivos anterores. Textos , documentos , recursos que non seguen os recursos tradicionais . exemplo : teses.

No entorno impreso, fálase de literatura gris que sería a información que non se poe adquirir a través de canles comeciais habituais e polo que é difícil identificar e obter. É dicir, son documentos que non se distribúen a través dos circuitos habituais, como informets, tesis de doutoramento, ponencias e comunicacións de congresos, informes, etcétera

Dalgunha maneira podemos relacionar a literatura gris con internet invisible .

En internet canto mais especializada sexa a búsqueda , máis especializados deben ser os nosos recursos. Todo dependerá do ámbito no que esteamos traballando.

En canto as folcsonomía ou Folksonomía son clasificacións de contidos pero a diferencia dos outros , é que é feita polos usuarios con palabras clave , descriptores. Faise en colaboración , non está marcada. Un exemplo é Bookmarks que era unha páxina , das primeiras que se creou , na que os ususarios ian gardando nesas páxinas todos os teus favoritos . Se te desprazabas sempre os tiñas Aí.

Estes marcadores sociales  identifican as páxinas para despois poder recuperar todas as información.

A Folcsonomía ou Folksonomía é unha forma de indización pero non controlada , pode haber duplicidade de palabras. O problema que ten é que se usa unha linguaxe tradicional  , e que os usuarios usas as súas palAo realizar unha folcsonomía, varios usuarios colaboran na descrición dun espazo informativo para establecer unha lista de palabras clave ou un vocabulario non controlado.

Dende a perspectiva dos usuarios, o tagging (de tag, marca ou etiqueta) xera unha navegación baseada na exploración. Os tags serven para clasificar, ordenar, buscar e atopar información. As nubes de termos son a representación deste tipo de indización.abras clave.

 

A imaxe / visualización desas palabras clave serían as nubes .

Folsonomía é unha indización ¨popular ¨de ususario , colaborativa.

 

Falando de indizadores podemos falar da ferramenta que os orienta : O thesaurus.

Nos últimos tempos, o ámbito da representación e recuperación de información na Documentación e a Biblioteconomía tivo que asumir o impacto de Internet e as súas tecnoloxías asociadas, en especial o World Wide Web (WWW). Os cambios tecnolóxicos derivados destes cambios tecnolóxicos están a conducir a unha progresiva dixitalización do ámbito da representación e recuperación de información que afecta por igual aos recursos de información, as ferramentas de representación e recuperación, e os requirimentos dos usuarios. Un exemplo destas ferramentas:

Un thesaurus é unha ferramenta para o control do vocabulario. Orienta aos indizadores e aos usuarios sobre os termos que poden utilizar e, así axuda a mellorar a calidade da recuperación.

Aínda que existe algún thesaurus xeral, de carácter enciclopédico, habitualmente un thesaurus deséñase para a indexación e busca nun tema ou área específicos. Exemplos de temas cubertos polos thesaurus son educación, metalurxia, arte ou arquitectura.

Un bo thesaurus debe deixar moi claro que significado cobre un termo. Faino mediante os termos non válidos e as relacións semánticas. Outras maneiras de dirixir o uso do thesaurus son as notas introdutorias e as notas de alcance. Unha nota de alcance toma a miúdo a forma dunha definición do termo. Asegurar que os termos están utilizados constantemente co mesmo significado é outro aspecto importante do control do vocabulario

A construción do thesaurus require recoller un conxunto de termos. Algúns destes rematarán sendo descritores e outros poden non aparecer no thesaurus na súa forma orixinal, pero poden suxerir os conceptos que necesitarán ser cuberto dalgún xeito.

 

 
Bibliografía :
 

Valle Gastaminza, Félix de. “Lenguajes documentales. Los tesauros” [en liña]. Facultad de Ciencias de la Información, Universidad Complutense, 2003-2004. [Consulta: 10 decembro 2012]

Rubio Liniers, María Cruz está en la página web. “El análisis documental: Indización y resumen en  bases de datos especializadas” [en liña]. CINDOC-CSIC, 2004 [Consulta: 10 decembro 2012]

Arano, Silvia. “Los tesauros y las ontologías en la Biblioteconomía y la Documentación” [en liña]. hypertext.net, 2005. < Arano, Silvia. “Los tesauros y las ontologías en la Biblioteconomía y la Documentación” [en liña]. hypertext.net, 2005. http://www.upf.edu/hipertextnet/numero-3/tesauros.html[Consulta: 10 Decembro 2012]

No hay comentarios:

Publicar un comentario