AnuarioThinkEPI2011
128
???????????????????????????????????????????????????????????????????
Lainformaciónacadémica
LA INFORMACIÓN ACADÉMICA o científicadifundelosresultadosdelainvestigaciónatravés de artículos de revista, contribucio-nesacongresos,tesis,patentes,etc.
Constituyeunsectoreconómicoespecíficoquedispone de una industria editorial –con Reed-Elsevier y Thomson Reuters a la cabeza– quesehavistoafectadaen losúltimosañospor losprocesosdedigitalizaciónypor la irrupcióndelaccesoabierto.
El número de contenidos generados es altí-simo1 y explica que se hayan creado diversosproductos y servicios pensados específicamenteparaayudaraloscientíficosalocalizaryconsul-tar documentos de su interés. Durante muchosaños–desdefinalesdelos60–lasbasesdedatosbibliográficasfueronlosúnicosinstrumentosquefacilitabanalosinvestigadoreslalocalizacióndereferenciascientíficas.Aprincipiosde2000apare-
cieronlosmotoresdebúsquedaacadémicos,queincluyentodaclasededocumentospublicadosensitios web relacionados con la actividad investi-gadora(conScirusyGoogleScholaralfrente);yapartirdeaquí,otrosproductosy servicioshanhechoactodepresencia.
D.6.Elecosistemadelainformacióncientífica:estructuraynivelesdeagregación
PorErnestAbadalyLluísCodina
14febrero2011
Abadal,Ernest;Codina,Lluís.“Elecosistemadelainformacióncientífica:estructuraynivelesdeagregación”.AnuarioThinkEPI,2011,v.5,pp.128-131.
Resumen:Sepresentanlosprincipalestiposdeproductosparaelaccesoalainformacióncientíficajuntoconsusras-gosdiferencialesencuantoaloscontenidosanalizados,latécnicautilizada(asignaciónyrecoleccióndemetadatos,in-dización o búsqueda federada) y los resultados ofrecidos.Losproductosconsideradossonlossiguientes:basesdeda-tos bibliográficas, portales de revistas, repositorios, moto-resdebúsquedaacadémicos,recolectores,metabuscadoresacadémicosymetabuscadoresdebiblioteca.
Palabrasclave: Informacióncientífica,Agregadores,Mo-tores de búsqueda académicos, Repositorios, Portales derevista,Metabuscadoresacadémicos,Basesdedatosbiblio-
gráficas,Metabuscadoresdebibliotecas.
Title:The scientific information ecosystem: structure and aggregation levels
Abstract:Thestructureandcharacteristicsofthemainproductsforaccessingscientificinformationaredescribed.Thedifferenttypesofcontent,thetechnologyused(assignmentandharvestingofmetadata,fulltextindexing,orfederatedsearch)andtheirresultsareanalysed.Theproductsare:bibliographicda-tabases,academicjournalsportals,repositories,academicsearchengines,academicmetasearchengines,andlibrarymetasearchengines.
Keywords:Scientificinformation,Academicsearchengines,Repositories,Academicjournalsportals,Aca-demicmetasearchengines,Bibliographicdatabases,Librariesmetasearchengines.
Elecosistemadelainformacióncientífica:estructuraynivelesdeagregación–ErnestAbadalyLluísCodina
“Duranteaños,lasbasesdedatosbibliográficasfueronlosúnicos
instrumentosquefacilitabanalosinvestigadoreslalocalizaciónde
referenciascientíficas”
Nuestroobjetivoespresentarunatipologíadelconjuntodesistemasdeaccesoalainformacióncientíficaqueactualmenteformanunecosistemaconnichosbienseparados,perotambiénconele-mentosencompetenciaquesesolapan.
AnuarioThinkEPI2011
129
??????????????????????????????????????????????????????????????????????
Tiposdeproductosparaaccederalainformacióncientífica
En la tabla 1 presentamos una propuesta decaracterizacióndelosdistintosproductosdeacce-soalainformacióncientíficaexistentes,juntoconunadescripcióndesusrasgosesenciales.
Contenidosanalizados
Una primera diferenciación de los productosde la tabla la podríamos establecer en funciónde los contenidos analizados. De esta manerase pueden distinguir dos niveles de agregación,según se almacene y se indice directamente lafuenteoriginaldelainformacióncientífica(artí-culosderevista,congresos,tesis,etc.)osellegueaellosdeformaindirecta,atravésdealgúnotro
productoagregadorcomolosportalesderevistaolosrepositorios.
Enelprimerniveldeagregaciónencontramoslossistemasderecuperaciónquesenutrendirec-tamentedelafuenteoriginaldela informacióncientífica, es decir, que toman como referencialosartículosderevista, lascontribucionesacon-gresos,lastesis,etc.,independientementedequealmacenenlostextoscompletosono.
Estosproductossonlasbasesdedatosbiblio-gráficas, losportalesderevistas (yaseancomer-cialesodeaccesoabierto),ylosrepositorios.
En el segundo nivel se encuentran aquellosserviciosquesenutrendelprimernivel,esdecir,queincluyencontenidosprocedentesdeportalesde revistas y de repositorios. Estos sistemas novan a buscar las fuentes (las revistas, las tesis olos congresos) en su lugar de origen, sino quellegan a ellas indirectamente por medio de los
Elecosistemadelainformacióncientífica:estructuraynivelesdeagregación–ErnestAbadalyLluísCodina
ProductoContenidosanalizados
Tecnología Resultados Inicios Coste EjemplosNiveldeagrega-
ción
Basesdedatosbiblio-gráficas
Fuentesprima-rias:artículosderevista,congre-sos,etc.
–Asignacióndemetada-tos(registrosbibliográficos)
Registrosbiblio-gráficos+accesoaunsistemaderesolucióndeenlaces
Finalesde1960
Comer-ciales
Scopus,ISIWoS,ChemicalAbstracts,Eric,Dialog
1
Portalesderevistas
Fuentesprima-rias:artículosderevistas
–Asignacióndemetada-tos(registrosbibliográficos)
–Indizacióndeltextocompleto
Registrosbiblio-gráficos+accesoaldocumentooriginal
Finalesde1990
Comer-cialesygratuitos
Emerald,Scielo,ScienceDirect,Recyt
1
Repositorios
Fuentesprima-rias:artículosderevista,tesis,congresos,etc.
–Asignacióndemetada-tos(registrosbibliográficos)
–Indizacióndeltextocompleto
Registrosbiblio-gráficos+accesoaldocumentooriginal
Finalesde1990
Gratuitos
E-LIS,DDD(UAB),MITDSpace,Repositorium
1
Motoresdebúsquedaacadémicos
–Portalesderevistas
–Repositorios–Sedesweb
académicas
Indizacióndeltextocompleto
Listadeenlaces 2000 GratuitosGoogleScholar,Scirus
2
Recolectores–Portalesde
revistas–Repositorios
–Recoleccióndemetadatos
Registrosbiblio-gráficos+accesoaldocumentooriginal
Media-dosde2000
Gratuitos
OAIster,Recolecta,Hispana,Arrow
2
Metabus-cadoresacadémicos
–Portalesderevistas
–Repositorios–Motoresde
búsquedaaca-démicos
–Búsquedafederada
ListadeenlacesPrinci-piosde2000
Gratuitosycomer-ciales
ScienceResearch,Biznar
2
Metabusca-doresdebibliotecas
–Repositorios–Portalesdere-
vistassuscritas–Catálogodela
biblioteca
–Búsquedafederada
Registrosbiblio-gráficos+accesoaldocumentooriginal
Princi-piosde2000
Comer-ciales
MetaLib,Encore
2
Tabla1.Productosprincipalesparaelaccesoalainformacióncientífica
AnuarioThinkEPI2011
130
???????????????????????????????????????????????????????????????????
agregadores de primer nivel. De esta forma lesbastaconacudiraunospocosmilesdesedeswebparahacerseconmillonesdecontenidos.
Aquíestánlosmotoresdebúsquedaacadémi-cos, los recolectores, los metabuscadores acadé-micosylosmetabuscadoresdebiblioteca.
– Búsqueda federada:consiste en enviar la mis-ma consulta a cientos defuentes (agregadores deprimer nivel que indizanlas fuentes primarias), enlugar de volverlas a indi-zardirectamente.Comoenel casoanterior,elusuariotambién recibe una listaúnicaderesultados.
Listaderesultados
Laspáginasderesultadosdeestosproductospuedenserdetrestipos:
a) Registros bibliográficos + acceso al docu-mentooriginal (portalesderevista,repositorios,recolectores).
b) Registros bibliográficos + acceso a un sis-tema de resolución de enlaces (bases de datosbibliográficas).
c) Listadeenlaces(motoresacadémicos,meta-buscadores).
Enelprimercaso(a),elusuariotienesolucio-nadosiempredeformadirectaelpasosiguientea cualquier búsqueda: la obtención del docu-mento.
Enelsegundocaso(b),lotienesolucionadodeformaparcial,esdecir,enocasioneselsistemaderesolucióndeenlacesloconduciráaldocumentocompleto, pero a veces no, y además deberáhacerloenvariospasos.
En el tercer caso (c), se ofrece una lista deenlacesaotrossitioswebdemodoqueelaccesoenprincipioesdirecto,pero llenode casuística:enlaces rotos, servidores que requieren suscrip-ción,etc.
Elecosistemadelainformacióncientífica:estructuraynivelesdeagregación–ErnestAbadalyLluísCodina
“Elmayornúmerodeconsultasalosrepositoriosprocededeagregadores
desegundonivelynotantodeconsultasdirectas”
http://www.scienceresearch.com
Tecnología
Los fundamentos técnicos utilizados por losproductosanalizadossoncuatro:
– Asignación de metadatos (catalogación eindización): proceso intelectual (no automático)queconsisteenelaborarunregistrobibliográficoparacadaunade las fuentesoriginalesanaliza-das.Puedeserrealizadoporelmismoautorquecrea los contenidos (artículos de revista, etc.) opor el analista de la base de datos, portal derevistasorepositorio.
– Indizaciónautomáticadel texto completo: con-siste en extraer (todos) lostérminosdeloscontenidosseleccionados,quepuedenestar más o menos disper-sos en servidores, y gene-rar un índice global comoresultado.
– Recolección de meta-datos: se crea un índicecomún recolectando (sólo)metadatosde los reposito-riosquecumplenunproto-colo de etiquetado común(OAI-PMH).Elusuario reci-beunalistaúnicaderesul-tados. http://www.emeraldinsight.com
AnuarioThinkEPI2011
131
??????????????????????????????????????????????????????????????????????
Consideracionesfinales
Delaestructuraynivelesdeagregaciónantesdescritos se desprenden diversos comentariospara algunos de los principales agentes de lacomunicacióncientífica:
Paraloscientíficoscomousuariosdeinfor-mación
Esfrecuentequelosinvestigadoresesténsus-critos a las alertas de las revistas de su máximointerés. De todas formas, para las búsquedassistemáticasyexhaustivasacostumbranautilizarmayoritariamente,ydeformaintensiva,losrecur-sosdesegundonivel(especialmentelosmotoresde búsqueda académicos) y también las basesdedatos,quelesaseguranelaccesoaunmayornúmero de fuentes primarias. Esto es lógico yaque no es práctico tener que ir recorriendo loscentenares de portales de revistas o de reposi-torios.
Paraloseditoresdelasrevistas
Dado que los científicos consultan funda-mentalmente agregadores de segundo nivel, esimportante para una revista estar presente enportalesderevistasoenrepositorios,yaquesonelpasoesenciale imprescindibleparapoderserincluidasenmotoresdebúsquedaymetabusca-dores.Esmuydifícilestarenelsegundonivelsinpasarporelprimero.
Paralosrepositorios
Los contenidos inclui-dos en repositorios tienenasegurada la presencia enel segundo nivel. Esto esmuy importante para loscontenidosqueestándepo-sitados en ellos. El mayornúmero de consultas a losrepositorios procede deagregadores de segundonivelynotantodeconsul-tasdirectas.
Para los científicos entantoqueautores
Si quieren asegurarunamáximadifusióna susobras tienen que publicarenrevistasincluidasenpor-talesy,sinosondeaccesoabierto, depositar sus tex-tosenrepositorios.Deesta
formatienenaseguradasuinclusiónenmotoresdebúsquedaymetabuscadoresacadémicosyunafácillocalizaciónporpartedesuscolegas.
Notas
1.Paratenerunareferencia:tansólolasrevis-tas académicas activas son unas 78.000 (segúnUlrich’s).
Comentario
Laclasificaciónpresentadaenesteartículosehahechoatendiendoalanálisisdeloscontenidos.Ademásexistenempresasquenoindizannireco-pilanmetadatos,sólosondistribuidores:
– Debasesdedatos(hosts).Recibenlasbasesde datos bibliográficas de los productores y lascarganen suordenador juntoaotras,ofrecién-dolasalpúblicoconunmismosoftwaredecon-sultaparatodas.Ejemplos:Dialog,Questel-Orbit,EbscoHost.
– De portales de revistas. Muchas editorialesnoquiereninstalarequiposinformáticospropiosparadistribuirsusrevistas,ysubcontratanelser-vicioaesasempresas.Losdistribuidoresalojanlospdfsylosofrecenatravésdewebs(portales)conla imagen y logotipos de la editorial. Ejemplos:MetaPress,HighWirePress,IngentaConnect.
– Agentes de suscripciones. Actúan comoagregadores de portales de revistas. Ejemplo:Swets(SwetsWise).
Elecosistemadelainformacióncientífica:estructuraynivelesdeagregación–ErnestAbadalyLluísCodina
http://biznar.com
Top Related