banner
Centro notizie
Ampia conoscenza nella vendita e nella produzione

CORE: un servizio di aggregazione globale per documenti ad accesso aperto

Jun 11, 2023

Dati scientifici, volume 10, numero articolo: 366 (2023) Citare questo articolo

171 accessi

30 Altmetrico

Dettagli sulle metriche

Questo articolo presenta CORE, un servizio accademico ampiamente utilizzato, che fornisce l'accesso alla più grande raccolta mondiale di pubblicazioni di ricerca ad accesso aperto, acquisite da una rete globale di archivi e riviste. CORE è stato creato con l'obiettivo di consentire l'estrazione di testo e dati dalla letteratura scientifica e quindi supportare la scoperta scientifica, ma ora è utilizzato in un'ampia gamma di casi d'uso nell'ambito dell'istruzione superiore, dell'industria, delle organizzazioni no-profit, nonché da parte di il pubblico generale. Attraverso i servizi forniti, CORE supporta casi d'uso innovativi, come il rilevamento del plagio, in organizzazioni terze leader di mercato. CORE ha svolto un ruolo fondamentale nel movimento globale verso l’accesso aperto universale rendendo la conoscenza scientifica più facilmente e liberamente reperibile. In questo documento descriviamo il set di dati in continua crescita di CORE e la motivazione dietro la sua creazione, presentiamo le sfide associate alla raccolta sistematica di documenti di ricerca su larga scala da migliaia di fornitori di dati in tutto il mondo e introduciamo le nuove soluzioni sviluppate per superare queste sfide. Il documento fornisce quindi una discussione approfondita dei servizi e degli strumenti costruiti sulla base dei dati aggregati ed esamina infine diversi casi d'uso che hanno sfruttato il set di dati e i servizi CORE.

La letteratura scientifica contiene alcune delle informazioni più importanti che abbiamo raccolto come specie, ad esempio come curare le malattie, risolvere difficili problemi di ingegneria e rispondere a molte delle sfide mondiali che stiamo affrontando oggi. L’intero corpo della letteratura scientifica sta crescendo a un ritmo enorme con un aumento annuo di oltre 5 milioni di articoli (quasi 7,2 milioni di articoli sono stati pubblicati nel 2022 secondo Crossref, la più grande agenzia di registrazione di Digital Object Identifier (DOI)). Inoltre, è stato stimato che la quantità di ricerche pubblicate ogni anno aumenta di circa il 10% ogni anno1. Allo stesso tempo, una quantità sempre crescente di letteratura scientifica, che secondo le stime ammontava a oltre 1 milione di pubblicazioni all’anno nel 20152, viene pubblicata ad accesso aperto (OA) e può quindi essere letta ed elaborata con un numero limitato o nullo di pubblicazioni. restrizioni sul diritto d'autore. Poiché la lettura di questa conoscenza va ormai oltre le capacità di qualsiasi essere umano, il text mining offre il potenziale non solo per migliorare il modo in cui accediamo e analizziamo questa conoscenza3, ma può anche portare a nuove intuizioni scientifiche4.

Tuttavia, la raccolta sistematica della letteratura scientifica per consentire metodi automatizzati per elaborarla su larga scala rappresenta un problema significativo. La letteratura scientifica è diffusa tra migliaia di editori, archivi, riviste e database, che spesso non dispongono di protocolli comuni per lo scambio di dati e di altro supporto per l'interoperabilità. Anche quando esistono protocolli, la mancanza di infrastrutture per la raccolta e l’elaborazione di questi dati, così come i diritti d’autore restrittivi e il fatto che l’OA non è ancora il percorso di pubblicazione predefinito nella maggior parte del mondo complicano ulteriormente l’elaborazione meccanica della conoscenza scientifica.

Per alleviare questi problemi e supportare l'estrazione di testo e dati dalla letteratura scientifica, abbiamo sviluppato CORE (https://core.ac.uk/). CORE aggrega documenti di ricerca ad accesso aperto provenienti da migliaia di fornitori di dati da tutto il mondo, inclusi archivi istituzionali e tematici, accesso aperto e riviste ibride. CORE è la più grande raccolta di letteratura sull'OA: al momento della stesura di questo articolo, fornisce un unico punto di accesso alla letteratura scientifica raccolta da oltre diecimila fornitori di dati in tutto il mondo ed è in costante crescita. Fornisce diversi modi per accedere ai suoi dati sia per gli utenti che per le macchine, inclusa un'API gratuita e un dump completo dei suoi dati.

A gennaio 2023, ci sono 4.700 utenti API registrati e 2.880 set di dati registrati e più di 70 istituzioni si sono registrate per utilizzare CORE Recommender nei loro sistemi di repository.

99.99% of its users./p>