Dimensionamento e Organização das Infraestruturas Públicas ...
Sistemas de Gestão de Ciência e Repositórios - Diretrizes nacionais e internacionais,...
-
Upload
conferencia-luso-brasileira-sobre-acesso-livre -
Category
Science
-
view
57 -
download
1
Transcript of Sistemas de Gestão de Ciência e Repositórios - Diretrizes nacionais e internacionais,...
Agenda1. Introdução aos sistemas de gestão de ciência2. Diretrizes nacionais e internacionais,
infraestruturas e serviços3. Repositórios: Desafios de alinhamento com
diretrizes nacionais/internacionais4. Repositórios e a política de acesso aberto da FCT5. DSpaceCRIS: Gerir ciência com um repositório
institucional6. DSpaceCRIS e o RCAAP7. Questões, debate e encerramento
01-05-2023 1
Diretrizes nacionais e internacionais
01-05-2023 2
Agenda1. Regulatory framework
a. CASRAIb. Identifiers (ORCID, Org Ids, works (doi,
handle, WoS, Scopus))c. CERIFd. OpenAIRE profile
01-05-2023 3
Cadeia de valor CRIS
01-05-2023 4
Serviços
Portal pesquisa
CV
RepositórioInstitucional
etc
InfraestruturasBase de dados organizações
Base de dados investigadores
Etc.
Quadro normativoIds
Pessoas, Orgs, Proj., public.
Semantica Vocabulário
Modelo dados etc
Programa
Cadeia de valor
01-05-2023 5
Serviços
Portal pesquisa
CV
Repositório Institucional
etc
InfraestruturasOrganizações
Investigadores
Financiamento
Trabalhos
Quadro normativoIds
Pessoas, Orgs, Proj., public.
Semantica / Vocabulário
Transporte (XML)Dados
EstruturaDados
Programa
CASRAIMore research, less paperwork, better
information
http://casrai.org/node/3
01-05-2023 7
Características
01-05-2023 9
CVDados
PessoaisFormação Atividade
Profissional Projetos Produções Serviços
Cadeia de valor
01-05-2023 10
Serviços
Portal pesquisa
CV
Repositório Institucional
etc
InfraestruturasOrganizações
Investigadores
Financiamento
Trabalhos
Quadro normativoIds
Pessoas, Orgs, Proj., public.
Semantica / Vocabulário
Transporte (XML)Dados
EstruturaDados
Programa
Quadro normativo: Identificadores
Problema• Dificuldade em identificar de forma unívoca os diferentes atores do universo de
Ciência e Tecnologia
• Como não há uma conexão entre os registos que atravesse toda a cadeia de fornecedores, falham as ligações entre os diferentes atores e os produtos destas interações, por exemplo:
- Autores não associados à sua investigação- Agências de financiamento não associadas à investigação/instituição
que financiam- Autores e indivíduos não conectados às suas instituições
O que resulta em:• Formulação de relatórios/documentos pouco precisos• Dificuldades de análise • Dificuldade nas tomadas de decisão
Solução• Identificadores únicos e persistentes
Pessoas
Organizações
Projetos
Publicações
• Qualidade dos dados
• Unicidade
• “Linking” entre sistemas
• Deduplicação
Quadro normativo: Identificadores
(adaptado a partir de http://www.slideshare.net/mimran15/a-realtime-heuristicbased-unsupervised-method-for-name-disambiguation-in-digital-libraries)
Identificadores de autor
01-05-2023 14
Identificadores de autor
Adaptado de apresentação por Laura Cox, Ringgold
Desambiguar Consolidar Hierarquizar
UCL:• University College
London (UK)• Université Catholique de
Louvain (Belgium)• Universidade Cristiana
Latinoamericana (Ecuador)
• University College Lillebaelt (Denmark)
• Centro Universitario Celso Lisboa (Brazil)
• Union County Library (USA)
Universidade de Oxford:• University of Oxford• Univ. Oxford• Oxford University• Library, Oxford Univ.• Radcliffe Science Library• Bodleian Library• Bodleian, Oxford• Oxford, University of
Universidade/Faculda-de/Departamento:• University of Northampton
• Northampton Business School
• School of Education• School of Health• School of Science and
Technology• Division of
Computing
• necessários para identificar de forma inequívoca cada instituição, centro de investigação, unidade, laboratório, universidade, departamento, etc.
• funcionam como um mecanismo que agrega a informação permitindo que a informação se mantenha atualizada e sem duplicações por toda a cadeia.
Identificadores institucionais - OrgIDs
O uso disseminado de identificadores institucionais permite:
- Prevenir a duplicação de contas e registos- Manter os dados atualizados e os sistemas sincronizados- Aumentar a eficácia do trabalho de quem necessita dos dados (e
a qualidade dos serviços)- Simplificar a transferência de dados intra e inter organizações- Melhorar a qualidade dos dados - Diminuir o tempo necessário para transferência de dados- Reduzir os custos associados à transferência de dados- Garantir que publicações, autores, organizações e agências de
financiamento ficam devidamente associados- Melhorar a capacidade de decisão de todos os envolvidos
15-Jan-2015 17
Identificadores institucionais - OrgIDs
Desafios
• Adoção universal de normas• Consistência de metadados• Curadoria dos dados• Etc.
Recomendação JISC-CASRAI-UK OrgID
ISNI +
Identificadores institucionais - OrgIDs
Cadeia de valor
01-05-2023 26
Serviços
Portal pesquisa
CV
Repositório Institucional
etc
InfraestruturasOrganizações
Investigadores
Financiamento
Trabalhos
Quadro normativoIds
Pessoas, Orgs, Proj., public.
Semantica / Vocabulário
Transporte (XML)Dados
EstruturaDados
Programa
Cadeia de valor
01-05-2023 28
Serviços
Portal pesquisa
CV
Repositório Institucional
etc
InfraestruturasOrganizações
Investigadores
Financiamento
Trabalhos
Quadro normativoIds
Pessoas, Orgs, Proj., public.
Semantica / Vocabulário
Transporte (XML)Dados
EstruturaDados
Programa
CERIF
01-05-2023 29
CERIF 1.6 Tutorial
Jan DvořákMay 11th, 2015
euroCRIS Strategic Membership Meeting
Paris, Paris
cfExpertiseAndSkills
cfEquipmentcfFunding
cfFacility
cfService
cfCitation
cfEventcfLanguage cfCurrency
cfCountry
cfCurriculumVitae
cfPrize
cfQualification
cfGeographicBoundingBox
cfPostalAddress
cfElectronicAddress
cfPerson
cfProject
cfOrganisation
Unit
cfResultPatent
cfResultPublication
cfResultProduct
cfIndicator cfMeasurement
cfFederated Identifier
What is Research Information?www.eurocris.orgwww.eurocris.org
Information about:• Researchers• Organisations
– Research performing orgs, Funders, Publishers, Facility Operators• Scientific Disciplines• Funding
– Funding Programmes, Calls• Projects
– Proposed, Ongoing, Completed• Research infrastructures
– Facilities, Equipment, Services• Outputs
– Publications, Patents, Research Data, Research Software, Products• Outcomes
– New product on the market, Improved treatment procedure, Regulation update• Impacts
– Increased market share, Reduced death rate of a disease
• And their Relationships
The Ultimate Answer:Common European Research Information Format
www.eurocris.orgwww.eurocris.org
cfExpertiseAndSkills
cfEquipmentcfFunding
cfFacility
cfService
cfCitation
cfEventcfLanguage cfCurrency
cfCountry
cfCurriculum
Vitae
cfPrize
cfQualification
cfGeographic
BoundingBox
cfPostalAddress
cfElectronicAddress
cfPerson
cfProject
cfOrganisation
Unit
cfResultPatent
cfResultPublication
cfResultProduct
cfIndicator cfMeasurement
cfFederated Identifier
Common European Research Information Format
CERIF is an EU Recommendation to Member Stateshttp://cordis.europa.eu/cerif/
The European Commission (EC) has authorised euroCRIS to maintainand develop CERIF and its usage http://www.eurocris.org/Index.php?page=CERIFreleases&t=1
www.eurocris.org
Model Levelswww.eurocris.orgwww.eurocris.org
• Conceptual Level (Specification) Concepts relevant for the research domainand their relationships
• Logical Level (ER Model)Entities and their relationships
• Physical Level (Database Scripts)Data Definition commands for the database
• Semantic Layer (Declared Semantics)A formalized controlled vocabulary describing ageneral contextual semantics of the research domaininline with the conceptual, logical and machine description
Equipment
ProjectProjectOrganisationOrganisation
Service
Funding
Patent
Skills
CV
Product
Event
PersonPerson
Classification
(Semantics )
Classification
(Semantics )
Publication
SQL Script-----------------------------CREATE Table cfPers (...);CREATE Table cfProj (...);CREATE Table cfOrgUnit (...);
CERIF Semantic Layerwww.eurocris.orgwww.eurocris.org
Allows to capture any Schema or Structure• Flat Lists• Thesauri• Classification Systems (e.g. SKOS, ...)• Taxonomies• OntologiesOpen / Extensible in all directions• New Schemas• New Concepts / Terms• New RelationshipsEnables to manage• Roles / Types Semantics• Subject Headings • Archiving (Time component)
Allows for Mappings between Schemes
CERIF Federated Identifiers
• ResultPublication– ISBN– ISSN– DOI– WoS Accession Number– Scopus EID– PubMed Central ID
• Person– Social Security Number– Staff Id in HR system– Author identifier
• ORCID• IdRef
• Project/Grant– Funder’s reference
number– Organisation’s
reference number• Organisation– VAT Identification
Number– Internal Code– FundId
• Classification– External Code
www.eurocris.org
CERIF XML 1.6 Interchange Formatwww.eurocris.orgwww.eurocris.org
For point-to-point interchange XML namespace XML Schema
Based on the ER modelcfExpertiseAndSkills
cfEquipmentcfFunding
cfFacility
cfService
cfCitation
cfEventcfLanguage cfCurrency
cfCountry
cfCurriculumVitae
cfPrize
cfQualification
cfGeographicBoundingBox
cfPostalAddress
cfElectronicAddress
cfPerson
cfProject
cfOrganisation
Unit
cfResultPatent
cfResultPublication
cfResultProduct
cfIndicator cfMeasurement
cfFederated Identifier
CERIF 1.6 XML Interchange Formatwww.eurocris.orgwww.eurocris.org
<CERIF xmlns=“urn:xmlns:org:eurocris:cerif-1.6-2”><cfProj>
<cfProjId>internal-project-identifier</cfProjId><cfAcro>ACRO</cfAcro><cfURI>http://www.project-url.ac.uk/acro.html</cfURI><cfTitle cfLangCode="en" cfTrans="o">The title of the project</cfTitle><cfAbstr cfLangCode=”en" cfTrans="o">The goals of the project</cfAbstr><cfProj_Class>
<cfClassId>infrastructure-project-uuid</cfClassId><cfClassSchemeId>-project-types-scheme-uuid</cfClassSchemeId>
</cfProj_Class><cfFedId>
<cfFedId>PROJECT NUMBER</cfFedId><cfClassId>project-number-uuid</cfClassId><cfClassSchemeId>-federated-identifier-type-uuid</cfClassSchemeId>
</cfFedId><cfProj_OrgUnit>
<cfOrgUnitId>orgunit-1-identifier</cfOrgUnitId><cfClassId>coordinator-uuid</cfClassId><cfClassSchemeId>orgunit-project-roles-scheme-uuid</cfClassSchemeId><cfStartDate>from-datetime</cfStartDate><cfEndDate>to-datetime</cfEndDate>
</cfProj_OrgUnit></cfProj>
</CERIF>
CERIF highlights
• Right level of abstraction• Normalized model– Record information only once– Reference rather than copy
• Versatile Semantic Layer• Time-based relationships• Clean design, regular structure
www.eurocris.org
The CERIF Evolutionwww.eurocris.orgwww.eurocris.org
EU Working Group on Research DatabasesWorkshop
1987 1991
CERIF 91
PROJECT
Similar IdeasUN/UNESCOOECDCODATA
Acronym: ERGOParticipant: Keith Jeffery, Anne Asser son, many moreOrganisations: Rutherford Appleton, Uni- versity of Bergen, …
2000
CLASSIFICATION
RESULTS EQUIPMENT
PROJECT
OrgUnit PERSON
EXPERTISERoles
CERIF 2000 Model
- Networking of DBs- Exchange of Records
- EC Recommendation to Member States
- Data Model - Multilinguality- Controlled Vocabulary- Roles / Types- User-driven
- EC Recommendation to Member States
ProjectProject OrganisationOrganisation
Service
Funding Programme
Patent
Skills
CV
Product
Event
PersonPerson
Classification(Semantics)
Classification(Semantics)
PublicationEquipment
2ndLevel Base
LanguageSemantics Link
CERIF 2006 / 2008 Model
- Data Model- Model Normalization - Robust/Consistent Structure - Extensible Structure - Semantic Layer - XML Exchange Specification- Elaboration on Publication- CERIF Core Semantics (2008 1.2)
2006 2008 2012
Measurement GEO
Citation
CV
Prize
Qualification
ExpertiseAndSkills
EquipmentFacility
Funding
Service
ElectronicAddresse
PostalAddress
Country
CurrencyLanguage
Event
Metrics
ResultProduct
ResultPublication
ResultPatent ResultProduct
ResultPublicationResultPublication
ResultPatent
Person OrganisationUnit
Project
PersonPerson OrganisationUnitOrganisationUnit
ProjectProject
Indicator Measurement
2ndLevel Base
CERIF 1.3
Semantics LanguageLink
Infrastructure
- Data Model- Infrastructure - Facility, Equipment, Service- Measurement & Indicator - Entities and Link Tables- Geographic Bounding Box- CERIF 1.3 Vocabulary - UUIDs - Terms - Schemes- CERIF 1.4 new XML format- CERIF 1.5 Federated Identifiers- CERIF 1.6 Dataset-ready
CERIF 1.6CERIF 1.5
CERIF 1.4 (XML)CERIF 1.3
FOR MA L
SEMANT ICS
+ Linked Data
2013
International Council for Science;Commission on Data Access
European Association of Research Managers and Administrators
All European Academies
www.eurocris.org
Cadeia de valor
01-05-2023 77
Serviços
Portal pesquisa
CV
Repositório Institucional
etc
InfraestruturasOrganizações
Investigadores
Financiamento
Trabalhos
Quadro normativoIds
Pessoas, Orgs, Proj., public.
Semantica / Vocabulário
Transporte (XML)Dados
EstruturaDados
Programa
Profile
Cadeia de valor
01-05-2023 78
Serviços
Portal pesquisa
CV
Repositório
etc
InfraestruturasBase de dados organizações
Base de dados investigadores
Etc.
Quadro normativoIds
Pessoas, Orgs, Proj., public.
Semantica Vocabulário
Modelo dados etc
Programa
Profile
The CERIF profile in the OpenAIRE Guidelines
for CRIS ManagersJan Dvořák
CERIF Task Group leader, euroCRISCharles University in Prague
InfoScience Praha
euro
CRIS
Str
ateg
ic M
embe
rshi
p M
eetin
g —
Nov
embe
r 9-1
1, 2
015
@ B
arce
lona
79
The GuidelinesNikos Houssos, Brigitte Jörg, Jan Dvořák: OpenAIRE Guidelines for CRIS Managers 1.0. June 2015. DOI 10.5281/zenodo.17065
Contents:• Specification• XML Schema• Semantic vocabulary• Examples
euro
CRIS
Str
ateg
ic M
embe
rshi
p M
eetin
g —
Nov
embe
r 9-1
1, 2
015
@ B
arce
lona
80
The OpenAIRE research information interchange
euro
CRIS
Str
ateg
ic M
embe
rshi
p M
eetin
g —
Nov
embe
r 9-1
1, 2
015
@ B
arce
lona
82
CRIS OpenAIRE Infrastructure
OpenAIRE CERIFwithin
OAI-PMH
A CERIF profileProfile: A set of data elements in a research information interchange scenario.
CERIF Profile:• A subset of CERIF entities will be populated• The populated entities will only be used for some of the
objects they represent in the full model• Attributes are given more precise interpretations• Only specific semantic terms are allowed as
types/statutes/roles
euro
CRIS
Str
ateg
ic M
embe
rshi
p M
eetin
g —
Nov
embe
r 9-1
1, 2
015
@ B
arce
lona
83
The OpenAIRE CERIF entities I
euro
CRIS
Str
ateg
ic M
embe
rshi
p M
eetin
g —
Nov
embe
r 9-1
1, 2
015
@ B
arce
lona
84
The OpenAIRE CERIF entities II2.4 Organisation (cfOrgUnit)
The CERIF entity cfOrganisationUnit (cfOrgUnit) is used in the context of OpenAIRE to represent research performing organizations producing research results and/or involved in funded projects (e.g. coordinators, participants), or funder organisations.
euro
CRIS
Str
ateg
ic M
embe
rshi
p M
eetin
g —
Nov
embe
r 9-1
1, 2
015
@ B
arce
lona
85
VsAn organization (or organisation - see spelling differences) is a social group which distributes tasks for a collective goal. The word itself is derived from the Greek word organon, itself derived from the better-known word ergon - as we know `organ` - and it means a compartment for a particular job.
Definition Source: http://en.wikipedia.org/wiki/Organization
The OpenAIRE CERIF Attributes2.5 Project (cfProj)
The CERIF entity cfProject (cfProj) in the context of OpenAIRE is used to represent funded projects.
Attributes Applicable Vocabularies Multiplicity
Internal Identifier cfProj.cfProjId
1
Start Date cfProj.cfStartDate
1
End Date cfProj.cfEndDate
1
Acronym cfProj.cfAcro
0..1
Title cfProj.cfTitle
1
... ... ...
euro
CRIS
Str
ateg
ic M
embe
rshi
p M
eetin
g —
Nov
embe
r 9-1
1, 2
015
@ B
arce
lona
86
The OpenAIRE CERIF Semantics2.1 Publication (cfResPubl)
The CERIF entity cfResultPublication (cfResPubl) is used in the context of OpenAIRE to represent research results that are considered text publications. Metadata about scientific journals or other sources that contain the research results are also represented using the cfResPubl entity.
Attributes Applicable Vocabularies Multiplicity
Publication Type cfResPubl.cfResPubl_Class
The range of allowed types is limited to the following terms:- Book- Anthology- Monograph- Encyclopedia…from the “Output Types” scheme.
1
Open Access Type cfResPubl.cfResPubl_Class
The range of allowed types is limited to the following terms: - Closed Access- Embargoed Access - Open Access- Restricted Accessfrom the “Open Access Types” scheme.
1
euro
CRIS
Str
ateg
ic M
embe
rshi
p M
eetin
g —
Nov
embe
r 9-1
1, 2
015
@ B
arce
lona
87
The OpenAIRE CERIF Semantics2.1 Publication (cfResPubl)
…
Attributes Applicable Vocabularies Multiplicity
Federated IdentifierscfResPubl.cfFedId.cfFedId (where the type of identifier is given through cfResPubl.cfFedId.cfFedId_Class)
The range of allowed identifier types is limited to the following terms:- DOI- Handle- PMCID- ISI-Number- SCP-Number- ISSN- ISBN- URL- URNfrom the “Identifier Types” scheme.
0..N
euro
CRIS
Str
ateg
ic M
embe
rshi
p M
eetin
g —
Nov
embe
r 9-1
1, 2
015
@ B
arce
lona
89