Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.
-
Upload
ine-willems -
Category
Documents
-
view
217 -
download
0
Transcript of Data wat is het en hoe kun je het vinden? Marina Noordegraaf & Wouter Gerritsma.
Data wat is het en hoe kun je het vinden?
Marina Noordegraaf & Wouter Gerritsma
onderzoeksdata• Line-up
• Data, wat is het?definitie, research life cycle, data life cycle, data formats, open data, jullie data
• Waarom is het ineens zo’n HOT issue?
• How to search 4 data repositories (waar vind ik ze?)• Oefening: zoek een data repository op jouw vakgebied en vind een dataset
• Metadata en data citatie (linking research together)
• How to search IN data repositories/data portals (hoe vind ik data)? • Oefening: zoek datasets in Narcis (data portal), DANS EASY, 3TU.Datacentrum, DANS Data
Portal
• Wrap-up (waarom vond ik wat ik vond?)
• Staying up to data
“Research data is defined as the recorded factual
material, commonly accepted in the scientific community as necessary
to validate research findings
“http://docs.lib.purdue.edu/cgi/viewcontent.cgi?article=1186&context=lib_research
Alles wat van belang is voor het begrip/traceren van de publicatie.
Niet alleen onderzoeksdata zelf, maar ook manier waarop data verzameld: Context, Metadata,
Supplementary Material
DATA bij NATUURWETENSCHAPPEN
– Observaties, nummers, meetpunten, coördinaten, frequenties, opgeslagen in b.v. spreadsheets en databases
– Discipline-specifiek, b.v. • Life-Sciences: genexpressies, DNA-to-RNA
translations, protein sequences, eiwitstucturen, NMR data van biomoleculen• Sterrenkunde: foto’s, mapping the universe• …….
DATA bij SOCIALE WETENSCHAPPEN
• Survey-onderzoek– Interviews– Vragenlijstonderzoek
• Data uit experimenten (je brengt mensen in voorbeeldsituaties en noteert wat ze doen)
• Filmpjes/stimulusmateriaal bij deze experimenten• Programmatuur, simulaties (gefingeerde data)• Transcripts van rechtszaken, … • ..
DATA FORMATS
DATA FORMATS
Een data formaat of bestandsformaat is de
vorm waarin informatie gecodeerd is.
De informatie is op zo'n manier gecodeerd dat een programma of toepassing (application) de data kan
herkennen, lezen en gebruiken
http://dataintelligence.3tu.nl/ii-data-management/data-formaten/
“ “
OPEN FORMATS
The safest option to guarantee long-term data access and usable
data is to convert data to standard formats that most software are
capable of interpreting, and that are suitable for data interchange and
transformation
http://www.data-archive.ac.uk/create-manage/format/formats
“ “
OPEN FORMATS
This typically means using open or standard formats - such as OpenDocument Format (ODF),
ASCII, tab-delimited format, comma-separated values, XML - as opposed to proprietary ones. Some
proprietary formats, such as MS Rich Text Format, MS Excel, SPSS, are widely used and likely to be
accessible for a reasonable, but not unlimited, time
http://www.data-archive.ac.uk/create-manage/format/formats
“ “
HOW (re)USABLE?
DATA bij JULLIE ?
• Welke data worden in jullie instelling geproduceerd ?
• Van welke ruwe data maken jullie(onderzoekers) gebruik
(of zouden ze gebruik vanWILLEN maken) ?
Waarom is het ineens zo’n HOT
issue?
“ In almost every laboratory,
“born digital” data proliferate in files,
spreadsheets, or data-bases stored on hard
drives, digital notebooks, Web sites, blogs, and
wikis.
The management, curation, and archiving of
these digital data are becoming increasingly
burdensome for research scientists.
“
http://www.cloudinnovation.com.au/Bell_Hey%20_Szalay_Science_March_2009.pdf
http://blogs.ch.cam.ac.uk/pmr/2011/08/01/why-you-need-a-data-management-plan/
2011Research misconduct includes fabrication, falsification, suppression, or inappropriate manipulation of data; inappropriate image manipulation; plagiarism; misleading reporting; redundant publication; authorship malpractice such as guest or ghost authorship; failure to disclose funding sources or competing interests; misreporting of funder involvement; and unethical Research
http://publicationethics.org/files/A_consensus_statement_on_research_misconduct_in_the_UK.pdf
““
2011
http://robbertdijkgraaf.com/pdf/Publicaties%20columns%20NRC/NRC_12_04_28_De_academische_lente.pdf
2012
http://www.freesoftwaremagazine.com/articles/can_open_source_software_drive_fourth_paradigm
Journals Data Availability Policy
Journals Data Availability Policy
Journals Data Availability Policy
http://oad.simmons.edu/oadwiki/Journal_open-data_policies
http://www.vitae.ac.uk/CMS/files/upload/Vitae_Information_Literacy_Lens_on_the_RDF_Apr_2012.pdf
Information Literacy has gone data
In the 21st century, information literacy is a key attribute for everyone, irrespective of age or experience. Information literacy is evidenced through understanding the ways in which information and data is
created and handled, developing skills in its management and use and modifying attitudes, habits and
behaviours to appreciate the role of information literacy in learning and
research
HOW 2 SEARCH 4 DATA
HOW 2 SEARCH 4 DATA
HOW 2 SEARCH 4 DATA
data paper
data repository(institutional,domain specific (communitysupported))
research data
directory of data
repositories
data portal (regional, national, …)
Zoeken naar data repository
zoeken naar data in meerdere data repositories
How to search 4 data repositories
data paper
data repository(institutional,domain specific (communitysupported))
research data
directory of data
repositories
data portal (regional, national, …)
Zoeken naar data repository
zoeken naar data in meerdere data repositories
Directory of Research Data Repositories
• http://databib.org/• http://datacite.org/repolist• http://
oad.simmons.edu/oadwiki/Data_repositories
• Discipline – Specifiek, b.v. http://biosharing.org/biodbcore
• Perspectief: http://datacatalogs.org/ (m.n. Overheidsinfo)
Directory of Research Data Repositories
Directory of Research Data Repositories
Research Data Repositories - discipline
http://biosharing.org/biodbcore
DATA bij JULLIE ?
• Welke data worden in jullie instelling geproduceerd ?
• Van welke ruwe data maken jullie(onderzoekers) gebruik
(of zouden ze gebruik vanWILLEN maken) ?
Oefening 1• Zoek (b.v. via http://databib.org) een data
repository op het vakgebied dat jij ondersteunt (of op één van de vakgebieden van jouw instelling)
• Kies er één uit en ga zoeken naar een dataset• Hoe heb je de dataset gevonden?
METADATA
http://dataintelligence.3tu.nl/ii-data-management/metadata
/
“ Scientific metadata provide the
information necessary for investigators
separated by time, space, institution or disciplinary norm to establish common
ground
“DataCite. (2011). DataCite MetaData
Scheme for the Publication and Citation of Research Data. http://
schema.datacite.org
METADATA
METADATA
METADATA
The gray line separates
medata from data
DATA CITATION
“ “
DATA CITATION
“The practice of providing a reference to data in the same way as researchers routinely provide a bibliographic reference to articles
“
http://ands.org.au/guides/data-citation-awareness.html
DATA CITATION
“Getting credit through formal citation, obtaining copies of articles that use the data, and learning of
products or publications that use the data are just some of the conditions
that will help encourage data sharing
“
http://www.plosone.org/article/info:doi/10.1371/journal.pone.0021101
PERSISTENT Identifiers
Een Persistent Identifier identificeert het object
zélf onafhankelijk van de plaats waar deze staat
URNurn:nbn:nl:ui:13-7yu-x43 = http://www.persistent-identifier.nl/?identifier=urn:nbn:nl:ui:13-7yu-x43
Handle
DOI
• DOI stands for "Digital Object Identifier (http://datacite.org/whatisdoi)
• Gebaseerd op Handle, maar een handle maakt het niet uit WAT er geidentificeerd wordt terwijl een DOI gebaseerd is op een datamodel die uitgaat van relaties tussen objecten
• Resolve a DOI http://dx.doi.org/
• Meer over persistent identifiers? – http://
wiki.esipfed.org/index.php/Interagency_Data_Stewardship/Identifiers/Table
– http://wiki.surf.nl/display/PersistentIdentifier/NL– http://www.doi.org/factsheets/DOIHandle.html
DATA CITATION
http://www.icpsr.umich.edu/icpsrweb/ICPSR/curation/citations.jsp
HOW 2 SEARCH 4 DATA
data paper
data repository(institutional,domain specific (communitysupported))
research data
directory of data
repositories
data portal (regional, national, …)
Zoeken naar data repository
zoeken naar data in meerdere data repositories
Research Data Repository
Research Data Portal
http://datacentrum.3tu.nl/nieuws-agenda/nieuwsbericht/datasets-3tudatacentrum-ook-in-narcis/
Research Data Portal
http://www.narcis.nl/searchhints/Language/nl
HOW 2 SEARCH 4 DATA
data paper
data repository(institutional,domain specific (communitysupported))
research data
directory of data
repositories
data portal (regional, national, …)
Zoeken naar data repository
zoeken naar data in meerdere data repositories
Oefening 2• - Zoek in NARCIS http://www.narcis.nl de dataset met de titel: ‘Water
Expenditure and Service Levels in Mozambique’ (afkomstig uit DANS EASY). Dit
is jouw dataset 1
- Kijk of je deze dataset ook in DANS EASY https://easy.dans.knaw.nl/ kunt
vinden
- Wat is het verschil in getoonde velden tussen EASY en NARCIS?
- Kies een trefwoord dat wel wordt getoond in de EASY omschrijving van de
dataset en niet in de NARCIS omschrijving. Voer dit trefwoord vervolgens in in
NARCIS. Wat gebeurt er?
Zoekmogelijkheden
ZOEKEN
Alleen door goed naar je
zoekresultaten te kijken en dit ook
vanuit verschillende oogpunten te doen,
kun je leren begrijpen hoe
gemaakte keuzes je zoekresultaten zullen
beïnvloeden.
Staying Up To Data
• https://www.surfspace.nl/sig/28-research-data/ • http://datapub.cdlib.org/• http://datapool.soton.ac.uk/• http://digital-scholarship.org/rdcb/rdcb.htm
Staying Up To Data
• Cursus volgen http://dataintelligence.3tu.nl• Naslag
http://libguides.library.uu.nl/onderzoeksdata
Staying Up To (Medical) Data
• https://blog.surfnet.nl/?p=644
• Maak gebruik van je netwerk en/of begin met (sociaal) netwerken
www.twitter.com/insearch4data
Marina Noordegraaf (www.verbeeldingskr8.nl)
Tot data• De plaatjes zonder bronvermelding zijn gemaakt door Marina Noordegraaf