Desiderata Lbrary: ePub aspects

46
Sassari, 8 o*obre 2015 - DesiderataLibrary DesiderataLibrary (Sam H. Minelli) Sassari, 8 Ottobre 2015

Transcript of Desiderata Lbrary: ePub aspects

Sassari,8o*

obre201

5-D

esiderataLibrary

DesiderataLibrary

(Sam H. Minelli)

Sassari, 8 Ottobre 2015

Sassari,8o*

obre201

5-D

esiderataLibrary

Lo standard ePUB

Par8amodaicontenu8

Sassari,8o*

obre201

5-D

esiderataLibrary

Cara*eris8chegeneraliePUB(1/2)

•  Riferimento dello standard: IDPF •  Ultima versione pubblicata nel 2011: 3.0 •  Formato: APERTO •  Estensione files: .epub •  Formati interni: varianti di XML •  Ambito applicativo: pubblicazione libri

digitali

Sassari,8o*

obre201

5-D

esiderataLibrary

Cara*eris8chegeneraliePUB(2/2)

•  Utilizza funzionalità XML •  Utilizzo di fogli di stile CSS •  Testo re-flowable e resizable •  Grafica raster e vettoriale •  Supporto DRM (ma…) •  Possibilità di incorporare font •  Metadati integrati nel codice

Sassari,8o*

obre201

5-D

esiderataLibrary

Forma8,etecnologie:ilcontesto(1/2)Forma&

Le*ori

Edi&ng

Sorgen&

basa&suXML Altriforma& Disposi&vi So=ware Gratuito apagamentoePub BBeB AlexeReader AdobeAcrobat AdobeInDesign AozoraBunko Amazon.com

Fic8onBook CBR/CBZ AmazonKindle AdobeDigitalEdi8ons Aquafadas BaenFreeLibrary Barnes&NobleXHTML LIT(MicrosoZ) Barnes&NobleNook Aldiko Atlan8sWordProcessorFeedbooks BooktrackXMDF Mobipocket/KindleBookeenCybook Blio CalligraAuthor HathiTrust Feedbooks PDF CondorOyo(4FFFN618)BluefireReader Feedbooks InternetArchive GooglePlay Txt COOL-ER Calibre iBooksAuthor Issuu iBooksStore EPS Elonexebook Kitabu LaTeX ProjectGutenbergKoboBookstore Postscript enTourageeDGe GooglePlayBooks Sigil Smashwords Smashwords MS.docx,xlxs enTouragepocketeDGeiBooks Wikibooks SonyReaderStore Odt FoxiteSlick OverDriveMediaConsole Wikisource Mojobooks etc. FujitsuFLEPia STDUViewer HanlineReader iRexDigitalReader1000 iRexiLiad iriverStory KoboeReader OnyxBoox Plas8cLogicReader PocketBookeReader QisdaES900 SamsungPapyrus Smartphones SoZBook SonyReader Tabletcomputers

Sassari,8o*

obre201

5-D

esiderataLibrary

Forma8,etecnologie:ilcontesto(2/2)

Leggono l’ePub

•  Tutti gli altri (pur con limitazioni imposte da sistemi di DRM)

•  Kindle Fire HD e HDX (se si usano sw di interpretazione)

Non leggono l’ePub

•  Kindle (solo Mobi)

Sassari,8o*

obre201

5-D

esiderataLibrary

PrincipaliSoZwarepercreareePub

OPEN

•  Calibre •  SIGIL •  Writer2ePub

PROPRIETARI

•  Adobe InDesign •  Diboox

Sassari,8o*

obre201

5-D

esiderataLibrary

LostandardePUB:trestandard

1.  Open Container Format (OCF) 1.0, definisce il protocollo di archiviazione (zip che raccoglie tutti i file).

2.  Open Packaging Format (OPF) 2.0.1, descrive in XML la struttura del file .epub;

3.  Open Publication Structure (OPS) 2.0, descrive la formattazione dei contenuti;

Sassari,8o*

obre201

5-D

esiderataLibrary

1-OpenContainerFormat(OCF)•  Lo standard OEBPS Container Format (OCF) definisce le

linee guida per la struttura dell’archivio. Esempio semplificato: –  Cartella:‘8tololibro’

•  File:mimetype•  Cartella:META-INF

–  File:Container.xml–  File:Encrip8on.xml

•  Cartella:OEBPS–  File:style.css–  File:toc.ncx–  File:content.opf–  File:capitolo1.xml–  File:capitoloN.xml–  Cartella:Immagini

»  Immagine1.jpg»  immagineN.jpg

Sassari,8o*

obre201

5-D

esiderataLibrary

2-OpenPackagingFormat(OPF)•  Standard che definisce le procedure con cui le

OPS sono collegate •  Fornisce la struttura semantica di un ePub •  Elenca e descrive i contenuti (immagini, files

markup, strutture della navigazione) e l’ordine lineare della lettura dell’ePub

•  Fornisce un meccanismo per specificare la struttura di navigazione

•  Consente di separare la logica (OPF) dal contenuto (OPS)

Sassari,8o*

obre201

5-D

esiderataLibrary

3-OpenPublica8onStructure(OPS)

•  Standard che descrive il contenuto dell’ePUB: linee guida per garantire la miglior fruibilità del contenuto a prescindere dalla piattaforma (HW/SW)

•  Conformità XHTML (vedi IDPF) – ConformitàXML1.1– Marcatoridefini8daIDPF(inXHTML1.1eCSS2)– Conformitàdeglioggelmul8mediali

Sassari,8o*

obre201

5-D

esiderataLibrary

ePUB3

•  utilizzo di HTML5 e CSS3->possibilità di inserire elementi multimediali

•  possibilità di utilizzare MathML •  Javascript; •  metadati integrati nel codice; •  utilizzo di elementi di semantic web;

Sassari,8o*

obre201

5-D

esiderataLibrary

ComeècostruitounfileePUB(1/4)

•  i files .epub sono delle cartelle compresse (ZIP) composti da –  File:mime8pe(‘applica&on/epub+zip’)semprepresentenellarootenondeveesserealterato

–  Folder:META-INF•  Filexml:CONTAINER.XML(perl’iden8ficazionedelfile.OPFcomeroonile)

•  Filexml:ENCRIPTION.XML(infosuifont,DRM,restrizioni)–  Folder:OEBPS(perIcontenu8,vediamoinsegito)

Sassari,8o*

obre201

5-D

esiderataLibrary

ComeècostruitounfileePUB(2/4):lacartellaOEBPS

–  Folder:OEBPS•  Folder:CSS/Styles(fogliodis8le)•  Folder:Fonts•  Folder:Image(immaginievideo)•  Folder:Text(tes8informatoxml)

–  File:TOC.xhtml(eventuale)•  File:CONTENT.OPF•  File:metadata-ebook-1.xhtml•  …•  File:metadata-ebook-N.xhtml•  File:TOC.NCX•  File:TOC.xhtml

Sassari,8o*

obre201

5-D

esiderataLibrary

ComeècostruitounfileePUB(3/4):IlContent.opfInclude in particolare: •  La dichiarazione di versione xml (‘1.0’) •  Encoding dei caratteri (‘UTF-8’) •  La dichiarazione di versione epub (es. ‘2.0’) •  i metadati relativi alla pubblicazione (Dublin

Core) e sono obbligatori almeno i seguenti: <dc:title> <dc:language> e <dc:identifier>

Sassari,8o*

obre201

5-D

esiderataLibrary

ComeècostruitounfileePUB(4/4):IfileTOC•  TOC.NCX: Contiene l’indice della

pubblicazione con la struttura gerarchica e pertanto è fondamentale

•  TOC.XHTML: elenco di tutti i file organizzati gerarchicamente

Sassari,8o*

obre201

5-D

esiderataLibrary

Conversionisemi-automa8zzateversoePUB•  Spesso le conversioni alterano la struttura

semantica del libro originale mantenedone apparentemente l’aspetto visuale.

•  La conversione è accettabile solo se tutte linee guida OPF, OCF, OSP sono rispettate rigorosamente ed in particolare se sono rispettati: 1.   Gerarchiadellastru*uradellibrointerminidicapitoli,

sezioni,so*osezioni,etc.2.   Tipologiadeicontenu&dellibro(conlacorrispondente

metadatazionecorre*a:tabelle,indici,bibliografia,didascalie,etc.–vediseguitoesempi-)

Sassari,8o*

obre201

5-D

esiderataLibrary

1-Gerarchiadellastru*uradellibro

•  Ogni parte dell’ePub deve mantenere la gerarchia del libro originale (i.e. indice) –  CreareunfileXHTMLpersingolocapitolo:DLriconosceilsingolofilecomeununicobloccotestuale:U8lizzarecorre*amenteimarkupspecifici(<sec8on></sec8on>)

– NoncreareunfileXHTMLperfrazionidicapitolo:verrebbeinterpretatocomecapitolo.So*opar8diuncapitolovannoannida8nelmarkupdelcapitolo.

Sassari,8o*

obre201

5-D

esiderataLibrary

2-Tipologiadeicontenu8dellibro•  Ogni elemento di contenuto deve avere l’attributo epub:type

con I paramteri corretti. •  Esempi:

–  epub:type="part”–  epub:type="chapter”–  epub:type=”subchapter”–  epub:type="8tle”–  epub:type=”sub8tle”–  epub:type=“ordinal”–  epub:type="introduc8on”–  epub:type=“footnotes”–  epub:type="glossaryterm”

Sassari,8o*

obre201

5-D

esiderataLibrary

2-Tipologiadeicontenu8dellibro:Esempidicalveconversioni•  Spesso nelle conversioni automatiche

vengono sostituite seguenti semantiche vengono sostituite da immagini –  Tabelle–  Formule–  Font–  Box– Noteeriferimen8internialtesto–  Interapagina(nelcasodigraficheetes8complessi)

Sassari,8o*

obre201

5-D

esiderataLibrary

Corre*ousodeimarkupHTML

•  E’ indispensabile che vengano rispettati i tag standard W3C (es: <b>, <strong> etc.) perchè tag non standard non verrebbero interpretati in modo corretto. Es: – Tabletag(<table>):soloperletabelle,nonperillayoutdiorganizzazionedellapagina

–  Imagetag(<image>):vau8lizzatosoloperiden8ficareleimmagini

Sassari,8o*

obre201

5-D

esiderataLibrary

Foglidis8leCSS:buonepra8che

•  Creare un solo file CSS con gli stili comuni usati in tutti i capitoli del libro. –  IlCSSdevecontenereladefinizionedellaforma*azionedeiparagrafi,delsolotesto

– Ovenecessario,peresigenzedialcunepar8dellibro,èpossibilecreareCSSaggiun8vicheereditanolos8ledelCSSprimarioeneestendanoleregoledis8le.

Sassari,8o*

obre201

5-D

esiderataLibrary

Buonepra8che:contenu8visuali

•  Formati: jpeg; png; gif; svg+xml •  Evitare di usare immagini TIFF •  Evitare immagini troppo ‘pesanti’ •  Tutte le immagini debbono stare nella

specifica cartella

Sassari,8o*

obre201

5-D

esiderataLibrary

Suggerimen8immagini

•  Immagini – Forma8preferibili:JPG,PNG– Dimensioni(esempioaltaqualità:circa1.000pxlatomaggiore,300dpi):ilprincipioèdiusarelaminimadimensionechehalamassimaqualitàpercepibile.

– Usareiltag<image>

Sassari,8o*

obre201

5-D

esiderataLibrary

Presenzafilesimportan8

•  Ogni pubblicazione deve contenere – TOC.ncx,indicedell’opera:descrivelastru*urainternadellibro(paragrafi,so*o-paragrafi,etc.)

– Content.opf:definiscel’ordineoriginaledile*ura.

Sassari,8o*

obre201

5-D

esiderataLibrary

Nomi-file:buonepra8che

•  Nomi files: – Nonusarecara*eriaccenta8speciali– Bonapra8cal’usodinomideifileinminuscolo

•  I contenuti indicizzati nel file NCX dovrebbero utilizzare percorsi relativi riferiti alle singole risorse XHTML privi di caratteri speciali come: spazi, trattini, virgolette, o simili.

Sassari,8o*

obre201

5-D

esiderataLibrary

Linkeriferimen8•  IDPF: http://www.idpf.org/ •  Open Publication Structure (OPS) 2.0 v1.0: http://www.idpf.org/epub/20/spec/

OPS_2.0.1_latest.htm •  Open Packaging Format (OPF) 2.0 v1.0: http://www.idpf.org/epub/20/spec/

OPF_2.0.1_latest.htm •  OEBPS Container Format (OCF) v1.0: http://www.idpf.org/doc_library/epub/

OPF_2.0_latest.htm •  ANSI/NISO Z39.86 - 2005 Specifications for the Digital Talking Book, NCX part

(NCX): http://www.niso.org/standards/resources/Z39-86-2005.html#NCX •  DCMI Metadata Terms 2006-12-18 (DC): http://dublincore.org/documents/2006/12/18/

dcmi-terms/ •  XHTML 1.1: http://www.w3.org/TR/xhtml11/ •  CSS 2.1: http://www.w3.org/TR/CSS21/ •  XML 1.0: http://www.w3.org/TR/xml/

Sassari,8o*

obre201

5-D

esiderataLibrary

Acronimi

•  IDPF: International Digital Publishing Forum •  MIME: Multipurpose Internet Mail Extensions •  OPF: Open Packaging Format •  OCF: Container Format •  OSP: Open Publication Structure •  CNX: Navigation Center eXtended

Sassari,8o*

obre201

5-D

esiderataLibraryIlBack-end

Sassari,8o*

obre201

5-D

esiderataLibrary

Back-end:strumen8edergonimia

Sassari,8o*

obre201

5-D

esiderataLibrary

IlcatalogoEditore:lepubblicazioni

Sassari,8o*

obre201

5-D

esiderataLibrary

Illibro(liquido)

Sassari,8o*

obre201

5-D

esiderataLibrary

Modificapagina

Sassari,8o*

obre201

5-D

esiderataLibrary

Personalizzazionedellapresentazione(libroliquido)

Sassari,8o*

obre201

5-D

esiderataLibrary

SEOeTagging

SEO/nonSEO

Geo-referenziazione

Ontologia

Keywords

Sassari,8o*

obre201

5-D

esiderataLibrary

Nuovocapitolo(paginamedia)

Sassari,8o*

obre201

5-D

esiderataLibraryOntologyBuilding

Sassari,8o*

obre201

5-D

esiderataLibrary

Ontologia:creazionedelleen8tà

Sassari,8o*

obre201

5-D

esiderataLibrary

En8tàdell’ontologia:lerelazioni

Sassari,8o*

obre201

5-D

esiderataLibrary

Rappresentazionedell’Ontologia(esempiosemplice)

Sassari,8o*

obre201

5-D

esiderataLibrary

Rappresentazionedell’Ontologia(esempiocomplesso-storia)

Sassari,8o*

obre201

5-D

esiderataLibrarySperimentazione

Sassari,8o*

obre201

5-D

esiderataLibrary

Alvitàdisperimentazione:valutazioneimportazioniVisione dei libri liquidi inseriti

a.  Aprireun8tolopervoltasuDLesuunvostroreader

b.  Confrontareacampionelepaginec.  Metadatazioned.  Segnalarediscrepanze

Sassari,8o*

obre201

5-D

esiderataLibrary

Alvitàdisperimentazione:edi8ng

Nuovo libro liquido a.  Creazionediunnuovolibrob.  Titolazionec.  Metadatazioned.  Impaginazioneemodifichedeltestoe.  Unapaginaperpagetype

Sassari,8o*

obre201

5-D

esiderataLibrary

Alvitàdisperimentazione:edi8ng

Ideazione di un’ontologia di dominio a.  Sceltadiungenereb.  Scri*uradiunmodelloconce*ualec.  CreazionedelmodellonelBack-endd.  Taggaturadeirela8vi8toli

Sassari,8o*

obre201

5-D

esiderataLibrary

Ing. Sam H. Minelli PM progetto: DesiderataLibrary

Gruppo Meta SRL Via Gozzini, 15/17 56121 – Pisa (PI)

Italy

e| [email protected] Skype| samminelli

www| GruppoMeta.it