doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Elektronické publikování
Mgr. Jiří Dvorský, Ph.D.
Katedra informatikyFEI VŠB-TU Ostrava
30. listopadu 2006
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Formátování textu
Dnes asi nejběžnější počítačová aplikace.1 text se zadá do počítače,2 vstupní text se zformátuje,3 naformátovaný text se zobrazí na monitoru,4 naformátovaný text se vytiskne.
Dva přístupy:
WYSIWYG editory – fáze splývají dohromady,
formátovací programy – fáze odděleny, značkovací jazyk.
Otázka znovupoužití a více cílových formátů.
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Publikační nástroje
Proprietární formátyMS WordMS PowerPoint
Nezávislé/rozšířené standardyTEX / LATEX / pdfTEXXML - XHTML, DocBookPDFPostScript
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Proprietární nástroje
Výhodyobvykle s uživatelsky přívětivým prostředím,integrace s operačním systémem.
Nevýhodynekompatibilita s jinými nástroji,problémy s přenositelnostmi mezi verzemi,závislost na operačním systému.
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Microsoft Word
de facto standard,
aktuální verze označována jako 2003,
je již hotova verze 2007,
běžná kancelářská práce,
vkládání obrázků – většinou rastrové formáty (jpg, bmp atd.),
propojení s dalšími kancelářskými aplikacemi – Excel, Access,
makra.
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Problémy s Wordem – nekancelářské použití
nekompatibilita s dávnými verzemi (čitelnost diplomkynapsané ve Wordu 6????),
kódování češtiny (dnes již vyřešeno),
vložené objekty, např. Equation,
údržba automaticky vkládaných částí textu.
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Nezávislé standardy
Nevýhodyproti komerčním systémům vyžadují znalosti a určitou přípravu„navícÿ.
Výhodynení nutná investice do nástrojů,obvykle přenositelnost mezi verzemi,nezávislost na operačním systému.
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
(X)HTML
značkovací jazyk,
vhodný pro tvorbu prezentací na WWW, podpora kaskádovýchstylů, hypertextu,
občasná nekompatibilita mezi prohlížeči,
obtížná konverze do knižní podoby (např. neexistencestránek).
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
PostScript – PS
standardní formát pro tisk,
nezávislost na operačním systému,
komunikační jazyk pro tiskárny,
vektorová grafika, RIP,
vhodný pro složitou grafiku,
prostorově náročný
prohlížeč – GhostView (zdarma)
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Portable Document Format – PDF
prezentační formát,
vychází z PS,
komprese dat, ochrana proti modifikaci, tisku, kopírování,
hypertext,
formuláře,
prohlížeč – Adobe Acrobat Viewer (zdarma)
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
TEX/LATEX/pdfTEX
TEX značkovaní jazyk, Donald E. Knuth, 1984
LATEX značkovaní jazyk vyšší úrovně, Leslie Lamport, 1985
pdfTEX/pdfLATEX, výstup přímo do PDF
vhodný pro komplikovanou sazbu, včetně matematiky
výstup do PS, PDF
možnost konverze do HTML,
pdfTEX– možnost sazby hypertextových dokumentů
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Výhody LATEXu – sazba knihy
perfektní sazba, plus neschopnost amatérů měnit parametry,
nezávislost na platformě,
výstup PS či PDF,
možnost použití vlastních maker.
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
DocBook
vydavatelství O’Reily pro dokumentaci k programům,
jazyk pro sazbu dokumentů založený na XML,
podpora generování výstupu do HTML, PS i PDF,
možnost rozšiřování,
obtížná sazba matematiky,
výstup není zcela perfektní.
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Použití v akademickém prostředí
odborné publikace,
bakalářské, diplomové a disertační práce,
skripta,
studijní opory,
tištěná i elektronická podoba,
dlouhá doba využití.
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Speciální požadavky – sazba skript
sazba matematiky,
import zdrojových textů např. v Javě,
množství odkazů mezi částmi textu,
rejstřík,
citace na seznam literatury,
výstup pro osvit,
hypertextová verze
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Matematická sazba
© Petr Šaloun, ZPP-Elektronické publikování
Matematická sazba
© Petr Šaloun, ZPP-Elektronické publikování
Speciální požadavky(výuková opora programování)
• Rozvržení stránky,• naviga ní ikony a nové pojmy,• zvýrazn ní syntaxe a aktuálnost obsahu
výpis zdrojových kód ,• rejst ík,• výstup pro osvit.
© Petr Šaloun, ZPP-Elektronické publikování
Papírová kniha
© Petr Šaloun, ZPP-Elektronické publikování
Zrcadlový výstup
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Zrcadlový výstup
1 Úvod
Již několik let si stěžujeme na informační explozi, ale neuvědomujeme si, že sto-jíme teprve na jejím počátku. Odhad říká, že do roku 1975 bylo na světě publi-kováno asi padesát milionů knih. Problém, ale spočívá v rychlosti růstu: podleodhadu se množství informací na světě zdvojnásobuje každých dvacet měsíců.Tento zarážející údaj nemusí být zcela přesný, může však sloužit pro zdůraz-nění závažnosti situace, kterou všichni cítíme: informace se začínají vymykatkontrole. Z globálního hlediska může být zajímavé podívat se, jak množstvíinformací rostlo v minulosti a porovnat tento růst s dnešní situací. Dále mů-žeme zkoumat, jak se lidé vyrovnávají s informační explozí. Dokumentografickéinformační systémy (DIS) se zdají být velmi důležitou a obecně použitelnoustrategií k udržení orientace v éře informací.
2 Dokumentografické informační systémy
Dokumentografické informační systémy (DIS) [1, 17] představují třídu progra-mových nástrojů, určených pro zpracování, úschovu a výběr dat, kterými jsoutexty1. K DIS přistupuje uživatel, který má potřebu získat z tohoto systémuinformaci nutnou pro řešení jeho problému. Takovou informaci nazýváme re-levantní. Pochopitelně, různé dokumenty mohou uživatele uspokojit v různémíře. Proto mluvíme také o míře relevance dokumentu.Při vyhledávání informace v DIS uživatel systému zadává svůj požadavek,
dotaz, a očekává výsledek ve formě množiny dokumentů, které systém vybírájako odpovídající požadavku uživatele, jako splňující jeho dotaz. Uživatel kladedotazy pomocí nějakého dotazovacího jazyka, přičemž je podstatná nejen lo-gická struktura dotazu, ale i termy, které uživatel při formulaci svého dotazupoužije. Pod pojmem term budeme chápat jistý vzorek textu, nejčastěji jednoslovo. Problémem, typickým pro tento druh úloh, je, že uživatel často nevíjak vhodně formalizovat svůj – více či méně neurčitý – požadavek (a to i přiznalosti daného problému).Obecným požadavkem, kladeným na DIS, je poskytnout uživateli systému
relevantní dokumenty (tj. ty, které ho zajímají), a to pokud možno všechny(které jsou v systému k dispozici), a právě jen ty (relevantní). Algoritmusrealizující výběr relevantních dokumentů předpokládá vhodné předzpracovánívstupních informací o dokumentech a uložení do vhodných datových struktur.Základní otázky předzpracování a výběru informace lze formulovat takto:
1. Jak z dokumentů vybrat „to podstatnéÿ pro jejich identifikaci?
2. Jaké datové struktury zvolit pro reprezentaci dokumentů?1V anglicky psané literatuře se tyto systémy nazývají fulltext systems, fulltextové nebo plnotextové systémy.
1
1Úvod
Jižněkolikletsistěžujemenainformačníexplozi,aleneuvědomujemesi,žesto-jímeteprvenajejímpočátku.Odhadříká,žedoroku1975bylonasvětěpubli-kovánoasipadesátmilionůknih.Problém,alespočívávrychlostirůstu:podleodhadusemnožstvíinformacínasvětězdvojnásobujekaždýchdvacetměsíců.Tentozarážejícíúdajnemusíbýtzcelapřesný,můževšaksloužitprozdůraz-něnízávažnostisituace,kterouvšichnicítíme:informacesezačínajívymykatkontrole.Zglobálníhohlediskamůžebýtzajímavépodívatse,jakmnožstvíinformacírostlovminulostiaporovnattentorůstsdnešnísituací.Dálemů-žemezkoumat,jakselidévyrovnávajísinformačníexplozí.Dokumentografickéinformačnísystémy(DIS)sezdajíbýtvelmidůležitouaobecněpoužitelnoustrategiíkudrženíorientacevéřeinformací.
2Dokumentografickéinformačnísystémy
Dokumentografickéinformačnísystémy(DIS)[1,17]představujítříduprogra-movýchnástrojů,určenýchprozpracování,úschovuavýběrdat,kterýmijsoutexty1.KDISpřistupujeuživatel,kterýmápotřebuzískatztohotosystémuinformacinutnouprořešeníjehoproblému.Takovouinformacinazývámere-levantní.Pochopitelně,různédokumentymohouuživateleuspokojitvrůznémíře.Protomluvímetakéomířerelevancedokumentu.
PřivyhledáváníinformacevDISuživatelsystémuzadávásvůjpožadavek,dotaz,aočekávávýsledekveforměmnožinydokumentů,kterésystémvybírájakoodpovídajícípožadavkuuživatele,jakosplňujícíjehodotaz.Uživatelkladedotazypomocínějakéhodotazovacíhojazyka,přičemžjepodstatnánejenlo-gickástrukturadotazu,aleitermy,kteréuživatelpřiformulacisvéhodotazupoužije.Podpojmemtermbudemechápatjistývzorektextu,nejčastějijednoslovo.Problémem,typickýmprotentodruhúloh,je,žeuživatelčastonevíjakvhodněformalizovatsvůj–vícečiméněneurčitý–požadavek(atoipřiznalostidanéhoproblému).
Obecnýmpožadavkem,kladenýmnaDIS,jeposkytnoutuživatelisystémurelevantnídokumenty(tj.ty,kteréhozajímají),atopokudmožnovšechny(kteréjsouvsystémukdispozici),aprávějenty(relevantní).Algoritmusrealizujícívýběrrelevantníchdokumentůpředpokládávhodnépředzpracovánívstupníchinformacíodokumentechauloženídovhodnýchdatovýchstruktur.Základníotázkypředzpracováníavýběruinformacelzeformulovattakto:
1.Jakzdokumentůvybrat„topodstatnéÿprojejichidentifikaci?
2.Jakédatovéstrukturyzvolitproreprezentacidokumentů?1Vanglickypsanéliteratuřesetytosystémynazývajífulltextsystems,fulltextovéneboplnotextovésystémy.
1
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Sazba zdrojových kódů
načtení přímo z kompilovaných souborů,
oddělení formy od obsahu,
zvýraznění syntaxe.
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Sazba zdrojových kódů – ukázka
public class Hello{// tohle je fakt mainpublic static void main(String [] args){System.out. println (”Hello world”);
}}
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Software pro LATEX
distribuce TeXLive 2005http://ftp.cstug.cz/pub/tex/./CTAN/systems/
texlive/Images/texlive2005-inst-20051102.iso.zip
popis instalace a další informace na www.cs.vsb.cz/dvorsky
archiv CTAN a CSTUGwww.cstug.cz
editor TeXnicCenterwww.toolscenter.org
prohlížeč PostScriptu GhostViewsoftwarový RIP GhostScripthttp://www.cs.wisc.edu/~ghost/
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Literatura k LATEXu
Helmut Kopka: Patrick W. Daly: LaTeX kompletní průvodce,Computer Press, Brno 2004, ISBN 80-722-6973-9
Jiří Rybička: LATEX pro začátečníky, 2. vydání, Konvoj, Brno1998, ISBN 80-85615-77-0
doc. RNDr. Petr Šaloun, Ph.D.katedra informatiky FEI VŠB–TU Ostravawww.cs.vsb.cz/saloun
Elektronické publikování
© Petr Šaloun, ZPP-Elektronické publikování
Základní pojmy
• Zpracování textu – myšlenka, typografický návrh, realizace, znovupoužití.
• Realizace – ztvárn ní myšlenky podle typografických pravidel daným programovým systémem.
• Znovupoužití – možnost (polo)automatického zpracování již hotových dokument pro jiný ú el.
© Petr Šaloun, ZPP-Elektronické publikování
B žné systémy
• Snaha o strukturní zna ky – obsahuje každý systém.
• (X)HTML – kaskádové styly.• LaTeX – styly a typografické zásady
sou ástí distribucí.• Word – využití znakových a
odstavcových styl .
© Petr Šaloun, ZPP-Elektronické publikování
Publika ní nástroje
• Proprietární formáty– MS Word– MS PowerPointmožnost XML exportu
• Nezávislé/rozší ené standardy– TeX / LaTeX / PDFTeX– XML – XHTML, DocBook– PDF– PostScript
Závěr
Oddělit obsah od formy.
Dodržovat jednotný styl v rámci publikace.
V jednoduchosti je síla.
Top Related