CFP Bauer - Corso di Storia dei linguaggi multimediali · CFP Bauer - Corso di Storia dei linguaggi...

23

Transcript of CFP Bauer - Corso di Storia dei linguaggi multimediali · CFP Bauer - Corso di Storia dei linguaggi...

CFP Bauer - Corso di Storia dei linguaggi multimediali

Docente: Fabio Volpi

e-mail: [email protected]

sito web: dies-project.com

CFP Bauer - Corso di Storia dei linguaggi multimediali

Lezione 04

- L’ evoluzione dei motori di ricerca.

- SEO Search Engine Optimization.

- Big Data e Data Visualisation.

- Machine learning

Questione n.4

Questione chiave: La produzione di contenuti ai nostri giorni non si rivolge solo ad un audience di esseri umani. Le macchine attualmente leggono e analizzano i dati da noi generati, soprattutto sul Web.

Allo stesso tempo è in atto una forte umanizzazione dei risultati di statistiche e analisi tipiche dei tabulati da computer (Data Visualisation).

In che maniera queste due realtà possono influenzare la nostra conoscenza ed espressività?

Mark Lombardi, diagramma

I motori di ricerca

II problema di trovare I’informazione di cui abbiamo bisogno nella Rete non è di ovvia soluzione.

II web è composto da pagine che sono accessibili liberamente, altre lo sono soltanto a un numero limitato e controllato di persone, ci sono poi pagine duplicate e pagine aggregate, pagine raggiungibili da altre pagine tramite link e pagine isolate, pagine di spam e adescatori, pagine statiche che rimangono invariate e pagine dinamiche che cambiano contenuto e forma.

E oltre alle pagine ci sono i messaggi di posta elettronica, i documenti condivisi, i podcast e molti altri tipi d’informazione.

Gli strumenti a cui ricorriamo di solito sono i motori di ricerca.

I motori di ricerca

Per motori di ricerca non si intendono solo quelli devoti alla ricerca di pagine nel web come Google, Yahoo o Bing, ma anche quelli integrati in quasi tutte Ie applicazioni che troviamo nel web.

I social network, per esempio, hanno delle funzionalità per ricercare persone, gruppi, pagine, applicazioni e aggiornamenti.

Difficile non trovare una casella «cerca» nelle applicazioni che usiamo o nei siti che visitiamo.

L’ importanza dei motori di ricerca è molto chiara: la pagina alla quale metteremo un link, la persona che aggiungeremo ai nostri contatti, iI blog che leggeremo tutti i giorni, saranno scelti dopo avere esaminato i risultati che ci ha fornito un motore di ricerca.

I motori di ricerca

Due sono i principali problemi di natura informatica che devono risolvere questi strumenti:

1- inserire in un database I’informazione estratta dal web, 2- rispondere alle ricerche degli utenti interrogando iI database.

II primo problema si affronta con degli agenti automatici che sondano iI web esplorando Ie pagine da aggiungere al database. Queste pagine contengono informazioni che debbono essere estratte, elaborate e strutturate per essere inserite in modo opportuno nel database.

II secondo problema si affronta offrendo agli utenti un linguaggio di interrogazione tale che essi possano effettuare Ie loro ricerche. lnoltre, si applicano delle tecniche di valutazione dei risultati per presentare Ie risposte mettendo in ordine quelle potenzialmentepiu interessanti e poi quelle di minore rilevanza.

I motori di ricerca

I motori di ricerca si sono evoluti dai tempi della loro creazione.

Le prime generazioni estraevano I’informazione indicizzando Ie parole chiave contenute nelle pagine web basando iI proprio lavoro solo sulla sintassi delle pagine stesse.

Oggi i motori di ricerca sfruttano, anche la struttura dei riferimenti tra pagine:

I’obiettivo di quest’ultima analisi e determinare la loro rilevanza in un contesto più generale rispetto a quello della singola pagina.

Tentano inoltre di capire iI significato delle parole tramite ragionamenti semantici e si adattano all’utente imparando quali sono i suoi interessi dalle ricerche che ha fatto in precedenza, tenendo conto anche del contesto in cui sono state fatte Ie ricerche.

I web crawler

I web crawler sono degli agenti software che esplorano in modo automatico il web alla ricerca di nuove pagine, oppure aggiornano Ie informazioni relative aile pagine già trovate in passato.

Mantengono vivo un archivio di pagine, che rappresenta ilframmento del web conosciuto dal motore di ricerca.

I web crawler

La natura dei dati rende difficile per il gestore del motore di ricerca eseguire delle applicazioni in senso generico, come avviene con una comune base di dati.

Per risolvere questo problema iI sistema di indicizzazionee I’analizzatore hanno la funzione di strutturare e ottimizzare i dati contenuti nell ‘archivio in forma di database specializzato.

Su questo database opera iI risolutore delle interrogazioni che ha la funzione di calcolare Ie risposte relative alle richieste degli utenti.

Le risposte passano anche attraverso un analizzatore dei risultati che Ie prepara per I’utente, ordinando i risultati per rilevanza.

I web crawler

I crawler sono dei pogrammi che cominciano la loro ricerca con un insieme iniziale di pagine e mantengono aggiornata una lista di pagine visitate per evitare di rivisitare con eccessiva frequenza Ie stesse pagine.

Queste vengono esaminate per estrarre dei dati. In particolare, i link vengono identificati per poter così aggiungere altre pagine alla lista di pagine da visitare.

I crawler osservano la frequenza con cui controllare Ie pagine giàconosciute (per verificare I’esistenza delle modifiche) e quanto debbono attendere da un certo server tra iI momento in cui richiedono una pagina e iI momento in cui la ricevono.

Un crawler che fa troppe richieste consecutive a uno stesso server pub sovraccaricarlo e provoca re disfunzioni del server web che si possono manifestare ai generici utenti come rallentamenti.

SEO Search Engine Optimization

“L’attività di ottimizzazione per i motori di ricerca comprende varie operazioni tecniche che vengono effettuate sul codice HTML e sui contenuti delle pagine web del sito, nonché sulla struttura ipertestuale complessiva,(...) per consentire un facile reperimento del sito da parte degli utenti che cercano sui motori e normalmente determina l’aumento del volume di traffico di utenti specificamente interessati, che un sito web riceve tramite imotori di ricerca”.(tratto dalla voce di Wikipedia)

SEO: principali regole di ottimizzazione

- Inserire i contenuti importanti all’inizio del codice HTML.

- Usare I tag HTML il più possibile attinenti alla struttura dei contenuti

- Differenziare opportunamente i titoli delle varie pagine di un sito, renderli chiari e coerenti con il contenuto della pagina: dovrebbero contenere le parole chiave di maggior peso.

-Evitare di inviare informazioni incontrollate o inutili (potenzialmente dannose) tramite tag

-scegliere anche l’URL della pagina in modo che contenga le parole chiave più probabili, ovvero che sia descrittivo e possibilmente somigliante al titolo della pagina stessa.

app google analitycs

SEO: verificare i trend con Google trends

Big Data

Big data è il termine usato per descrivere una raccolta di dati così estesa in termini di volume, velocità e varietà da richiedere tecnologie e metodi analitici specifici per l’estrazione di valore.

(Andrea De Mauro, Marco Greco e Michele Grimaldi, What is big data?)

https://it.wikipedia.org/wiki/Big_datadata scientistbig databig data esempi

Big Data: caratteristiche

volume: rappresenta la dimensione effettiva del dataset;

velocità: si riferisce alla velocità di generazione dei dati; si tende all’effettuare analisi dei dati in tempo reale o quasi;

varietà: riferita alle varie tipologie di dati, provenienti da fonti diverse.

variabilità: questa caratteristica può essere un problema; si riferisce alla possibilità di inconsistenza dei dati;

complessità: maggiore è la dimensione del dataset, maggiore è la complessità dei dati da gestire; il compito più difficile è collegare le in-formazioni, ed ottenerne di interessanti.

Information Design - Data Visualisation

Per Data Visualisation o Data Representation, si intende il processo di restituzione grafica di dati raccolti e analizzati precedentementein forma numerica.(storia1) (storia 2)Il compito principale di questo metodo di rappresentazioneè quello di rendere percepibile al fruitore i dati nella maniera più veloce e comprensibile. (video)

Edward_Tuftecatalogo esempi graficiMark Lombardi /videopoppy fieldsvisual-storytelling-gestalten/information visualisationsmashingmagazine.comvalue of data visualisationIn a Nutshellvirtual phisical interfaces

Information Design - Data Visualisation

estetica del pi greco in 10 esempimusic visualisationhttp://webdesignledger.com/15-stunning-examples-of-data-visual-izationhttp://ww2.kqed.org/lowdown/2013/11/12/traffic-waves/http://simonrogers.net/2013/05/02/my-life-as-a-datavisualisation/beautiful-map-of-the-internet-news/mafia_apps-112815783/?ref=fbprvisualizing organised crimehttp://newsmap.jp/giorgia lupi-digicult

10 siti di big data e informazioni personalibig data personal future prediction