Optimização de pesquisas Web utilizando Colónias de Formigas

24
Wide Scope Optimization Solutions The company concept

Transcript of Optimização de pesquisas Web utilizando Colónias de Formigas

Page 1: Optimização de pesquisas Web utilizando Colónias de Formigas

Wide ScopeOptimization SolutionsThe company concept

Page 2: Optimização de pesquisas Web utilizando Colónias de Formigas

Wide Scope – The Company Concept

Page 2

Page 3: Optimização de pesquisas Web utilizando Colónias de Formigas

Wide Scope – The Company Concept

Net-WMSEuropean-funded project (FP6) for integrating Virtual Reality and optimization techniques in a new generation of Networked businesses in Warehouse Management Systems under constraints.

Page 3

» PSA – Peugeot Citroen (France)‏» FIAT – Research Centre (Italy)‏

» Wide Scope (Portugal)‏» KLS Optim (France) » Mind2Biz (Turkey)‏

» CEA – Commisariat Energie Atomique (France)‏» SICS – Swedish Institute Computer Science (Sweden)‏» INRIA (France)‏» École des Mines de Nantes (France)‏» ERCIM – W3C (France)‏

http://

net-wms.

ercim.org

Page 4: Optimização de pesquisas Web utilizando Colónias de Formigas

Optimização de pesquisas Web utilizando Colónias de FormigasPedro Gomes, Filipe Carvalho

Page 4

Page 5: Optimização de pesquisas Web utilizando Colónias de Formigas

Pesquisa Web – Case Study

Page 5

Pesquisa:Expressão “404 Error – Page not found”

Resultados (~7.660.000):Nas 6 primeiras posições temos 5 “páginas não encontradas” e 1 explicação Wikipedia.

Page 6: Optimização de pesquisas Web utilizando Colónias de Formigas

Pesquisa Web - Case Study

Page 6

Página 2:Mais do mesmo...

Page 7: Optimização de pesquisas Web utilizando Colónias de Formigas

Pesquisa Web – Case Study

Page 7

Mas ao longo das várias páginas de resultados surgem alguns links interessantes ....

pag. 1

pag. 2

pag. 2

pag. 3

Page 8: Optimização de pesquisas Web utilizando Colónias de Formigas

Porquê, porquê, porquê ?

Question 1- Porque surgem tantos resultados desinteressantes e apenas alguns relevantes

para aquilo que pretendo encontrar ?

- ... devo refinar a pesquisa ?- ... procurar noutro site ?- ... navegar de página para página a partir de um link que pareça interessante (e.g.,

wikipedia) ?

Question 2- Porque não estão logo na primeira página todos os resultados interessantes

que encontrei espalhados por várias páginas ?

Page 8

Page 9: Optimização de pesquisas Web utilizando Colónias de Formigas

State-of-the-art

Page 9

Os resultados de uma pesquisa são devolvidos em função de duas dimensões:

• a sintaxe textual da “query”

• a “importância” de cada página enquadrada no contexto da pesquisa (PageRank)

Resultados = Sintaxe + Ranking

Page 10: Optimização de pesquisas Web utilizando Colónias de Formigas

State-of-the-art

Page 10

Os resultados de uma pesquisa são devolvidos em função de duas dimensões:

• a sintaxe textual da “query”

• o ranking de cada página enquadrada no contexto da pesquisa

“PageRank is defined as follows:

We assume page A has pages T1...Tn which point to it (i.e., are citations). The parameter d is a damping factor which can be set between 0 and 1. We usually set d to 0.85. Also C(A) is defined as the number of links going out of page A. The PageRank of a page A is given as follows:

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))“

In The Anatomy of a Large-Scale Hypertextual Web Search Engine, Sergey Brin and Lawrence Page, Computer Science Department, Stanford University, 1998

Page 11: Optimização de pesquisas Web utilizando Colónias de Formigas

Introdução da semântica

Page 11

Com “semântica de uma pesquisa” referimo-nos ao que o utilizador pretende encontrar;

A semântica está além dos caractéres utilizados numa expressão de pesquisa ou na relevância que outros sites atribuem a cada resultado.

Resultados = Sintaxe + Semântica + Ranking

Page 12: Optimização de pesquisas Web utilizando Colónias de Formigas

Introdução da semântica

Page 12

Question:Como saber o significado da pesquisa para além dos caractéres utilizados ?

Question:Como saber que um resultado é relevante para essa semântica independentemente do seu PageRank ?

Page 13: Optimização de pesquisas Web utilizando Colónias de Formigas

Ant Colonies OptimizationSwarm Intelligence

Page 13

Page 14: Optimização de pesquisas Web utilizando Colónias de Formigas

Behaviour of real ants

Real ants are capable of finding the shortest path from a food source to the nest without using visual cues.

Also, they are capable of adapting to changes in the environment, for example finding a new shortest path once the old one is no longer feasible due to a new obstacle

Page 14

Page 15: Optimização de pesquisas Web utilizando Colónias de Formigas

Behaviour of real ants

Ants deposit a certain amount of pheromone while walking, and each ant probabilistically prefers to follow a direction rich in pheromone rather than a poorer one.

This elementary behavior of real ants can be used to explain how they can find the shortest path which reconnects a broken line after the sudden appearance of an unexpected obstacle has interrupted the initial path.

Page 15

Page 16: Optimização de pesquisas Web utilizando Colónias de Formigas

Behaviour of real ants

In fact, once the obstacle has appeared, those ants which are just in front of the obstacle cannot continue to follow the pheromone trail and therefore they have to choose between turning right or left.

In this situation we can expect half the ants to choose to turn right and the other half to turn left. The very same situation can be found on the other side of the obstacle.

Page 16

Page 17: Optimização de pesquisas Web utilizando Colónias de Formigas

Behaviour of real ants

Those ants which choose, by chance, the shorter path around the obstacle will more rapidly reconstitute the interrupted pheromone trail compared to those which choose the longer path.

The shorter path will receive a higher amount of pheromone in the time unit and this will in turn cause a higher number of ants to choose the shorter path. Due to this positive feedback (autocatalytic) process, very soon all the ants will choose the shorter path

Page 17

Page 18: Optimização de pesquisas Web utilizando Colónias de Formigas

Modelação matemática

Em cada nodo i, a desejabilidade de passar para j é determinada em função da visibilidade (i -> j) e da quantidade de feromona entre (i -> j).

O troço i->j será seguido com uma probabilidade proporcional à sua desejabilidade, tal como qualquer outro nodo destino k.

Page 18

Page 19: Optimização de pesquisas Web utilizando Colónias de Formigas

Modelação matemática

Em cada nodo i, a desejabilidade de passar para j é determinada em função da visibilidade (i -> j) e da quantidade de feromona entre (i -> j).

O troço i->j será seguido com uma probabilidade proporcional à sua desejabilidade, tal como qualquer outro nodo destino k.

Page 19

A probabilidade de passar de i para j no instante p é directamente proporcional à feromona (τ) depositada entre i e j e à visibilidade/ desejabilidade (η) de passar para j.

Page 20: Optimização de pesquisas Web utilizando Colónias de Formigas

Feromonas nas pesquisas

Ao navegar de página em página de resultados e ao seleccionar alguns links de interesse nessas páginas, estamos a delinear um trilho de feromonas sobre o que achámos interessante e, ao mesmo tempo, a mostrar que alguns tópicos não são interessantes, ignorando-os.

Page 20

Pag 1 Pag 2 Pag 3

“404 Error -Page Not Found”

Page 21: Optimização de pesquisas Web utilizando Colónias de Formigas

Mapeamento Ants/Utilizadores

Para cada pesquisa i, a desejabilidade de mostrar o resultado j é determinada em função do PageRank de j e da quantidade de feromona entre i e j.

Desta forma, a ordem dos resultados baseia-se no PageRank de cada página e na experiência prévia de navegação de outros utilizadores, em função do mesmo critério de pesquisa.

Page 21

Page 22: Optimização de pesquisas Web utilizando Colónias de Formigas

Mapeamento Ants/Utilizadores

Para cada pesquisa i, a desejabilidade de mostrar o resultado j é determinada em função do PageRank de j e da quantidade de feromona entre i e j.

Desta forma, a ordem dos resultados baseia-se no PageRank de cada página e na experiência prévia de navegação de outros utilizadores, em função do mesmo critério de pesquisa.

Page 22

A ordem do resultado j em função da pesquisa por i no instante p é directamente proporcional à feromona (τ) depositada entre i e j e ao PageRank (η) de j.

Page 23: Optimização de pesquisas Web utilizando Colónias de Formigas

Upgrade proposto

Page 23

Pag 1 Pag 2 Pag 3

“404 Error -Page Not Found”

Pag 1

“404 Error -Page Not Found”

Pesquisa = Sintaxe + PageRank

Pesquisa = Sintaxe + PageRank + Semântica

Page 24: Optimização de pesquisas Web utilizando Colónias de Formigas

Conclusões

Os resultados de pesquisas web podem incluir mais informação do que apenas a relevância que outros sites lhe atribuem;

Essa informação é baseada na experiência de navegação que outros utilizadores revelaram em função de critérios de pesquisa semelhantes;

A informação sobre a desejabilidade de cada resultado é mantida por um sistema autocatalítico de passagem de informação- As feromonas evaporam com o tempo;

- Os troços mais seleccionados são promovidos naturalmente e reforçada a sua feromona;

- Os troços menos seleccionados afundam-se cada vez mais nas páginas de resultados;

Page 24