CORSO SISTEMI DI GOVERNO DEI ROBOT Lezione n.4 Paradigma Reattivo prof. Ernesto Burattini

2

Proposta di progetto

Sia assegnato un ambiente chiuso con ostacoli. Assegnata una tana, si vogliono raccogliere una serie di cubi accumulati in alcuni luoghi non noti all’interno dell’ambiente.Raccogliere un cubo alla volta e portarlo alla tana, evitando gli ostacoli e cercando il percorso migliore. Terminati i cubi accumulati in un posto cercare gli altri.Gli ostacoli sono di colore blu, i cubi di colore rosso, la tana di colore giallo.Dotare il robot di un sistema sensoriale facendo ricorso a sensori disponibili sul mercato (sonar, bumper, bussole, luminosità (colore), suoni, etc.).Può esserci una piccola memoria ma il paradigma di riferimento deve essere quello reattivo.

http://www.informatik.uni-bremen.de/simrobot/index_e.htm

3

Il Paradigma Reattivo emerse nei tardi anni ‘80. Esso è importante da

studiare per almeno due ragioni.

Primo, i sistemi robotici operanti in domini ristretti con compiti limitati

sono ancora oggi costruiti usando architetture reattive.

Secondo, il Paradigma Reattivo è la base per il Paradigma Reattivo-

deliberativo Ibrido

4

Il Paradigma Reattivo scaturì dall'insoddisfazione del paradigma gerarchico e dalle idee provenienti dall'etologia.

Anche se i vari sistemi reattivi possono o non possono aderire strettamente ai principi dell'intelligenza biologica, generalmente imitano alcuni aspetti della biologia.

L'insoddisfazione del Paradigma Gerarchico fu molto bene compendiata da Rodney Brooks, che caratterizzò quei sistemi come aventi una decomposizione orizzontale come mostrato

5

Invece, un esame della letteratura etologica suggerisce che l'intelligenza è stratificata secondo una decomposizione verticale, come mostrato qui

6

Secondo una decomposizione verticale, un agente prevede in primo luogo behavior di sopravvivenza primitivi ed evolve poi verso strati nuovi di behavior che o riusano i behavior più bassi e precedenti, oppure interdicono i behavior più vecchi, o creano tracce parallele di behavior più avanzati.

Gli elementi paralleli possono essere pensati a strati, accatastati verticalmente. Ogni strato ha accesso a sensori ed attuatori indipendentemente da qualunque altro strato.

Se accade qualche cosa ad un behavior avanzato, i behavior di livello più basso restano ancora operativi. Questo ritorno ad un livello più basso imita il degrado di funzioni autonome nel cervello. Le funzioni nel cervello funzionano (come il respirare) continuamente indipendentemente da funzioni di ordine più alte (come contare, riconoscere volti, progettare), permettendo ad esempio ad una persona che ha un danno di cervello da uno scontro di auto ancora di respirare, etc.

7

Lavori da Arkin, Brooks e Payton si sono concentrati sulla definizione

dei behavior e sui meccanismi per manipolare correttamente situazioni

quando più behavior sono simultaneamente attivi.

Brooks propose un approccio noto ora come sussunzione e costruì degli

insetti robot con behavior inseriti direttamente nell’hardware.

8

Arkin e Payton usarono una metodologia di campi potenziale, favorendo

realizzazioni software. Entrambi gli approcci sono equivalenti. Il

Paradigma Reattivo incontrò inizialmente una forte resistenza da parte

dei clienti tradizionali di robotica, particolarmente i militari e le agenzie

per il controllo nucleare. Questi utenti delle tecnologie robotiche erano

preoccupati del modo impreciso in cui behavior distinti si combinavano

per formare un behavior emergente e più ricco.

In particolare, i behavior reattivi non sono assoggettabili a dimostrazioni

matematiche che mostrano che essi sono sufficienti e corretti per un

certo compito.

Alla fine, i tempi di esecuzione rapidi associati coi behavior riflessivi

portarono alla loro accettazione da parte degli utenti, proprio nel

momento in cui i ricercatori si erano spostati verso il paradigma Ibrido

per esplorare anche strati di intelligenza

9

I Behavior possono operare concomitantemente e sequenzialmente.

Di seguito le due architetture rappresentative, sussunzione e campi di potenziale, sono confrontate e contrapposte usando lo stesso task come esempio.

Vedremo in questa parte come una architettura manipola behavior concomitanti per produrre un behavior emergente.

10

Attributi del Paradigma Reattivo

L'attributo fondamentale del paradigma reattivo è che tutte le azioni sono

portate a termine attraverso behavior.

Come nei sistemi etologici, i behavior sono un mapping diretto degli

input dei sensori con un pattern di azioni motorie che sono usate poi per

realizzare il compito.

Da una prospettiva matematica, i behavior sono semplicemente una

funzione di trasferimento, trasformando gli input sensori in comandi per

gli attuatori.

11

Per gli scopi di questo corso, un behavior sarà trattato come uno schema,

e consisterà di almeno un schema motore ed uno schema percettivo.

Lo schema percettivo contiene l'algoritmo per estrarre il percetto e la sua

forza (o valore), lo schema motore contiene l'algoritmo per generare il

pattern di azione per un attuatore fisico.

Teniamo presente però che solo poche architetture di robot reattivi

descrivono i loro behavior in termini di schemi. Ma in pratica, le

realizzazioni più behaviorali hanno routine motorie e percettive

riconoscibili, anche se raramente sono riportate come schemi.

12

Il Paradigma Reattivo letteralmente eliminò la componente di Pianificazione della triade Percezione, Pianificazione, Azione, come mostrato in Figura.

SENSE ACT

BEHAVIOR

SENSE ACT

BEHAVIOR

SENSE ACT

BEHAVIOR

SENSE ACT

BEHAVIOR

SENSE ACT

BEHAVIOR

SENSE ACT

BEHAVIOR

13

Le componenti di Percezione e Azione sono strettamente accoppiate nei behavior, e tutte le attività del robot emergono come il risultato di questi behavior che o operano in sequenza o concomitantemente.

L’organizzazione S-A non specifica come i behavior sono coordinati e controllati; questo è un importante tema evidenziato dalle architetture. La percezione nel Paradigma Reattivo è locale in ogni behavior, o behavior-specifico. Ogni behavior ha il suo proprio sistema percettivo dedicato. In molti casi, questo è implementato come un sensore e schema percettivo per behavior. Ma in altri casi, più di un behavior può prendere lo stesso output da un sensore e può trattarlo differentemente (tramite lo schema percettivo del behavior).

Un behavior letteralmente non sa quello che un altro behavior sta facendo o sta percependo. La Fig. mostra graficamente il meccanismo percettivo del Paradigma Reattivo.

14

…....

15

Organizzazione S-A del Paradigma Reattivo in behavior multipli e concomitanti Questo paradigma, come già detto, è fondamentalmente opposto al modello di mondo globale usato nel paradigma gerarchico.

Il percetto è immediatamente disponibile per lo schema percettivo del behavior che può fare poca o molta elaborazione secondo le necessità per estrarre il percetto prevalente.

Se è usata una affordance, computazionalmente poco costosa, allora la parte percettiva del behavior è quasi istantanea e l’azione è molto rapida.

Come può essere visto dal capitolo precedente sui fondamenti biologici

del paradigma reattivo, i behavior favoriscono l'uso di affordances.

16

Brooks disse (rumorosamente) in una conferenza, "noi non abbiamo bisogno di rappresentazione puzzolenti."

Si dovrebbe notare che spesso la parte di schemi percettivi del behavior deve usare una rappresentazione behavior-specifica o una struttura dati per rivelatori specializzati capace di estrarre affordances.

Per esempio, estrarre una regione rossa in un'immagine è non-banale per un computer comparato con un animale che vede il rosso.

Il punto è che mentre un programma di computer può dovere avere strutture dati per simulare un semplice funzionamento neurale, il behavior non conta su alcuna rappresentazione centrale fornita da tutti i sensori.

17

Nelle prime realizzazioni del paradigma reattivo, l'idea di

"un sensore, un behavior" funzionò bene.

Per behavior più avanzati, divenne utile fondere l’output di sensori multipli all'interno di uno schema percettivo per avere maggiore precisione o una migliore misura della forza dello stimolo.

Questo tipo di fusione di sensori è permesso all'interno del paradigma reattivo finché la fusione è locale al behavior.

18

Caratteristiche e connotazioni dei behavior reattivi

Come visto precedentemente, un sistema robotico reattivo decompone la funzionalità in behavior che accoppiano strettamente percezione ad azione senza l'uso di interposizioni di rappresentazioni astratte (globale).

Questa è una definizione ampia e vaga.

19

La connotazione primaria di un sistema robotico reattivo è che risponde rapidamente.

L'accoppiamento stretto di percezioni ed azioni permettono al robot di operare in tempo reale, muovendosi alla velocità di 1-2 cm per secondo. I behavior possono essere implementati direttamente in hardware come circuiti, o come algoritmi di complessità computationale bassa (0(n)).

Questo vuole dire che i behavior reagiscono non solo rapidamente rispetto al processo, ma sono particolarmente veloci se comparati alle velocità di esecuzione di Shakey e di altri robot legati al paradigma gerarchico.

Una connotazione secondaria è che i sistemi robotici reattivi non hanno nessuna memoria, limitando i behavior reattivi a quello che i biologi chiamerebbe riflessi stimolo-risposta puri.

20

In pratica, molti behavior esibiscono un pattern di risposta di azione-prefissata, laddove il behavior persiste per un periodo di tempo corto senza la presenza diretta dello stimolo.

Il punto principale è che i behavior sono controllati da quello che sta accadendo nel mondo, duplicando così lo spirito di meccanismi di releasing innati, piuttosto che dal memorizzare e ricordare quello che il robot ha fatto di recente.

21

Le cinque caratteristiche di quasi tutte le architetture che seguono il Paradigma Reattivo sono:

1. I robot sono agenti situati che operano in una nicchia ecologica.

Come visto nella prima Parte, agente situato vuole dire che il robot è una parte integrante del mondo. Un robot ha le sue proprie mete ed intenzioni. Quando un robot agisce, cambia il mondo, e riceve una reazione immediata dal mondo attraverso i sensori. Quello che il robot percepisce influenza le sue mete e il tentativo di soddisfarle, genera un nuovo ciclo di azioni.

Attenzione che la situatedness è definita da un ciclo Azione-percezione di Neisser. Similmente, le mete del robot, il mondo nel quale opera e come esso può percepire il mondo formano la nicchia ecologica del robot.

Per enfatizzare questo molti ricercatori di robotica dicono che loro stanno lavorando su robotica ecologica.

22

2. I behavior servono come fondamenti di base per le azioni del robot, ed il behavior complessivo del robot è quello che emerge.

I behavior sono entità computazionali indipendenti, ed operano concomitantemente. Il behavior complessivo emerge di conseguenza: non c'è nessun modulo "controllore" esplicito che determina quello che sarà fatto, o funzioni che chiamano le altre funzioni. Ci può essere un programma di controllo coordinato nello schema di un behavior, ma non c'è nessun controllore esterno di tutti i behavior per un dato compito. Come con gli animali, l’ "intelligenza" del robot è nell'occhio dell'osservatore, piuttosto che in un specifico pezzo di codice. Poiché il behavior complessivo di un robot reattivo emerge dal modo con cui i suoi behavior individuali interagiscono, le maggiori differenze tra le architetture reattive risiedono di solito nello specifico meccanismo per le interazioni. Ricordiamo dal Capitolo 3 che questi meccanismi includono combinazione, soppressione, e cancellazione.

23

3. Sono permessi solo behavior-specifico percettivi locali.

L'uso di rappresentazioni della conoscenza astratte esplicite nel trattare la percezione, anche se è behavior-specifico, è evitato. Qualunque percetto che richiede rappresentazione è espresso mediante coordinate ego-centriche (robot-centriche). Per esempio, si consideri l’evitare un ostacolo. Una rappresentazione ego-centrica vuole dire che non è importante che un ostacolo è nel mondo alle coordinate (x,y,z), ma solamente dove è relativamente al robot.

I dati sensoriali, con l'eccezione del GPS, sono inerentemente ego-centrici (e.g., un range finder ritorna una distanza dall'oggetto più vicino al transducer), questo elimina l’elaborazione necessaria per creare un modello del mondo, mentre estrae solo la posizione degli ostacoli relativamente al robot.

24

4. Questi sistemi seguono i buoni principi della progettazione software.

La modularità dei behavior favorisce la decomposizione di un task in behavior componenti.

I behavior sono esaminati indipendentemente, e possono essere assemblati a partire da behavior primitivi.

25

5. Modelli animali di behavior sono spesso citati come una base per questi sistemi o per un particolare behavior.

Diversamente dei primi giorni della robotica AI, dove c'era un sforzo consapevole di non imitare l'intelligenza biologica, è molto più accettabile nel paradigma reattivo usare gli animali come una motivazione per una collezione di behavior.

26

I vantaggi di programmare con i behavior

Costruire un sistema robotico sotto il Paradigma Reattivo è spesso riportato come programmare con behavior, poiché il componente fondamentale di ogni realizzazione sono i behavior. Programmare con behavior ha molti vantaggi, la maggior parte dei quali sono coerenti coi buoni principi di ingegneria del software. I Behavior sono inerentemente modulari e facili da esaminare isolati dal sistema (i.e., essi forniscono unità di test). I Behavior forniscono anche possibili espansioni incrementali delle capacità di un robot. Un robot diviene più intelligente avendo più behavior. La decomposizione comportamentale dà luogo ad una realizzazione che opera in tempo reale ed è di solito computazionalmente poco costosa. Ciononostante vedremo che alcune volte la duplicazione di alcuni sensori specializzati (come i flussi ottici) è lenta. Se i behavior sono realizzati in economia, allora la realizzazione reattiva può essere lenta.

27

Generalmente, la velocità di reazione di un robot reattivo è equivalente ai tempi di stimolo-risposta negli animali.

I behavior supportano buoni principi di ingegneria del software attraverso la decomposizione, modularità e i test incrementali.

Se è programmato con il più alto grado di indipendenza possibile (anche detto accoppiamento basso), il progettista può mettere su biblioteche facili da capire, da manutenere, e può riusare moduli che minimizzano i side effects. Accoppiamento basso vuole dire che i moduli possono funzionare indipendentemente l'uno dall'altro con minimi collegamenti o interfacce, promuovendo così un facile riuso. Coesione vuole dire che i dati e le operazioni contenute in un modulo si riferiscono solo al goal di quel modulo.

28

Architetture rappresentative Per implementare un Sistema reattivo il progettista deve identificare

il set di behavior necessario per il task. I behavior possono essere o nuovi o si possono usare behavior esistenti. L'azione complessiva del robot emerge da behavior multipli e concomitanti.

Quindi un'architettura reattiva deve offrire meccanismi per

1) gestire behavior

2) determinare quello che accade quando behavior multipli sono attivi allo stesso tempo.

Un'altra caratteristica che distingue tra loro le architetture reattive è come esse definiscono un behavior.

Si noti che alcuni autori usano terminologie particolari.

29

Ci sono molte architetture che vanno bene con il Paradigma Reattivo.Le due più conosciute e meglio formalizzate sono la sussunzione e le metodologie dei campi di potenziale.

La sussunzione fa riferimento a come i behavior sono combinati.

Le Metodologie a Campi di potenziale costringono i behavior ad essere implementati come campi di potenziale, ed i behavior sono combinati dalla sommatoria dei campi.

Un terzo stile di architettura reattiva che è popolare in Europa e in Giappone è il rule encoding, dove il componente schema motore del behavior ed il meccanismo di combinazione sono implementati come regole logiche. Le regole per combinare i behavior sono spesso ad hoc, e perciò non le tratteremo in questo corso.

Altri metodi per combinare behavior esistono, incluso metodi fuzzy e il vincitore-prende-tutto, ma questi tendono ad essere dettagli di realizzazione piuttosto che una vera e propria architettura.

30

Architettura a Sussunzione L'architettura a sussunzione di Rodney Brooks è la più nota nei sistemi puramente Reattivi. Parte della popolarità scaturisce dalla pubblicità che circonda i molti robot naturalistici costruiti con la sussunzione. Come si può vedere in Fig., questi robot davvero sembrano insetti dell’ordine di grandezza di una scatola di scarpe, con sei gambe ed antenne.

In molte realizzazioni, i behavior sono inseriti direttamente nel hardware o su piccoli micro-microprocessori, permettendo ai robot di avere tutta la capacità di calcolo on-board (questo non era vero per i microprocessori poco potenti di metà degli anni 1980).

Inoltre, i robot di Brooks furono i primi ad essere capaci di camminare, evitando collisioni, salire su ostacoli senza le pause del "muovi-pensa-muovi-pensa" di Shakey.

32

Il termine "behavior" nell'architettura a sussunzione ha un significato meno preciso che nelle altre architetture.

Un behavior è una rete di moduli percezione-azione che portano a termine un task. I moduli sono Augmented Finite State Machine AFSM, che hanno registri, temporizzatori, e altri miglioramenti per permettere loro di essere connessi con gli altri moduli.

Un AFSM è equivalente all'interfaccia tra gli schemi e la strategia di controllo coordinata in un schema comportamentale. In termini di teoria degli schemi, un behavior di sussunzione è una raccolta di uno o più schemi in un behavior astratto.

33

Una Macchina a Stati Finiti (FSM) è un sistema computazionale che cambia il suo stato in funzione dello stato corrente e dell’input.Essa può assumere un numero finito di stati differenti e passa da uno stato all’altro secondo precise regole.

Un esempio è un cancelletto girevole che si apre con una moneta.Se il cancelletto è bloccato (stato 1) e si inserisce una moneta allora la macchina cambia stato (stato 2 - cancelletto sbloccato).Se l’input ora è una persona, cioè qualcuno cerca di entrare, e si inserisce una moneta allora si sblocca e subito dopo però torna allo stato 1.Se è sbloccato e si inserisce una moneta, la macchina resta nello stato 2. Se è bloccato (stato 1) e l’input è una persona esso rimane bloccato.

1 bloccato 2 sbloccato

Inseriscimoneta

Inserisci moneta

Persona attraversa il cancello

34

Le Macchine a Stati Finiti Augmented (AFSM) sono FSM a cui vengono aggiunte alcune facilities (registri, sistemi di timing etc.)

input/stato 1 (bloccato) 2 (sbloccato)

Moneta 2 (sbloccato) 2 (sbloccato)

Persona 1 (bloccato) 1 (bloccato)


Inseriscimoneta

Inserisci moneta


35

I Behavior sono attivati con una modalità tipo stimolo-risposta, senza un programma esterno che li coordini e controlli esplicitamente.

Ci sono quattro aspetti interessanti della sussunzione in termini di attivazione e controllo :

1. I moduli sono raggruppati in strati di competenza. Gli strati riflettono una gerarchia dell'intelligenza, o della competenza. Strati più bassi incapsulano funzioni di sopravvivenza di base come evitare collisioni, mentre livelli più alti creano azioni dirette alla meta come ad esempio il mapping di un oggetto. Ognuno degli strati può essere visto come un behavior astratto per un particolare compito.

36

2. I moduli in un strato più alto possono avere la priorità, o sussumere, l’output del behavior nello strato adiacente più basso.

Gli strati comportamentali operano concomitantemente ed indipendentemente, quindi si ha bisogno di disporre di un meccanismo che si occupi dei conflitti potenziali.

La soluzione nella sussunzione è del tipo il vincitore-prendere-tutto, dove il vincitore è sempre lo strato più alto.

37

3. L'uso di stati interni è evitato.

Per stato interno in questo caso si intende un qualunque tipo di rappresentazione locale e persistente che rappresenta lo stato del mondo, o un modello.

Poiché il robot è un agente situato, la maggior parte delle sue informazioni dovrebbero venire direttamente dal mondo.

Se il robot dipende da una rappresentazione interna, quello che esso crede può cominciare a divergere pericolosamente dalla realtà.

Alcuni stati interni sono necessari per attivare behavior come essere spaventati o affamati, ma una buona progettazione li minimizza.

38

4. Un task è portato a termine attivando lo strato opportuno che

poi attiva gli strati più bassi sotto di lui e così via.

In pratica, i sistemi a sussunzione non sono facilmente taskable,

ovvero, non possono ricevere l’ordine di fare un altro task senza

essere riprogrammati.

39

Esempi Questi aspetti sono illustrati meglio da un esempio, preso e modificato estensivamente dai lavori originali di Brooks al fine di essere consistente con la terminologia della teoria degli schemi e facilitare il paragone con la metodologia dei campi di potenziale.

Un robot capace di muoversi in avanti e non collidere con niente potrebbe essere rappresentato con un solo strato, Livello 0.

In questo esempio, il robot ha sonar multipli (o altri sensori di distanza), ognuno che punta in una direzione diversa, e due attuatori, uno per andare avanti ed uno per girare.

40

Il modulo Sonar legge il range dei sonar, fa ogni possibile filtraggio del rumore, e produce un grafico polare.

Un grafico polare rappresenta le letture di distanze in coordinate polari, (r, ), intorno al robot.

Come mostrato in Fig., la trama polare può essere sviluppata linearmente.

41

Se la lettura del range del sonar rivolto in avanti è sotto una certa soglia, il modulo COLLIDE annuncia una collisione e spedisce il segnale di alt all'attuatore che gestisce il FORWARD. Se il robot si sta muovendo in avanti, ora si ferma. Nel frattempo, il modulo di FEELFORCE sta ricevendo lo stesso grafico polare. Esso tratta ogni lettura del sonar come una forza repulsiva che può essere rappresentata come un vettore. FEELFORCE può essere pensato come un sommatore di vettori formati da ognuna delle letture sonar. Questo dà luogo ad un vettore nuovo. Il vettore repulsivo è passato poi al modulo di TURN. Il modulo di TURN fornisce la direzione per girare e la invia all'attuatore di svolta. TURN passa il vettore anche al modulo FORWARD che usa la grandezza del vettore per determinare la grandezza del prossimo movimento in avanti (quanto lontano o quanto veloce). Così il robot gira e va via per una piccola distanza dall'ostacolo.

42

Il behavior osservabile è che il robot verifica che non si trova in un spazio occupato e fa questo finché un ostacolo non gli arriva vicino. Se l'ostacolo è su un lato del robot, il robot girerà di 180° nella direzione opposta e va via. Il robot può reagire ad un ostacolo se l'ostacolo (o robot) è immobile o in lento movimento; la risposta è calcolata ad ogni aggiornamento dei sensori. Se parte dell'ostacolo, o un altro ostacolo, è messo davanti, il robot si fermerà, poi applicherà i risultati di RUNAWAY. Cioè si fermerà, girerà e comincerà a muoversi di nuovo in avanti. La fermata impedisce al robot di urtare l'ostacolo mentre sta girandosi e sta muovendosi in avanti. Il livello 0 mostra come un set abbastanza complesso di azioni può emergere da moduli molto semplici.

43

È utile rivedere l'architettura a sussunzione nei termini usati finora in questo corso, come mostrato in Fig. Si noti come questo somiglia alla decomposizione verticale del lucido 4: i dati sensoriali circolano attraverso i behavior concorrenti verso l'attuatore, l’indipendenza di questi behavior fa sì che il robot faccia la cosa giusta. Il modulo SONAR potrebbe essere considerato come un'interfaccia globale verso i sensori, mentre i moduli TURN e FORWARD sarebbero considerati come parte dell'attuatore (un'interfaccia).

44

Per gli scopi di questo corso, un behavior deve consistere di uno schema percettivo e di uno schema motorio. Gli schemi percettivi sono connessi ad un sensore, mentre gli schemi motori sono connessi ad attuatori. Per il Livello 0, gli schemi percettivi sarebbero contenuti nei moduli FEELFORCE e COLLIDE. Gli schemi motori sono i moduli RUNAWAY e COLLIDE. COLLIDE combina sia il processo percettivo (estrae il vettore dal sonar che guarda direttamente avanti) sia il pattern attuativo (dà l'alt se c'è una lettura negativa). I behavior primitivi riflettono i due percorsi attraverso lo strato. Uno potrebbe essere chiamato il behavior di RUNAWAY e l'altro il behavior di COLLIDE. Insieme, i due behavior creano un behavior per evitare ostacoli, o uno strato di competenza.

45

Si noti che i behavior usano una percezione diretta, o affordances. La presenza di una lettura di distanza indica che c’è un ostacolo; il robot non deve sapere di che tipo di ostacolo si tratti. Supponiamo di costruire un robot che va in giro invece di stare immobile, ma sempre capace di evitare ostacoli. Sulla base dello schema della sussunzione, può essere aggiunto un secondo strato di competenza (Livello 1).

L0

L1

46

In questo caso, il Livello 1 consiste di un modulo WANDER che elabora un andamento casuale ogni n secondi. L'andamento casuale può essere pensato come un vettore. Esso ha bisogno di passare la sua indicazione ai moduli TURN e FORWARD. Ma non può essere passato direttamente al modulo TURN. Questo infatti sacrificherebbe l’evitare gli ostacoli, perché TURN accetta solamente un input. Una soluzione è di aggiungere un altro modulo al Livello 1, AVOID che combina il vettore di FEELFORCE col vettore di WANDER.

L0

L1

47

Aggiungendo un nuovo modulo AVOID si offre un'opportunità di creare una risposta più sofisticata agli ostacoli. AVOID combina la direzione della forza da evitare con la direzione desiderata. Questo dà luogo alla direzione attuale che è rivolta più verso una direzione corretta che verso la svolta che il robot avrebbe dovuto fare perdendo un avanzamento diretto. (Si noti anche che il modulo AVOID è capace di "spiare" le componenti dello strato più basso). L’output di una direzione di AVOID ha la stessa rappresentazione dell’output di RUNAWAY così che TURN può accettare input da entrambe le fonti.

48

Il problema ora sembra essere quando accettare il vettore di direzione e da quale strato.

La sussunzione rende questo semplice: l’output dal livello più alto sussume l’output dal livello più basso.

La sussunzione è realizzata in uno di due seguenti modi:

1. inibizione.

Nell’inibizione, l’output del modulo di sussunzione è connesso all’output di un altro modulo. Se l’output del modulo che sussume è "on" o ha un qualunque valore, l’output del modulo sussunto è bloccato o spento. L’inibizione agisce come un rubinetto, cambiando da on a off l’output.

49

2. soppressione.

Nella soppressione, l’output del modulo che sussume è connesso all’input di un altro modulo. Se l’output del modulo che sussume è on, esso sostituisce l’input normale al modulo sussunto.

La soppressione agisce come un interruttore, scambiando un input con un altro.

In questo caso, il modulo AVOID sopprime (segnato nel diagramma con una S) l’output da RUNAWAY.

RUNAWAY sta ancora operando, ma il suo output non va da nessuna parte.

Invece, l’output da AVOID va a TURN.

50

L'uso di strati e sussunzione permette a nuovi strati di essere

costruiti sopra lo strato meno competente, senza cambiare gli strati

più bassi. Questa è buon ingegneria del software, poichè facilita la

modularità e semplifica il test. Essa aggiunge anche un po' di

robustezza nel senso che se qualche cosa dovesse disabilitare il

Livello 1, il Livello 0 è probabile che rimanga intatto. Il robot

sarebbe almeno capace di preservare il suo meccanismo di

autodifesa e quindi di fuggire quando si avvicina agli ostacoli.

51

La Fig. mostra il Livello 1 rivisto come behavior. Nota che FEELFORCE è usato da RUNAWAY e AVOID. FEELFORCE è la componente percettiva (nello schema) di ambo i behavior, con i moduli AVOID e RUNAWAY che sono il componente motorio. Spesso accade che i behavior sono chiamati con il nome dell'azione osservabile. Questo vuole dire che il behavior (che consiste di percezione ed azione) e la componente azione hanno lo stesso nome. La figura non mostra che i behavior AVOID e RUNAWAY hanno lo stesso schema percettivo FEELFORCE. Come sarà visto nel prossimo capitolo, le proprietà object-oriented dello schema theory facilitano il riuso e la condivisione di componenti percettive e motorie.

52L0

L1

L2

Ora supponiamo di aggiungere un terzo strato per permettere al robot di muoversi lungo un corridoio, come mostrato in Fig. (il terzo strato nel lavoro originale di Brooks è "esplorare", perché lui stava considerando un task di mappatura). Il modulo di LOOK esamina il plot polare del sonar ed identifica un corridoio. (Si noti che questo è un altro esempio di behavior che condivide gli stessi dati sensoriali ma li usa localmente per scopi diversi). Poiché identificare un corridoio è più costoso computazionalmente che estrarre solo i dati di distanza, LOOK può richiedere molto più tempo di elaborazione di quello richiesto dai behavior a livelli più bassi. LOOK passa il vettore che rappresenta la direzione in mezzo al corridoio al modulo STAYINMIDDLE. STAYINMIDDLE sussume il modulo WANDER e manda il suo output al modulo AVOID che può eventualmente girare attorno agli ostacoli.

53

Ma come fa il robot se il modulo di LOOK non ha calcolato una direzione nuova? In questo caso il modulo INTEGRATE sta osservando il moto attuale del robot dagli shaft encoders degli attuatori. Questo dà una stima di quanto lontano dal centro il robot abbia viaggiato dall'ultimo aggiornamento di LOOK.STAYINMIDDLE può usare i dati raccolti per calcolare il vettore per il nuovo corso. Questo serve a colmare i vuoti negli adattamenti dovuti a diverse velocità di aggiornamento dei diversi moduli. Si noti che LOOK e STAYINMIDDLE sono alquanto sofisticati da un punto di vista software.

L0

L1

L2

54

INTEGRATE è un esempio di modulo che si preoccupa di un eventuale stato interno pericoloso: esso opera sulla base di un feedback dal mondo reale. Se per qualche ragione, il modulo di LOOK non aggiorna mai, allora il robot potrebbe operare senza alcuni dati sensoriali per sempre. O almeno finché non si rompe! Perciò, sistemi con lo stile a sussunzione includono costanti di tempo sulla soppressione e sull'inibizione. Se la soppressione da STAYINMIDDLE funziona più a lungo di n allora la soppressione cessa. Il robot comincia a vagare con una buona speranza che qualunque sia il problema (come il corridoio bloccato totalmente) che aveva condotto alla perdita dei segnali si risolva.

55

Chiaramente, un altro problema è: come sa il robot che non ha cominciato a percorrere il corridoio come avrebbe dovuto?

Risposta: non lo sa.

Il progetto presume che un corridoio sarà sempre presente nella nicchia ecologica del robot.

Se non c’è, il robot non si comporta come previsto.

Questo è un esempio della connotazione i che sistemi reattivi sono "senza memoria."

56

Sommario Sussunzione

• La sussunzione ha una debole definizione di behavior come accoppiamento stretto di percezione e azione. Anche se non è un'architettura a schema-theory, essa può essere descritta in questi termini. Essa raggruppa moduli tipo schema in strati di competenza, o behavior astratti. • Strati più alti possono sussumere e inibire behavior in strati più bassi, ma behavior in strati più bassi non sono mai riscritti o sostituiti. Da un punto di vista della programmazione, questo può sembrare strano. Comunque, così si imita l'evoluzione biologica. Si ricordi che il behavior volante nelle rane (Lez. 3) era il risultato di due behavior, uno che sempre si muoveva verso gli oggetti in movimento e l'altro che sopprimeva questo behavior quando l'oggetto era grande.

57

• Il progetto di strati e componenti di behavior per una realizzazione della sussunzione, come con ogni altro progetto comportamentale, è difficile; è più un'arte che una scienza. Questo è vero per tutte le architetture reattive. • Non vi è nulla che assomigli ad una pianificazione tipo STRIPS nella sussunzione. Invece i behavior sono attivati dalla presenza dello stimolo nell'ambiente.

58

•La sussunzione risolve il Frame problem eliminando il bisogno di modellare il mondo. Non ci deve preoccupare se il mondo aperto è non-monotono e non ha un tipo di meccanismo di mantenimento di verità, perché i behavior non ricordano il passato. Ci può essere della persistenza percettiva che conduce ad un tipo di behavior con un pattern di azione fisso (e.g. seguire un corridoio), ma non c'è nessun meccanismo che evidenzi i cambi nell'ambiente. I behavior semplicemente rispondono a qualunque stimolo dell'ambiente.

•La Percezione è diretta, usando le affordances. Il releaser per un behavior è quasi sempre il percetto per guidare lo schema motore. •La percezione è ego-centrica e distribuita. Nell'esempio del WANDER (strato 1), il plot polare del sonar era relativo al robot. Un plot polare nuovo veniva creato ad ogni aggiornamento dei sensori. Il plot polare era anche disponibile per qualunque processo ne avesse bisogno (memoria globale e condivisa), permettendo ai moduli utente di essere distribuiti. L’output dallo schema percettivo può essere condiviso con gli altri strati.

59

Metodologie a Campi di potenziale

Un altro stile di architettura reattiva è basato sui campi di potenziale. Le architetture specifiche che usano il tipo a campi di potenziale sono troppo numerose per essere descritte tutte, per cui ci limiteremo ad una generalizzazione. Lo stile a campo di potenziale dei behavior fa uso sempre di vettori per rappresentare i behavior e la somma vettoriale per combinare vettori di behavior diversi per produrre un behavior emergente.

60

Visualizzazione dei campi di potenziale

Il primo dogma di un'architettura a campi potenziale è che l'azione motoria di un behavior deve essere rappresentata come un campo di potenziale .

Un campo di potenziale è un array, o campo di vettori.

Un vettore è una struttura matematica che consiste di una ampiezza ed una direzione.

I vettori sono rappresentati con una lettera maiuscola in grassetto, per esempio di solito V. Un vettore può essere scritto anche come un coppia (m,d), dove m sta per ampiezza e d per direzione.

Per convenzione l’ampiezza è un numero reale tra 0 e 1, ma in generale può essere qualunque numero reale.

61

L'array rappresenta una regione di spazio. In molte applicazioni robotiche lo spazio è bidimensionale, rappresentando una prospettiva a volo di uccello del mondo come fosse una mappa. La mappa può essere divisa in quadrati, creando una griglia (x,y). Ogni elemento dell'array rappresenta un quadrato dello spazio. Oggetti percepibili nel mondo esercitano un campo di forza sullo spazio circostante. Il campo di forza è analogo ad un campo magnetico o gravitazionale.

Il robot può essere pensato come una particella che entra nel campo emesso da un oggetto o da un ambiente. Il vettore rappresenta la forza, cioè la direzione di rotazione e l’ampiezza o velocità da intraprendere in quella direzione.

I campi di potenziale sono continui perché non importa quanto piccolo sia l'elemento; ad ogni punto nello spazio è associato un vettore.

62

La Fig. mostra come un ostacolo produce un campo sul robot e lo fa fuggire. Se il robot è vicino all'ostacolo, diciamo entro i 5 metri, esso è nel campo di potenziale, allora si genera una forza che lo spinge ad allontanarsi dall'ostacolo.

Se il robot non è all'interno del raggio dell'ostacolo, esso resta là perché nessuna forza è applicata su lui. Si noti che il campo rappresenta quello che dovrebbe fare il robot (lo schema motorio) se il robot percepisse un ostacolo (lo schema percettivo).

Il campo non si interessa a come il robot arriva vicino all'ostacolo; il robot sente la stessa forza sia se si sta muovendo all'interno del raggio sia se sta fermo al suo interno.

63

Un modo di pensare ai campi di potenziale è di immaginare un campo di forza che agisce sul robot. Un altro modo è pensare a loro come ad una superficie di energia potenziale in tre dimensioni (la gravità spesso è rappresentata così) ed il robot come una palla di marmo. In questo caso, il vettore indica la direzione verso cui il robot rotolerebbe sulla superficie.

Dossi sulla superficie fanno sì che il robot rotoli via o giri intorno (i vettori dovrebbero puntare lontano dalla "vetta" della collina), e le valli fanno sì che il robot rotoli verso il basso (vettori che puntano verso il fondo).

64

Ci sono cinque campi di potenziale di base, o primitivi che possono essere combinati per costruire campi più complessi: uniforme, perpendicolare, attrattivo, repulsivo, e tangenziale. La Fig. a mostra un campo uniforme. In un campo uniforme, il robot dovrebbe sentire la stessa forza indipendentemente da dove si trova e quale orientamento abbia. Esso dovrebbe sentire il bisogno di girare e allinearsi alla direzione della punta della freccia e muoversi in quella direzione ad una velocità proporzionale alla lunghezza della freccia. Un campo uniforme si usa spesso per descrivere il behavior "va in direzione di ….”.

65

La Fig. b mostra un campo perpendicolare, dove il robot è orientato perpendicolarmente all'oggetto o al muro o al confine. Il campo mostrato è diretto fuori dal muro grigio, ma un campo perpendicolare può essere puntato anche verso un oggetto.

66

In Fig. c si illustra un campo attrattivo. Il cerchio al centro del campo rappresenta un oggetto che sta esercitando un'attrazione sul robot. Dovunque il robot sia, il robot sentirà una forza dovuta all'oggetto. I campi attrattivi sono utili per rappresentare un qualche tropismo, dove l'agente è letteralmente attirato da luce, cibo o una meta. L'opposto di un campo attrattivo è un campo repulsivo, mostrato in Fig. d. I campi repulsivi sono associati comunemente agli ostacoli, o cose che l'agente dovrebbe evitare. Più vicino il robot è all'oggetto, più è forte la forza repulsiva che lo allontana di 180° via da lui.

67

L’ultimo campo primitivo è il campo tangenziale in Fig. e. Il campo è una tangente attorno all'oggetto (si pensi ad un vettore tangente come perpendicolare alle linee radiali che si estendono verso l’esterno dell'oggetto). I campi tangenziali possono essere destrorsi o antiorario; la Fig. e mostra una rotazione destrorsa. Essi sono utili per spingere un robot a girare attorno ad un ostacolo, o un robot a investigare su qualche cosa.

68

Profili di ampiezze Si osservi che in Fig. c,d,e la lunghezza delle frecce diventa più piccola man mano che arriva vicino all'oggetto. Il modo in cui l’ampiezza dei vettori cambia nel campo è stata chiamata profilo di ampiezza. (Il termine “profilo di ampiezza” è usato qui perché il termine profilo di velocità è usato dagli ingegneri di controlli automatici per descrivere come i motori di un robot accelerano e rallentano per produrre un particolare movimento senza dare scosse.)

69

Si consideri il campo repulsivo in Fig. Matematicamente, il campo può essere rappresentato in coordinate polari ed il centro del campo è l'origine (0, 0): (4.1) Vdirection = -Ф

Vmagnitude = cIn questo caso, l’ampiezza è un valore costante c; la lunghezza delle frecce cioè rimane la stessa. Questo può essere visualizzato con un plot della ampiezza mostrata in Fig. a.

70

Questo profilo dice che il robot fuggirà (la direzione verso cui correrà

è

-Ф) sempre alla stessa velocità, non importa quanto vicino sia

all'oggetto, finché è nel raggio dell'ostacolo. Appena il robot esce dal

raggio d’azione dell'ostacolo, la velocità cade a 0, fermando il robot.

Il campo è essenzialmente binario: il robot o sta fuggendo a velocita'

costante o si ferma.

In pratica c’è qualche problema con l’ampiezza costante. Si può infatti

produrre un moto a scatti lungo il perimetro del raggio d’azione del

campo. Questo si nota quando un robot andando in una particolare

direzione, incontra un ostacolo. Fugge, lasciando quasi

immediatamente il campo, poi torna indietro di nuovo sul suo percorso

originale, incontra il campo di nuovo, e così via.

71

I profili di ampiezza rendono anche possibili al progettista di rappresentare la riflessività (una risposta che dovrebbe essere proporzionale alla forza dello stimolo) e creare risposte interessanti. Si consideri il profilo in Fig. b. Esso può essere descritto dal comportamento visto da un osservatore che guarda il robot :se il robot è lontano dall'oggetto, esso andrà in giro e si muoverà rapidamente, quando si dirige verso lui inizierà a rallentare per evitare di colpire l'oggetto.

72

In matematica, questo andamento è detto linear drop off (esaurimento lineare), perché la velocità alla quale l’ampiezza si esaurisce può essere rappresentata da una linea retta. La formula di una retta è y = mx + b dove x è la distanza e y è l’ampiezza. b influenza l'inizio della linea e m è l’inclinazione ( ). Qualunque valore di m e b è accettabile. Se non è specificato, m = 1 o -1 (una inclinazione di 45° in su o in giù) e b = 0 per le funzioni lineari. Il profilo lineare in Fig. b soddisfa il behavior desiderato dal progettista di avere un robot che reagisca di più, quanto più è vicino.

x

ym

73

Per catturare il bisogno di una reazione forte e più accentuata si deve usare un altro profilo. Un tale profilo è una funzione detta a esaurimento esponenziale in cui l’esaurimento è proporzionale al quadrato della distanza: per ogni unità di distanza dall'oggetto la forza sul robot diminuisce della metà.

74

Come si può vedere dagli esempi precedenti, quasi nessun profilo di ampiezza è accettabile. La motivazione di usare profili di ampiezza è quella di raffinare il behavior. È importante notare che il robot calcola solamente i vettori che agiscono su di lui nella sua posizione corrente. Le figure, invece, espongono il campo intero per tutte le possibili ubicazioni del robot.

La domanda che sorge è: perché le figure mostrano un campo intero su uno spazio?

Prima di tutto, questo aiuta a visualizzare quello che il robot farà complessivamente, non solo ad un particolare istante di tempo.

Secondo, siccome i campi sono rappresentazioni continue, questa è una semplificazione che conferma se il campo è corretto e rende subito evidente ogni cambio improvviso.

75

Campi di potenziale e percezione

Negli esempi precedenti, la forza del campo di potenziale in ogni dato punto era una funzione del profilo di ampiezza e della distanza relativa tra il robot ed un oggetto.

La forza di un campo di potenziale può però essere una funzione dello stimolo, indipendentemente dalla distanza. Come esempio si richiama dalla lez. 3 il behavior di cibo per il piccolo di rondine artica dove il behavior cibo è guidato dallo stimolo "rosso." Questo può essere modellato da un campo attrattivo. Più grande e rosso è un oggetto nel campo visivo del piccolo, più forte l'attrazione, suggerendo un profilo di ampiezza che usa una funzione esponenziale crescente.

Un altro importante punto che già è stato menzionato è che i campi di potenziale sono ego-centrici perché la percezione di un robot è ego-centrica.

76

Programmazione di un singolo campo di potenziale

I campi di potenziale sono facili da programmare, specialmente quando sono ego-centrici rispetto al robot. La visualizzazione di un intero campo può sembrare indicare che il robot e gli oggetti sono in un sistema di coordinate fisso, assoluto, ma in realtà non lo sono.Il robot calcola l'effetto del campo di potenziale, di solito come una linea retta, ad ogni aggiornamento senza memoria di dove era prima o dove il robot si è mosso. Vediamo alcuni esempi.

77

Vdirection = -180°

Vmagnitude =

Ddper

Ddper

0D

dD

dove D è il range massimo dell'effetto del campo, o la massima distanza a cui il robot può scoprire l'ostacolo. (D non è sempre la distanza di rilevamento. Può essere la distanza alla quale il robot dovrebbe rispondere ad un stimolo. Per esempio, molti sonar possono scoprire ostacoli lontani 60 cm, producendo una risposta quasi infinitesima nel behavior emergente ma richiedendo un alto runtime per la chiamata di funzione.

In pratica, un robotico metterebbe un D di 2 metri). Si noti che la formula produce un risultato quando

0.0 <= Vmagnitude <= 1.0.

Un campo di potenziale primitivo è rappresentato usualmente da una sola funzione. Il vettore che ha un impatto sul robot è calcolato ad ogni aggiornamento. Si consideri il caso di un robot con un solo sensore di distanza rivolto in avanti. Il progettista decide che è adatto un campo repulsivo con una attenuazione lineare. La formula è:

78

Questo è un frammento di codice C che cattura il campo repulsivo.

typedef struct { double magnitude; double direction;

} vector; vector repulsive(double d, double D) {

if (d <=D) { outputVector.direction =180; // si gira! outputVector.magnitude = (D-d)/D; // decadimento

lineare } else {

outputVector.direction=O.O outputVector.magnitude=O.O }

return outputVector;}

79

A questo punto, è facile illustrare come un campo di potenziale può essere usato da un behavior, RUNAWAY, per il robot con un solo sensore. Il behavior RUNAWAY userà la funzione repulsive() come schema motorio, ed una funzione readSonar() come schema percettivo. L’output del behavior è un vettore.RUNAWAY è chiamato dal robot ad ogni ciclo di aggiornamento. vector RUNAWAY() { double reading; reading=readSonar(); // schema percettivo vector=repulsive(reading, MAX_DISTANCE); // schema

motorio return Voutput; } while (robot==ON) {

Vrunaway=runaway(reading); // schema motorio turn(Vrunaway.direction); forward(Vrunaway.magnitude*MAX_VELOCITY);

}

80

Combinazione di Behavior e Campi

Come affermato precedentemente, il primo attributo di una vera metodologia di campi di potenziale è che essa richiede che tutti i behavior siano implementati come campi di potenziale.

Il secondo attributo è che essa combini i behavior non mediante una sussunzione uno dell’altro, ma mediante una sommatoria di vettori. Un robot avrà generalmente forze agenti su lui provenienti da behavior multipli e concomitanti.

Vogliamo fornire due esempi di come behavior multipli sorgono e come sono implementati e sono combinati.

81

Un primo esempio è la semplice navigazione di un robot che sta perseguendo una meta (specificata come "10.3 m in direzione Θ") ed incontra un ostacolo. Lo schema motorio del behavior di move2goal è rappresentato con un campo di potenziale attrattivo che usa gli shaft encoder del robot per dire se è giunto alla posizione di meta. Il behavior RUNAWAY è un campo repulsivo ed usa un sensore di distanza per scoprire se qualche cosa è di fronte a lui.

GO

82

La Fig. mostra una vista a volo di uccello dell'area di azione, e mostra una visualizzazione del campo di potenziale. Il behavior di move2goal in Fig. b esercita un campo attrattivo sull’intero spazio; dovunque sia il robot, esso sarà attratto dalla meta. Il behavior RUNAWAY in Fig. a esercita un campo repulsivo in un raggio attorno all'ostacolo (tecnicamente il campo repulsivo si estende su tutto lo spazio come fa move2goal, ma la ampiezza della repulsione è 0.0 oltre il raggio d’azione). Il campo combinato è mostrato in Fig. 4.16 c.

O

G

O

G

O

G

83

Ora si consideri il behavior emergente del robot immerso in questo campo quando parte dall'angolo in basso a destra, mostrato in Fig. Al tempo t0, il robot sente il mondo. Può percepire solamente la meta e non può percepire l'ostacolo, così l'unico vettore che sente è attrattivo (runaway ritorna un vettore di ampiezza 0.0). Esso si muove su una linea retta verso la meta. A t2, aggiorna i suoi sensori ed ora percepisce la meta e l'ostacolo. Ambo i behavior offrono un vettore; i vettori sono sommati ed il robot ora si allontana. A t3, il robot si è mosso già oltre l'ostacolo e la meta va ora esercitando la forza più forte. A t4, riprende la corsa e raggiunge la meta.

84

L'esempio illustra anche altri punti sui metodi a campi di potenziale: l'impatto della velocità di aggiornamento e i minimi locali. Si noti che la distanza (lunghezza delle frecce) tra aggiornamenti è diverso. Questo è dovuto ai cambi nella ampiezza del vettore di output che controlla la velocità del robot. Se il robot ha un vettore più "corto", viaggia più lentamente e, perciò, copre meno distanza nello stesso ammontare di tempo. Può anche superare il segno tra un aggiornamento e l’altro come visto tra t3 e t4 dove il robot va veloce senza girare e quindi deve tornare indietro. Il cammino sarà più breve se l’aggiornamento è più frequente. Un altro aspetto della frequenza di aggiornamento è che il robot può superare la meta, specialmente se sta usando shaft encoders (la meta è a 10.3 metri da dove il robot è partito). Qualche volta i progettisti usano campi attrattivi con una ampiezza che si attenua man mano che il robot si avvicina, facendo rallentare il robot che così può dire che è giunto alla meta. (I Programmatori mettono di solito una tolleranza sull'ubicazione della meta, per esempio invece di 10.3m la meta è l0.3m0.5m.)

85

I campi di potenziale trattano il robot come se fosse una particella che può cambiare istantaneamente velocità e direzione. Questo non è vero per i robot reali. Robot di ricerca come Khepera (mostrato in Fig.) possono girare in qualunque direzione, ma devono fermarsi prima e c'è un ammontare misurabile di errore a causa dell’attrito tra le ruote e la superficie. Molti robot hanno Ackerman, o sterzi di automobile, e chiunque ha tentato di parcheggiare un'automobile sa che una macchina può andare solamente in certe direzioni.

86

Un terzo problema è che i campi possono anche dare somma 0. In Fig., si disegni una linea tra la Meta e l'Ostacolo. Lungo questa linea dietro all’ostacolo, i vettori hanno solamente una testa (direzione della freccia) e nessun corpo (lunghezza della freccia). Questo vuole dire che l’ampiezza è 0 e che il robot se raggiunge quel posto, si fermerà e non si muoverà più. Questo stato è chiamato un problema di minimo locale, perché il campo di potenziale ha un minimo, o un avvallamento che intrappola il robot. Soluzioni al problema di minimi locali saranno descritte alla fine del capitolo.

87

Esempio che usa un behavior per sensore Per avere un altro esempio di come è potente questa idea di sommatoria di vettori, è utile considerare come RUNAWAY per evitare ostacoli è implementato comunemente su veri robot. La Fig. 4.18 mostra una configurazione dei sensori di distanza IR su un robot Khepera.

88

Siccome i sensori sono montati permanentemente sulla piattaforma, il

loro angolo αi, relativo al fronte è conosciuto. Se un sensore riceve una

lettura di distanza, qualche cosa è di fronte a quel sensore. Sotto un

campo repulsivo per RUNAWAY, il vettore di input sarà di 180°

opposto a αi. Il sensore IR non è capace di dire molto sull'ostacolo: solo

che si trova diritto di fronte a lui e perpendicolare.

Se questo sensore fosse l'unico sensore sul robot, il behavior

RUNAWAY sarebbe molto stringente. Ma cosa accade se, come nel

caso di Khepera, il robot ha più sensori di distanza? Gli ostacoli più

grandi saranno scoperti da più sensori allo stesso tempo. Il modo comune

è di avere un behavior RUNAWAY per ogni sensore. Questo è chiamato

istanziazione multipla dello stesso behavior.

89

Sotto c’è un'esposizione di un frammento di codice a istanziazione multipla; tutto quello che deve essere fatto è di aggiungere un ciclo per sondare ogni sensore.

Questo riceve un vantaggio da due proprietà della somma vettoriale: essa è associativa (a+b+c+d) può essere calcolata come ((a + b) + c) + d), ed è commutativa (non importa in che ordine i vettori sono sommati).

while(robot==ON) { vector.mag=vector.dir=0.0; //inizializza a 0for (i=0; i<=numberIR; i++ { vectorCurrent=Runaway(i); guarda un certo sensore

vectorOutput=VectorSum(tempVector,vectorCurrent);} turn(vector.direction); forward(vector.magnitude*MAX-VELOCITY);}

90

Come si vede in Fig. 4.19, il robot è capace di uscire fuori da una trappola tipo caverna, detta un box canyon, senza costruire un modello del muro. Ogni istanza offre un vettore, alcuni dei quali hanno una componente X o Y che li porta fuori. Da una prospettiva etologica, il programma è elegante perché è equivalente alla instanziazione di behavior negli animali. Si ricordi, nel Ch. 3 il modello di rana computrix e la sua controprate nella vita reale il rospo dove ogni occhio vede e risponde indipendentemente dall'altro occhio al passaggio di una mosca. In questo caso, il programma sta trattando il robot come se avesse 8 occhi indipendenti!

91

Da un punto di vista robotico, l'esempio illustra due punti importanti.

Primo, l'accoppiamento diretto delle operazioni di sentire e di agire.

Secondo, la programmazione con behavior è consistente con le buone pratiche di ingegneria del software. La funzione RUNAWAY esibisce una coesione funzionale, dove la funzione fa una sola cosa e bene ed ogni asserzione nella funzione ha direttamente qualche cosa a che fare con lo scopo della funzione. La coesione funzionale è desiderabile, perché questo vuole dire che è improbabile che la funzione presenti side effects nel programma principale o che sia dipendente da un'altra funzione. L'organizzazione complessiva mostra l’accoppiamento dei dati, dove ogni chiamata di funzione prende un semplice argomento. L’accoppiamento dei dati è buono, perché ciò vuole dire che tutte le funzioni sono indipendenti; per esempio, il programma può essere cambiato facilmente per tener conto di più sensori IR.

92

L'alternativa alla instanziazione multipla è fare in maniera che lo schema percettivo di RUNAWAY processi tutte le 8 letture di distanza. Un approccio è quello di sommare internamente tutti gli 8 vettori. (Si può facilmente vedere che il vettore risultante è lo stesso) . Questo non è elegante dal punto di vista dell’ingegneria del software perché il codice ora è specifico del robot (si dice che la funzione ha una coesione procedurale), e può essere usato solamente con un robot che ha otto sensori di distanza in quelle ubicazioni.

Un altro approccio che produce un behavior emergente diverso è quello che prevede che lo schema percettivo ritorni la direzione e la distanza delle sole letture di distanza più grandi. Questo rende il behavior più selettivo.

93

Alcuni richiami

94

…....

95

Le Macchine a Stati Finiti Augmented (AFSM) sono FSM a cui vengono aggiunte alcune facilities (registri, sistemi di timing etc.)

input/stato 1 (bloccato) 2 (sbloccato)

Moneta 2 (sbloccato) 2 (sbloccato)

Persona 1 (bloccato) 1 (bloccato)


Inseriscimoneta

Inserisci moneta


96

Behaviors e Schema Theory Nella applicazione fatta da Arbib dello schema theory verso una teoria computazionale dell'intelligenza, un behavior è uno schema che è composto da un schema motorio ed uno schema percettivo. Lo schema motorio rappresenta la modalità per l'attività fisica; lo schema percettivo incarna il sentire. Lo schema motorio e lo schema percettivo sono come pezzi di un puzzle; entrambi i pezzi devono essere messi insieme prima di avere un behavior.

SensoryInput

BEHAVIORPattern of MotorAction

Schemamotorio

Schemapercettivo

Releaser

98

Pfields comparati con la sussunzione

Come possono formare un behavior emergente più complicato i semplici behavior? Alla stessa maniera dei campi di potenziale più complicati che sono costruiti da campi primitivi: combinando instanziazioni multiple di behavior primitivi.

Questo può essere visto rivisitando il behaviour di esempio che descriveva l'architettura di sussunzione.

Nel caso del Livello 0 nella sussunzione, se non ci sono ostacoli all'interno del raggio d’azione, il robot non sente la forza repulsiva ed è immobile. Se un ostacolo entra all'interno di raggio d’azione ed è rivelato da più di un sonar, ognuna delle letture sonar crea un vettore, puntando il robot nella direzione opposta.

99

Nell'esempio della sussunzione , si può immaginare, che questi vettori vengano sommati nel modulo RUNAWAY come mostrato in Fig. In un sistema a campi di potenziale, ciascuna lettura sonar rilascia un’istanza del behaviour RUNAWAYpf ("pf" è usato per rendere chiaro quale RUNAWAY è assegnato). Il behaviour di RUNAWAYpf usa un campo di potenziale repulsivo. I vettori di output sono quindi sommati, e il vettore risultante è usato per guidare la svolta e l’avanzamento del motore.

100

While (robot==ON){

vector.magnitude=vector.direction=0; For (i=0; i<=numberSonars; i++)

{ Reading=readSonar (); // schema percettivo currentVector=runaway(reading); // schema motorio vector=vectorSum(vector, currentVector);

} turn(vector.direction); forward(vector.magnitude*MAX-velocità);

}

101

Il modulo COLLIDE nella sussunzione non coincide con un behavior nella metodologia a campi di potenziale. Si ricordi che lo scopo di COLLIDE è fermare il robot se tocca un ostacolo; e questo accade se il behavior RUNAWAY fallisce.

Questo va bene per la definizione di behavior: ha un input sensorio (range to obstacle = 0) ed un pattern riconoscibile dell'attività motoria (si ferma).

Ma non produce un campo di potenziale, a meno che un campo uniforme di vettori di ampiezza 0 non sia considerato lecito. Se fosse trattato come un behavior, il vettore a cui esso contribuisce sarebbe sommato con gli altri vettori prodotti dagli altri behavior. Ma un vettore di ampiezza 0 è la funzione identità per la somma dei vettori, così un vettore COLLISION non avrebbe alcun impatto. Invece le collisioni sono spesso trattate come situazioni di "panico", provocando una risposta di emergenza fuori della struttura del campo di potenziale.

102

Alcune differenze più sottili tra campi di potenziale e sussunzione appaiono quando è considerato il caso del Livello 1. La stessa funzionalità può essere portata a termine aggiungendo un solo blocco di behavior WANDER, come mostrato in Fig.

103

Come prima, il behavior genera una direzione nuova per muoversi ogni n secondi. Questo potrebbe essere rappresentato da un campo di potenziale uniforme dove il robot sente la stessa attrazione ad andare in una certa direzione, incurante di dove si trova, per n secondi. Comunque, combinando l’output di WANDER con l’output dei vettori di RUNAWAYpf, il bisogno di un nuovo behaviour AVOID è eliminato. Il vettore WANDER è sommato al vettore repulsivo e di conseguenza, il robot si allontana contemporaneamente dagli ostacoli e va verso la direzione desiderata. Questo è mostrato in Fig.

104

Le differenze principali in questo esempio sono che i campi di potenziale esplicitamente incapsulano percezione e azione in behavior primitivi, e non devono sussumere nessun behavior più basso. Come con la sussunzione, il robot diventa più “intelligente” quando il behavior WANDERpf viene aggiunto al behavior RUNAWAYpf.

Ora vediamo, per il Livello 2, come sarebbe implementato follow-corridor in un sistema a campo di potenziale.

In questo caso si vede bene la differenza concettuale tra i due approcci. Il robot avrebbe due behavior concorrenti: RUNAWAYpf e follow-corridor. RUNAWAYpf rimarrebbe lo stesso di prima, ma WANDER potrebbe essere scartato.

In termini di campi di potenziale, il task di seguire un corridoio richiede due behavior simili, mentre il task di vagare richiede due behavior diversi.

105

FOLLOW-CORRIDOR

L0

L1

L2

106

Il behavior follow-corridor è interessante, perché richiede un campo di potenziale più complesso. Come mostrato in Fig., sarebbe desiderabile per il robot stare nel mezzo del corridoio. Questo può essere fatto usando due campi di potenziale: un campo uniforme perpendicolare al confine sinistro e che punta al centro, ed un campo uniforme perpendicolare al confine destro che punta al centro. Si noti che ambo i campi hanno un decremento lineare in ampiezza non appena il campo si avvicina al centro del corridoio. In pratica questo abbassamento impedisce al robot di oscillare al centro.

107

Si noti anche che i due campi uniformi non sono sufficienti perché non permettono al robot di muoversi in avanti; il robot si muoverebbe nel mezzo del corridoio e si fermerebbe là. Perciò si aggiunge un terzo campo uniforme che è parallelo al corridoio. Questi tre campi combinati producono un campo smussato che spinge il robot nel mezzo del corridoio secondo una funzione di prossimità al muro, mentre contemporaneamente il robot va spostandosi in avanti. La figura sotto mostra i campi coinvolti. Si ricordi, in questo esempio, che il robot non sta proiettando confini passati o futuri del corridoio; la visualizzazione del campo lo fa apparire così

108

Il behavior di follow-corridor usa gli stessi dati dei sonar di AVOID;

perciò i muri produrranno un campo repulsivo che generalmente

spingerebbe il robot verso il mezzo del corridoio.

Perché non usare un solo campo parallelo uniforme per seguire-

corridoio?

Prima di tutto i behavior sono indipendenti. Se c'è un behavior seguire-

corridoio, esso deve essere capace di seguire le sale senza dipendere da

effetti collaterali dagli altri behavior. Secondo, la simmetria polare dei

campi repulsivi può causare oscillazioni, così c'è un vantaggio pratico

ad avere un behavior separato.

109

L'uso di conoscenza di behavior-specifico del dominio (data al

momento dell’instanziazione come un parametro di inizializzazione

opzionale) può migliorare ulteriormente il behavior complessivo del

robot. Se il robot conosce l'ampiezza della sala a priori, follow-corridor

può sopprimere le istanze di AVOID perché per gli ostacoli sa che

quella è la forma del confine del muro. Quindi eviterà solamente gli

ostacoli che sono nella sala. Se non ci sono ostacoli, seguire-corridoio

produrrà una traiettoria diritta. Se gli ostacoli sono prossimi ad un

muro, il follow-corridor tratterà il profilo dell'ostacolo come un muro e

si sposterà più vicino al centro.

110

Gli schema motori per un behavior possono essere ordinati in sequenza. Un esempio di questo è il behavior di docking. Docking (approccio) è quando un robot si deve muovere verso una specifica ubicazione (la stazione di docking) con un certo orientamento. Questo è utile per i robot che maneggiano materiali in una industria. Per prendere un pezzo di materiale da trasportare il robot deve, nella sua posizione finale, essere abbastanza vicino al lato giusto del nastro trasportatore e trovarsi rivolto verso di esso. Poiché il docking richiede una specifica posizione ed orientamento, non può essere fatto con un schema motorio attrattivo. Con questo campo il robot andrebbe in linea retta verso il nastro, anche se è girato al contrario; il robot si fermerebbe di schiena nella posizione giusta ma con l’orientamento sbagliato. Invece, è necessario un campo di attrazione selettivo. Qui il robot "sente" solamente la forza attrattiva quando è all'interno di un certo range angolare della stazione di docking, come mostrato in Fig. 4.24.

111

Sfortunatamente l'attrazione selettiva non copre il caso di quando il robot si avvicina dalla parte posteriore o di lato. Come si può muovere un robot in un'area dove c’è un campo di attrazione selettivo? Un modo per fare questo è avere un campo tangenziale che permette al robot di orbitare attorno al dock finché non entra nell'area di attrazione selettiva. La combinazione dei due schemi motori produce un campo continuo che fa convergere il robot nella posizione ed orientamento corretto, come mostrato in Fig..

113

Un aspetto interessante del behavior di docking è quando il robot sta operando in prossimità del dock. Il dock rilascerà un’istanza di AVOID che impedirebbe al robot di andare vicino alla posizione desiderata. In questo caso, i behaviour di docking devono attenuare l’ampiezza (il guadagno) del vettore di output dell’ AVOID instanziato nell'area di dock. Essenzialmente questo è come se inibisse in parte l'AVOID behaviour in alcune regioni selezionate. Avremo quindi che tra attrazione e repulsione il robot si ferma dove l'attrazione selettiva del dock si bilancia con la repulsione. I campi selettivi e tangenziali non sono sufficienti in pratica, a causare delle limitazioni percettive. Se il robot non può vedere il dock, non può istanziare i campi.

114

DOCKING

115

E’ probabile che un robot industriale sappia la direzione relativa di un dock molto di più di quanto un'ape ricordi la direzione del suo alveare. Perciò una forza attrattiva attira il robot vicino al dock, e poi quando il robot vede il dock, comincia l’effetto di incanalamento verso la posizione con l’orientamento corretto anche in presenza di ostacoli, come si vede in Fig.

117

Almeno tre schemi percettivi sono necessari per il behavior di docking.

Uno è necessario per estrarre la direzione relativa del dock per

l'attrazione regolare.

Un altro è uno schema percettivo capace di riconoscere il dock in

generale, anche dalla parte posteriore o dai lati, al fine di sostenere il

campo tangenziale.

Il terzo schema percettivo è necessario per il campo di attenzione

selettiva e deve essere capace di interagire con la parte anteriore del dock

e valutare la distanza e l’orientamento relativo del robot.

118

DOCKINGSELETTIVO

DOCKINGTANGENZIALE

DOCKINGATTRATTIVO

119

Il behavior di docking è definito quindi come costituito da tre schemi

percettivi e tre schemi motorii (potrebbero essere raggruppati in 3

behavior primitivi). Una rappresentazione in termini di schema-theory

indica che il behavior ha alcuni programmi di controllo per coordinare e

controllare questi schemi.

120

Nel caso del behavior di docking, una macchina a stati finiti è una scelta ragionevole per coordinare la sequenza di schemi percettivi e motorii.

Essa fornisce una maniera formale per rappresentare la sequenza, ed anche ricorda al progettista di considerare transizioni di stato fuori dell’ordinario.

Il robot per esempio potrebbe stare muovendosi verso il dock sotto l’influenza dei campi tangenziali e dell’attenzione selettiva. Se una persona gli passa davanti, essa occluderebbe la vista del dock e quindi cesserebbe l’attrazione. Allora si riattiva lo schema motorio di attrazione generale, e insieme allo schema percettivo associato rivalutano la direzione del dock alla luce del nuovo ostacolo.Il nuovo vettore permetterebbe al robot di evitare la persona andando in una direzione favorevole al raggiungimento del dock e tentare di raggiungerlo.

121

Il behavior di docking illustra anche quale impatto hanno le capacità

sensoriali del robot sui parametri dello schema motorio.

Si noti che l’ampiezza angolare del campo di attenzione selettivo è

determinata dagli angoli ai quali il terzo schema percettivo potrebbe

identificare il dock.

Similmente il raggio del campo tangenziale e di attrazione selettiva è

determinato dalla distanza alla quale il robot può percepire il dock.

122

Vantaggi e svantaggi

L’architettura a campo di potenziale ha molti vantaggi. Il campo di potenziale è una rappresentazione continua che è facile visualizzare su una grande regione dello spazio. Di conseguenza, è più facile per il progettista visualizzare il behavior complessivo del robot. È anche facile combinare campi, e, linguaggi come C++, forniscono strumenti per la creazione di biblioteche comportamentali.

I campi di potenziale possono essere parametrizzati: il loro range di influenza può essere limitato e una funzione continua può esprimere il cambio in ampiezza rispetto alla distanza (lineare, esponenziale, ecc.).

Inoltre un campo bi-dimensionale di solito può essere esteso ad un campo tri-dimensionale, e così behaviours sviluppati per 2D vanno bene anche per il 3D.

123

Costruire un sistema reattivo con campi di potenziale non è senza

svantaggi.

Il problema comunemente più citato con i campi di potenziale è quello

che campi multipli possono portare ad un vettore con ampiezza 0; questo

è chiamato il problema del minimo locale. Si veda il caso del box

canyon. Se il robot viene attirato in un punto dietro il box canyon, il

vettore attrattivo annullerebbe il vettore repulsivo ed il robot rimarrebbe

fermo perché tutte le forze si annullerebbero. Il problema del box canyon

è un esempio di raggiungimento di un minimo locale.

In pratica, vi sono molte soluzioni eleganti per questo problema. Una è

quella di avere un schema motorio che produce vettori di piccola

ampiezza a partire da rumore casuale. Il rumore nello schema motorio

servirebbe a sbattere il robot fuori dai minimi locali.

Si vedano le reti neurali e il simulated annealing.

124

Un'altra soluzione è quella dei template di navigazione (Navigation

Templates), come quelle implementate da Mark Slack per JPL.

La motivazione è che il problema dei minimi locali spesso sorge a causa

di interazioni fra il behavior di campo repulsivo di AVOID e gli altri

behavior, come quello del campo attrattivo di muovere-verso-una-meta.

Il problema dei minimi scomparirebbe se il campo di potenziale AVOID

fosse in qualche modo più intelligente. In NaTs, il behavior AVOID

riceve come input il vettore somma degli altri behavior. Questo vettore

rappresenta la direzione verso cui il robot andrebbe se non ci fossero

ostacoli vicino. Per gli scopi di questo corso, questo sarà chiamato

vettore strategico.

Se il robot ha un vettore strategico, quel vettore dice se c’è un ostacolo

esso deve essere passato sulla destra o sulla sinistra.

125

Per esempio, se il robot sta attraversando un ponte (vedi Fig.), vorrà passare alla sinistra degli ostacoli che stanno a destra per stare nel mezzo. Nota che il vettore strategico definisce quello che sta a sinistra e quello che sta a destra.

126

NaTs implementa questa semplice euristica nel campo di potenziale per

RUNAWAY, promuovendolo ad un vero AVOID. Il campo di

repulsione viene completato con un campo a orbita tangenziale. La

direzione dell'orbita (in senso orario o anti orario) è determinato dalla

posizione del robot cioè se è a destra o a sinistra del vettore strategico.

L’output del behavior AVOID può essere chiamato vettore tattico,

perché persegue la meta strategica del robot di fronte a sfide immediate,

così come un generale dice ad un capitano di catturare un forte senza

specificare ogni passo.

Una più recente soluzione al problema di minimi locali è stata quella di

esprimere i campi come funzioni armoniche.

I campi di potenziale implementati come funzioni armoniche sono

garantiti dal non avere un minimo locale pari a 0. Lo svantaggio di

questa tecnica è che è computazionalmente costosa, e deva essere

implementata su un chip VLSI per operare in tempo reale per grandi

aree.

127

Per riassumere i punti principali sulle architetture a campi di potenziale: • I Behavior sono definiti come formati da uno o più behavior di schemi motori e percettivi. Lo schema motorio per un behavior deve essere un campo di potenziale. • Tutti i behavior operano concomitantemente ed i vettori di output sono sommati. I behavior sono trattati alla pari e non sono stratificati, anche se ci possono essere, come vedremo, behavior astratti che internamente ordinano in sequenza i behavior. Il programma di controllo coordinato non è specificato; il progettista può usare la logica, macchine a stati finiti, ogni qualvolta è ritenuto opportuno. L’ordinare in sequenza è di solito controllato da percezioni o affordances presenti nell'ambiente che sono viste come releasers.

128

• Anche se tutti i behavior sono trattati ugualmente, i behavior possono dare contributi diversi all'azione complessiva del robot. Un behavior può cambiare i guadagni rispetto a un altro behavior, riducendo o aumentando l’ampiezza del suo output. Questo vuole dire che i behavior possono inibire o eccitare gli altri behavior, anche se questo è usato in pratica raramente.

• La percezione di solito è gestita da percezioni dirette o affordances.

• Una percezione può essere condivisa da diversi behavior. Una conoscenza a priori può essere data allo schema percettivo, per simulare un sensore specializzato che è più sensibile ad eventi come i confini di una sala.

129

La valutazione delle Architetture Reattive

Come visto dall'esempio di follow-corridor, le due architetture, sussunzione e campi di potenziale, sono molto simili nella filosofia e nei tipi di risultati che si ottengono. Essenzialmente, sono equivalenti.

In termini di supporto alla modularità, entrambe decompongono, le azioni e le percezioni necessarie per trasformare un task in un behavior, anche se c'è disaccordo sul livello di astrazione di un behavior.

La sussunzione sembra favorire una realizzazione hardware, mentre i metodi dei campi di potenziale hanno interessanti proprietà per un sistema orientato al software.

La nicchia di targetability è alta per entrambe, presumendo che il task ppossa essere perseguito da behavior riflessivi. Effettivamente, l'uso della percezione diretta enfatizza il fatto che i robot reattivi veramente sono costruiti per riempire una nicchia.

130

Il problema ancora aperto èse queste architetture mostrano una buona

trasportabilità verso altri domini. I sistemi reattivi sono limitati a

applicazioni che possono essere portate a termine con behavior riflessivi.

Essi non possono essere trasferiti a domini dove il robot ha bisogno di

fare pianificazione, ragionando sull'allocazione delle risorse, ecc. (questo

ha portato al Paradigma Ibrido).

In pratica, veramente pochi dei livelli dell’architettura a sussunzione

possono essere trasferiti a nuove applicazioni di navigazione senza fare

cambiamenti.

Le diverse applicazioni creano strati che hanno bisogno di sussumere

differentemente gli strati più bassi. La metodologia dei campi potenziale

fa un po' meglio nel senso che il progettista può creare una libreria di

behavior e schemi tra cui scegliere, senza un implicito ricorso ad uno

strato più basso.

131

Nessuna architettura presenta sistemi che potrebbero essere detti

veramente robusti.

La stratificazione della sussunzione impone un certo degrado se un

livello superiore è distrutto, ma non ha nessun meccanismo per

evidenziare che c’è stato un degrado.

La macchina a stati finiti nel behavior di docking mostra una certa

elasticità, ma di nuovo, solamente per situazioni che possono essere

anticipate e registrate nel diagramma di stato.

Come negli animali, un robot reattivo farà cose consistenti con la sua

percezione del mondo, ma non sempre quelle giuste.

CORSO SISTEMI DI GOVERNO DEI ROBOT Lezione n.4 Paradigma Reattivo prof. Ernesto Burattini

Documents

Transcript of CORSO SISTEMI DI GOVERNO DEI ROBOT Lezione n.4 Paradigma Reattivo prof. Ernesto Burattini